Análisis de Regresión Local
Enviado por poland6525 • 21 de Mayo de 2018 • 1.410 Palabras (6 Páginas) • 405 Visitas
...
Entonces, la traza[S’] = traza[S], y así
[pic 33]
En cierto sentido representa los grados de libertad asociados con el modelo total. En algunos programas de cómputo es llamada la cantidad equivalente de parámetros, y representa una medida de la complejidad de procedimiento de estimación. Un estimador común de es:[pic 34][pic 35][pic 36]
[pic 37]
Por último se puede definir una versión de como sigue:[pic 38]
[pic 39]
Cuya interpretación es la misma que antes, en los mínimos cuadrados ordinarios.
---------------------------------------------------------------
- OTROS:
Ventajas:
- La principal ventaja de LOESS es que el usuario no debe especificar ningún modelo que deba ajustarse a los datos. En su lugar solo tienen que proveer un valor de parámetro de suavizado y el grado del polinomio local.
- LOESS es una técnica de análisis muy flexible y por tanto es ideal para analizar procesos para los cuales no existen modelos teóricos.
- La técnica LOESS permite calcular la incertidumbre asociada al modelo de predicción y de calibración así como aplicar la mayoría de las pruebas y procedimientos utilizados para validar los modelos de regresión basados en mínimos cuadrados.
Desventajas:
- Hace un uso menos eficiente de los datos que otros métodos de mínimos cuadrados. Sin embargo, dados los resultados que el método proporciona, sin duda podría ser más eficiente en general, que otros métodos de estimación por ejemplo como el de mínimos cuadrados no lineales.
- LOESS no produce una función de regresión y por tanto no puede transferirse a otros usuarios.
---------------------------------------------------------------
- EJEMPLO DE APLICACIÓN
- DESCRIPCIÓN DE LOS DATOS
EJEMPLO:
Utilizamos un conjunto de datos incorporados al R cars que consiste en un data frame con la velocidad (speed en millas por hora) y la distancia que requieren para frenar (dist en pies). Los datos fueron registrados en 1920.
- RESULTADOS
Análisis de los datos:
Gráfico de dispersión:
[pic 40]
Se puede observar que los datos tienen una tendencia lineal positiva.
Interpretación: Según el grafico se puede deducir que a mayor velocidad (millas por horas) la distancia (pies) de frenado aumenta.
Comparación del modelo lineal y del modelo LOESS
Modelo Lineal
[pic 41]
Modelo LOESS
[pic 42]
---------------------------------------------------------------
Comparación entre ambos modelos
[pic 43]
En el grafico se puede observar que no hay mucha diferencia, ya que ambos tienen casi la misma dispersión y gráfico de normalidad.
Pero comparando sus errores estándar residual obtenemos que el mejor modelo para estos datos es el modelo loess.
Gráfico modelo loess y modelo lineal
[pic 44]
El diagrama de dispersión muestra claramente el ajuste del modelo de regresión loess (se centra más en los puntos centrales) y la regresión lineal (línea azul).
---------------------------------------------------------------
Ejercicio
Una alternativa más suavizada la proporcionan las regresiones locales ponderadas que se construyen con el algoritmo LOESS.
Este hace una regresión polinomial (en general por defecto cuadrática) sobre los datos en una ventana, opcionalmente dando más importancia (más peso) a los datos centrales que a los de los extremos.
periodo
x
y
Gráfica
plot(x,y, main="Curva senoidal+ ruido uniforme")
mtext("loess suavizado (suavizado de regresión local)")
[pic 45]
Ajuste loess + intervalos
d.loess
Ventanas con el 75% de los datos
d.predict
'se = TRUE' calcula el error estándar, necesario para el intervalo de confianza
par(mfrow=c(1,1))
El par se puede utilizar para establecer o saber la parámetros gráficos.
lines(x,d.predict$fit,lwd=3,col="blue")
lines(x,d.predict$fit+2*d.predict$se.fit,lty=2,col="blue")
lines(x,d.predict$fit-2*d.predict$se.fit,lty=2,col="blue")
[pic 46]
La anchura de la ventana es crucial pues de ella depende la interpretación de los datos.
Si es muy grande, la regresión pierde su carácter local y se ajusta una línea recta o un polinomio del orden que se haya indicado.
Si es muy pequeña, el resultado es una línea que salta de punto en punto sugiriendo una relación totalmente circunstancial.
Para varios span
plot(x,y,
...