GUÍA BÁSICA DE REGRESIÓN LINEAL MÚLTIPLE EN EXCEL
Enviado por mondoro • 21 de Enero de 2018 • 2.207 Palabras (9 Páginas) • 491 Visitas
...
A continuación, mostramos como desarrollar este caso a través del programa Excel (Microsoft office)
[pic 9]
¿Cómo configurar Análisis de datos en mi computadora?
- Dar un click sobre [pic 10] con el botón izquierdo del mouse. Luego dar un click sobre “Opciones” con el botón izquierdo del mouse.
[pic 11]
- Aparecerá una ventana con opciones de Excel, debemos clickear “complementos” con el botón izquierdo del mouse.[pic 12]
[pic 13][pic 14][pic 15][pic 16]
- A continuación, aparecerá otra ventana de “complementos disponibles”. Debemos seleccionar “Herramientas para análisis” y aceptar.[pic 17]
[pic 18][pic 19]
- Después de esto, debemos esperar un poco para que se configure la función análisis de Datos en el programa de Excel. Luego, podremos empezar a desarrollar nuestro caso PRENDAS Y ACCESORIOS DE BABY ALPACA.
¿Cómo empiezo a desarrollar el caso propuesto?
- Lo primero que debemos hacer es contar con toda la información que requerimos. Debemos tener datos de la variable dependiente (CANTIDAD DE
FIBRA DE ALPACA) y de las variables independientes (DEMANDA DE BABY ALPACA, NÚMERO DE EMPRESAS DEL MISMO RUBRO, NÚMERO DE CAMÉLIDOS CRIADOS EN LA ZONA DE JUNIN, PRECIO DE LA FIBRA NATURAL DE ALPACA, INVERSIÓN EN EL SECTOR DE CAMÉLIDOS) que van a tratar de explicar nuestro modelo.
[pic 20][pic 21][pic 22]
- Luego, aparecerá una ventana de “Análisis de datos”, debemos Clickear la función “regresion” y aceptar.
[pic 23]
[pic 24]
- A continuación, aparecerá una ventana de “Regresión”, en donde deberemos seleccionar los datos de todas nuestras variables. En la parte Rango Y de entrada debemos seleccionar los datos de nuestra variable dependiente Y (CANTIDAD DE FIBRA DE ALPACA).
[pic 25][pic 26][pic 27]
- De la misma manera en la parte Rango X de entrada seleccionaremos todos los datos de nuestras variables independientes (DEMANDA DE BABY ALPACA, NÚMERO DE EMPRESAS DEL MISMO RUBRO, NÚMERO DE CAMÉLIDOS CRIADOS EN LA ZONA DE JUNIN, PRECIO DE LA FIBRA NATURAL DE ALPACA, INVERSIÓN EN EL SECTOR DE CAMÉLIDOS).
[pic 28][pic 29][pic 30][pic 31][pic 32][pic 33]
[pic 34][pic 35]
10. A continuación mostramos los resultados obtenidos a través del análisis de regresión:
[pic 36][pic 37]
[pic 38]
11. A continuación tenemos que construir nuestra ecuación de la regresión múltiple en base a los coeficientes que hemos obtenidos del Excel, la cual va ser construido de la siguiente manera.
Y = -10.4401503422712 + 0.386835014322082 X1 + 0.0127955430989426 X2 -0.442182249216924 X3 + 0.125390513310503 X4 + 0.0855720006187913X5
12. una vez que construimos nuestra ecuación de regresión múltiple con los datos que nos proporciona el Excel, tenemos que hacer una Prueba global para poder determinar si nuestro modelo sirve o no sirve, es decir si nuestras variables independientes (DEMANDA DE BABY ALPACA, NÚMERO DE EMPRESAS DEL MISMO RUBRO, NÚMERO DE CAMÉLIDOS CRIADOS EN LA ZONA DE JUNIN, PRECIO DE LA FIBRA NATURAL DE ALPACA E INVERSIÓN EN EL SECTOR DE CAMÉLIDOS pueden explicar a nuestra variable respuesta cantidad de fibra de alpaca. Esta prueba no especifica que variable independiente explica a la variable dependiente, puede ser uno, dos, tres o todas, lo que se busca como se mencionó anteriormente es que el modelo sirva. Para esto tenemos que hacer una prueba global que se va realizar a través del análisis de varianza.
13. En el análisis de varianza vamos a explicar primero los grados de libertad[pic 39]
[pic 40][pic 41]
[pic 42]
[pic 43]
14. A continuación, explicaremos como el Excel haya el promedio de los cuadrados tanto de la regresión como de los residuos [pic 44][pic 45]
[pic 46]
15. Una vez que se ha visto como se ha determinado el promedio de cuadrados tanto de la regresión como para los residuos se va explicar como resulta el F calculado (a través de Excel), que en este caso resulta 80.34. Pero antes de explicar el F calculado vamos a dar los pasos que se siguen en forma teórica para determinar la validez de este modelo.[pic 47]
- Formulación de hipótesis
H0: β1 = β2 = β3 =β4 =β5 = 0
Ha: β1 ≠ β2 ≠ β3 ≠ β4 ≠ β5≠ 0
- Determinación del nivel de significación
α = 0,10
- Selección de la prueba estadística:
[pic 48][pic 49]
[pic 50]
[pic 51]
Fc = 3.454972369 = 80.3499358[pic 52][pic 53]
16. El F calculado (de Excel) es el punto más importante del análisis de varianza, ya que me va determinar si mi modelo sirve o no sirve, pero para determinar esto tengo que compararlo con el F de tabla. A continuación se va explicar como hallar el F de tabla.
[pic 54][pic 55][pic 56]
[pic 57][pic 58][pic 59][pic 60][pic 61][pic 62][pic 63][pic 64]
17. A continuación, podemos observar un cuadro de argumento de función donde en probabilidad colocaremos 0.05 que es mi nivel de significancia. Si bien es cierto que mi nivel de significancia es 0.1 por tratarse de una distribución que no es normal el α que es 0,10 se divide entre 2 por la forma de distribución que podemos observar en la siguiente figura.
[pic
...