Estadistica aplicada. Población y muestra
Enviado por Eric • 12 de Abril de 2018 • 11.284 Palabras (46 Páginas) • 444 Visitas
...
X16 : Nivel de Cobre (ppm).
X17 : Nivel de Hierro (ppm).
X18 : Nivel de Manganeso (ppm).
X19 : Nivel de Zinc (ppm).
X20 : Altura (cm).
X21 : Humedad del grano (%).
Otras,
X22 : Variedad de maíz.
X23 : Tipo de fertilizante.
---------------------------------------------------------------
Métodos Estadísticos
El Análisis de Regresión Múltiple, estudia la relación de una variable dependiente con dos o másvariables independientes, a través del uso de modelos de regresión múltiple. En la terminología que se emplea en regresión, a la variable que se va a predecir se le llama variable dependiente (Y). A las variables que se usan para predecir el valor de la variable dependiente se les llama variables independientes (X).
El Modelo de regresión múltiple es la Ecuación matemática que describe cómo está relacionada la variabledependiente Y con las variables independientes X1, X2, . . ., XPy con el término del error ϵ.Se supone que el modelo de regresión múltiple toma la forma siguiente:
[pic 1]
En donde β0, β1, β2,...,βp, son parámetros y el término del error ϵ es una variable aleatoria.
Suposiciones sobre el Término del Error ϵen el Modelo de Regresión Múltiple
- El término del error ϵ es una variable aleatoria cuya media o valor esperado es cero,es decir, E(ϵ) = 0.Consecuencia: Para valores dados de x1, x2, . . . , xp, el valor esperado o valor promediode y está dado por
[pic 2]
En esta ecuación, E(y) representa el promedio de todos los valores que puede tomary para valores dados de x1, x2, . . . , xp.
- La varianza de ϵ se denota σ2 y, es la misma para todos los valores de las variables independientesx1, x2, . . . , xp.Consecuencia: La varianza de y respecto a la línea de regresión es σ2 y es la misma para todos los valores de x1, x2, . . . , xp.
- Los valores de ϵ son independientes. Consecuencia: El valor de ϵ para un determinado conjunto de valores de las variables independientes no está relacionado con el valor de ϵ de ningún otro conjunto de valores.
- El término del error ϵ es una variable aleatoria distribuida normalmente y que reflejala desviación entre el valor de y,y el valor esperado de y dado por .Consecuencia: Como β0, β1, β2,..., βpson constantes para los valores dados de x1, x2, . . . , xp, la variable dependiente y es también una variable aleatoria distribuida normalmente.[pic 3]
Análisis de Varianza (ANOVA): la tabla general para el análisis de varianza se obtiene como resultado del uso del software, y proporciona los resultados importantes en la aplicación de los métodos estadístico. a continuación se presenta la información que contiene:
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
F
Regresión
p
SCR
[pic 4]
[pic 5]
Residuos
n - p - 1
SCE
[pic 6]
Total
n - 1
STC
En el caso de la regresión múltiple, la suma de cuadrados del total (STC) tiene n - 1 gradosde libertad, la suma de cuadrados debida a la regresión (SCR) tiene p grados de libertad y la sumade cuadrados debida al error (SCE) tiene n -p- 1 grados de libertad. Por tanto, el cuadrado mediodebido a la regresión (CMR) es SCR/p y el cuadrado medio debido al error (CME) es SCE/(n - p - 1).
Prueba de significancia:
- La prueba F se usa para determinar si existe una relación de significancia entre la variable dependiente y el conjunto de todas las variables independientes; a esta prueba F se le llama prueba de significancia global.
- Si la prueba F indica que hay significancia global, se usa la prueba t para ver si cada una de las variables individuales es significativa. Para cada una de las variables independientes del modelo se realiza una prueba t. A cada una de estas pruebas t se le conoce como prueba de significancia individual.
Prueba F de significancia global
[pic 7]
[pic 8]
Estadístico de prueba
[pic 9]
Regla de rechazo
Valor aproximado p: Rechazar H0 si valor p ≤ α
Valor Crítico aproximado: Rechazar H0 si F ≥ Fα
Donde Fα pertenece a la distribución F con p grados de libertad en el numerador y
n - p - 1 grados de libertad en el denominador.
Prueba t:
Si la prueba F indica que la relación de regresión múltiple es significativa, se puede realizar unaprueba t para determinar la significancia de cada uno de los parámetros. A continuación se presentala prueba t de significancia para cada uno de los parámetros.
Prueba t de significancia para cada uno de los parámetros
Para cualquier parámetroβi
[pic 10]
[pic 11]
Estadístico de prueba
[pic 12]
Regla de rechazo
Valor aproximado p: Rechazar H0 si valor
...