DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS
Enviado por Ledesma • 26 de Agosto de 2018 • 12.773 Palabras (52 Páginas) • 249 Visitas
...
Si obtenemos distintas muestras aleatorias de una población, los estadísticos de cada una tendrán unos valores diferentes. Estos valores se comportan como una variable aleatoria que toma una determinada distribución, que se conoce con el nombre de distribución muestral. Es muy importante distinguir los siguientes conceptos:
- Distribución de (o en) la muestra: Son los datos o valores (distribución de frecuencias) que toma la variable en una muestra concreta. La media, mediana, proporción, desviación típica, correlación, etc. de la muestra, son los estadísticos.
- Distribución poblacional: Son los datos o valores (distribución de frecuencias) que toma una variable en el conjunto de la población. Su media, mediana, proporción, desviación típicas, etc. son los parámetros poblacionales.
- Distribución muestral de un estadístico: Son los datos o valores (distribución de frecuencias) que toma una variable o estadístico en el conjunto de todas las infinitas muestras que pueden obtenerse de una población. Como en toda distribución, también de la distribución muestral, podemos obtener su media y su desviación típica o error típico del estadístico.
Cuando los estadísticos (muestrales) se refieren a una muestra concreta, se designan con letras latinas mayúsculas (Media de la muestra = , Varianza de la muestra = S2, Proporción de la muestra = P). Los mismos parámetros referidos a la población, se indican con los caracteres griegos equivalentes (µ, π, σ2).[pic 1]
---------------------------------------------------------------
2. Distribución muestral de la MEDIA.
Hay que distinguir tres supuestos:
1.- Si la distribución poblacional de la variable de estudio es normal con media µ y varianza o desviación típica σ conocidas, entonces la distribución muestral del estadístico media es también normal, con independencia del tamaño de la muestra, siendo su media y desviación típica (o error típico de la media), respectivamente µY y σ/ (fórmula 1, pág. 9 del formulario). Si tipificamos, entonces será N (0,1). [pic 2]
2.- Si se desconoce la varianza (o la forma de la distribución poblacional), el estadístico media se distribuye como una T de Student, con n-1 grados de libertad y usaremos la desviación típica insesgada o cuasidesviación típica de la muestra (fórmula 2, página 9 del formulario, ojo siempre n-1 en vez de n).
3.- Aunque la forma de distribución o la varianza sean desconocidas, si la muestra es lo suficientemente grande (n>30 o n>100, según los autores), aunque el estadístico media seguirá distribuyéndose según la T de Student, por el Teorema Central del Límite tenderá a una distribución normal y podremos usar la primera fórmula del cuadernillo pero usando la desviación típica insesgada o cuasidesviación típica de la muestra, siempre que se use n-1 en vez de n, si no, saldrá mal (problema 1 del examen de septiembre).
3. Distribución muestral de la PROPORCIÓN.
En las variables dicotómicas o dicotomizadas (las que sólo pueden tomar dos valores), la proporción es el porcentaje de elementos que tienen una determinada propiedad (éxito) en relación con el total. Las probabilidades asociadas a cada valor concreto se distribuyen según la distribución binomial con parámetros n y π. Con muestras grandes la binomial tiende a aproximarse a la normal N (π, σp), (fórmula 3, página 9 del cuadernillo). En esta asignatura siempre se usa la distribución normal.
4. Distribución muestral de la VARIANZA.
La distribución muestral de la varianza se ajusta a una χ2 (chi-cuadrado), con n-1 grados de libertad. Cuando la muestra es mayor de 100, la χ2 tiende a la normal.
Es muy importante retener que cada estadístico se distribuye con su propia distribución que no cambia con el tamaño de la muestra, sin perjuicio de que por el TCL cuanto mayor sea la muestra, mayor será la aproximación de la distribución muestral correspondiente (T de Student, binomial o chi-cuadrado) a la normal. Ojo, cuidado, las fórmulas que se usan cuando aproximamos con la normal son algo diferentes.
5.- ESTIMACIÓN DE PARÁMETROS: PUNTUAL Y POR INTERVALOS.
Un estimador es un estadístico calculado en la muestra que se utiliza para estimar o elaborar hipótesis acerca del valor del parámetro correspondiente en la población. Para todo parámetro existen diversos estimadores, con diferentes propiedades. Por ejemplo, para la media poblacional podrían utilizarse la media aritmética o la media geométrica de la muestra. El uso de uno de otro dependerá del parámetro que pretenda estimarse y de la bondad en el cumplimiento de determinadas propiedades.
Las propiedades de los estimadores son:
- Sesgo: Un estimador es insesgado cuando su valor esperado, es decir, la media de la distribución muestral, coincide con el parámetro estimado.
- Eficiencia o precisión: Es la inversa de la varianza. Un estimador es eficiente cuando tiene poca variabilidad. Entre dos estimadores insesgados es más eficiente el que tiene menor desviación típica o error típico de medida y por tanto, menor varianza.
- Consistencia. Un estimador es consistente cuando al aumentar el tamaño de la muestra, la varianza del estimador disminuye, tendiendo en el límite a 0.
- Suficiencia. Un estimador es suficiente si para estimar el parámetro de la población utiliza todos los elementos o información disponibles en la muestra.
La propiedad de los estimadores insesgados y eficientes (con varianza pequeña) se llama acuracidad.
Los estadísticos media, proporción y coeficiente de correlación muestrales son estimadores insesgados, eficientes, consistentes y suficientes de los parámetros media, proporción y coeficiente de correlación poblacional. La mediana es eficiente y consistente pero no es insesgada; ni tampoco suficiente al usar sólo los valores centrales de la muestra.
La varianza muestral no es un estimador insesgado de la varianza poblacional, aunque sí cumple con las otras tres propiedades. Por el contrario, la cuasivarianza muestral (o varianza insesgada, calculada sobre n-1) sí es un estimador insesgado de la varianza poblacional, pero es menos eficiente que la varianza muestral.
Resumen de las propiedades de estadísticos
Carencia
...