DISTRIBUCIONES DE PROBABILIDAD CONTINUA
Enviado por Kate • 21 de Julio de 2018 • 4.281 Palabras (18 Páginas) • 581 Visitas
...
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya que también la podemos utilizar con muestras aleatorias de tamaño grande.
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres distribuciones mencionadas. Este concepto es “Grados de Libertad”.
G
rados de libertad.
Para definir grados de libertad se hará referencia a la varianza muestral:
[pic 48]
Esta fórmula está basada en [pic 49] grados de libertad (degrees of freedom, df).
Esta terminología resulta del hecho de que, si bien [pic 50] está basada en n cantidades [pic 51], [pic 52], ..., [pic 53], éstas suman cero; así que, especificar los valores de cualquier [pic 54] de las cantidades determina el valor restante.
Por ejemplo, si [pic 55] y [pic 56]; [pic 57] y [pic 58], entonces automáticamente tenemos [pic 59], así que sólo tres de los cuatro valores de [pic 60] están libremente determinados con 3 grados de libertad.
Podemos definir los grados de libertad como el número de valores que podemos escoger libremente. Entonces, la fórmula de grados de libertad y su simbología será [pic 61].
---------------------------------------------------------------
D
istribución t de Student
Supóngase que se toma una muestra de una población normal con media [pic 62] y varianza [pic 63]. Si [pic 64] es el promedio de las [pic 65] observaciones que contiene la muestra aleatoria, entonces la distribución [pic 66] es una distribución normal estándar.
Supóngase que la varianza de la población [pic 67] es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza [pic 68] por s? La distribución t proporciona la respuesta a esta pregunta.
La Distribución de Probabilidad t de Student se publicó por primera vez en 1908 en un artículo de W. S. Gossett. En esa época, Gosset era empleado de la Guinness Brewery en Dublín, Irlanda; una cervecería irlandesa que desaprobaba la publicación de investigaciones de sus empleados, con su propio nombre. Para evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de “Student”. En consecuencia, la distribución t normalmente se llama Distribución t de Student, o simplemente Distribución t. Para derivar la ecuación de esta distribución, Gosset supone que las muestras se seleccionan de una población normal. Aunque esto parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no normales que poseen distribuciones en forma casi de campana aún proporcionan valores de t que se aproximan muy de cerca a la distribución t.
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Únicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas.
[pic 69]
El uso de la distribución t requiere siempre que el tamaño de la muestra sea de 30 o menor y que la desviación estándar de la población no sea conocida. Además, al utilizar la distribución t, suponemos que la población es normal o aproximadamente normal.
Propiedades de la distribución t de Student:
- La función de densidad de la distribución t es:
[pic 70]
- Es de media cero, y simétrica con respecto a la misma; En la figura se puede ver la comparación entre las funciones de densidad de t1 y la normal (0,1)
[pic 71]
- Para tamaños de muestra mayores de 30, la distribución t se asemeja tanto a la normal que utilizaremos a esta última para aproximar a la distribución t.
- La distribución t tiene, proporcionalmente, más porcentaje de su área en los extremos que la distribución normal; ésta es la razón por la cual será necesario alejarse más de la media de una distribución t para poder incluir la misma área bajo la curva. Los anchos de intervalo de una distribución t, por tanto, son mayores que los que están basados en la distribución normal.
- Si [pic 72] es la media de una muestra aleatoria de tamaño [pic 73] tomada de una población normal con medía [pic 74] y varianza [pic 75], entonces:
[pic 76]
[pic 77]
La tabla t es más compacta y muestra áreas y valores de t solamente para algunos porcentajes (10, 5, 2 y 1%). Debido a que hay una distribución t diferente para cada número de grados de libertad, una tabla más completa sería bastante grande, Si estamos haciendo cálculos y queremos estar 90% de que son correctos buscaríamos en la tabla t en la columna encabezada con el valor 0.10 (100% - 90% = 10%).
Esta probabilidad de 0.10 de tener error se representa con el símbolo α, la letra griega alfa. Encontraríamos los valores t apropiados para valores 1-α de 95%, 98% y 99% en las columnas alfa encabezadas por los valores 0.05, 0.02 y 0.01, respectivamente.
Al utilizar la tabla t debemos especificar los grados de libertad con los cuales estamos tratando. Suponga que hacemos cálculos y se quiere estar 90% seguros de ello, con una muestra de tamaño 14, que tiene 13 grados de libertad. Se busca en la tabla t en la columna encabezada por el valor 0.10 hasta que se encuentre la hilera etiquetada con 13. Del mismo modo que con un valor Z, el valor encontrado en ese sitio, 1.771, indica que si señalamos una distancia de [pic 78] en ambos lados de la media, el área bajo la curva que se encuentra entre estos dos limites será 90% del área total, y el área que se encuentra fuera de tales límites (la posibilidad de error) será 10% del área total.
Ejemplo 4.2
Una estación de servicio localizada en una ciudad grande ha encontrado que sus ventas de gasolina tienen un promedio de 12.40 galones por cliente con una desviación estándar de 2.833.
Para una muestra aleatoria de 25 clientes, encuentra la probabilidad de que la compra promedio de gasolina:
- sea menor que 13.00 galones
- exceda los 13.37 galones
- exceda los 10.99 galones
...