CALCULO DE TAMAÑO DE MUESTRA
Enviado por monto2435 • 23 de Diciembre de 2018 • 2.566 Palabras (11 Páginas) • 407 Visitas
...
a elegir una probabilidad de aceptar una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar la hipótesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse.
La variabilidad es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere investigar en alguna investigación anterior o en un ensayo previo a la investigación actual. Del mismo modo se debe tener en cuenta que el cálculo del tamaño de muestra también se ve afectado por factores tales como los que se exponen a continuación:
La magnitud de las diferencias que se quiere detectar en la investigación, es decir, la importancia de la decisión a tomar. Si son pequeñas mayor será el tamaño muestral y viceversa.
La variación esperada en los datos, debido a fuentes de variación no controladas. A mayor variación será necesario un tamaño muestral mayor.
El número de tratamientos (o muestras) que se desea comparar. A mayor número de ellos, menor tamaño muestral.
Riesgo que está dispuesto a tomar el investigador. A menor riesgo, el tamaño deberá ser mayor. Aquí está incluida la potencia de la prueba que se desea. La complejidad de los análisis estadísticos. Cuanto más complejos el tamaño deberá ser más grande.
El número de variables o factores de estudio. Cuanto más numerosas, más grande tendrá que ser la muestra. El tamaño de la población. Para poblaciones finitas, el tamaño de muestra será menor que para poblaciones infinitas, pero la relación no es lineal.
Es importante tener en cuenta que existen una gran variedad ecuaciones para calcular el tamaño de muestra, entre las más importantes y mayormente usadas, tenemos las ecuaciones siguientes:
n= (Z^2 σ^2)/e^2 (1) n= (NZ^2 σ^2)/(e^2 (N-1)+σ^2 Z^2 ) (2)
n=(Z^2 pq)/e^2 (3) n=(NZ^2 σ^2)/(e^2 (N-1)+Z^2 pq) (4)
Dónde:
n Es el tamaño de la muestra.
N Es tamaño de la población.
σ Es la desviación estándar de la población, habitualmente cuando no se tiene su valor se utiliza un valor constante de 0,5.
Z Es el valor obtenido mediante niveles de confianza este es un valor constante que, si no se tiene su valor se toma en relación al porcentaje de confianza por ejemplo para un nivel de confianza de 95% equivale a 1,96 o en relación al 99% de confianza equivale 2,32.
e Se conoce como el límite aceptable de error muestral que generalmente cuando no se tiene su valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09).
Así mismo tenemos que p es la variabilidad positiva; y q es la variabilidad negativa.
Como se puede ver estas ecuaciones son muy similares entre sí, sin embargo el enfoque de cada una de ellas es distinto, pues la ecuación uno y la ecuación dos nos permite estimar promedios, es decir calcular el tamaño de muestra en estudios q se basan en datos cuantitativos, la ecuación uno para calcular el tamaño de la muestra cuando esta es infinita y la ecuación 2 para calcularla cuando la población es finita; mientras que las ecuaciones tres y cuatro nos permiten estimar proporciones es decir se enfocan básicamente en el cálculo del tamaño de muestra en estudios de variables cualitativas, por ejemplo cuando se desea calcular el porcentaje o proporción de amas de casa de una ciudad que prefieren consumir el nuevo detergente Blanquito, con un nivel de confianza de 95% y un error de 5%, siendo variables cualitativas por lo que se usaría la ecuación 3 puesto que no se conoce el tamaño de la población.
Ahora bien, si queremos calcular el promedio de cuanto en dólares gastan los estudiantes de una universidad en transporte usaríamos la ecuación 1 o 2, dependiendo si su población es infinita o finita.
En base a todo lo anteriormente expresado, y tomando en cuenta que hoy día la analítica deportiva es un campo en que los propietarios, entrenadores y aficionados están utilizando medidas estadísticas y modelos de todo tipo para estudiar el rendimiento de los jugadores y equipos, se realizó un estudio para conocer rendimientos de jugadores en el beisbol en este caso enfocándose en el promedio de bateo de los jugadores durante ocho temporadas en las cuales debían cumplir con al menos 400 turnos al bate en cada una de las temporadas esta restricción se impuso para asegurar que sólo se incluyeran jugadores regulares (los mejores en sus equipos en sus respectivas posiciones), se obtuvieron datos que contienen estadísticas para el análisis que consisten en promedio de bateo de cada temporada, edad, nacionalidad y promedio de bateo acumulado en estas ocho temporadas.
El promedio de bateo de un jugador es la proporción de su número de hits a su número de oportunidades para golpear (los turnos al bate). Hay 162 juegos en la temporada, y un jugador de posición regular (que es titular en su posición) normalmente tiene 4 o 5 turnos al bate por partido y acumula 600 o más en una temporada si no pierde muchos Juegos debido a lesiones o ser suspendido. La mayoría de los jugadores tienen promedios de bateo entre 0.250 y 0.300. Debido a que el promedio de bateo de un jugador en un año dado de su carrera es un promedio de un número muy grande de variables aleatorias, casi estadísticamente independientes, podría esperarse que se distribuya normalmente alrededor de su valor verdadero hipotético que está determinado por su habilidad de golpear la pelota. Además, es razonable esperar que estos valores verdaderos hipotéticos se distribuyan aproximadamente normales en la población y que en cierta medida se "hereden" de un año de la carrera de un jugador al siguiente (como la herencia de tamaño en los guisantes dulces de Galton). Por lo tanto, no debería sorprendernos que la distribución empírica de los promedios de bateo de todos los jugadores a lo largo de todos los años esté muy cerca de una distribución normal y que el rendimiento de un jugador en un año dado esté positivamente correlacionado con su promedio de bateo en años anteriores.
Como se expresó anteriormente en el presente estudio se quiere conocer el rendimiento de jugadores en el beisbol enfocándose en el promedio de bateo de los jugadores durante ocho temporadas, siendo
...