Estadística Descriptiva. Ciencia que estudia una variable observable observada
Enviado por Ensa05 • 6 de Febrero de 2018 • 2.078 Palabras (9 Páginas) • 486 Visitas
...
La media aritmética se ve afectada en gran medida por valores extremos.
Su fórmula en:
- Serie simple → Xraya= Σ Xi / n
- Datos Agrupados por Frecuencia → Xraya= ΣXi Ni / n
- Datos Agrupados por Intervalos → Xraya= ΣXi Ni / n
Características de la Media Aritmética: Univoca, en la misma constante. La Σ de los desvíos de los valores respecto a la MA riempre va a ser 0 → Σ (Xi – Xraya) = 0
6 7 8 → 7 PROMEDIO → Valor de la Xi – Xraya= 0[pic 1][pic 2]
7 7 7
-1 0 1
Promedio Geométrico: La Mg depende de su conjunto de valores y frecuencias. Presenta una ventaja ya que está menos afectada que la MA por los valores extremos. En gral, la MG es menos usada que la MA porque es más laborioso el cálculo, es una explicación científica menos inmediata, más fácil de interpretar.
La MG es muy sensible a valores pequeños de la variable, sí hay valores nulos y negativos no se puede sacar la MG.
La MA es casi siempre mayor que la MG, en algunos casos es =, y es así cuando es una constante.
Ej: X1= 4
X2= 4
MA= 4+4/2} 4
MG= RAÍZ CUADRADA DE 4x4} RAÍZ CUADRADA DE 16} 4[pic 3]
El log de la MG es = a la MA de los log de los valores de las variables
LOG XrayaG= n1logX1
n2logX2
Promedio armónico: MH su uso es excepcional, en gral se utiliza para comparar la Q de variables de una especie, con una Q de constante de otra.
MH= n (Q de variables) / suma de los inversos (Σ Q de variables a la inversa) ni/xi
La inversa de la MA es = a 1/XrayaH
Es más chica que la MG, si son constantes son =.[pic 4]
MG= RAÍZ CUADRADA DE MA x MH.
Mediana: Es el valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad de las observaciones serán menores y la otra mitad serán mayores. La mediana no se ve afectada por valores extremos. Es de posición, indica un valor que no supera el 50%, ni es superado por el 50%. Para calcular la mediana:
- Serie Simple: Ordenar, sí es una serie impar será el valor central, y sí es una serie par entonces será el promedio de los dos valores centrales.
1, 2, 3, 4, 5 (n+1:2) → Posición.
1, 2, 3, 4, 5, 6} 3+4/2} 3,5
- Datos Agrupados por Frecuencia: Calcular n/2, calcular la Frecuencia Acumulada. Verificar el 1º valor que supere o iguales a n/2 en Frecuencia Acumulada, sí lo supera la mediana es el valor de la variable, y sí lo iguala es el promedio entre el valor de la variable y valor de la variable siguiente.
- Datos Agrupados por Intervalos: Calcular el nx0,5 (n/2), calcular la Frecuencia Acumulada, verificar el 1º valor que supere o iguale a n/2 en Frec. Acumulada, y usar la siguiente fórmula: Linf + (nx0.5 – F acumulada anterior) / n1 x [pic 5]
Amplitud del intervalo (Ls- Li) [pic 6]
El cálculo del valor de la media se ve afectado por el número de observaciones, no por la magnitud de cualquier extremo.
Moda. Es el valor de una serie de datos que aparece con más frecuencia. La moda no se ve afectada por la ocurrencia de cualquier valor extremo. ¿Cuándo usar moda? Cuando se repita más de un valor (sino sería amodal) Es una medida de frecuencia.
- Serie Simple: Valor de variable que más se repite.
- Datos Agrupados por Frecuencia: Valor de variable (Xi) de la frecuencia absoluta (Ni) que más se repite.
- Datos Agrupados por Intervalos: Determinar el intervalo modal como el que más Frecuencia Absoluta tenga. Linf + D1 / D1 + D2 [pic 7]
D1= Es la resta de la Frecuencia Absoluta mayor a la anterior.
D2= Es la resta de la Frecuencia mayor con la posterior.
Cuartiles: Los cuartiles son mediciones descriptivas que dividen los datos ordenados en cuatro cuartos (Cuartir 1º= P25 / Cuartir 2º= P50 –Mediana- / Cuartir 3º= P75). Se da en los Datos Agrupados por Intervalos: Calcular el n x pe, calcular la Frecuencia Absoluta. Verificar el 1º valor que supere o iguales a n x pe en Frec. Acumulada. Usar la fórmula: Linf + (nxpe – Frec. acumulada anterior) / ni [pic 8]
Mediciones de la Variación:
El rango: Es la diferencia entre la mayor y la menor observación en una serie de datos (Ls-Li). El rango mide la propagación total en la serie de datos. La debilidad del rango es que no logra tomar en cuenta la forma en que los datos se distribuyen realmente entre el mayor y el menor valor. Sería impropio usar el rango como una medición cuando uno de o ambos componentes son observaciones extremas.
Marca de clase: Punto medio del intervalo. Ej → 12 – 8 (12+8) : 2= 10
El rango intercuartil: Es la diferencia entre el tercer y primer cuartil. No se ve influida por valores extremos.
La varianza y la desviación estándar: A diferencia de las mediciones anteriores la varianza y la desviación estándar toman en cuenta como se distribuyen las observaciones. La varianza de muestra es el promedio de las diferencias cuadradas entre cada una de las observaciones de una serie de datos y la media. El objeto de esta es caracterizar el agrupamiento de los valores de la distribución alrededor de la media artimética. Puede significar valores muy grandes, que significa que la variabilidad de los valores está bastante alejada de la media aritmética a la inversa de un valor pequeño, que están concentrados en la cercanía de la Xraya. La desviación estándar es simplemente la raíz cuadrada de la varianza. La varianza y la desviación miden la dispersión promedio alrededor de la media, es decir, como las observaciones
...