Medidas que resumen información
Enviado por Gaby67890 • 2 de Febrero de 2023 • Práctica o problema • 3.656 Palabras (15 Páginas) • 252 Visitas
Medidas que resumen información
Interpretación de las bases de datos
En el módulo anterior estudiamos distribuciones de frecuencias y su valor para resumir información a través de tablas y gráficos. Aún se puede resumir mucho más sin que por eso se pierda la posibilidad de rescatar la información verdaderamente útil y que resulta de interés para proyectar una estrategia de negocios. Continuando con estadística descriptiva, estudiaremos las medidas más utilizadas para resumir información: medidas de tendencia central, posición y dispersión.
Medidas de tendencia central
[pic 1]Las medidas de tendencia central resumen los datos a un solo valor central de la distribución. Ese valor central puede ser calculado de distintas maneras, de modo que existen distintas medidas de tendencia central. Reciben la denominación general de promedios. Las tres medidas de tendencia central más relevantes son:
Media aritmética o promedio
Es el resultado de sumar todos los valores de una variable cuantitativa y luego dividir por la cantidad de datos que hemos sumado (n para una muestra o N, si se tratara de una
población). A la media de una muestra se la simboliza generalmente como x y al de una población µ. Por ejemplo, la taba muestra el consumo en los supermercados (el mismo que ya analizamos en un módulo anterior). Calculemos el promedio (media aritmética) de la muestra de cien casos. [pic 2]
7215 3243 2295 3600 2454 5739 3375 9933 3960 1455
4695 4479 2226 8946 3909 3186 3960 6213 2589 5967
5880 7188 6714 6327 4101 7050 10005 3336 6534 1650
4530 8799 11950 2601 4485 8043 3672 4530 4050 7050
4110 6081 3309 2253 5100 5106 14520 6300 4155 3840
6345 6270 4296 12725 3642 2778 1983 4074 5232 5160
5730 4623 6300 2280 5634 1773 3369 1524 1665 5715
4272 3930 3030 2577 4275 3186 2883 3816 2589 4152
4419 5265 4455 6552 2232 6639 6570 1545 4371 1635
5472 2850 5043 3045 2004 2634 5160 5121 5055 8361
x x1 x2 xn 1i n xi [pic 3][pic 4]
n n i1
El promedio es igual a 4769,64 pesos.
Mediana
La mediana es el valor que divide a la muestra (o a la población) en dos mitades, una de las cuales consiste en todos los datos menores y la otra es todos los datos mayores. Por ejemplo, si se tienen los datos 8, 4, 3, 1, y 7 primero se los orden en forma creciente: 1, 3, 4, 7 y 8; luego, se cuenta cuántos valores son: son cinco valores. Por lo tanto, la mediana será el tercer valor, el 4, pues deja la mitad de los datos por debajo (1 y 3) y la otra mitad por arriba (7 y 8). Si la muestra (o la población) tuviera un número par de observaciones, la mediana es el promedio de los dos valores centrales. Por ejemplo, si se tienen los datos 2, 8, 4, 3, 1, y 7 se los orden en forma creciente: 1, 2, 3, 4, 7 y 8; son seis valores de los cuales 3 y 4 son los centrales. Por lo tanto, la mediana será el tercer valor, el 3,5 (el promedio de 3 y 4).
Usando los cien datos de la tabla del consumo semanal en supermercados, la mediana es $4333,5 (el promedio entre el 50vo valor: 4296 y el 51vo: 4371). Este valor no está entre los cien datos, pero eso no presenta ningún inconveniente para la estadística.
Modo
El modo es el valor más frecuente de la distribución. Es posible que haya distribuciones cuyos valores (todos) tengan la misma frecuencia. En esos casos, la distribución de los datos carece de modo. También puede suceder que exista más de un modo. Por ejemplo, para la serie 1, 2, 3, 3, 3, 4, 4, 5, el modo es 3, pero la serie 1, 2, 3, 3, 3, 4, 4, 4, 5, es bimodal, sus modos son 3 y 4.
Medidas de posición
Las medidas de posición son medidas que se obtienen a partir de la distribución de los datos clasificados en forma ascendente. Una vez ordenados, se buscan ciertas posiciones específicas de interés. Los más comunes son los cuartiles, los deciles y los percentiles.
Los cuartiles son posiciones que dividen la distribución de los datos en cuatro tramos. El primero va desde el valor mínimo hasta el valor que deja por debajo suyo, por lo menos, al 25% de los datos y por encima suyo, por lo menos, al 75% de los mismos; este valor recibe el nombre de primer cuartil ( Q1). El segundo cuartil va desde el Q1 hasta el valor que deja por debajo suyo, por lo menos, al 50% de los datos y por encima suyo, por lo menos, al otro 50% de los mismos. Este valor coincide con la mediana de la distribución. Q3 va desde la mediana hasta el valor que deja por debajo suyo, por lo menos, al 75% de los datos y por encima suyo, por lo menos, al 25% de los mismos. El último cuartilo va desde Q3 hasta el valor máximo.
...