Correlación El concepto de correlación
Enviado por Helena • 9 de Marzo de 2018 • 8.011 Palabras (33 Páginas) • 259 Visitas
...
• Estas características son verdaderas para los coeficientes de correlación que miden la relación lineal, pero no lo son para todos los coeficientes de correlación.
Ejemplo de correlación curvilínea aplicado a variables que describen situaciones de los países.
[pic 1]
PAIS
PNB PER CAPITA EN DOLARES
X
ESPERANZA DE VIDA. AÑOS
Y
Afganistán
75
40
Nigeria
135
39
Nepal
87
43
Zaire
90
45
Tanzania
120
44
Indonesia
80
48
Uganda
140
49
China
170
53
Vietnam del Sur
245
54
Irán
370
54
Turquía
760
57
Brasil
500
63
Taiwán
460
69
México
770
64
Venezuela
1000
66
Argentina
1300
67
¿Existe una relación entre el producto nacional bruto (PNB) per cápita, expresado en dólares, y la esperanza de vida de los niños nacidos actualmente en los países no desarrollados?
En la tabla adjunta se muestran los ingresos per cápita y la esperanza de vida en dieciséis naciones. A estas variables las hemos llamado X e Y, donde X es el valor en dólares del PN B, e Y el valor de la esperanza de vida. Nótese que para cada nación hay dos valores, uno para la variable X y otro para la variable Y.
Para ayudar a visualizar estas relaciones, se ha dibujado un diagrama de dispersión.
Es tradicional representar los valores de la variable X en el eje horizontal (llamado también eje X o eje de las abscisas) y los valores de la variable Y en el eje vertical (llamado también eje Yo eje de las ordenadas). Los puntos que aparecen en el diagrama de dispersión adjunto representan los pares de valores X e Y para cada nación. Veamos el procedimiento para construir un diagrama de dispersión.
Obsérvese que el valor de X para Afganistán es 75, y que el correspondiente valor de y es 40. Situemos en el eje X el valor de 75. Levantemos una perpendicular al eje X en este punto. Situemos ahora el valor de 40 en el eje Y. Tracemos por este punto una perpendicular al eje Y. El punto en que se cortan ambas rectas representa el valor de cada variable, X e y, para Afganistán.
Los diagramas de dispersión son útiles para representar la relación entre dos variables. En el diagrama anterior se aprecia que hay una relación real entre X e Y (o sea, que los valores bajos en X están generalmente asociados a valores bajos de Y, y los valores altos de X lo están con valores altos en Y). Dicho de otro modo, los ciudadanos de los países no desarrollados con un alto PNB per cápita tienen una larga esperanza de vida. Los ciudadanos de los países con bajo PNB tienen una corta esperanza de vida. También se aprecia que la relación no es lineal (línea recta), sino curvilínea.
---------------------------------------------------------------
[pic 2]
Fig. 1 Diagramas de dispersión que muestran varios grados de relación entre dos variables.
La r de Pearson y los valores z
Un valor positivo alto de la r de Pearson indica que cada individuo obtiene, aproximadamente, las mismas calificaciones z en ambas variables. En una correlación positiva perfecta (r = 1.00), cada individuo obtiene exactamente la misma calificación z en ambas variables.
Con una r negativa alta, cada individuo obtiene aproximadamente la misma calificación z en ambas variables, pero con signos diferentes.
Recordando que el valor z representa una medida de posición relativa en una variable dada (es decir, un valor positivo alto de z representa una alta calificación relativa al resto de la distribución, y un valor negativo alto de z representa una baja calificación relativa al resto de la distribución), es posible, ahora, generalizar el significado de la r de Pearson.
La r de Pearson es una medida del grado en que los mismos individuos o sucesos ocupan la misma posición relativa respecto a dos variables.
Con el fin de investigar las características fundamentales de la r de Pearson, examinemos un ejemplo simplificado de una correlación positiva perfecta. En la tabla 2 encontramos las parejas de valores para 7 individuos respecto a dos variables X e Y.
Tabla 2. Calificaciones originales y sus correspondientes valores z de 7 individuos con respecto a dos variables
...