BIOESTADÍSTICA SIMPLE USANDO EXCEL
Enviado por Eric • 5 de Diciembre de 2018 • 3.247 Palabras (13 Páginas) • 308 Visitas
...
(R) para datos normalmente distribuidos (paramétricos), y el coeficiente de correlación de orden de clasificación de Spearman (r) para datos que no están distribuidos normalmente (datos no paramétricos). Ambos varían de +1 (correlación perfecta) a 0 (sin correlación) a -1 (correlación negativa perfecta). En Excel el coeficiente de Pearson se puede encontrar por dos fórmulas alternativas
[pic 65]
No hay una fórmula directa para el coeficiente de Spearman, pero se puede calcular haciendo primero dos nuevas columnas para las filas de los datos originales. Para cada una de las dos variables el valor más grande se da un rango de 1, el siguiente mayor un rango de 2, y así sucesivamente. Esto se puede hacer mas simplemente a mano, o para los conjuntos de datos grandes, usando el comando de Excel = RANK.
El coeficiente de Spearman es simplemente el coeficiente de Pearson calculado sobre los datos de rango, ignorando los datos originales. Ambos coeficientes se demuestran en la Figura 4. Esto muestra medidas sobre el tamaño de los pares reproductores de pingüinos para ver si existe una correlación entre los tamaños de los dos sexos. El coeficiente de Spearman rs (0,77) es más conservador que el coeficiente de Pearson r (0,88), pero ambos muestran una fuerte correlación positiva
[pic 66]
REGRESIÓN LINEAL
-
FIG.4: Dos tipos de coeficientes de correlación. Los datos son las longitudes de un hueso de pierna (en mm) en parejas de apareamiento de pingüinos. El coeficiente de Pearson r se puede calcular directamente a partir de los datos, pero el coeficiente de Spearman r debe calcularse a partir de las filas de los datos. Las filas pueden ser introducidas a mano o calculadas usando la fórmula de Excel = RANK
REGRESIÓN LINEAL
La regresión se usa cuando tenemos razones para creer que los cambios en una variable causan los cambios en la otra. Una correlación no es evidencia de una relación causal, pero muy a menudo somos conscientes de una relación causal y diseñamos un experimento para investigarlo más a fondo. El tipo más simple de relación causal es una relación de línea recta, y esto puede analizarse mediante regresión lineal. Esto ajusta una línea recta a los datos usando un método de mínimos cuadrados, y da los valores de la pendiente y la intersección que definen la línea (m y c en la ecuación y = mx + c). Hay varias maneras diferentes de calcular la pendiente y la interceptación de una línea de regresión lineal en Excel, pero la más simple es trazar un gráfico de dispersión y usar la característica de la línea de tendencia del gráfico. Haga clic con el botón derecho en cualquier punto de datos del gráfico, seleccione Agregar línea de tendencia y elija Lineal. Haga clic en la ficha Opciones y seleccione Mostrar ecuación en el gráfico. También puede elegir establecer que la intercepción sea cero (o algún otro valor), y mostrar r2 (el cuadrado del coeficiente de correlación de Pearson). La ecuación completa con los valores de pendiente e intercepción se muestra ahora en el gráfico. Esto se demuestra en la Figura 5, que muestra los datos obtenidos de contar una suspensión de células de levadura en un hemocitómetro y en un colorímetro. Esperamos una relación causal lineal entre la densidad celular y la turbiedad, por lo que esta es una buena ocasión para usar la regresión, y podemos usar la ecuación para predecir el recuento celular para una absorbancia dada.
[pic 67]
FIG. 5: Regresión lineal. El gráfico de dispersión tiene una línea de tendencia con la ecuación de regresión mostrada. En este caso, la intercepción se fijó en cero, lo cual es apropiado para estos datos
- ESTADÍSTICOS DE COMPARACIÓN:
Otra tarea común en el análisis de datos es comparar dos o más conjuntos de datos para determinar si son básicamente los mismos (es decir, podrían provenir de la misma población) o si un conjunto es significativamente diferente de los otros. Para empezar, es una buena práctica calcular las medias y los Intervalos de confianza (IC) para los diferentes grupos y trazar un gráfico de barras con los IC representados como barras de error. Esto nos da una buena idea visual de lo diferente que son los grupos. A veces se piensa que si las barras de error no se superponen, entonces debe haber una diferencia significativa entre los datos, pero esto no es necesariamente cierto, y una prueba estadística de comparación es necesaria para probar diferencias significativas. El resultado final de tales pruebas es una probabilidad (P) de que la 'hipótesis nula' (que siempre indica que no hay diferencia entre los conjuntos de datos) es verdadera. En biología usualmente aceptamos que las diferencias son significativas si P es menor que 5%, así que si P 5% entonces podemos decir que no hay diferencia significativa entre los conjuntos de datos (es decir, aceptar la hipótesis nula).
t-test
La prueba estadística comparativa más común es la prueba t, que se utiliza cuando hay sólo dos conjuntos de datos distribuidos normalmente para comparar. En Excel esto se realiza mediante la fórmula
[pic 68]
Que devuelve P directamente (no la estadística t en sí, que no se informa y no es necesario). Las colas pueden ser 1 para una prueba de una cola o 2 para una prueba de dos colas, pero en biología generalmente queremos la prueba de dos colas, que prueba las diferencias independientemente del signo. El tipo puede ser 1 para datos emparejados (cuando los dos conjuntos son de los mismos individuos) o 2 para datos no emparejados (donde los conjuntos son de individuos diferentes), y ambos son comunes.
Ambos tipos de prueba t se demuestran en la Figura 6. En la prueba no apareada (tipo 2) se comparó el rendimiento de patatas en 10 parcelas tratadas con un fertilizante con el de 10 parcelas tratadas con otro fertilizante. El fertilizante B ofrece un rendimiento medio mayor, pero el test t muestra que existe un 8% de probabilidad de que estos dos conjuntos no sean realmente diferentes. Dado que esto es más del 5%, debemos concluir que el fertilizante B no es significativamente mejor que el fertilizante A. En la prueba pareada (tipo 1), se midió la frecuencia de pulso de 8 individuos antes y después de una comida grande. La frecuencia media del pulso es un poco mayor después de la comida, y la prueba t muestra que hay sólo una pequeña probabilidad del 0,006%
...