La Regresión Lineal y la correlación, como herramienta de Pronóstico.
Enviado por klimbo3445 • 8 de Marzo de 2018 • 2.251 Palabras (10 Páginas) • 505 Visitas
...
[pic 6]
1 El Producto Bruto Interno es una magnitud macroeconómica que expresa el valor monetario de la producción de bienes y servicios de demanda final de un país o una región durante un periodo determinado de tiempo que normalmente es un año.
2 Es el grado máximo de los exponentes de las variables de los monomios que lo componen. Tiene básicamente el mismo significado cuando se refiere a un polinomio o a una ecuación algebraica
3 Situación en donde dos o más variables de medidas se creen estadísticamente relacionadas pero no tienen relación de causalidad entre ellas en realidad. En otras palabras, relación matemática entre acontecimientos que no tienen ninguna conexión lógica.
En minería, hoy en día se hace uso de esta herramienta para determinar modelos de recuperación metalúrgica por tipos de minerales, es decir se determinan variables independientes como ley del mineral valioso (%), contenido de interferentes o contaminantes (%), grado de oxidación4, entre otros que influyen en la variable dependiente que es la Recuperación del metal en el Proceso. Siendo este valor muy importante para la determinación de los planes de producción anuales y además en las estimaciones de las utilidades netas a generar en el negocio minero – metalúrgico.
Desde el punto de vista teórico puedo destacar lo siguiente:
El modelo lineal relaciona la variable dependiente Y con K variables explícitas [pic 7] (k = 1,...K), o cualquier transformación de éstas que generen un hiperplano5 de parámetros [pic 8] desconocidos:[pic 9]
donde [pic 10] es la perturbación aleatoria que recoge todos aquellos factores de la realidad no controlables u observables y que por tanto se asocian con el azar, y es la que confiere al modelo
[pic 11]
4 Indicador del grado de oxidación de un átomo que forma parte de un compuesto u otra especie química
5 En un espacio unidimensional (como una recta), un hiperplano es un punto: divide una línea en dos líneas. Este concepto también puede ser aplicado a espacios de dos, tres, cuatro dimensiones y más.
su carácter estocástico6. En el caso más sencillo, con una sola variable explícita, el hiperplano es una recta:[pic 12]
El problema de la regresión consiste en elegir unos valores determinados para los parámetros desconocidos[pic 13], de modo que la ecuación quede completamente especificada. Para ello se necesita un conjunto de observaciones. En una observación i-ésima (i= 1,... I) cualquiera, se registra el comportamiento simultáneo de la variable dependiente y las variables explícitas (las perturbaciones aleatorias se suponen no observables).[pic 14]
.
Los valores escogidos como estimadores de los parámetros[pic 15], son los coeficientes de regresión sin que se pueda garantizar que coincidan con parámetros reales del proceso generador. Por tanto, en[pic 16]
Los valores [pic 17] son por su parte estimaciones o errores de la perturbación aleatoria.
[pic 18]
6 Es un concepto matemático que sirve para tratar con magnitudes aleatorias que varían con el tiempo, o más exactamente para caracterizar una sucesión de variables aleatorias(estocásticas) que evolucionan en función de otra variable, generalmente el tiempo
Se puede sintetizar en que el objetivo de un análisis de regresión es determinar la relación que existe entre una variable dependiente y una o más variables independientes. Para poder realizar esta relación, se debe postular una relación funcional entre las variables. Cuando se trata de una variable independiente, la forma funcional que más se utiliza en la práctica es la relación lineal. El análisis de regresión entonces determina la intensidad entre las variables a través de coeficientes de correlación y determinación.
El coeficiente de correlación, comúnmente identificado como r o R, es una medida de asociación entre las variables aleatorias X y Y, cuyo valor varía entre -1 y +1. [pic 19]
Figura 2: Ejemplo de una Correlación. Fuente: http://www.ingenieriaindustrialonline
Pero es necesario aprender a determinar cómo reconocer si una relación es directa o inversa, y esto lo podremos ver en el siguiente cuadro:
[pic 20]
Figura 3: Ejemplo de una Correlación. Fuente: http://www.dmae.upm.es/WebpersonalBartolo/Probabilidad/15_RegresionLineal.pdf
También es importante que se describa el coeficiente de determinación, donde este valor es la principal forma en que podemos medir la extensión, o fuerza de asociación que existe entre dos variables, X y Y. Puesto que hemos desarrollado una muestra de puntos para desarrollar las líneas de regresión, nos referimos a esta medida como el coeficiente de determinación de la muestra.
El coeficiente de determinación de la muestra se desarrolla de la relación entre dos tipos de variación: la variación de los valores Y en conjunto de los datos alrededor de la línea de regresión ajustada a su propia media. El termino variación en estos dos casos se refiere a “la suma de un grupo de desviaciones cuadradas”.
Una correlación perfecta es aquella en que todos los valores de Y caen en la línea de estimación, por lo tanto el coeficiente de determinación es 1. Cuando el valor del coeficiente de determinación es 0 quiere decir que no hay correlación entre las dos variables. En los problemas con que se topa la mayoría de los responsables de la toma de decisiones, r2 caerá en alguna parte entre estos dos extremos de 1 y 0. Recuerde, no obstante que un r2 cercano a 1 indica una fuerte correlación entre X y Y, mientras que un r2 cercano a 0 significa que existe poca correlación entre estas dos variables.
Un punto que se debe subrayar fuertemente es que r2 mide solo la fuerza de una relación lineal entre dos variables.
Los estadísticos también interpretan el coeficiente de determinación viendo la cantidad de variación en Y que es explicada por la línea de regresión.
El análisis de regresión es una técnica estadística para investigar la relación funcional entre dos o más variables, ajustando algún modelo matemático. La regresión lineal simple utiliza una sola variable de regresión y el caso más
...