Procesos Estocásticos Entrega Intermedia – Proyecto Final
Enviado por Ledesma • 22 de Diciembre de 2018 • 3.633 Palabras (15 Páginas) • 433 Visitas
...
[pic 12]
Se debe aclarar que esta entrega parcial solo tomará en cuenta las dos primeras etapas descritas anteriormente, es decir, el cálculo del tiempo de permanencia en el sistema () y el cálculo de las probabilidades de transición (a través de la matriz P).[pic 13]
- Datos específicos de entrada:
En primer lugar, es necesario establecer que, para desarrollar este proyecto de acuerdo a los procedimientos descritos por Cheng, Chiu, Cheng y Wu, ha sido necesario construir una simulación de las variables identificadas, puesto que el Paper hace mención de unos datos de estudio a los cuales no ha sido posible acceder para su manipulación. Debido a lo anterior, la simulación se ha planteado con el mismo tamaño de muestra señalado en el Paper (3239 clientes) y a partir de las distribuciones de las variables edad del ultimo carro comprado y promedio de dinero gastado por visita para el concesionario. Estas distribuciones se pueden observar en las siguientes tablas:
[pic 14]
[pic 15]
A partir de estas distribuciones se utilizaron números aleatorios con tales magnitudes y porcentajes; las otras variables fueron obtenidas con valores aleatorios igualmente y haciendo los siguientes supuestos:
- Se han tomado las variables que son consideradas como significativas en el paper de autores C.-J. Cheng, S.W. Chiu, C.-B. Cheng y J.-Y. Wu para el cálculo del tiempo de permanencia en el sistema para cliente (edad en años del automóvil actual del cliente antes de comprar uno nuevo, valor promedio que cada cliente del estudio ha gastado en el concesionario, frecuencia de visita al concesionario, total de carros comprados a ese concesionario y la probabilidad de que el año actual (año de realización del estudio) el cliente haya abandonado el concesionario). Estas variables constituyen los datos de entrada para este proyecto práctico.
- Se asume que este estudio ocurre en el mismo horizonte temporal que aquel establecido en el Paper, el cual tuvo lugar en 1990.
- La edad del último carro comprado en el concesionario se supuso desde una edad menor a 1 año y máximo hasta 21 años.
- El gasto total promedio por cada compra realizado en el concesionario se supuso desde el rango de 0 a 2.000 USD hasta un valor máximo de 30.000 USD
- La frecuencia, o cantidad de visitadas realizadas por año al concesionario por cliente fue tomada desde 0 hasta un máximo de 8 visitas.
- La cantidad de vehículos adquiridos en ese concesionario históricamente por cada cliente fue tomada desde 0 hasta un máximo de 20 vehículos.
- La probabilidad de que el cliente haya abandonado el concesionario para el año en el cual se realizó el estudio fue calculada de la siguiente manera: se asumió que, como dicha probabilidad correspondió al 25% en el estudio del Paper, se le asignó ese mismo valor para este ejercicio. De esta manera, de los 3239 clientes de esta muestra, se considera que para 1990, 810 habían abandonado el concesionario, mientras que el resto de usuarios permanecían como clientes del sistema.
Estos datos de entrada fueron calculados, obtenidos y clasificados en una tabla que puede encontrarse en un archivo.xlx anexo a este documento, que tiene la siguiente estructura:
[pic 16]
- Procedimientos para lograr los resultados:
En primera instancia se decidió analizar detalladamente el artículo a estudiar, siguiendo con el proceso que llevaron los autores se creó una base de datos “Histórica”; al no tener ningún dato, bajo una distribución aleatoria se crearon aproximadamente 3000 datos para usar como referencia dentro de los cálculos que se ven reflejados en la implementación preliminar.
Se usó el software R studio para hacer el cálculo de la regresión logística y bajo los parámetros encontrados en la misma se encontraron probabilidades que facilitan la toma de decisiones para lo que se quiere realizar. Bajo estos resultados se hicieron aproximaciones de cadenas de Markov, con lo cual se puede modelar este sistema.
En segunda etapa se logró encontrar las probabilidades de transición del sistema y los lambdas para hallar las mismas. Esto bajo un enfoque de cadenas de Markov como se mencionaba anteriormente. La evidencia de los cálculos y resultados se encuentra en el archivo de Excel adjunto.
- Implementación preliminar:
Resultados primera etapa (ponga lo del tiempo de permanencia)
Probabilidad abandono del sistema (formula) del cliente k:
[pic 17]
Siendo: la media global del modelo de regresión, la variable Edad del último carro comprado, la variable Gasto por visita al concesionario, la variable Frecuencia de visita y la variable Número de Carros comprados en el concesionario. Los coeficientes son los valores que acompañan a y respectivamente.[pic 18][pic 19][pic 20][pic 21][pic 22][pic 23][pic 24][pic 25][pic 26]
Tiempo de permanencia en el sistema
[pic 27]
Resultados segunda etapa (cuales son los estados, los lambdas y la matriz de transición)
Evidencia del análisis de regresión logística extraido del programa R Studio:
Call:
glm(formula = Abandono ~ `Edad del ultimo carro` + `Gasto por visita` +
`Frecuencia Visita` + `Numero Carros comprados`, family = "binomial",
data = Datos_finales)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.028e-05 -9.832e-06 -2.110e-08 4.331e-06 9.850e-06
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.400e+01 6.029e+03 0.004 0.997
`Edad del ultimo carro` -1.356e-02 9.125e+02 0.000 1.000
`Gasto por visita` 1.241e-07 5.630e-01
...