Portada Licenciatura en Administración de Tecnología de Información
Enviado por Sandra75 • 25 de Septiembre de 2018 • 1.233 Palabras (5 Páginas) • 349 Visitas
...
En el análisis de la matriz de confusión podemos observar que cuando verdaderamente fue N obtuvo un 75% de precisión y cuando verdaderamente fue S obtuvo un 25 %.
Podemos deducir que el análisis no fue el más adecuado debido a que solo hubo un 55% de exactitud.
[pic 8]
Ejercicio #2
En este caso, se tienen los datos de clientes de un banco y se desea determinar si un cliente pagará o no pagará el préstamo al cabo del plazo inicial de 10 años. Los datos están en el archivo germanCredit.csv.
Primera mente se mostrará un screenshot de la ejecución correcta del proceso:
[pic 9]
[pic 10]
- Indique el tipo de problema de minería de datos
-El tipo de problema de minería de datos es: predictivo
- Indique la tarea de minería de datos.
-La tarea de minería de datos es: clasificación
- Debe dividir los datos en dos conjuntos (70% training y 30% testing). Debe incluir un screenshot.
Se puede observar en la siguiente imagen que se predetermina un training de 70% y un testing del 30%, esto se puede comprobar observando el recuadro gris a la derecha (remarcado con el cuadro rojo )
[pic 11][pic 12]
- ¿Según el modelo generado, bajo cuáles condiciones una persona paga el préstamo en 10 años? ¿Bajo cuáles no lo hace? Debe incluir un screenshot donde se observe claramente el modelo, en este caso, el árbol de decisión.
La primera condición que dispone el árbol es por edad, cuando la edad es mayor que 35 años, los clientes no pagan en el plazo inicial de diez años, cuando la edad es menor o igual que 35 años de edad, pone otra condición de ingresos cuando los ingresos son mayores que 20129, pasa a una subdivisión donde pone otra condición de ingreso si los ingresos son mayores que 696…, si paga dentro del plazo inicial de 10años, si no son mayores al dato anterior no pagan dentro del plazo inicial de 10 años (pero se observa un error de datos choque de colores azul y rojo), volviendo a la condición antes de la subdivisión si los ingresos son mayores a 20129.500, los clientes si pagan dentro del plazo inicial de 10 años.
[pic 13]
-Se adjunta descripción del árbol para entenderlo de una forma más amplia:
Tree
edad > 35.500: 0 {0=1235, 1=0}
edad ≤ 35.500
| ingresos > 20129.500
| | ingresos > 69605.500: 1 {0=0, 1=2}
| | ingresos ≤ 69605.500: 0 {0=482, 1=279}
| ingresos ≤ 20129.500: 1 {0=0, 1=2}
- Explique los resultados de la matriz de confusión. Además, incluya un screenshot donde se observe claramente la matriz de confusión.
Como podemos observar, que el análisis de los datos obtuvo un 88% de exactitud.
Nos muestra que predijo 0, en 528 de aciertos cuando fueron verdaderamente, pero cuando predijo cero y realmente era 1 tuvo 71 errores de aciertos, es por esto que la precisión fue de un 88.15%, una predicción muy alta.
Cuando la predicción 1, y eran 0 verdad, hubo 1 acierto que realmente era cero, cuando predijo verdad 1, encontró 0 predicciones de predicción de 1 que realmente eran uno, es por eso que predicción da 0.00% debido a que no encontró predicciones de 1
En el análisis de la matriz de confusión podemos observar que cuando verdaderamente fue verdad 0 obtuvo un 99.81% de precisión y cuando verdaderamente fue 1 obtuvo un 0.00 %.
Podemos deducir que el análisis fue bastante preciso debido a que la exactitud posee un porcentaje bastante alto, el cual es de 88.00%
[pic 14]
...