Nteligencia de Negocio Caso práctico
Enviado por pperezgr • 31 de Agosto de 2022 • Práctica o problema • 1.225 Palabras (5 Páginas) • 338 Visitas
Pedro Antonio Perez-Griffo Cuesta
pperez@gmail.com
Inteligencia de Negocio
Caso práctico.
Análisis de fuentes:
- Descripción global de las fuentes.
- Descripción en detalle de cada campo.
- Tipo de campo, naturaleza, cardinalidad aproximada.
Descripción global de las fuentes
La única fuente de datos proporcionada es el fichero Mystery Shopping “IMF_M5_Mystery_Shopping.csv”, donde se observan todas las métricas y dimensiones.
Adicionalmente y para normalizar las localidades se usa el fichero 11codmun.xls descargada de la página del INE e incorporada al proceso de carga y trasformación de datos
Descripción en detalle de cada campo.
IMF_M5_Mystery_Shopping.csv
Campo | Descripción | Tipo | Cardinalidad |
COD_LOC | Código Localización | Carácter | 5645 |
NOMBRE_LOC | Localización | Texto | 6556 |
CP | Código Postal | Numérico | 1797 |
POBLACION | Población | Texto | 1655 |
OFICINA | Oficina | Texto | 13 |
PROVINCIA | Provincia | Texto | 53 |
COD_PROY | Código de yecto | Texto | 224 |
ID_EVALUACION | Id de Evaluación | Numérico | 32797 |
FECHA DE EJECUCION | Fecha de ejecución | Fecha | 189 |
COD_AUDITOR | Código del Auditor / Auditoría | Texto | 1145 |
RESULTADO | Resultado | Decimal | 4205 |
TITULO_CUESTIONARIO | Título del Cuestionario | Texto | 439 |
Fichero 11codmun.xls del INE
Campo | Descripción | Tipo | Cardinalidad |
CPRO | Código Provincia | Carácter | 54 |
CMUN | Código de municipio | Carácter | 474 |
DC | Dígito Control | Numérico | 10 |
NOMBRE | Nombre del municipio | Texto | 8101 |
Tipo de campo, naturaleza, cardinalidad aproximada.
Para cada campo, se ha definido en la tabla superior el tipo de campo
Si entendemos la cardinalidad en una sola columna o campo como en número de valores únicos, dicha cardinalidad del campo está indicada en las tablas. Una baja cardinalidad significa que solo hay unos pocos valores únicos (como en el campo OFICINA). Una alta cardinalidad significa que hay muchos valores únicos (como en el campo ID_EVALUACION).
Si entendemos la Cardinalidad como el número de registros únicos que contiene la tabla, la cardinalidad es de:
IMF_M5_Mystery_Shopping: 32797
11codmun: 8117
Si entendemos la Cardinalidad entre tablas se refiere a si una fila de una tabla podría vincularse con más de una fila de otra tabla. La cardinalidad es de N:1 ( N registros tabla IMF_M5_Mystery_Shopping se puede vincular a 1 registro de la tabla 11codmun)
Análisis funcional y diagrama de arquitectura de flujo de datos.
Las fuentes de datos a usar son:
- IMF_M5_Mystery_Shopping.csv como datos generados por el departamento antifraude
- 11codmun.xls datos de INE (como datos externos)
Un proceso de transformación y carga del DWH que:
- Cargará los ficheros
- Ejecutará las siguientes transformaciones:
- Carga de la tabla calendario
- Todos los campos texto se pondrán en mayúscula
- Se cambiarán las letras con tilde a letras sin tildes
- …
- Carga del DWH: cargando la tabla de hechos y las dimensiones
[pic 1]
Ilustración 1Proceso de transformación
¿Qué arquitectura de referencia usaría? Justifique la respuesta.
La arquitectura Back-End tradicional. Esta arquitectura está asociada con la recopilación de datos y la organización de datos (ETL y almacén de datos en los sistemas tradicionales).
¿Qué tecnología OLAP usaría? Justifique la respuesta.
ROLAP permite realizar análisis multidimensional dinámico a partir de los datos almacenados en una base de datos relacional. En nuestra solución hemos generado un modelo de datos donde los datos se almacenan como filas y columnas de forma relacional.
Si se utiliza ROLAP, ¿cuál de estos dos modelos se ajustaría mejor: el modelo en estrella o el de copo de nieve?
El modelo en estrella.
...