Inteligencia de Negocio y ETL
Enviado por Omar Reina • 18 de Noviembre de 2022 • Trabajo • 1.273 Palabras (6 Páginas) • 770 Visitas
Caso práctico
Enunciado
El objetivo de este caso práctico es poner en práctica los conceptos de inteligencia de negocio y data warehousing aprendidos a lo largo del módulo, haciendo hincapié en el diseño e implementación del modelo multidimensional y modelo de estrella, así como en los conceptos de dimensión, hechos, jerarquías, niveles, métricas y operaciones OLAP.
Del mismo modo, se pondrán en práctica los conocimientos adquiridos sobre inteligencia de negocio y ETL, prestando especial atención al diseño e implementación del proceso básico ETL hasta culminar en un modelo en estrella, así como en la implementación de dimensión y hechos en la capa física.
Los estudiantes deberán realizar:
⦁ La implementación de un pequeño modelo multidimensional, haciendo uso de Pentaho Business Analytics Server o cualquier herramiena similar.
⦁ La implementación de un pequeño proceso ETL, haciendo uso de Pentaho Data Integration (PDI) o cualquier herramienta similar.
Para la realización de este ejercicio práctico se partirá de los datos de mystery shopping “IMF_Mystery_Shopping.csv” disponible para descargar a continuación.
Todas las respuestas deben estar lo suficientemente desarrolladas y justificadas, independientemente de la contestación.
Se recomienda acompañar cada respuesta de todos los diagramas y representaciones que sea posible para argumentarla y justificarla.
IMF_Mystery_Shopping.csv
ESCENARIO:
El departamento antifraude de una compañía de mystery shopping desea hacer un seguimiento y analizar la información relativa a las encuestas que realiza en los distintos centros de sus clientes. Para ello, solicita:
• Un análisis y diseño del data warehouse que daría respuesta a los usuarios analíticos del departamento antifraude, suponiendo que los usuarios aún no tienen claro el tipo de análisis que quieren realizar.
• Partiendo del análisis y diseño previo realizado, y usando Pentaho Data Integration o alguna herramienta similar, realizar la implementación del proceso ETL con el objetivo de:
- Identificar y extraer los datos de las fuentes.
- Procesar los datos y aplicar procesos de limpieza y calidad del dato.
- Generar y cargar los datos en el modelo físico de estrella identificado en la fase de diseño.
• Posteriormente, partiendo del análisis y diseño previo realizado y conociendo ya la tecnología seleccionada, en este caso Pentaho Business Analytics, Power BI o una herramienta similar, ha de realizarse una implementación ágil del modelo multidimensional.
El objetivo en este caso práctico es la implementación del modelo multidimensional sobre diseño del data warehouse que daría respuesta a los usuarios analíticos del departamento antifraude, suponiendo que los usuarios aún no tienen claro el tipo de análisis que quieren realizar.
Se pide
⦁ Análisis de fuentes:
a. Descripción global de las fuentes.
Son todos aquellos medios de los cuales procede la información de clientes, que satisfacen las necesidades de conocimiento del local, provincia y población y, que posteriormente será utilizado para realizar un análisis de datos de cada local.
a. Descripción en detalle de cada campo.
b. Tipo de campo, naturaleza, cardinalidad aproximada.
CODIGO DE LA VARIABLE NOMBRE DE LA VARIABLE TIPO DE VARIABLE TIPO DE DATO CARDANALIDAD
COD_LOC CODIGO DE LOCAL VARIABLE ESTADÍSTICA CUALITATIVA STRING 1 - 15
NOMBRE_LOC NOMBRE DE LOCAL VARIABLE ESTADÍSTICA CUALITATIVA STRING 1 - 50
CP CODIGO POSTAL VARIABLE ESTADÍSTICA CUALITATIVA INTEGER 1 - 5
POBLACION POBLACION VARIABLE ESTADÍSTICA CUALITATIVA STRING 0 - 50
OFICINA NUMERO DE OFICINA VARIABLE ESTADÍSTICA CUALITATIVA STRING 1 - 3
PROVINCIA NOMBRE DE PROVINCIA VARIABLE ESTADÍSTICA CUALITATIVA STRING 1 - 25
COD_PROY CODIGO PROVINCIA VARIABLE ESTADÍSTICA CUALITATIVA STRING 2 - 15
ID_EVALUACION IDENTIFICACION DE EVALUACION VARIABLE IDENTIFICADORA INTEGER 1 -10
Fecha de ejecucion FECHA DE EVALUACION VARIABLE CRONOLÓCICA STRING 10 - 10
COD_AUDITOR CODIGO DE AUDITOR VARIABLE ESTADÍSTICA CUALITATIVA STRING 1 -10
RESULTADO VALOR VARIABLE ESTADÍSTICA CUANTITATIVA FLOAT 1 - 8
TITULO_CUESTIONARIO CUESTIONARIO VARIABLE DE COMUNICACIÓN STRING 1 - 50
⦁ Análisis funcional y diagrama de arquitectura de flujo de datos.
Vamos a realizar una extracción, transformación y carga que conformaran el Data Warehouse.
⦁ Generación de al menos 5 kpi's.
a. Crecimiento del volumen de valor agregado en el año 2014.
b. Actividades exitosas por oficina.
c. Evaluar la productividad de acuerdo a los resultados
d. Analizar el comportamiento
...