Caso Practico Business Intelligence
Enviado por David Castro • 23 de Marzo de 2023 • Tarea • 1.007 Palabras (5 Páginas) • 354 Visitas
Memoria Caso Practico Business Intelligence |
I. Introducción
Para esta práctica se pide la implementación de un pequeño modelo multidimensional, haciendo uso de Pentaho Business Analytics Server y su herramienta wizard para modelado multidimensional y la implementación de un pequeño proceso ETL, haciendo uso de Pentaho Data Integration (PDI). A continuación, se detalla en profundidad la práctica.
II. Análisis de fuentes
- Descripción global de las fuentes
Para esta práctica se va a utilizar una fuente de datos externa, proporcionada en el módulo. Esta fuente de datos viene dada por mystery shopping y se encuentra en formato .CSV. Esta fuente de datos se considera externa ya que a pesar de ser un fichero físico proporcionado por IMF originalmente fue creada y proporcionada por una empresa ajena a la nuestra, en este caso, mystery shopping.
- Descripción en detalle de cada campo:
A continuación, se explica cada uno de los campos dados en el archivo CSV:
COD_LOC;NOMBRE_LOC;CP;POBLACION;OFICINA;PROVINCIA;COD_PROY;ID_EVALUACION;Fecha de ejecucion;COD_AUDITOR;RESULTADO;TITULO_CUESTIONARIO
Donde:
- COD_LOC: Código de la localización
Este campo se trata de un dato Numérico de naturaleza “Categórica” que indica una categoría o grupo.
- NOMBRE_LOC: Nombre de la localidad.
Este campo se trata de un dato Alfanumérico (cadena de caracteres) de naturaleza “Categórica” que indica una categoría o grupo.
- CP: Código postal
- Tipo de dato: Numérico (entero)
- Naturaleza: Categórico
- Cardinalidad aproximada: Dependerá del número de códigos postales distintos en el conjunto de datos.
- POBLACION: Población (nombre del municipio o ciudad)
- Tipo de dato: Alfabético (cadena de caracteres)
- Naturaleza: Categórico
- Cardinalidad aproximada: Dependerá del número de municipios o ciudades distintas en el conjunto de datos.
- OFICINA: Número de oficina
- Tipo de dato: Numérico (entero)
- Naturaleza: Categórico
- Cardinalidad aproximada: Dependerá del número de oficinas distintas en el conjunto de datos.
- PROVINCIA: Nombre de la provincia
- Tipo de dato: Alfabético (cadena de caracteres)
- Naturaleza: Categórico
- Cardinalidad aproximada: Dependerá del número de provincias distintas en el conjunto de datos.
- COD_PROY: Código del proyecto
- Tipo de dato: Alfanumérico (cadena de caracteres)
- Naturaleza: Categórico
- Cardinalidad aproximada: Dependerá del número de proyectos distintos en el conjunto de datos.
- ID_EVALUACION: Identificador de la evaluación
- Tipo de dato: Numérico (entero)
- Naturaleza: Categórico
- Cardinalidad aproximada: Dependerá del número de evaluaciones distintas en el conjunto de datos.
- Fecha de ejecución: Fecha en la que se realizó la evaluación
- Tipo de dato: Fecha
- Naturaleza: Temporal
- Cardinalidad aproximada: Dependerá del rango de fechas en el conjunto de datos.
- COD_AUDITOR: Código del auditor
- Tipo de dato: Alfanumérico (cadena de caracteres)
- Naturaleza: Categórico
- Cardinalidad aproximada: Dependerá del número de auditores distintos en el conjunto de datos.
- RESULTADO: Resultado de la evaluación (en este caso, 0)
- Tipo de dato: Numérico (entero)
- Naturaleza: Cuantitativo
- Cardinalidad aproximada: Dependerá del rango de resultados posibles en el conjunto de datos.
- TITULO_CUESTIONARIO: Título del cuestionario utilizado en la evaluación
- Tipo de dato: Alfabético (cadena de caracteres)
- Naturaleza: Categórico
- Cardinalidad aproximada: Dependerá del número de cuestionarios distintos en el conjunto de datos.
III. Análisis funcional y diagrama de arquitectura de flujo de datos.
...