GUIA PREGUNTAS BUSINESS INTELLIGENCE
Enviado por Ledesma • 21 de Agosto de 2018 • 4.285 Palabras (18 Páginas) • 575 Visitas
...
En ella, los datos están “estructurados” de tal forma que están listos para ser utilizados en Procesamiento Analítico (OLAP), minería de datos, consultas y reportes no estructurados.
El DW es una colección de datos orientados s sujetos , integrados, variables con el tiempo, no volátiles y estructurados para ser eficientes en dar respuestas en los procesos de toma de decisiones.
26. En qué se diferencia un DW de una base de datos operativa:
El DW difiere de las bases de datos operacionales en que las últimas (operacionales), son orientadas a registros y sintonizadas a las transacciones, en vez que a la gestión. Una vista al sujeto es mucho más amplia en la organización. Finalmente el DW contiene también datos históricos.
27. Indique las diferencias entre una EDW, DM y ODS:
- EDW (Enterprise Datawarehouse): Son las de tamaño mayor, con múltiples fuentes de datos y de mayor costo de implementación.
- Data Marts (DM): El DM es un subconjunto de datos de una DW mayor o puede ser un DW más pequeño e independiente para atender por ejemplo solo a una Departamento. También se los define como DM dependientes o independientes. El alto costo de un DW limita su uso en empresas medianas y pequeñas, por lo que se recurre normalmente a los DM’s.
- ODS (Operational Data Stores): Son equivalente a los DM pero son actualizados en línea por las aplicaciones fuentes.
28. Describa los procesos básicos de una herramienta ETL:
Los procesos básicos son: Extracción, transformación, limpieza y carga de datos.
- Extracción: es la lectura de datos desde fuentes diferentes: OLTP, Texto, Web, Planillas Excel, captura de datos manuales, etc.
- Transformación: convertir los datos desde su forma original a la forma adecuada para ser incorporada en una DW o en otra base de datos intermedia.
- Limpieza: proceso de eliminación de impurezas de los datos o de eliminación de datos irrelevantes para el DW.
- Carga: introducción de los datos en el repositorio (DW) en formato apropiado para la lectura desde las herramientas del BI.
29. Porqué el ETL es tan importante en la construcción de un BI?:
La importancia radica en que sin la realización de los procesos de ETL, la información que vaya a leer las herramientas de BI, no será confiable dado los diferentes formatos que puedan existir (OLTP, Excel, Texto, etc.) , como la gran cantidad de datos irrelevantes.
30. Que es una “dimensión” en un Cubo OLAP?
Son parámetros en función de los cuales se analizan los datos
Es una variable dentro de un “cubo”, que permite un análisis detallado de una determinada variable, ejemplo: la dimensión ventas.
31. Que es un atributo de una variable en un cubo (esfera) OLAP
Los atributos son los elementos que integran una dimensión, son aquellos aspectos que vamos a tener en cuenta a la hora de describir un dato indicador o medida.
Por ejemplo, los atributos típicos de una dimensión de producto pueden ser el nombre, la categoría, la línea, el tamaño y el precio del producto.
32. Describa la operación “slice&dice” y “drill down”:
Primero que todo debemos tener claro el concepto de “Slice o Rebanada”, el cual es un subconjunto de datos de un arreglo multidimensional, usualmente de 2 dimensiones. Ejemplo: Dimensión 1 = Ventas y Dimensión 2 = Tiempo.
Slice&dice, es un slice que se utiliza en más de dos dimensiones de un cubo. Ejemplo: Dimensión 1 = Ventas, Dimensión 2 = Tiempo y Dimensión 3 = Geografía.
Drill Down/Up (taladrar): Es bajar por una de las variables o dato desde lo más agrupado a lo más detallado.-
33. Cuál es la ventaja importante de un OLAP respecto de una base transaccional operativa?
El hecho que las bases OLAP sean multidimensionales pueden generar respuestas a consultas con muchas variables o filtros, lo que no hacen eficientemente las bases de datos relacionales transaccionales.-
34. Pensando en la velocidad de respuesta a una consulta a un cubo OLAP, qué es mejor que la base OLAP sea pequeña y sin datos redundantes o grande y máxima redundancia?
35. Defina Data Mining (DaMi):
Son procesos orientados a descubrir inteligencia o conocimiento desde una gran cantidad de datos.
DaMi se centra en obtener “Patrones” desde grandes volúmenes de datos, mediante técnicas estadísticas, matemáticas u otro tipo de algoritmos inteligentes, por ejemplo: Reglas de Negocio, Afinidad entre Datos, Correlaciones, Tendencias, Modelos, Etc.
Es hacer un uso inteligente de la información recolectada.-
Es obtener información valiosa para la toma de decisiones aplicando técnicas y productos a los datos almacenados en el DW.-
36. Cuáles son las áreas de la industria en donde se necesita usar DaMi?:
Dada la importancia clave de DaMi, es posible encontrarlas en casi todos los ámbitos de la industria, es decir:
- Administración de relación con Cliente (CRM)
- Bancaria y Financiera
- Comercio minorista y Logística
- Manufactura y Producción
- Corretaje y Transacción de Valores
- Seguros
- Tecnología de Computadores HW y SW
- Gobierno, Defensa e Inteligencia
- Viajes y Turismo
- Salud Privado y Pública
- Medicina
- Industria del entretenimiento
- Policía, Legal y Terrorismo
-
...