Análisis de datos sobre ventas históricas de una empresa de supermercados
Enviado por angie Vicuña • 15 de Mayo de 2024 • Práctica o problema • 1.772 Palabras (8 Páginas) • 258 Visitas
INTRODUCCIÓN
Con el paso del tiempo, se ha incrementado la creación de herramientas de análisis de datos, tanto para datos relaciones como no relaciones. Dependiendo de la empresa, su postura económica y los datos que se manipulen se tiende a tomar preferencia por alguna. En la actualidad, contamos con softwares tanto privados como gratuitos, además, los datos son la fuente principal en la toma de decisiones empresariales ya los mismos se basan en registros tanto históricos como a tiempo real los cuales son analizados y traducidos sobre el estado de la empresa.
En el presente informe se pretende transmitir y compartir principalmente el desarrollo de un análisis de datos sobre ventas históricas de una empresa de supermercados que ha registrado datos en 3 sucursales diferentes durante 3 meses. mediante el enfoque a grafos a partir de la herramienta Neo4j.
Neo4j es sistema de gestión de bases de datos de grafos, el cual está diseñado para almacenar, gestionar y consultar de manera eficiente datos en forma de gráficos, es decir, datos organizados en una red de nodos y relaciones.
DESARROLLO
Se solicita a los alumnos de la Maestría en Big Data y Ciencia de Datos que realicen un análisis de datos de ventas utilizando grafos en el sector de ventas. A continuación, se detallan los requerimientos y el entregable en cada caso:
- Requerimiento: Búsqueda y obtención de una base de datos: Se debe buscar una base de datos que contenga información relevante sobre ventas en el sector de ventas. Puede ser una base de datos estructurada o no estructurada, en cualquier formato comúnmente utilizado.
Entregable:
Extracción de información: La Base de datos “Ventas de supermercados” en archivo .csv, fue extraída mediante la plataforma Kaggle donde los desarrolladores pueden almacenar, colaborar y compartir trabajos, bases de datos, ente otros tipos de documentos y formatos.
La base de datos en mención cuenta con un total de 1000 registros (ventas) y compuesto por los siguientes campos:
Tabla 1: Descripción de campos del dataset de ventas
Campo | Descripción | Tipo de dato |
Invoice id | Número de identificación de identificación de factura de deslizan de ventas | Integer |
Branch | Rama de supercentro (A /B/C) | String |
City | Ubicación de los supercentros | String |
Customer type | Tipo de clientes (Miembro/Normal) | String |
Gender | Tipo de género de clientes | String |
Product line | Grupos de categorización de elementos generales (Accesorios electrónicos, Accesorios de moda, Alimentos y bebidas, Salud y belleza, Hogar y estilo de vida, Deportes y viajes) | String |
Unit price | Precio de cada producto | Float |
Quantity | Número de productos comprados por el cliente | Integer |
Tax | 5% de cuota de impuestos para la compra de clientes | Float |
Total | Precio total, incluido el impuesto | Float |
Date | Fecha de compra (Regicha disponible de enero de 2019 a marzo 2019) | Date |
Time | Hora de compra (10am a 9pm) | Time |
Payment | Pago utilizado por el cliente para la compra (3 métodos están disponibles) | String |
COGS | Costo de los bienes vendidos | Float |
Gross margin percentage | Porcentaje del margen bruto | Float |
Gross income | Ingresos brutos | Float |
Rating | Calificación de estratificación del cliente | Float |
Fuente: Elaboración propia
- Requerimiento: Carga de datos en la herramienta Neo4j. Una vez que los estudiantes hayan obtenido los datos, deberán cargarlos en la herramienta Neo4j, utilizando el enfoque de grafos. Neo4j es una base de datos orientada a grafos que permite modelar y consultar relaciones complejas de manera eficiente.
Entregable:
Proceso de carga en Neo4j: Descripción de cómo se cargaron los datos en Neo4j y cómo se modelaron las relaciones entre los nodos para reflejar las ventas y sus interacciones.
Carga de datos en Neo4j
Como primer paso, se procede a crear un proyecto llamado “Caso Practico” y la base de datos “Sales”. Se importa la base en formato .csv colocando el archivo en la carpeta import de Neo4j.
[pic 1][pic 2][pic 3][pic 4]
[pic 5][pic 6][pic 7]
[pic 8]
Figura 1: Proceso de carga de datos (forma A)
Se procede a la carga del base mediante el comando:
[pic 9]
Figura 2: Proceso de carga de datos
Anexo:
Existe otra manera eficaz de realizar la importación de la base de datos es mediante el uso de Neo4j workspace, en el cual solamente arrastramos la base y procedemos a crear las relaciones y nodos correspondientes.
[pic 10][pic 11][pic 12]
Figura 3: Proceso de carga de datos (modelo B)
Modelación de relación entre nodos
[pic 13]
Figura 4: Esquema de relaciones entre nodos
Entregable:
Representación de los nodos en Neo4j: Presentación visual de los nodos y relaciones creados en Neo4j para representar los datos de ventas. Se deben incluir ejemplos y explicaciones claras.
...