Essays.club - Ensayos gratis, notas de cursos, notas de libros, tareas, monografías y trabajos de investigación
Buscar

Análisis de datos sobre ventas históricas de una empresa de supermercados

Enviado por   •  15 de Mayo de 2024  •  Práctica o problema  •  1.772 Palabras (8 Páginas)  •  260 Visitas

Página 1 de 8

INTRODUCCIÓN

           Con el paso del tiempo, se ha incrementado la creación de herramientas de análisis de datos, tanto para datos relaciones como no relaciones. Dependiendo de la empresa, su postura económica y los datos que se manipulen se tiende a tomar preferencia por alguna. En la actualidad, contamos con softwares tanto privados como gratuitos, además, los datos son la fuente principal en la toma de decisiones empresariales ya los mismos se basan en registros tanto históricos como a tiempo real los cuales son analizados y traducidos sobre el estado de la empresa.

           En el presente informe se pretende transmitir y compartir principalmente el desarrollo de un análisis de datos sobre ventas históricas de una empresa de supermercados que ha registrado datos en 3 sucursales diferentes durante 3 meses. mediante el enfoque a grafos a partir de la herramienta Neo4j.

           Neo4j es sistema de gestión de bases de datos de grafos, el cual está diseñado para almacenar, gestionar y consultar de manera eficiente datos en forma de gráficos, es decir, datos organizados en una red de nodos y relaciones.

DESARROLLO

Se solicita a los alumnos de la Maestría en Big Data y Ciencia de Datos que realicen un análisis de datos de ventas utilizando grafos en el sector de ventas. A continuación, se detallan los requerimientos y el entregable en cada caso:

  1. Requerimiento: Búsqueda y obtención de una base de datos: Se debe buscar una base de datos que contenga información relevante sobre ventas en el sector de ventas. Puede ser una base de datos estructurada o no estructurada, en cualquier formato comúnmente utilizado.

Entregable:

Extracción de información: La Base de datos “Ventas de supermercados” en archivo .csv, fue extraída mediante la plataforma Kaggle donde los desarrolladores pueden almacenar, colaborar y compartir trabajos, bases de datos, ente otros tipos de documentos y formatos.

La base de datos en mención cuenta con un total de 1000 registros (ventas) y compuesto por los siguientes campos:

Tabla 1: Descripción de campos del dataset de ventas

Campo

Descripción

Tipo de dato

Invoice id

Número de identificación de identificación de factura de deslizan de ventas

Integer

Branch

Rama de supercentro (A /B/C)

String

City

Ubicación de los supercentros

String

Customer type

Tipo de clientes (Miembro/Normal)

String

Gender

Tipo de género de clientes

String

Product line

Grupos de categorización de elementos generales (Accesorios electrónicos, Accesorios de moda, Alimentos y bebidas, Salud y belleza, Hogar y estilo de vida, Deportes y viajes)

String

Unit price

Precio de cada producto

Float

Quantity

Número de productos comprados por el cliente

Integer

Tax

5% de cuota de impuestos para la compra de clientes

Float

Total

Precio total, incluido el impuesto

Float

Date

Fecha de compra (Regicha disponible de enero de 2019 a marzo 2019)

Date

Time

Hora de compra (10am a 9pm)

Time

Payment

Pago utilizado por el cliente para la compra (3 métodos están disponibles)

String

COGS

Costo de los bienes vendidos

Float

Gross margin percentage

Porcentaje del margen bruto

Float

Gross income

Ingresos brutos

Float

Rating

Calificación de estratificación del cliente

Float

Fuente: Elaboración propia

  1. Requerimiento: Carga de datos en la herramienta Neo4j. Una vez que los estudiantes hayan obtenido los datos, deberán cargarlos en la herramienta Neo4j, utilizando el enfoque de grafos. Neo4j es una base de datos orientada a grafos que permite modelar y consultar relaciones complejas de manera eficiente.

Entregable:

Proceso de carga en Neo4j: Descripción de cómo se cargaron los datos en Neo4j y cómo se modelaron las relaciones entre los nodos para reflejar las ventas y sus interacciones.

Carga de datos en Neo4j

Como primer paso, se procede a crear un proyecto llamado “Caso Practico” y la base de datos “Sales”. Se importa la base en formato .csv colocando el archivo en la carpeta import de Neo4j.

[pic 1][pic 2][pic 3][pic 4]

[pic 5][pic 6][pic 7]

[pic 8]

Figura 1: Proceso de carga de datos (forma A)

Se procede a la carga del base mediante el comando:

[pic 9]

Figura 2: Proceso de carga de datos

Anexo:

Existe otra manera eficaz de realizar la importación de la base de datos es mediante el uso de Neo4j workspace, en el cual solamente arrastramos la base y procedemos a crear las relaciones y nodos correspondientes.

[pic 10][pic 11][pic 12]

Figura 3: Proceso de carga de datos (modelo B)

Modelación de relación entre nodos

[pic 13]

Figura 4: Esquema de relaciones entre nodos

Entregable:

Representación de los nodos en Neo4j: Presentación visual de los nodos y relaciones creados en Neo4j para representar los datos de ventas. Se deben incluir ejemplos y explicaciones claras.

...

Descargar como  txt (12.3 Kb)   pdf (822.1 Kb)   docx (1 Mb)  
Leer 7 páginas más »
Disponible sólo en Essays.club