Fundamientos de la ciencia de datos. El software y los algoritmos de Machine Learning
Enviado por LADE • 10 de Marzo de 2024 • Apuntes • 703 Palabras (3 Páginas) • 182 Visitas
FUNDAMENTOS DE
LA CIENCIA DE DATOS
Aunque cada persona podría llegar a tener un concepto diferente acerca de lo que es en realidad la Ciencia de Datos para ellos, es bien conocido que la mayoría en sí coincide que el análisis es un componente clave para su entendimiento. Teniendo en cuenta la gran cantidad de datos disponibles de diversas fuentes como: registros, correos, redes sociales, datos de ventas, información de pacientes, rendimiento deportivo, sensores, cámaras de seguridad, entre muchos más. Poseyendo la potencia informática para hacer análisis y revelar un conocimiento. Los científicos de datos no solo analizan los datos para aumentar el conocimiento de la empresa explorando la mejor manera de utilizarlos para proporcionar valor a la empresa. Si no, también puede ayudar a las empresas a entender sus entornos, analizando los posibles problemas existentes, y revelando las oportunidades ocultas.
¿CUAL ES EL PROCESO DE LA CIENCIA DE DATOS?
Un problema empresarial suele iniciar con el proceso de la ciencia de datos, puesto que muchas empresas la usan para enfocarse en problemas específicos. Como respuesta a ello, es ahí en donde un científico de datos trabajará con las partes interesadas del negocio para entender las necesidades del mismo. Este primer paso es crucial, pues define cómo avanzará el proyecto y una vez definido el problema, el científico de datos puede resolverlo con el proceso que consiste en obtener, depurar, explorar y modelar datos e interpretar los resultados.
¿QUÉ DATOS NECESITAMOS PARA RESOLVER EL PROBLEMA?
OBTENER DATOS:
Los datos pueden ser preexistentes, recién adquiridos o un repositorio descargable de Internet. Los científicos de datos pueden extraerlos de las bases de datos internas o externas del software CRM, conocido por ser la gestión de las relaciones con los clientes, siendo una estrategia para gestionar todas las relaciones e interacciones de una empresa con sus clientes potenciales y existentes. Ayudando así a las compañías, para mantener un contacto, agilizando los procesos y dando así una mejora en la rentabilidad de la empresa, de los registros del servidor web, de las redes sociales o adquiridos a terceros de confianza.
DEPURAR DATOS:
La depuración o limpieza de datos consiste en el proceso de normalizarlos según un formato predeterminado. Incluyendo la gestión de los datos que faltan, la corrección de errores en estos y la eliminación de datos atípicos. Algunos ejemplos de la depuración de datos son:
Cambiar todos los valores de fecha a un formato estándar común.
Corregir
...