Essays.club - Ensayos gratis, notas de cursos, notas de libros, tareas, monografías y trabajos de investigación
Buscar

MONOGRAFIA BIG DATA

Enviado por   •  14 de Noviembre de 2018  •  5.819 Palabras (24 Páginas)  •  568 Visitas

Página 1 de 24

...

Es importante entender que las bases de datos convencionales son una parte importante y relevante para una solución analítica. De hecho, se vuelve mucho más vital cuando se usa en conjunto con la plataforma de Big Data. Pensemos en nuestras manos izquierda y derecha, cada una ofrece fortalezas individuales para cada tarea en específico. Por ejemplo, un beisbolista sabe que una de sus manos es mejor para lanzar la pelota y la otra para atraparla; puede ser que cada mano intente hacer la actividad de la otra, más sin embargo, el resultado no será el más óptimo.

BIG DATA

DEFINICIÓN

Big Data (grandes datos, grandes volúmenes de datos o macrodatos como recomienda utilizar la Fundación Fundeu BBVA “Fundación del español urgente”) supone la confluencia de una multitud de tendencias tecnológicas que venían madurando desde la primera década del siglo XXI, y que se han consolidado durante los años 2011 a 2013, cuando han explosionado e irrumpido con gran fuerza en organizaciones y empresas, en particular, y en la sociedad, en general: Movilidad, redes sociales, aumento de la banda ancha y reducción de su coste de conexión a internet, medios sociales (en particular las redes sociales), internet de las cosas, geolocalización, y de modo muy significativo la computación de la nube (cloud computing).[1]

Según la consultora tecnológica IDC citado en Luis Aguilar “Big Data es una nueva generación de tecnologías, arquitecturas y estrategias diseñadas para capturar y analizar grandes volúmenes de datos provenientes de múltiples fuentes heterogéneas o una alta velocidad con el objeto de extraer valor económico de ello”.[2] En este pequeño párrafo nos da una definición según la consultora Tecnológica IDC, la cual toma al Big Data como una nueva generación de tecnologías que permite amasar grandes cantidades de datos provenientes de diversas fuentes heterogéneas a una alta velocidad.

Según la consultora Gartner citado en Luis Aguilar “Big Data son los grandes conjuntos de datos que tiene tres características principales: volumen (cantidad), velocidad (velocidad de creación y utilización) variedad (Tipos de fuentes de datos no estructurados, tales como la interacción social, video, audio, cualquier cosa que se pueda clasificar en una base de datos)”.[3] Aquí se puede ver la definición según la consultora Gartner que da tres características del Big Data, lo cual permite definir la importancia de Big Data y cuál es la mejor manera de utilizar los datos según sus características.

Según Adrian Merv citado en Luis Aguilar “Big Data excede el alcance de los entornos de hardware de uso común y herramientas de software para capturar, gestionar y procesar los datos dentro de un tiempo transcurrido tolerable para su población de usuarios”[4] Aquí se define a Big Data como las fuentes de datos que supera el uso común de Hardware y las herramientas de Software. El Big Data revoluciono a todo el mundo debido a la gran cantidad de datos que tenemos hoy en dia.

Según Mackinsey Global Institute Big Data se refiere a los conjuntos de datos cuyo tamaño esta más allá de las capacidades de las herramientas típicas de software de bases de datos para capturar, almacenar, gestionar, y analizar. [5]Mackinsey Global Institute dice que actualmente existe una gran cantidad de datos la cual va en aumento. Se podría decir que en un tiempo no muy lejano los datos que existen actualmente se podrían duplicar o hasta triplicar y seguir aumentando.

TIPOS DE DATOS:

Los Big Data son diferentes de la fuentes de datos tradicionales que almacenan datos estructurados en las bases relacionales .Es frecuente dividir las categorías de datos en dos grandes tipos: estructurados (datos tradicionales) y no estructurados (datos Big Data).Sin embargo, las nuevas herramientas de manipulación de Big Data han originado unas nuevas categorías dentro de los tipos de datos no estructurados: Datos semi-estructurados y datos no estructurados propiamente dichos. (Aguilar , Tipos de datos 2013)

Tipo

Descripción

Tipo1

Donde la representación no relacional del dato es necesaria para el análisis y la resolución del problema

Tipo2

Donde la escalabilidad horizontal es necesaria para el procesamiento eficiente de los datos

Tipo3

Donde la representación no relacional del dato implementada con soluciones que aportan escalabilidad horizontal es necesaria para el análisis y la resolución eficientes del problema

DATOS ESTRUCTURADOS:

La mayoría de las fuentes de datos tradicionales son datos estructurados, datos con formato o esquema fijo que poseen campos fijos. En estas fuentes, los datos vienen en un formato bien definido que se especifica en detalle, y que conforma las bases de datos relacionales. Son los datos de las bases de datos relacionales, las hojas de cálculo y los archivos, fundamentalmente. Los datos estructurados se componen de piezas de información que se conocen de antemano, vienen en un formato especificado, y se producen en un orden especificado. Estos formatos facilitan el trabajo con dichos datos. Formatos típicos son: fecha de nacimiento (DD, MM, AA); documento nacional de identidad o pasaporte (por ejemplo, 8 dígitos y una letra); número de la cuenta corriente de un banco (20 dígitos), etcétera.[6] Mayormente los datos estructurados vienen de los datos tradicionales por lo que es más fácil de procesar a la hora de adquirir información de una base de datos, un dato estructurado es la forma que comúnmente encontramos hoy en día.

DATOS SEMIESTRUCTURADOS:

Los datos semiestructurados tienen un flujo lógico y un formato que puede ser definido, pero no es fácil su comprensión por el usuario. Datos que no tienen formatos fijos, pero contiene etiquetas y otros marcadores que permiten separar los elementos del dato. La lectura de datos semiestructurados que permiten separar los elementos del dato. La lectura de datos semiestructurados requiere el uso de reglas complejas que determinan como proceder después de la lectura de cada pieza de información. Un ejemplo típico de datos semiestructurados son los registros Web Log de las conexiones de internet. Un web Log se compone de diferentes piezas de información, cada una de las cuales sirve para un propósito

...

Descargar como  txt (37.3 Kb)   pdf (93.4 Kb)   docx (31.8 Kb)  
Leer 23 páginas más »
Disponible sólo en Essays.club