Capítulo 1. ¿Qué queremos decir con datos impulsados?
Enviado por Rebecca • 23 de Noviembre de 2018 • 4.754 Palabras (20 Páginas) • 366 Visitas
...
Queryable
Debe haber herramientas adecuadas para consultar y cortar y cortar los datos. Todos los informes y análisis requieren filtrar, agrupar y agregar datos para reducir las grandes cantidades de datos brutos en un conjunto más pequeño de números de nivel superior que ayudan a nuestros cerebros a comprender lo que está sucediendo en un negocio. Tengo que ser capaz de ver tendencias o entender las diferencias entre los segmentos de clientes. Los analistas tienen que tener herramientas que les permitan calcular esas métricas con relativa facilidad.
OK, así que ahora tenemos datos y es accesible. ¿Es esto suficiente? No aún no. Necesitas personas con las habilidades adecuadas para usar esos datos. Esto puede significar la mecánica de filtrar y agregar datos, como a través de un lenguaje de consulta o macros de Excel, pero también significa que las personas que diseñan y seleccionan las métricas apropiadas para extraer y rastrear (este tema se trata en el Capítulo 6). Esas métricas pueden ser tasas de resubscripción (para servicios de suscripción como Netflix o Wall Street Journal), valores de por vida o métricas de crecimiento, pero alguien necesita decidir sobre ellos y alguien (otro) necesita crear algún proceso para proporcionar esos valores.
Por lo tanto, para que una organización sea impulsada por datos, tiene que haber seres humanos en el bucle, los humanos que hacen las preguntas correctas de los datos, los humanos que tienen las habilidades para extraer los datos y métricas correctos y los humanos que usan esos datos para Informar los pasos siguientes. En resumen, los datos por sí solos no van a salvar a su organización.
Informes
Vamos 's suponga que tiene un grupo de análisis con acceso a datos precisos. El grupo extrae los datos de ventas y genera un informe con orgullo afirmar que las reservas de la compañía s crecieron el 5,2% de abril a mayo (Figura 1-1).
[pic 1]
[pic 2]
Esto ciertamente ahora suena más como una empresa basada en datos. Sin embargo, esto sigue siendo profundamente insuficiente. Ciertamente es bueno que estén siguiendo estas métricas. El CFO y el CEO definitivamente estarán interesados en esos números. Sin embargo, ¿qué significa este valor del 5,2%? Muy poco, de hecho. Hay muchas razones posibles por las que las ventas de la compañía crecieron en esta cantidad:
- Supongamos que usted vende un producto altamente estacional, como ropa de playa. Quizás el 5,2% es mucho más bajo de lo normal. Tal vez la mayoría de los años, de mayo 's crecimiento es más del 7% respecto al mes anterior y este año' s crecimiento está muy por debajo de la media.
- Tal vez su director de marketing gastó mucho dinero en una campaña nacional para impulsar la conciencia de marca. ¿Cuánto de ese crecimiento de 5,2% se generó a partir de esa campaña, y fue esa campaña un buen valor por el dinero?
- Tal vez su CEO apareció en Good Morning America, o su producto fue presentado en Techcrunch, o un video se volvió viral, y que era el conductor. Es decir, el crecimiento puede ser rastreado hasta un evento de conducción inusual específico (que podría impulsar el crecimiento transitorio o sostenido).
- Tal vez las ventas mensuales son de bajo volumen y muy variable. Tal vez ese crecimiento fue sólo suerte y tal vez la tendencia general es a la baja. (Si alguna vez has negociado acciones, seguramente entenderás.)
- Tal vez los datos están mal. Si sus ventas son relativamente estables, y usted ve un punto, y usted no está enterado de cualquier acontecimiento inusual, quizás hay un problema de la calidad de los datos.
Todas estas son posibilidades. El número reportado es sólo eso, un valor numérico con poco o ningún contexto.
“A medida que se hacen más grandes orgs y complejo, la gente en la parte superior dependen menos de la experiencia de primera mano, y más en datos muy procesados. ”- John Gardner John Maeda (@johnmaeda) de 16 de agosto de, 2014
Alerta
¡Ding, ding, ding! El servidor de aplicaciones web # 14 acaba de promediar más del 98% de utilización de la CPU durante los últimos cinco minutos.
Las alertas son esencialmente informes sobre lo que está sucediendo ahora. Por lo general, proporcionan datos muy específicos con métricas bien diseñadas. Pero al igual que los informes, que don 't decirle por qué usted está viendo un aumento en la utilización de la CPU, y que don' t te dice qué hacer, en este momento, para rectificar el problema. Como tales, como los informes, carecen de este contexto crucial. No hay explicación causal. Este es el punto en el que los ingenieros de rendimiento o los administradores de sistemas se sumergen en los registros de producción para averiguar qué está pasando, por qué está sucediendo y cuáles son las opciones para arreglarlo: revertir algunos códigos, aumentar algunos servidores, reconfigurar la carga Equilibrador, etc.
La Figura 1-2 muestra un ejemplo de carga de servidor a lo largo del tiempo. Hay cierta variabilidad, pero la mayor parte del día se gasta con una cola de ejecución de aproximadamente 0,5 o menos. A la 1 de la mañana, la carga comienza a pico, disparando hasta más de un 5, un aumento de diez veces más “normal ", en el espacio de 30 minutos. Parece muy inusual. Lo 's pasando? Tal vez alguien debería arreglar eso, pero ¿cómo ?
En este caso, sólo se ejecutan las copias de seguridad semanales. Esto sucede todos los jueves a la 1 am - perfectamente normal, nada que ver aquí. Esto hace que el punto de que hay grandes datos aquí y una buena métrica que 's presentados con claridad. Pero el contexto - que es causada por las copias de seguridad, que ocurre en un horario determinado y se espera que esta ranura hora 1 de la mañana, y que el servidor puede manejar esta carga sin problemas - es todo lo que faltaba.
[pic 3]
[pic 4]
Del informe y la alerta al análisis
Los informes y las alertas son características necesarias, pero no suficientes, de la datadriven. Sin embargo, no debemos subestimar la importancia de estas dos actividades. La presentación de informes es un componente sumamente valioso de una organización basada en datos. No puedes tener uno efectivo sin ella. Sin embargo, lo contrario no es cierto:
...