miércoles, abril 23

Big Data I: “No dejéis que vuestras cabezas se vuelvan más grandes que vuestros sombreros”

En 2004 encontré mi vocación absoluta, empecé a devorar todo lo que caía en mis manos sobre analítica web, ahora me está pasando lo mismo con Big Data. ¿No os parece impresionante todo lo que tiene que ver con Big Data? A nivel de tecnología, de algoritmos, de modelos, … Hay tanto sobre lo que leer, aprender y poner en marcha que me faltan horas en el día. Así que he decidido hacer un pequeño resumen sobre todo lo que he ido aprendiendo en este último año, me da para muchos posts así que creo que seré monotema de aquí al otoño :)

El  90% de los datos de los que disponemos actualmente se ha generado en los últimos 2 años. Cada vez tenemos más datos y, cuando fue más barato almacenarlos que destruirlos, nació el Big Data. Ahora ha llegado la hora de sacarle partido.

Hay muchas definiciones sobre Big Data, estoy segura que irán saliendo más cada día. La definición que más se ajusta a cómo veo yo el Big Data es: la oportunidad de encontrar ideas en los tipos de datos y contenidos para tomar acción y que los negocios sean más ágiles. Porque el análisis de los datos debe llevarnos a tomar acción, no se pueden analizar cantidades ingentes de datos si el resultado no nos lleva a tomar decisiones y a cambiar la forma que tenemos de hacer las cosas.

Entonces… cuál es nuestra frontera? Hasta donde podemos llegar? Cómo lo hacemos? A medida que nuestra comunicación, el ocio y el comercio se han trasladado a internet y desde que internet se ha trasladado a nuestros teléfonos, coches, gafas… la vida puede ser registrada y cuantificada como nunca antes!

Empecemos por el principio, por  la base del Big Data, lo que llamamos las 3 Uves. V de Volumen de información, V de Variedad  de dicha información y V de Velocidad en el tratamiento de la información. Es decir, para ser Big Data debemos tener un gran volumen de información de diversas fuentes de origen y ser capaces de obtener conocimiento en real time.

Hay corrientes de analistas que defienden la 4ª uve… la Veracidad de dicha información… ¿Conocéis la historia de Google y la gripe? Google se jactó de que podía medir de forma más rápida e indolora la velocidad en que se extendía la epidemia de la gripe en el mundo. Y lo hizo: Google Flu Trends. Basó todo el conocimiento en la correlación que había entre las búsquedas de los usuarios sobre los síntomas y la epidemia en sí.

Google Flu Trends fue un fracaso, soy un poco dura pero es así. Básicamente porque los ingenieros no habían pensado en algo importante: la correlación no tiene por qué ser la causa, por lo que el no saber qué causa una correlación puede llevar a falsas conclusiones.  En este caso, desde Google no se pararon a pensar que mucha gente sana buscaba información sobre la epidemia para detectar síntomas, para saber cómo actuar, para estar actualizado sobre la epidemia…

Por lo tanto, no es tan fácil construir un algoritmo como pensaba Google. Pero esta historia nos deja una moraleja: No solamente hay que buscar la correlación entre dos métricas. También hay que encontrar la causa de dicha correlación. El ejemplo más claro de esta diferencia lo encontramos en la figura de abajo: El verano es la causa de un mayor consumo de helados y un número más alto de ahogos. Pero el aumento en el consumo de helados no causa más ahogo ni el aumento de ahogos causa más consumo de helados:

Ejemplo de diferencia causa-correlación


Entonces, ¿por dónde empezamos? La realidad es que actualmente el 80% del esfuerzo actual en Big Data se nos va en recopilar los datos e integrarlos. Supongo que esto irá a mejor con el tiempo por la sencilla razón de que no tenemos suficiente experiencia actualmente como para hacerlo de forma menos indolora. Pero deberíamos invertir el mismo tiempo que tardamos en integrar los datos en convertirlos en conocimiento.

Hasta ahora solamente éramos conscientes de lo que teníamos en nuestras BBDD o en nuestra herramientas de analítica online y offline. Ahora ha llegado el momento de ir más allá, mucho más allá, al poder cruzar nuestros datos con los datos de otras plataformas, sean de redes sociales, online, offline u open data. Nuestro éxito dependerá de los objetivos de negocio: Necesitaremos tenerlos muy claros para determinar qué tipo de dato necesitamos para poder encontrar causas que nos lleven a tomar decisiones.

Por lo que podemos afirmar que BIG DATA es la frontera de una compañía para almacenar, procesar y acceder a todos los datos que necesita para operar eficazmente, tomar decisiones, reducir riesgos, servir a los clientes y cumplir objetivos de negocio. El éxito vendrá con la identificación de los datos que necesitaremos para que aporten al análisis de la información y podamos sacar conclusiones que nos lleven a optimizar nuestra estrategia.

Podemos catalogar estos datos en tres grandes grupos. Por un lado tendríamos el SMART DATA, que trata de recopilar los datos que tienen que ver con nuestro negocio, mediante el uso de las diferentes plataformas de datos, sean offline u online. Aquí tendríamos los datos referentes a nuestras ventas, a nuestros productos, nuestros clientes, nuestro negocio... todos los datos que tienen que ver con nuestros objetivos.

El siguiente grupo es el IDENTITY DATA, que tiene que ver con la identificación física y online de los clientes o potenciales clientes enriquecido con sus gustos para poder personalizar al máximo nuestra oferta de productos o servicios, para dirigirnos a él por el canal adecuado, etc...

Finalmente el OPEN DATA, que compila todos los datos que existen de forma externa a nuestra empresa y que están a disposición de todo el mundo, nos ayudará a ponerle contexto a los demás datos y a predecir crecimientos y demás conocimiento de estas bases de datos gratuitas.

Tipos de Big Data

La combinación de estos tres tipos de datos nos permitirá tener una visión 360º de nuestro negocio/cliente, además de tener una gran cantidad de datos para combinar y relacionar de forma que nos permita realizar un análisis predictivo completo de cualquier área de nuestro negocio.

Lo primero que me viene a la cabeza cuando hablo de Big Data es la generación de ideas que podemos implementar para entender mejor el universo de nuestro negocio, lo que ya sabemos desde adentro y lo que hay fuera. Esto nos invita a optimizar nuestros procesos, a modificar nuestras cadenas de valores y formas de entender el progreso y así conducir nuevos negocios de datos.

Los tres núcleos más importantes en Big Data son el procesamiento de datos, por supuesto, ya que alcanza otras dimensiones con la cantidad de datos que tenemos a nuestra disposición pero también el poder manejarlos en el momento y poder tomar decisiones en el instante que ocurran las cosas, el acceso rápido a la información y el tratarla en el momento nos da un potencial increíble.

Finalmente tenemos el machine learning, el aprendizaje adaptativo según vayan ocurriendo las cosas. Como le pasa a Google, que va modificando su algoritmo y perfeccionando sus resultados según lo que va aprendiendo de diversas fuentes o a cualquiera de los sitios que ofrecen recomendaciones en base a lo comprado o consultado por los usuarios.

Esto es la base, si no estamos procesando los datos, no los manejamos en el momento y no nos beneficiamos del aprendizaje… ¿para qué almacenamos estos datos? El poder del análisis del Big Data es precisamente lo que hace que sea tan interesante para mí. De hecho, lo que más me interesa no es el entorno tecnológico, sino lo que se puede llegar a hacer con esa cantidad ingente de datos.

Esto es solamente el principio, 2014 está siendo el año de no parar! Estuve en el TechDay de Burgos en marzo hablando de Big Data (a partir del minuto 28), en Tecnológica Santa Cruz de Tenerife hablando de la necesidad de analizar la información y convertirla en conocimiento.

                
                                         En el Innova Bilbao en abril 2014

Además en abril he estado en Innova Bilbao hablando de cómo hornear buenas KPIs y acabo de llegar de Santa Cruz, Bolivia donde empieza a crecer el interés por el Big Data. Como os decía... esto es solamente el principio J

lunes, marzo 3

No por tener muchas herramientas se accede al conocimiento

A finales del mes pasado estuve en el evento Comunica2 enGandía y, además de aprovechar para ver a mucha gente interesante, intenté poner mi granito de arena para evangelizar en la medición total a los profesionales que gestionan redes sociales en la analítica digital. Mi mensaje central es la importancia de desayunar con datos cada mañana, cómo nos ayudará a tomar decisiones el tener claras las métricas según los objetivos de negocio. Os cuento paso a paso en qué consistía para que se entienda bien la presentación que os adjunto al final.

Partimos de un caos y descontrol importante, debido al alto número de plataformas sociales donde tenemos que realizar nuestra estrategia y a las numerosas herramientas que existen a la hora de medir su rendimiento en Redes Sociales. No por tener muchas herramientas se accede al conocimiento, lamentablemente. Es más complicado que eso, hay que tener un plan.

Como bien comentaba hace unos días Avinash Kaushik en su twitter, si queremos saber el ROI en Social Media, primero hay que determinar los objetivos que tenemos y cómo vamos a focalizar nuestros esfuerzos. Una vez tenemos nuestros objetivos hay que preguntarse si se pueden describir, medir y predecir. Si no se puede… entonces esos objetivos NO nos valen.

Para ayudar a determinar los objetivos vale la pena echar un ojo a lo que mostraba John Lovett en su libro Social Media Metrics, se parte de los objetivos de negocio (Ingresar, Fidelizar o Innovar) y así podremos tener más claros los objetivos en las Redes Sociales (notoriedad, diálogo, ventas, servicio al cliente, generar comunidad o promover innovación).

Teniendo los objetivos claros, podremos definir los indicadores que vamos a utilizar y el tipo de redes sociales donde haremos nuestro esfuerzo. Es decir, tendremos más claro QUÉ HACER y CÓMO MEDIRLO. Pero no basta con tener claros los indicadores, lo importante es definir acciones a partir de los valores que tengan dichos indicadores.

Disfrutando durante la presentación 
Por eso es importante, igual que seguiremos una estrategia en Redes Sociales, avanzar en un plan de medición que nos permita actuar donde haga falta para optimizar dicha estrategia. El embudo de conversión que siempreutiliza Tristán Elósegui me parece un marco estupendo para identificar problemas y soluciones.

Hay que medir en base a cada fase del embudo y determinar los indicadores que utilizaremos en cada fase. La diferencia es que ahora no estamos midiendo únicamente los indicadores “de negocio” sino que complementamos las métricas con las propias de cada nivel:

Escuchar, Notoriedad, Diálogo, Conversión y Satisfacer serán los objetivos de cada una de las etapas de nuestro embudo de conversión: Pasar de impactar al usuario a que se convierta en FAN.

En la etapa de Escuchar, tendremos que realizar un diagnóstico tanto del entorno en el que nos vamos a mover como de la competencia que nos vamos a encontrar. La idea es ver quien habla, cómo lo hace y de qué (relacionado con nuestra empresa o persona) y así identificar perfiles, sentimientos, lugares y competencia para poder afianzar nuestro plan en Social Media.

Pasamos entonces a la etapa de Notoriedad, donde intentaremos impactar al máximo número posible de usuarios, por lo que nuestras métricas serán casi todas cuantitativas, cuánto alcance, cuántos seguidores, cuántos favoritos o me gusta por ejemplo en las redes sociales (siempre segmentar por red social y tipo de contenido para saber de qué hablar y dónde según mejores resultados). No podemos olvidar, si tenemos una web donde finalizar un negocio, obtener las métricas relacionadas también con métricas: cuantitativas como son las visitas y cualitativas como la tasa de rebote, también segmentadas por red social, tipo de contenido, página de aterrizaje, si son visitas recurrentes o nuevas, etc… Podremos entonces determinar qué mensajes obtienen mejores resultados de notoriedad, dónde y cuánto tráfico atraemos a nuestro sitio web.

La etapa del diálogo ya es algo más ambiciosa puesto que buscamos crear y ser parte de conversaciones relacionadas con el movimiento de la marca. Por lo que las métricas en redes sociales irán orientadas a este tipo de conocimiento, amplificación de mensajes, conversaciones, menciones… segmentadas por red social y tipo de mención para poder entender qué pasa y por qué. En el caso de la web, las métricas irán orientadas al tiempo o páginas vistas que medirán el interés del usuario en nuestro sitio después de conocernos vía una red social. ¿Qué tipo de contenido interesa por cada red social? ¿Qué tipo de contenido les engancha? ¿Qué producto o servicio puede llegar a interesarles? Esta información nos ayudará a ir un paso más allá, ya no hablamos de que nos conozcan, sino de que mantengan su interés.

Llegamos a la etapa que más interesa al negocio, la etapa de la conversión. El objetivo aquí es generar valor para la marca en forma de usuarios que cumplen el objetivo real de la empresa, la conversión. En este punto lo que nos interesa es saber qué contenido o producto o servicio genera más visitas a la web que se terminan convirtiendo en clientes. Cuántos clicks tenemos en nuestros mensajes en cada red social y cuántos de esos clicks y cómo terminan cumpliendo nuestro objetivo final. Mucha gente comenta que no se vende por redes sociales, pero las herramientas de analítica web, si las configuramos bien, nos pueden dar mucha información. Por ejemplo, qué usuarios que terminan comprando en una visita posterior después de tener el primer impacto en redes sociales… Esto es muy grande! Entender el proceso de compra, cómo un usuario que nos conoce vía nuestro anuncio en Facebook termina convirtiendo 3 semanas después porque nos busca en Google con nuestra propia marca J

Y terminaremos nuestro plan de medición en la última etapa, la de fidelización y satisfacción. Ahora lo que nos interesa es saber quien puede ayudarnos a influenciar a cada una de las redes y cómo podemos dar servicio a nuestros clientes resolviendo incidencias propias de atención al cliente. Así podremos aumentar beneficios rebajando las consultas que se realizan a nuestro call center, por ejemplo. Y las recomendaciones a los seguidores de cada usuario convertido nos ayudarán a establecernos sólidamente en este entorno: Retener a un cliente es infinitamente más barato que captar uno nuevo J

Gemma Muñoz

Realmente lo que importa en una red social es lo que pasa después de la participación. Entender el comportamiento en cada una de las fases del embudo de conversión nos ayudará a optimizar la estrategia al máximo.

Finalmente, ya sabéis que estoy muy pesada últimamente con la visualización y la transmisión del conocimiento, es importante saber cómo mostrar la información, tanto a nosotros mismos para tomar decisiones en base a los datos como a los directivos de la empresa para explicar qué se está consiguiendo en base a nuestros esfuerzos. Podemos partir de una tabla básica para ver cómo vamos evolucionando pero lo interesante es tener un buen cuadro de mandos para saber qué pasa y por qué y qué puedo hacer al respecto.

Un último apunte: no hay que quedarse en el análisis descriptivo de qué está pasando, hay que ir un paso más allá prediciendo qué pasará con cada una de las acciones propuestas (hipótesis) para terminar con lo que realmente cambia las cosas, el análisis prescriptivo: qué hemos de hacer y dónde para optimizar nuestra estrategia en Redes Sociales.

Os comparto mi presentación, espero que os resulte interesante y que empecéis a medir de verdad para que os valga la pena el esfuerzo de desayunar con datos.

Analítica para Redes Sociales por Gemma Muñoz



martes, febrero 25

The greatest value of a picture is when it forces us to notice what we never expected to see


Parece que febrero ha sido en Madrid el mes de los eventos dedicados a la visualización de los datos. Y yo feliz, porque es uno de los temas más apasionantes de la analítica digital y me sirve para contar mi experiencia en dashboards.

Primero fueron las Madrid Geek Girls en su evento #MGGHub, que repasaron los principales errores a la hora de crear un dashboard. Principalmente quedó claro por parte de Gema, Paula y Ana que ha de ser simple, pero de simplicidad, no de simpleza.

También hablaron del paso a paso para realizar un buen dashboard. Hay que ser capaz de ver el conjunto de todo, la historia, las acciones… Destacar todo lo que huela a negocio! Aquí está la presentación por si os apetece profundizar en este tema.

Nadia Fankhauser, de Tinte Digital, en el evento de Open Analytics que se celebró la semana siguiente, comentó que hay que hacer los datos aptos para el consumo humano; es decir, hay que saber diseñarlos, sacarles el máximo partido a nivel visual para que cuenten la historia. El periodismo de datos es ya un presente.  Y ella es una auténtica crack en temas de visualización.

Finalmente Pere Rovira en el Conversion Thursday de Madrid estuvo defendiendo la importancia de que el analista debe convertir el análisis en información y conocimiento adaptado al receptor al que va dirigido. Me gustó el paseo por los gráficos de Google Analytics, treemaps y grafos, sobre todo con respecto a visualizar el comportamiento y relaciones entre datos.



Ejemplo de Grafo hecho con Netvizz + Gephi

Todo esto me lleva al mismo punto… En analítica digital tenemos que crecer más deprisa. Después de muchos dashboards sobre mis espaldas, lo que me he dado cuenta es que estamos creciendo, sí, cada vez más. Los dashboards a lo mejor no es de lo más valorado de un analista, pero son muy necesarios, sobre todo para mostrar a los que no son analistas cómo va el negocio y hacer más fácil el trabajo de cada uno de los receptores.

Lo importante es que muestren la parte estratégica y también la operativa, para que se puedan tomar decisiones tanto del día a día como estratégicas.

En su momento, todos empezamos y tuvimos nuestros más y nuestros menos con los dashboards en Google Analytics:


                            http://wurlwind.co.uk/wp-content/uploads/2012/06/Google-Analytics-Dashboard-Large.jpg

Hemos pasado de los dashboards en Google Analytics a los dashboards automatizados en Excel con cualquiera de las herramientas que conectan con las APIs:

-       Supermetrics 
-       Next Analytics 
-       Excellent 
-       Analytics Kanvas 

Esto ya es un paso, el poder ir más allá de los cuadros de mando de una herramienta y avanzar obteniendo un cuadro de mando más completo, con datos que cuentan una historia, que nos llevan a tomar decisiones de negocio, como dónde invertir mejor nuestro presupuesto en base al negocio generado.

Lo mejor es que, al estar automatizado, no hace falta más que cambiar la fecha para poder obtener lo que necesitamos para entender qué ha pasado y por qué puede estar pasando en nuestra estrategia online y offline.

                        Ejemplo de Dashboard en Excel: Este ejemplo se diseña y automatiza en 42 horas

Sin embargo no nos podemos quedar aquí. Tras hacer múltiples dashboards en Excel, me he dado cuenta de que uno de sus problemas es que hay que hacer las cosas una y otra vez. Cada cliente tiene sus propias KPIs, su estrategia que hay que mostrar de forma diferente y la construcción de cada uno de los dashboards conlleva un trabajo importante.

Y esto termina siendo un problema, de tiempo y de recursos. Porque no podemos asumir que el dashboard es igual para todo el mundo. Cada departamento, cada directivo, necesita datos diferentes y, obviamente, la visualización será diferente, incluso dentro de una misma compañía.

Por eso el  trabajo se multiplica, cada receptor debería recibir un cuadro de mando personalizado, en la forma que necesita y con los comentarios de análisis de KPIs que le permita tener la foto completa y así detectar qué necesita ser optimizado en base a conseguir cumplir los objetivos de negocio.

En los clientes más desarrollados a nivel estratégico en internet hemos decidido ir un paso más allá y apostar por una solución de visualización de datos más flexible que el Excel, en la Web, más escalable y que nos permita llegar donde necesitamos llegar: a tener un workflow en el que todos los insights tengan un responsable y cada optimización tenga nombre y apellidos. Hay gente que esto lo llama ser chivato, yo prefiero llamarlo Involucración jajaja.


    Dashboard en SweetSpot: este ejemplo se diseña y automatiza en 1 hora

¿Cuántas veces el analista ve un insight que se puede arreglar fácilmente y al final nadie de la organización se encarga y queda sin arreglar o se arregla tarde?

Esta comunicación eficaz de insights ayuda a que el analista hable el idioma de la empresa y se convierta en perfil imprescindible para la compañía. Sobre todo si la empresa no tiene un perfil analítico, para el consultor es vital llegar a todos los stakeholders del negocio. Por eso hemos investigado opciones y la que más nos convence es la de SweetSpot Intelligence.

Puede competir con las grandes herramientas americanas, lo mejor de todo es que es española y se ha desarrollado aquí.  Por eso me quiero involucrar, así que colaboro con esta herramienta para hacerla crecer.

Este proyecto me ha enamorado… recordáis mi primer dashboard? Ojo que han pasado casi 6 años… y lo que ha llovido J


Pd. Echa un ojo a la chuleta para analistas de SweetSpot, buen comienzo para entender la conceptualización de un dashboard.