Hablamos de Big
Data cuando tenemos una cantidad de datos superior a la que podemos procesar
con herramientas habituales. Si la cantidad es grande, se mueve demasiado
rápido o no está estructurada, y se quiere sacar partido de ella, es necesario
desarrollar herramientas alternativas de proceso. Las más conocidas son Hadoop, Spark, Mapreduce, Storm o Hive.
Estamos hablando
de la aparición de “data sets” de tamaño y complejidad enormes. Podemos
resumirlo en estas variables:
- Volumen.
Se refiere a la cantidad de datos en terabytes incluso petabytes;
- Velocidad.
Los datos son muchas veces dependientes del tiempo, y sus análisis necesarios
para decisiones en tiempo real;
- Variedad:
Los datos vienen en formatos y estructuras diferentes, no fáciles de integrar;
- Veracidad:
Se refiere a la calidad y fiabilidad de los datos disponibles;
- Accesibilidad: Muchas veces las fuentes posibles de datos no están claramente identificadas. Llamamos DDSs a fuentes de datos (“streams”) que tienen potencial de ofrecer conocimiento.
Schumpeter en
1934 ya describía la destrucción creativa de las organizaciones, cómo los
sectores evolucionan creando nuevas empresas con nuevas formas de hacer las
cosas y empujando las antiguas que no son capaces de adaptarse al mercado. Por
eso las empresas buscan las flexibilidades operacionales que les permiten
adaptarse, y ésta es la razón de existir de Big Data. Hablaremos de los
posibilitadores como el Internet of Things, la capacidad incremental de
computación y los sistemas de datos en la nube: estos son características del
entorno que ofrecen la posibilidad. Pero Big Data existe porque es fuente de
ventaja competitiva para las organizaciones.
En gran parte por
esta razón, es esta era de disrupción, los grandes titanes como Kodak,
Blockbuster, Nokia y otros han sido sustituidos por Instagram, Netflix, Apple,
Spotify,… Es el caso, por ejemplo, de Kodak y Pinterest. Mientras Kodak
desarrollaba productos a espaldas de su cliente, Pinterest hace uso activo de
técnicas de Big Data con ese objetivo. Así, Pinterest colecciona intereses, no
imágenes, mediante un sistema de descubrimiento personalizado que extrae el
contexto y la intención de cada pin. Todo eso genera petabytes de información
que no pueden procesarse con herramientas tradicionales. Pinterest utiliza
Hadoop.
Esto también ha
ocurrido con los clasificados en papel y webs tipo eBay. eBay también utiliza
Hadoop por ser una plataforma abierta y altamente escalable. Permite analizar
en tiempo real la enorme cantidad de datos de “streaming” que entran
constantemente. Busca metadato, es decir, tags de información asociados al dato
y que convierten el dato en información útil para la comunidad de usuarios en
general, con el nivel de seguridad y permisos adecuado. eBay consigue un nivel
alto de personalización, “merchandizing” y “A/B testing” para probar nuevos
elementos y mejorar la experiencia de usuario. El “merchandizing” se consigue
mediante un motor de recomendaciones basado en búsqueda de patrones entre dato
estructurado. eBay también usa Big Data
para detección de fraude, predicción de riesgo del comprador y del vendedor y “account
take over”, cambios no claros de usuario en la misma cuenta.
eBay también
utiliza Big Data para analizar y diseñar los procesos. Analizar a posteriori
los datos es siempre más complejo y menos fiable que diseñar por adelantado de
forma exacta los procesos, las tareas, los tiempos y las responsabilidades.
En el mundo del
vinilo y Spotify ha ocurrido una disrupción similar. Spotify nació en 2008 y
hoy tiene decenas de millones de usuarios activos, más de 6 millones pagando.
Pone a disposición más de 20 millones de canciones y cada día agrega más de 20
mil. Genera más de 500 millones de dólares en derechos de autor. Una de las
claves de este éxito es el perfilado, el desarrollo de playlists acorde al
perfil y el motor de recomendaciones que genera adicción a seguir escuchando,
cada canción más interesante que la anterior.
Netflix es un
caso muy completo de estudio en el sector media, que necesita un apartado en sí
mismo. “House of Cards” ha cambiado la historia de la producción de contenidos.
En el sector
Industria 4.0, Big Data viene en una combinación con Internet of Things,
sensores, plataformas estándares, robótica, redes que están juntas abriendo
modelos de negocio antes desconocidos.
En algunos
sectores como media, tecnología y telecomunicaciones, esta disrupción ha
ocurrido ya. En otros sectores está ocurriendo, como logística, manufactura, banca
retail, retail, viajes, automoción y seguros. En el resto de los sectores
económicos irá ocurriendo progresivamente, como educación, medicina, farmacia,
utilities o construcción.
En 1995 las
empresas más valoradas del mundo eran Nipon, GE, Exxon, Coca Cola, Toyota y
Phillip Morris. En 2019 esa lista no incluye a Toyota ni a Roche ni a Phillip
Morris, sino que incluye Apple, Google, Microsoft, Amazon y Facebook.

No hay comentarios:
Publicar un comentario