INNOVACIÓN

Big data: la inteligencia de los datos

Tiempo de Lectura: 5 minutos

Big data: la inteligencia de los datos
Avatar

CaixaBank

26 Agosto, 2019


Más de 7400 millones de habitantes compartimos el planeta Tierra, y más de la mitad de ellos (4388 millones) nos conectamos a Internet. Por ejemplo tú, que estás leyendo este artículo. De entre ellos, más de la mitad (3986 millones) lo hacen a través de smartphones. Son los últimos datos del informe Global Digital 2019 Report que han presentado We Are Social y Hootsuite, donde también se muestra la evolución creciente constante, la cual en este último año ha representado un crecimiento del 9,1%.

Pero sigamos con las cifras mareantes. Según el estudio elaborado por Digital Information World, en cada minuto de 2018 se enviaron 18 millones de mensajes a través de WhatsApp, se lanzaron 481 000 tuits y se realizaron 3,7 millones de búsquedas en Google. Además, en 60 segundos se vieron 4,3 millones de vídeos en YouTube y los usuarios de Netflix visualizaron 266 000 horas de contenidos. ¿Te suenan estos servicios? ¿Has utilizado alguno en los últimos días? ¿Tal vez… todos ellos?

Es ilustrativo recordar el ejemplo de que la radio tardó nada menos que 38 años en alcanzar 50 millones de usuarios en todo el mundo. La televisión, en cambio, tan solo tardó 13 años. Internet, apenas 4. El iPod, 3, y Facebook, 2 años. Facebook tiene hoy no 50, sino 2271 millones de usuarios en todo el mundo, más que los habitantes del país más poblado, China. Y todos ellos ceden sus datos.

Y es que estamos viviendo una época marcada por la revolución de los datos masivos, que nosotros cedemos, de forma más o menos voluntaria, a cambio de la supuesta gratuidad de los servicios. Pero todos estos datos y metadatos que subimos a la red no servirían de mucho si no se almacenaran, clasificaran y analizaran. Y es la disciplina que se encarga de este proceso la que recibe el nombre de inteligencia de datos o big data.

A partir de estos datos (o macrodatos) podemos generar conocimiento, productos y servicios. Estos datos permiten, por ejemplo, predecir el tiempo, analizar parámetros de salud, mejorar la eficiencia energética o vender más y mejor. Y es que la inteligencia de datos se encuentra en todos los servicios antes mencionados. Por ejemplo, si te equivocas al escribir una palabra en Google, este la corrige; Amazon, Netflix o Spotify nos muestran productos que nos pueden interesar y Facebook nos sugiere amistades con gente que es probable que conozcamos. En todos esos casos, se está utilizando el big data.

Las cuatro «uves»

¿Cuáles son las principales características del big data? Se podrían resumir en lo que se ha dado en llamar las cuatro «uves»: volumen, velocidad, variedad y veracidad. Es decir, gestión de un gran volumen de datos, a la mayor velocidad posible, almacenados junto a una extensa variedad de información, que debe estar constantemente verificada.

  • Volumen: «los datos nunca duermen», se suele decir. Y es verdad: el crecimiento de los datos es constante, se dobla cada 40 meses. Eso significa que se generan más datos en un solo día de los que han existido en los últimos 20 años.
  • Velocidad: la información se procesa tan rápido que podemos conocer datos del presente inmediato y consultar qué es lo que está ocurriendo en el mundo ahora mismo. Esto permite hacer análisis muy detallados –y bastante complejos– que frecuentemente se integran en otros procesos de trabajo y sistemas.
  • Variedad: hay datos de muchos formatos y tipologías, según su procedencia. Se podrían clasificar en: datos públicos (los que poseen las administraciones públicas, por ejemplo, sobre transporte, uso de energía, sanidad, etc.); datos privados (derivados de transacciones comerciales, de la navegación web, de la telefonía móvil, etc.); datos comunitarios (producidos principalmente en las redes sociales y generados por el usuario); y finalmente, datos quantified self (proporcionados por las propias personas que miden y cuantifican sus comportamientos y acciones: por ejemplo, las pulsaciones durante la realización de ejercicio físico que monitorizan los wearables).
  • Veracidad: los datos obtenidos deben ser fiables, íntegros y auténticos, por lo que será necesario confirmar su veracidad. Ello dependerá de las fuentes y los recursos que hayamos empleado para obtenerlos.

Afinar la «inteligencia» de este gran volumen de datos, aunque sean veloces, variados y, con suerte, veraces, sigue siendo el gran reto pendiente.

Acepto las condiciones de uso.