Big Data, cantidades ingentes de datos

Imagen de jgironesr

"Se estima que el 90% de los datos almacenados a nivel mundial, se han generado solo en los 2 últimos años"                                                              

       


Las redes sociales, servicios como GPS, meteorología, aplicaciones para Smart Phones, tarjetas de crédito, telefonía móvil, sensores ... los canales por los que obtenemos multitud de servicios crecen año tras año, y con ello la cantidad de datos que generan.

Y la tendencia a generar y generar más información crece exponencialmente. Toda esta cantidad de información es lo que se conoce como Big Data.

Se caracteriza básicamente por tres factores:

  1. La Variedad: puede tratarse de texto, de video, de imágenes, de trazabilidad de acciones sobre distintos entornos como la web, aplicaciones, ...
  2. La Velocidad: en muchos casos se trata de información con una fecha de caducidad muy corta, a veces prácticamente solo tiene valor en el mismo momento que se genera.
  3. El Volumen: Cantidades ingentes de datos, que requieren de técnicas avanzadas de procesamiento e interpretación para que puedan ser usadas.

Grandes fabricantes como IBM, ORACLE, SAP, Google, Amazon, Facebook, Twitter ofrecen ya soluciones pioneras a esta nueva gestión del conocimiento, pero se plantean también interrogantes:

  1. Internet deja de ser tan democrática como parecía. Solo las grandes empresas pueden aprovechar este tipo de herramientas.
  2. La privacidad de la información que generamos a modo individual no siempre está protegida como es debido y por supuesto puede ser usada sin nuestro consentimiento.
  3. Se abren nuevos campos de oportunidades para sectores como la biomedicina, la ciencia, los servicios post venta, la personalización de la oferta

También quedan al descubierto viejos paradigmas para el mundo de las matemáticas y la estadística y por extensión para el Data Mining cuando para generalizar en muchos casos se parten de pequeñas muestras que con más o menos precisión nos permiten extrapolar comportamientos similares en universos de datos mucho mayores.

Con grandes cantidades de datos, con tecnología suficiente, con capacidad de cálculo suficiente, en muchos casos ya no será necesario recurrir a muestras ... simplemente dejará de tener sentido, se tratará de descubrir tendencias y patrones directamente sobre el Big Data.