El problema no es el dato

¡El Big Data ha llegado y nos va a destruir a tooooooddooooooosssss y van a saber TODOS nuestros secretos!

Bueno, a ver, vamos a analizar un poco qué está pasando en la actualidad con tanto dato y tantas empresas que beben de nuestros secretos, y cuánto hay de cierto en las conspiraciones de gorrito de papel Albal que escuchamos en los telediarios entre noticias del COVID y los deportes.


En primer lugar, y como todo en esta vida, habrá que definir qué es un dato, ¿no?


Según el diccionario de la Real Academia de la Lengua, un dato es “Información sobre algo concreto que permite su conocimiento exacto o sirve para deducir las consecuencias derivadas de un hecho.” o, en su defecto y en un ámbito más informal, “información dispuesta de manera adecuada para su tratamiento por una computadora”.

 

Para bajarlo a tierra, un dato puede ser bien una pieza de información que nos permite saber algo, bien aquello que podemos meter en nuestro ordenador y que este va a saber leer adecuadamente. Es decir, una fecha de nacimiento sería un dato, excepto que esté en un formato que un ordenador no pueda leer y entonces no se pueda procesar. Perfecto. Entendido hasta aquí. Vamos al lío de los problemas que surgen en la actualidad.

 

La aparición del Big Data

 

El Big Data para muchos es como un gnomo maligno en forma de código binario que viene a destruir el mundo, pero realmente, y explicado para mi abuela, el Big Data no es más que el hecho de que tenemos cacharros tecnológicos que pueden cogerte millones de piezas de información y procesarlas en un tiempo récord e incluso encontrar patrones que unen 1 pieza de información con otra dentro de esos millones. ¿Qué?, ¿a qué no da tanto miedo explicado así?

 

Párate a pensarlo de esta forma, imagínate los datos que tiene que procesar solo la aplicación de WhatsApp: textos, fotos, GIFs, vídeos, stickers, llamadas, videollamadas y todo eso multiplicado por 2.000 millones de usuarios en todo el planeta. Ahora piensa que tu móvil no solo tiene 1 aplicación, sino 15-20-30. Sin una tecnología que consiga procesar todo esto, es imposible que en 1 segundo puedas enviarle el GIF de Ralph a tu amigo cuando te rompe el corazón, mientras escuchas el nuevo disco de Bad Bunny en Spotify y el reloj sigue funcionando con el huso horario correcto.

 

Tuve la suerte de trabajar en el Barcelona Supercomputing Center, que tiene el ordenador más grande de Europa, una pasada. Mis compañeros eran científicos brillantes que cruzaban millones de datos en un modelo creado por ellos solo para poder predecir el clima desde unas semanas hasta varias décadas. Y tú me dirás, y ¿para qué quiero yo saber si va a llover el 30 de abril de 2025? Eso dije yo, hasta que me explicaron que es necesario para los agricultores que dependen del tiempo. Sin esta predicción, podrían perder su cosecha completa. Ahí, me cambió la percepción de los datos.

 

Ahora que tenemos un poco más de idea de lo que puede hacer el Big Data y de que no es tan malo como lo pintan, vamos a adentrarnos en la peor parte, el mal uso.


 

El principal problema de todo, ¿quién controla los datos?

 

Aiiins, el control. Eso que tanto nos gusta. Ya lo decía Heródoto: De todos los infortunios que afligen a la humanidad el más amargo es que hemos de tener conciencia de mucho y control de nada. Mira que hace 2500 años no existían ni TikTok ni los challenges, pero Heródoto ya reflexionaba sobre el problema del siglo XXI: Tenemos conciencia de mucha información pero no la controlamos. Al menos, nosotros como usuarios de a pie. 

 

Según un estudio de MyData más del 90% de los datos que se generan en el mundo son gestionados por compañías de Estados Unidos, principalmente por los gigantes tecnológicos Google, Amazon, Facebook y Apple. Repito por si acaso no lo habéis visto: POR COMPAÑÍAS. ¿Y sabes cuáles son las posibilidades de acceder a esos datos que tienen sobre ti? Si alguna vez has probado a hacer una Spartan Race, puede ser algo parecido a esto solamente para acceder al 10% de lo que saben sobre ti.

 

En paralelo a esto, puedes ver como los perfiles de “Data Analyst” o “Business Analyst” están cada vez más demandados. O sea, tienen el 90% de los datos de todo el mundo y un equipazo de expertos en exprimir esos datos para el beneficio comercial de la compañía a la que pertenecen.

 

¿Y nosotros qué tenemos? Pues mira yo tengo un ordenador que me compré hace 7 años habiendo ahorrado y poquísimos conocimientos sobre tratamiento masivos de datos.

 

Injusto, ¿no?

 

Se está abriendo un nuevo horizonte

 

Y es que no hay nada que me guste más que alguien que rompe con lo preestablecido para el beneficio conjunto. A pesar de que no llevamos más de 1 década con este nuevo escenario, ya han salido respuestas ante este descontrol de datos y aquí te expongo varios:


  • Tor/DuckDuckGo: Son dos tipos de navegadores (fuera de Google) que no te rastrean en ningún momento tus “paseos surfeando por la web”. 
  • El creador de internet se rebela: Y es que Tim Berners-Lee hace un año dio una charla sobre el estado actual de su invento, coincidiendo con el 30 aniversario de la creación, e hizo un llamamiento para que se cambie la forma en la que se usa y las plataformas se centren en que los usuarios puedan controlar sus datos. Puedes ver más información en este artículo de Retina.
  • Crowdfunding para la transparencia de datos públicos: Barriendo para casa, el último ejemplo es el de Jaime Gómez-Obregón, un analista de datos que un día hizo un hilo exprimiendo datos públicos y sacando conclusiones que pusieron rojo a más de uno de las figuras públicas de la política cántabra. Debido al alcance que tuvo el hilo,  Jaime decidió crear un Crowdfunding y posteriormente una cuenta en Patreon para poder hacer de esto su trabajo y poder sacar conclusiones para los usuarios de a pie analizando y cruzando datos públicos. Actualmente recibe más de 3.000€ al mes en suscripciones por esto. Se nota que el problema es vigente. Podéis leer más información aquí.


Espero que con este artículo os haya hecho pensar un poco acerca del Big Data y de que las claves al final son dos: Es muy importante equilibrar la seguridad y la privacidad y es fundamental tomar conciencia como el primer paso para cambiar las cosas.

 

Y con esto, me despido como diría Ana Pastor: Estos son los datos, suyas son las conclusiones.


Por Carlos Otero