El “Big Data” No es neutral.

Mientras mas avanzan las discusiones sobre la importancia de los datos y la acelerada apuesta que le hemos estado haciendo a la cuantificación de la vida gracias a los datos, lo primero que debemos desmitificar es que el “Big Data” no es neutral.

Los datos en sí mismos obedecen a las diferentes elecciones de las personas, lo que dicen, lo que cuentan, los sentimientos y las emociones; cuando hablamos de personas. En el caso de las empresas, el comercio, la política los datos reflejan los intereses de cada uno de los segmentos sobre el que se quiera poner la lupa de los datos.

La neutralidad de los datos sería como decir que las opiniones políticas de las personas recogidas en twitter y agrupadas en tendencias reflejan el pensamiento frío de cada personas sin la afectación emocional de quien hace el trino o asumir el desinterés de cada persona por cada uno de los temas. Eso por un lado.
Por otro lado debemos examinar las fuentes de datos de quienes nos entregan el “Big Data” del qué tanto hemos estado hablando, ya sea las estadísticas del buscador de google, las de twitter, facebook o pornhub, aunque sus algoritmos se ufanan de almacenar las búsquedas sin ningún filtro hay que dudar de antemano de los filtros realizados al entregar una estadística u otra y como no podemos acceder al 100% de los datos no podemos fiarnos de su veracidad o de su neutralidad que es el tema especifico.

El dato es un ejercicio político, por eso desde hace unos años hemos venido hablando de los datos abiertos, del gobierno abierto y otros cuantos términos en donde se pretende que diferentes personas puedan entender que es eso del “Big Data” tome el control de sus propios datos y comprenda las implicaciones de lo que tenemos en frente.

Hoy decimos que los datos de contratación de los gobiernos pueden ayudar a resolver los temas de corrupción, pero los datos del portal de contratación de Colombia no son 100% abiertos y el tener los datos de todos los contratos no pueden decirnos como afectar la problemática social de la corrupción. Mi hipótesis es que con datos o sin datos seguirá existiendo corrupción y que los datos sólo mostraran en que se quiere gastar el dinero pero no quienes están detrás del proceso, los datos de contratación nos mostraran en que se esta gastando el dinero y en que decidieron gastarse cada centavo del dinero público.
Ademas podremos leer que tipo de tendencia política tiene el gasto publico a que intereses obedece el gasto mas allá de los programas políticos el cruce de los datos de contratos puede hablar sobre los intereses de las personas en los diferentes puntos del poder político y como están interpretando la ejecución del presupuesto. Eso si del presupuesto publico hay una parte de ese presupuesto que es de ejecución “secreta” de la cual no podemos saber nada.

Después de los datos del gasto publico en otro nivel de importancia aparecen los datos de trafico, los datos arrojados por los sensores que miden diferentes variables de contaminación ambiental, los datos de las personas que usan taxis o transporte publico etc etc que pueden servir para que ciudadanos interesados den una lectura o propongan soluciones a problemas locales, “Ciudadanos inteligentes” en ciudades inteligentes. Esa es parte de la apuesta del “Big Data” pero sigue estando lejos de ser neutral. ¿Quién tiene el poder de computo para procesar el flujo diario de twitter que no sea twitter o las grandes empresas? a los ciudadanos de a pie nos toca conformarnos con lo que el “Big data” esta hablando.

La cuantificación por medio de los datos suele mostrar un problema de manera fría al enumerar las cosas y pareciera que tomara distancia, es por eso que el analista de los datos debe acompañar sobre todo cuando se trata de datos sociales o culturales de las preguntas típicas que intenten explicar los números, siempre un ¿por que? que intente dar cuenta de lo que nos muestran los datos es igual de importante y su respuesta es humanamente imposible que sea neutral. Aún la inteligencia artificial no esta analizando los datos y cuando lo haga debemos dudar también de su neutralidad.