Big Data, Bigger Data. . . Demasiado grande

Si bien la mayoría de nosotros estábamos ocupados abriendo regalos en Navidad, The Wall Street Journal publicó un artículo sobre la recopilación de datos de la NSA. El punto no era que violara la privacidad, lo cual es cierto, sino que estaban reuniendo mucho más de lo que podían usar. En resumen, también fue estúpido.

The Journal citó a William Binney, un empleado retirado, de alto rango y largo tiempo de la NSA que trabajó en su código informático, hablando en una conferencia sobre privacidad en Suiza: "Lo que están haciendo es volverse disfuncionales tomando todos estos datos".

El artículo continuó comentando: "La agencia se está ahogando en datos inútiles, lo que perjudica su capacidad para llevar a cabo una vigilancia legítima. . . Los analistas están inundados con tanta información que no pueden hacer su trabajo con eficacia, y la enorme reserva es una tentación irresistible para el mal uso ".

El artículo describe los esfuerzos de Binney, Ed Loomis, jefe de un centro de investigación para supervisar los datos, y otros, para examinar los vastos trozos de mensajes y encontrar información importante y útil. Ellos "construyeron un sistema para raspar datos de Internet, descartan el contenido sobre los ciudadanos de EE. UU. Y amplían los metadatos sobrantes, o la información" de "a" y "de" en el tráfico de Internet. Lo llamaron ThinThread ".

La agencia eliminó ese plan, y eligió uno llamado "Trailblazer". Pero, el Journal señaló, "el sistema de filtrado de datos de Trailblazer nunca se construyó, tampoco. En cambio, los funcionarios de la NSA secretamente buscaron y obtuvieron apoyo para una variedad de programas para realizar escuchas sin orden judicial de contenido telefónico y de Internet. Obtuvieron una aprobación similar para recopilar y analizar metadatos de casi todas las llamadas telefónicas de los EE. UU. Y vastas franjas del tráfico de Internet ". (Véase," La NSA lucha para comprender la inundación de los datos de vigilancia ").

El resultado neto es el sistema inflado e ineficiente que ahora tenemos, uno que tiene éxito en comprometer salvaguardias constitucionales contra la invasión de la privacidad sin poder encontrar la información que necesitamos para estar seguros. ¿Cómo dar cuenta de estas fallas?

A nivel individual, es producto de la obsesión, un enfoque intensificado en una cosa que conduce a una especie de visión de túnel, ignorando el contexto y el significado. En resumen, si su trabajo es recopilar datos secretos, no puede saber cuándo es suficiente o cuándo detenerse, porque su trabajo es obtener la mayor cantidad de datos posible, no pensar qué hacer con él o por qué necesito. Y si tienes enemigos reales, se convierte fácilmente en una obsesión paranoica. Entonces, realmente no puedes parar, porque sucumbes demasiado fácilmente a la ilusión de que un poco más de información te salvará.

A nivel grupal u organizativo, significa falta de liderazgo o supervisión. Las funciones técnicas y la tecnología requerida para tener éxito existen en un silo o un vacío. Es similar a lo que sucedió con los bancos durante la crisis crediticia cuando los ambiciosos traficantes sin escrúpulos generaban enormes ganancias manipulando algoritmos que sus gerentes no entendían. Su trabajo consistía simplemente en ganar dinero, la mayor cantidad de dinero posible, mientras que los gerentes, hipnotizados por las ganancias y temerosos de mostrar su ignorancia, esperaban y dejaban que sucediera, hasta que el sistema estalló.

¿Qué tan inteligente tienes que ser para no ser demasiado inteligente?