Big Data, Bigger Data. . . Muito grande

Enquanto a maioria de nós estava ocupada a desembrulhar presentes no Natal, o Wall Street Journal publicou um artigo sobre a coleta de dados da NSA. O ponto não era que violasse a privacidade – o que é verdade -, mas que eles estavam se reunindo muito mais do que poderiam usar. Em suma, também foi estúpido.

O jornal citou William Binney, um empregado aposentado, de alto escalão e longo tempo da NSA que trabalhou em seu código de computador, falando em uma conferência sobre privacidade na Suíça: "O que eles estão fazendo é tornar-se disfuncional tomando todos esses dados".

O artigo passou a comentar: "A agência está se afogando em dados inúteis, o que prejudica sua capacidade de realizar uma vigilância legítima. . . Os analistas estão inundados com tanta informação que não podem fazer seus trabalhos de forma eficaz, e o enorme estoque é uma tentação irresistível de uso indevido ".

O artigo descreveu os esforços de Binney, Ed Loomis, chefe de um centro de pesquisa para monitorar os dados, e outros, para examinar as vastas mensagens para encontrar informações importantes e úteis. Eles "criaram um sistema para raspar dados da Internet, descartam o conteúdo sobre os cidadãos dos EUA e aumentam o zoom sobre os metadados sobrantes – ou as informações" para "e" de "no tráfego da Internet. Eles chamaram ThinThread. "

A agência escolheu esse plano, e foi para um chamado "Trailblazer". Mas, observou o jornal, "o sistema de filtragem de dados do Trailblazer nunca foi construído. Em vez disso, as autoridades da NSA secretamente procuraram e ganharam suporte para uma série de programas para realizar chamadas telefônicas sem mandantes de conteúdo de telefone e internet. Eles obtiveram aprovação semelhante para coletar e analisar metadados de quase todos os telefonemas dos EUA e vastas áreas de tráfego na Internet. "(Veja" A NSA se esforça para fazer sentido de inundação de dados de vigilância ").

O resultado líquido é o sistema inchado e ineficiente que temos agora, um que consegue comprometer as salvaguardas constitucionais contra a invasão de privacidade, ao mesmo tempo que não encontra a informação que precisamos para garantir a segurança. Como contabilizar essas falhas?

Em um nível individual, é um produto de obsessão, um foco maior em uma coisa que leva a uma espécie de visão de túnel, ignorando contexto e significado. Em suma, se o seu trabalho é coletar dados secretos, você não pode saber quando é suficiente ou quando parar, porque seu trabalho é obter o máximo de dados possível, não pensar sobre o que fazer com isso ou por que nós preciso disso. E se você tem inimigos reais, ele se torna facilmente uma obsessão paranóica. Então você realmente não pode parar, porque você facilmente sucumbir facilmente à ilusão de que mais um pouco de informação irá torná-lo seguro.

Em nível de grupo ou organizacional, significa falta de liderança ou supervisão. As funções técnicas e a tecnologia necessária para o sucesso existem em um silo ou vácuo. É semelhante ao que aconteceu com os bancos durante a crise de crédito quando os comerciantes rogues ambiciosos estavam gerando enormes lucros manipulando algoritmos que seus gerentes não entendiam. Seu trabalho era apenas ganhar dinheiro, tanto dinheiro quanto possível, enquanto os gerentes, hipnotizados pelos lucros e com medo de mostrar sua ignorância, ficaram de pé e deixaram isso acontecer – até o sistema explodir.

Quão inteligente você precisa estar para não ser muito inteligente?