Como Cambridge Analytica Mined Data for Influence Eleitor

Por que solicitar dados pessoais com desinformação é um grande negócio.

Se olharmos para o uso da análise de mídia social nas eleições de Obama, poderíamos perguntar, como é que a campanha de Trump tentou fazer com a empresa de pesquisa Cambridge Analytica diferente? Isso é sobre a violação da política da Facebook pela Cambridge Analytica ou isso é um problema maior do que isso?

Em janeiro de 2013, escrevi sobre como o presidente Obama usou efetivamente as mídias sociais nas campanhas presidenciais de 2008 e 2012, comparando o conhecimento de mídia social de sua equipe com a capacidade de Kennedy de usar a televisão. Enquanto Kennedy tinha muitos talentos inatos, como carisma e bom cabelo, que permitiam que ele se projetasse bem através das lentes para as telas de TV em casa, a equipe de Obama colocou a psicologia social para trabalhar usando as mídias sociais. Em 2016, o pessoal de Trump recorreu aos dados.

Pamela Rutledge/Shutterstock

Fonte: Pamela Rutledge / Shutterstock

Estamos agora na era da ciência de dados. A capacidade de coletar dados de várias plataformas de mídia social, capturando padrões de comportamento do usuário e comentários, é inédita. Isso gerou uma enorme demanda por cientistas de dados de alto nível, que estão descobrindo como coletar e analisar grandes quantidades de dados, criando algoritmos que descartam e respondem e construindo modelos preditivos. Sua caixa de ferramentas é uma mistura impressionante de aprendizado de máquina, estatística, habilidades robustas de programação e inteligência artificial e natural – e todas elas tentam capturar e influenciar o comportamento humano de formas cada vez mais diferenciadas e direcionadas.

Quaisquer que sejam as comparações entre Obama e Trump, elas são pistas falsas. É o acesso e uso de dados que estão no centro desse debate público. Este material não está indo embora. Só ficará mais sofisticado e onipresente. Nem tudo é ruim, nem tudo de bom. Este é um momento-chave de ensino – uma oportunidade para entender melhor algumas das principais questões éticas e legais em torno da mineração de dados – se não cairmos no buraco da indicação política.

Ainda assim, muitos vão querer fazer comparações. Quatro anos é literalmente uma vida na evolução da ciência de dados. As capacidades e o clima social são diferentes em comparação com o que estava acontecendo em 2008 e certamente em 2012. As ferramentas e a capacidade de coletar e avaliar dados são muito mais sofisticadas agora – tanto de base tecnológica quanto teórica – do que a equipe de Obama conseguiu. usar.

Mas o mais importante é que o clima social mudou e, junto com ele, a conscientização sobre violações de dados e a compreensão do uso de dados para violar a privacidade, incluindo o aumento de diretrizes e regulamentos éticos. As pessoas estão cada vez mais conscientes de como os algoritmos de dados são usados ​​com base em nossos comportamentos on-line, desde recomendações da Amazon até anúncios segmentados que nos seguem de um site para outro. Transparência, permissão e manutenção da privacidade – por segurança e para evitar a manipulação – têm sido tópicos importantes de delatores e discurso social.

Um dos grandes problemas da controvérsia da Cambridge Analytica está em como os dados foram coletados. Segundo relatos no New York Times e em outros lugares, Cambridge solicitou informações pessoais através de um aplicativo com divulgação enganosa quanto ao propósito e intenção. Os vários tipos de informação solicitados, alguns dos quais parecem inócuos, como cursos universitários e afiliação política, mas o aplicativo também incluía perguntas de avaliação da personalidade para gerar perfis de personalidade.

Agora, por que isso é um grande negócio? Nós já sabemos que é possível estimar um perfil de personalidade a partir de um monte de dados de texto ou codificando o perfil do Facebook de alguém, como os pesquisadores mostraram. O problema é que é difícil fazê-lo em escala. Você precisa ter uma quantidade significativa de texto de cada participante, o que se torna extremamente caro e trabalhoso para um grupo de qualquer tamanho. Onde os pesquisadores psíquicos podem olhar para um grupo de participantes de 200 e ser felizes como amêijoas com sua generalização, isso não serve para a persuasão dos eleitores. O desejo de traçar psicologicamente o público-alvo, no entanto, tem um grande apelo, pois fornece informações valiosas que não estão disponíveis publicamente no momento. Várias empresas de pesquisa estão trabalhando em soluções, usando técnicas analíticas como Processamento de Linguagem Natural ou aproveitando o poder do Watson da IBM, mas atualmente é usado em pequenos grupos para fins de RH (com permissão dos participantes) ou feito no agregado às identidades individuais. Mais importante, no entanto, são estimativas – reconhecidamente algumas são melhores que outras – mas elas não são o mesmo que um perfil de personalidade que você obtém quando as pessoas tomam medidas validadas de teste psíquico. (FYI – alguns argumentam que, como os testes de personalidade são auto-relatos, na verdade são menos precisos do que os perfis estimados a partir dos dados, mas deixo isso para aqueles com mais experiência nas trincheiras de avaliação para lutar.)

É desnecessário dizer que é muito mais fácil obter perfis de personalidade de muitas pessoas se uma empresa conseguir que as próprias pessoas façam um teste de personalidade. Se eles não disserem às pessoas para que servem, a empresa não precisa se preocupar com os participantes que distorcem suas respostas para “parecerem bons” para seus propósitos. Um número menor de perguntas e acesso a identificadores de mídia social permite que o desenvolvedor do aplicativo copie os dados das contas de mídia social (que o aplicativo faz desde que o participante digitou para usar o aplicativo), é fácil para um cientista de dados de crack perfis de personalidade com gostos, não gostos, posições políticas, identificar amigos e criar modelos preditivos.

Agora, eles têm a capacidade de segmentar indivíduos com base em traços psicológicos, não apenas em “variáveis ​​de estilo de vida”, como preferências de filmes. Com toda honestidade, os profissionais de marketing adorariam fazer isso, mas não o fazem. Não é apenas difícil obter dados de preferências pessoais vinculados a dados de usuários direcionados sem violar normas de privacidade e padrões éticos das empresas de mídia social, mas eles também não têm a saída de testes de personalidade legítimos. Empresas como o Twitter, por exemplo, guardam zelosamente a identificação de usuários individuais em solicitações de correspondência de dados de campanhas de marketing e políticas. A Cambridge Analytica aproveitou o fato de que a maioria de nós fará login em um aplicativo e fornecerá informações privadas se nos sentirmos seguros. Solicitar no Facebook e dizer às pessoas que era para pesquisa acadêmica fez com que elas se sentissem seguras. Assim, a questão jurídica: conta se a permissão foi dada sob falsos pretextos?

Em 2008 e 2012, durante a campanha de Obama, sua equipe estava usando perfis publicamente disponíveis. Se você divulgou Obama no Facebook, você deu a ele seus dados e mostrou quem eram seus amigos. Está nas letras miúdas. Leia isso algum tempo. Os dados fornecidos pelo usuário permitiram que eles identificassem predisposições prováveis ​​em relação à política, correspondam a outros dados disponíveis, como códigos postais.

As pessoas fazem previsões a partir de informações o tempo todo. Quando estamos usando nossa própria experiência, é chamada de heurística. Com um monte de informações e matemática, é chamado de ciência de dados. A questão é a precisão. Mesmo com os dados coletados por Cambridge, sua capacidade de influenciar as pessoas não é uma certeza ou tem a capacidade de perturbar a cultura, como alguns afirmaram. Mas o direcionamento pessoal torna a persuasão mais provável e o direcionamento sem permissão é, vamos encarar, um pouco assustador. A equipe de Obama era bastante sofisticada na época, mas não mais do que Google, Amazon ou qualquer outra preocupação comercial baseada em dados. A campanha de Obama foi apenas a primeira vez que as técnicas de marketing de mídia social foram aplicadas à política. A atenção não veio da sofisticação de seu direcionamento, tanto quanto da capacidade de Obama de usar sua personalidade nas redes sociais para ativar um entusiasmo de base e efetivamente crowdsource os cofres da campanha.

O que ainda não sabemos é o que a campanha de Trump pediu a Cambridge para fazer com seus dados? Essa história se desdobrará. No entanto, as pessoas não gostam de ser manipuladas. Você pode se lembrar da reação do público ao Facebook experimentando os feeds de notícias positivos e negativos para ver se a valência do conteúdo mudou o tom geral e o “humor” – e isso foi em grande parte no agregado e não no direcionamento individual. Será interessante ver se as pessoas uniformemente consideram a perspectiva de manipulação ofensiva ou se é rotulada de coisas diferentes ao longo das linhas partidárias.

Todo político procura o que ressoará com os eleitores. O uso de dados de mídia social e perfis de eleitores nas eleições de 2012 parece quase saudável em comparação com a exploração de dados da Cambridge Analytica. Mas esta é a primeira vez (que sabemos) que os dados foram solicitados para fins políticos usando informações erradas para enganar as pessoas para a divulgação. Isso desencadeia um grave botão quente para muitos, dada a quantidade de desinformação que circulou durante e após a eleição de Trump-Clinton. Todos são hipersensíveis a notícias falsas, independentemente da sua persuasão política. Saber que a desinformação estava na raiz dessa coleta de dados fará com que a violação pareça ainda mais notória para muitos, especialmente considerando o viés cognitivo que nos faz atribuir comportamentos ou intenções com base na experiência passada. (Se eles trapacearam em A, provavelmente irão trair B OR se eles trapacearem em B, eles devem ter traído A.) ​​Isto não é racional, mas ser manipulado move as pessoas inerentemente de uma posição confiante para uma posição defensiva e suspeita.

Infelizmente, isso tudo se manifesta em muitos dedos apontando e nós sempre gostamos de ter alguém para culpar. Neste caso, parece que os pés do Facebook serão mantidos em chamas junto com o Cambridge Analytica. Eu duvido seriamente se há algo que o Facebook poderia ter feito para evitar que uma organização deturecesse sua intenção. No entanto, ironicamente para o Facebook, a força de sua marca implicitamente validou o aplicativo.