Twitter pode prever quem irá desenvolver a depressão pós-parto?

Mika Heittola/Shutterstock
Fonte: Mika Heittola / Shutterstock

O novo campo da análise de dados sociais nos fornece mais recursos do que nunca para investigar fenômenos sociais. Um dos meus exemplos favoritos de como o novo campo da análise de dados sociais está sendo aplicado está em um belo estudo 2013 da Microsoft Research [1] . Ao analisar os feeds do Twitter de mulheres grávidas, os pesquisadores poderiam prever com 80% de precisão se uma mulher continuasse a desenvolver depressão pós-parto.

Começaram por recrutar cerca de 400 mulheres para participar. Do Twitter, eles colecionaram dados, incluindo os textos dos tweets das mulheres, seus favoritos e respostas. Eles então mediram quatro tipos de comportamento:

  • Noivado. Isso inclui com que frequência alguém tweetou, quantos desses tweets responderam a outras pessoas e quantos links, retweets e perguntas que publicaram.
  • Redes sociais. No Twitter, isso é simplesmente o número de pessoas seguidas e o número de seguidores que alguém tem.
  • Emoção. Usando ferramentas que analisaram os tipos de palavras que as pessoas usam, mediram posts para palavras que expressavam felicidade, tristeza, ansiedade, tristeza, etc.
  • Estilo de idioma. Saindo nos detalhes linguísticos, essas medidas analisaram coisas como artigos, verbos auxiliares, pronomes e preposições em tweets. Essas palavras são interessantes porque não possuem o significado principal do que estamos dizendo, mas tendem a variar entre as pessoas com base em seu humor, personalidade ou outros traços. Eles também são muito difíceis de controlar, porque nós os escolhemos principalmente inconscientemente.

Após a criação de uma lista de atributos, as mulheres foram monitoradas quanto a sinais de depressão pós-parto (PPD). Enquanto todo o comportamento das mulheres mudou ao longo de suas gravidezes, as mulheres que passaram a ter PPD mudaram de maneiras diferentes. Os pesquisadores construíram modelos de computadores que utilizavam essas pequenas diferenças. Esses modelos de computador poderiam então olhar para o feed do Twitter de uma pessoa e adivinhar se ela iria ou não para desenvolver PPD.

Usando apenas dados de antes que as mulheres dêem à luz, seus modelos poderiam classificar com precisão as mulheres com probabilidade de desenvolver PPD ou não com uma precisão de 70%. No entanto, PPD normalmente desenvolve cerca de um mês após o parto. Quando os pesquisadores adicionaram nas primeiras semanas pós-parto, antes que os sintomas de PPD começassem a se desenvolver , os algoritmos ficaram ainda melhores, atingindo 80% de precisão ou superior.

De que forma o comportamento do Twitter nas mulheres mudou? As mulheres que desenvolveram PPD tendem a diminuir a freqüência de tweet e o número de seguidores, bem como o uso de pronomes pessoais de segunda e terceira pessoa ("ele", "eles", "você"), enquanto os que fizeram não desenvolver PPD realmente aumentou em todas as categorias.

Por outro lado, as mulheres que desenvolvem PPD tendem a fazer mais perguntas, enquanto as mulheres que não diminuíram o número de perguntas que pediram.

A interessante visão científica é que estas são pistas sutis que não são expressões diretas do PPD. Isso significa que, mesmo que as mulheres tentassem esconder sua condição potencial, é improvável que sejam capazes de fazê-lo com sucesso, pelo menos a partir do algoritmo.

Como uma ferramenta de diagnóstico para médicos, esta técnica é de grande promessa. Não é invasivo e, com tanta precisão, pode ser de grande ajuda para sinalizar quais novas mães podem se beneficiar de monitoramento e atenção extra.

[1] De Choudhury, Munmun, Scott Counts e Eric Horvitz. "Previsão de mudanças pós-parto em emoção e comportamento através das mídias sociais". Procedimentos da Conferência SIGCHI sobre Fatores Humanos em Sistemas de Computação. ACM, 2013.