O novo campo da análise de dados sociais nos fornece mais recursos do que nunca para investigar fenômenos sociais. Um dos meus exemplos favoritos de como o novo campo da análise de dados sociais está sendo aplicado está em um belo estudo 2013 da Microsoft Research [1] . Ao analisar os feeds do Twitter de mulheres grávidas, os pesquisadores poderiam prever com 80% de precisão se uma mulher continuasse a desenvolver depressão pós-parto.
Começaram por recrutar cerca de 400 mulheres para participar. Do Twitter, eles colecionaram dados, incluindo os textos dos tweets das mulheres, seus favoritos e respostas. Eles então mediram quatro tipos de comportamento:
Após a criação de uma lista de atributos, as mulheres foram monitoradas quanto a sinais de depressão pós-parto (PPD). Enquanto todo o comportamento das mulheres mudou ao longo de suas gravidezes, as mulheres que passaram a ter PPD mudaram de maneiras diferentes. Os pesquisadores construíram modelos de computadores que utilizavam essas pequenas diferenças. Esses modelos de computador poderiam então olhar para o feed do Twitter de uma pessoa e adivinhar se ela iria ou não para desenvolver PPD.
Usando apenas dados de antes que as mulheres dêem à luz, seus modelos poderiam classificar com precisão as mulheres com probabilidade de desenvolver PPD ou não com uma precisão de 70%. No entanto, PPD normalmente desenvolve cerca de um mês após o parto. Quando os pesquisadores adicionaram nas primeiras semanas pós-parto, antes que os sintomas de PPD começassem a se desenvolver , os algoritmos ficaram ainda melhores, atingindo 80% de precisão ou superior.
De que forma o comportamento do Twitter nas mulheres mudou? As mulheres que desenvolveram PPD tendem a diminuir a freqüência de tweet e o número de seguidores, bem como o uso de pronomes pessoais de segunda e terceira pessoa ("ele", "eles", "você"), enquanto os que fizeram não desenvolver PPD realmente aumentou em todas as categorias.
Por outro lado, as mulheres que desenvolvem PPD tendem a fazer mais perguntas, enquanto as mulheres que não diminuíram o número de perguntas que pediram.
A interessante visão científica é que estas são pistas sutis que não são expressões diretas do PPD. Isso significa que, mesmo que as mulheres tentassem esconder sua condição potencial, é improvável que sejam capazes de fazê-lo com sucesso, pelo menos a partir do algoritmo.
Como uma ferramenta de diagnóstico para médicos, esta técnica é de grande promessa. Não é invasivo e, com tanta precisão, pode ser de grande ajuda para sinalizar quais novas mães podem se beneficiar de monitoramento e atenção extra.
[1] De Choudhury, Munmun, Scott Counts e Eric Horvitz. "Previsão de mudanças pós-parto em emoção e comportamento através das mídias sociais". Procedimentos da Conferência SIGCHI sobre Fatores Humanos em Sistemas de Computação. ACM, 2013.