Num futuro, talvez bem mais próximo do que imaginamos, a detecção precoce de sintomas de depressão ou do transtorno da ansiedade pode vir das redes sociais. Pesquisadores da Universidade de São Paulo (USP) estão desenvolvendo um modelo de inteligência artificial capaz de analisar a linguagem empregada nessas mídias, em especial no Twitter brasileiro, para detectar possíveis indivíduos com tendência a desenvolver essas doenças. Tudo com base no comportamento, linguístico ou não, na internet.
Distúrbios de saúde mental têm sido apontados pela Organização Mundial da Saúde (OMS) como uma preocupação crescente no mundo. Estima-se que 11,3% dos brasileiros já tenham sido diagnosticados com depressão.
O projeto foi iniciado na forma de um estudo-piloto em setembro de 2019, e passou a contar com apoio financeiro da Fundação de Amparo à Pesquisa do Estado de São Paulo a partir de abril de 2022. As primeiras conclusões da pesquisa "SetembroBR: a social media corpus for depression and anxiety disorder prediction" foram publicadas na revista "Language Resources and Evaluation". O nome é uma homenagem ao movimento Setembro Amarelo – uma campanha de prevenção ao suicídio realizada anualmente.
A equipe da pesquisa é formada por dois estudantes de doutorado e dois estudantes de mestrado da EACH/USP, todos com formação em computação e atuantes na área de Inteligência Artificial (IA), ou mais especificamente na área de Processamento de Língua Natural (PLN). Além destes, há ainda dois pesquisadores colaboradores, sendo um deles da área de PLN e um da área de psicologia.
Para a pesquisa foram analisadas, inicialmente, 47 milhões de tuítes públicos, de 19 mil usuários do Twitter, de forma anônima. Destes, 3,9 mil tiveram diagnóstico de transtorno mental. A pandemia da Covid levou a um aumento de 25% de ansiedade e depressão entre os textos coletados.
Tantos os tuítes dos indivíduos quanto suas relações sociais de amigos, seguidores e interações com outros usuários contam para o projeto, explica Ivandré Paraboni, professor da Escola de Artes, Ciências e Humanidades (EACH-USP) e autor correspondente do estudo.
Segundo ele, os modelos computacionais usam exemplos de indivíduos com diagnóstico e outros aleatórios no Twitter (grupo de controle) para distinguir padrões linguísticos e não linguísticos que são difíceis para a interpretação humana. “Há entretanto alguns padrões bastante evidentes e fáceis de reconhecer, e que inclusive reforçam os achados da área médica, como o uso mais pronunciado de pronomes de primeira pessoa (eu, mim, comigo), que normalmente são aceitos como um possível indicador linguístico de depressão”, explica Paraboni.
Foi constatada também uma incidência alta entre os usuários depressivos da utilização do símbolo de coraçãozinho, o emoji da afetividade, “que talvez ainda não esteja caracterizado na psicologia”, afirma Paraboni.
Ele observa ainda que, além dos padrões linguísticos, há também resultados que demonstram que as próprias contas que um indivíduo segue no Twitter (por exemplo, um determinado canal sobre saúde mental), seus amigos e os usuários com quem ele/a conversa na rede social podem ser também indicativos de seu estado de saúde mental.
Para o pesquisador, lidar com dados textuais de uma rede social é sempre bastante desafiador. “Além da observação mais óbvia de que usuários Twitter nem sempre escrevem de maneira convencional, detectar transtornos de saúde mental é complexo porque estamos em busca de um fenômeno normalmente raro, que aparece de forma muito esparsa nas timelines do indivíduo. E, por vezes, nem aparece”, argumenta.
Outro problema, segundo ele, é o grande volume de dados a processar, tanto em número de tuítes quanto na extensão das redes de amigos e seguidores. “Além disso, é importante observar que mesmo um indivíduo aleatório, selecionado como integrante do grupo de controle da pesquisa, pode afinal ter um transtorno de saúde mental que nós desconhecemos (e que ele próprio talvez desconheça). Isso pode representar um certo ruído para o modelo de IA que está tentando ‘aprender’ a distinguir uma coisa da outra”, detalha.
Mas ele pondera que, de modo geral, os métodos utilizados tendem a ser robustos diante destas dificuldades, que estão sendo gradativamente contornadas.
“Estes modelos já possuem uma certa capacidade de detectar depressão e ansiedade com base em textos e relações sociais de um indivíduo, mas precisam ser aprimorados. O segundo ano do projeto tratará então de aprimorar essas técnicas de modo a obter resultados ainda mais precisos”, diz Paraboni.
Modelo de IA não pretende substituir diagnóstico médico
Paraboni pondera que esse tipo de análise automática das redes não tem o objetivo de diagnosticar ou muito menos substituir os esforços e conhecimento da área médica para este fim. “Nosso projeto trata-se de uma iniciativa que poderia ser usada no futuro, por exemplo, para auxiliar na identificação precoce de certos comportamentos divergentes da população em geral, e que poderiam eventualmente ser levados em conta por um usuário de rede social para decidir se, por exemplo, seria ou não o caso de procurar aconselhamento médico”, afirma.
Outra possível aplicação, segundo ele, seria a criação de algum tipo de ferramenta que permitiria que o comportamento de usuários na rede social fosse acompanhado pelos seus pais para sinalizar situações que possam exigir algum tipo de atenção.
Brasil é um dos países mais conectados do mundo
Os brasileiros passam 46 horas por mês nas redes sociais em média, segundo um levantamento da Comscore, divulgado em março. O país é o terceiro no mundo que mais consome redes sociais, ficando atrás apenas da Índia e da Indonésia.
As redes mais acessadas pelos brasileiros são YouTube (96,4%), Facebook (85,1%) e Instagram (81,4%). TikTok, Kwai e Twitter aparecem na sequência. O Twitter, após ser comprado no ano passado pelo bilionário Elon Musk, tem preocupado usuários e especialistas. O site passou por mudanças de regras e passou a cobrar por alguns serviços, como o selo de verificação.
O artigo completo, em sua versão em inglês, está disponível neste link.