Gerador de teorias

Utilizados para ‘ler’ toda a literatura sobre um tema e sugerir hipóteses promissoras,
algoritmos prometem facilitar pesquisas científicas em futuro próximo. (foto: Pixabay)

Hipóteses científicas não caem do céu: cada vez mais, são geradas por inteligência artificial.
Por: Marcelo de Araujo

Existem, atualmente, mais de 50 milhões de artigos científicos disponíveis online. Estima­se que a cada três minutos um novo artigo apareça. Nesse contexto, formular uma hipótese científica original é cada vez mais difícil. Nenhum cientista consegue mais ler toda a literatura produzida em sua própria área de pesquisa! Porém, para formular uma hipótese original, ele ou ela precisa de saber o que tem sido produzido sobre determinado assunto.
Como resolver esse problema?

É aí que entra a inteligência artificial. Ela aparece como ferramenta para ‘ler’ toda a literatura sobre um tema científico e sugerir, em seguida, algumas hipóteses promissoras. Aos cientistas, cabe testar as hipóteses levantadas e determinar se elas são verdadeiras ou não.

Já existem pelo menos dois algoritmos capazes de escavar montanhas de publicações em busca de novas ideias: KnIT e brainSCANr. O primeiro foi criado por Olivier Lichtarge (Faculdade de Medicina de Baylor) e Scott Spangler (IBM) e o segundo, pelo casal Bradley Voytek e Jessica Voytek (Universidade da Califórnia).

Lichtarge e Spangler descreveram o funcionamento de KnIT (acrônimo para Knowledge Integration Toolkit) em um artigo de 2014. Eles relataram que o programa ‘leu’ 186.879 artigos sobre uma proteína conhecida como p53, associada à supressão de tumores em seres humanos. O algoritmo gerou, em seguida, 64 hipóteses para serem testadas empiricamente. Dessa lista, nove se mostraram verdadeiras.

Para avaliar a eficácia do algoritmo, o programa considerou apenas os artigos publicados até 2003. A razão para isso é simples: em 2014, Lichtarge e Spangler já sabiam o que havia sido descoberto sobre a proteína p53 nos dez anos anteriores, mas o algoritmo, não. KnIT não tinha nenhuma informação sobre o que foi descoberto nessa área a partir de 2004, uma vez que os dados mais recentes inseridos no sistema eram de 2003. Isto é, se pelos menos algumas das hipóteses geradas pelo algoritmo coincidissem com descobertas feitas a partir de 2004, então o algoritmo estaria fazendo um prognóstico confiável sobre o que, a partir de 2004, valeria a pena pesquisar na busca por novas formas de tratamento contra o câncer.

Já o casal Voytek descreveu o funcionamento de brainSCANr (Brain Systems, Connections, Associations, and Network Relationships) em um artigo de 2012. O programa analisou informações sobre cerca 3,5 milhões de artigos indexados no PubMed, um imenso banco de dados sobre publicações médicas. A missão do brainSCANr é examinar correlações entre termos científicos que ocorrem nas publicações sobre um determinado tema, procurando ‘buracos estatísticos’, isto é, correlações que ainda não aparecem na literatura, mas que poderiam ser examinadas pelos cientistas.

Os dois softwares têm muita coisa em comum, mas algumas diferenças. Por exemplo, as áreas da ciência em que são utilizados. Enquanto KnIT vasculha artigos em busca de hipóteses para serem testadas nas pesquisas sobre o câncer, brainSCANr investiga artigos ligados às neurociências. O importante, no entanto, é que os dois são capazes de formular hipóteses, o que parecia, até bem pouco tempo, uma tarefa que apenas seres humanos poderiam realizar.

É claro que nem só de artigos vive a ciência. Novas ideias surgem também da leitura de livros e outros materiais que não necessariamente têm relação direta com a pesquisa. Sem contar as conversas informais durante os intervalos nos congressos… Para isso, por enquanto, ainda não há softwares disponíveis. Mesmo assim, é provável que softwares como KnIT e brainSCANr se tornem, em breve, importantes ferramentas na pesquisa científica.

Marcelo de Araujo
Departamento de Filosofia, Universidade do Estado do Rio de Janeiro
Departamento de Teoria do Direito, Universidade Federal do Rio de Janeiro