Termômetro para a web

‘Triste’, ‘Dunga’, ‘torcer’, ‘azarão’, ‘bundão’. Basta ler algumas das palavras mais postadas no Twitter depois da partida do Brasil contra a Holanda – nas quartas-de-finais que eliminaram a seleção, sexta-feira passada – para entender o sentimento da maioria dos usuários da ferramenta.

Uma constatação nada evidente, quando se trata do universo da web. Afinal, milhares de mensagens e textos são deixados diariamente no Twitter, no Orkut, em blogues e ferramentas afins expressando os pensamentos dos usuários. Mas dificilmente se consegue extrair o sentimento da maioria a partir desse mar de ideias soltas.

Pensando em formas de entender melhor o universo da internet e aproveitar a força dessas redes sociais, o Instituto Nacional de Ciência e Tecnologia para Web (InWeb) desenvolveu o programa Observatório da Web – INWeb, coordenado pela Universidade Federal de Minas Gerais (UFMG), em parceria com as federais do Amazonas e do Rio Grande do Sul.

A ferramenta coleta todas as mensagens deixadas em blogues, jornais on-line e redes sociais sobre determinado assunto

Essa ferramenta coleta todas as mensagens deixadas em blogues, jornais on-line e redes sociais como o Twitter sobre determinado assunto. Para dar a largada, foram escolhidos os dois assuntos mais falados no momento: a Copa do Mundo e as eleições de 2010, que têm os resultados apresentados em dois links separados.

“A ideia era escolher temas atuais e próximos ao cotidiano dos usuários”, conta o coordenador do projeto, o professor Virgílio Fernandes de Almeida, do Departamento de Ciência da Computação da UFMG.

Por meio de palavras-chaves, o programa rastreia todas as postagens sobre os temas e gera gráficos, tag clouds (nuvens de palavras-chave) e outras formas visuais para mostrar as variações na quantidade de comentários feitos no período escolhido.

“A web é um retrato da sociedade, mas não sabemos o quanto ele é fiel. A ferramenta ajuda a mostrar a interação das pessoas com a informação e o impacto que ela tem na sociedade”, explica Almeida.

Ele também ressalta o mérito científico do programa, que usa algoritmos e técnicas avançadas para tratar grandes massas de dados em tempo real.

'Tag cloud' de torcedores
A ‘tag cloud’ formada a partir das palavras mais usadas para comentar e eliminação do Brasil nas quartas-de-final contra a Holanda (imagem: reprodução).

Olho no lance

Na página dedicada à Copa do Mundo, o internauta pode buscar resultados específicos por jogador, por país ou por partida (Brasil x Costa do Marfim, digamos). Pode ver também a lista dos vídeos mais populares no YouTube; fotos do mundo todo postadas por torcedores no Flickr; e viajar num mapa-múndi em que se visualiza, um após o outro, o que dizem e de onde vêm as mensagens postadas no Twitter.

É possível verificar se a opinião dos usuários foi mais positiva ou negativa

Além de mostrar o quanto o assunto foi discutido, é possível verificar se a opinião dos usuários foi predominantemente positiva ou negativa.

Palavras como ‘odeio’, ‘adoro’ e sinônimos ajudam as máquinas a detectar o que passa na cabeça dos internautas. Um trabalho difícil de ser automatizado, já que nem sempre as palavras são usadas em um contexto relacionado ao assunto da busca.

Sentimentos no ar

A tentativa de extrair dados e números de manifestações subjetivas já é conhecida no universo da computação. A chamada técnica de análise de sentimentos é usada por empresas no exterior para traçar o perfil de consumidores. Neste caso, determinados produtos são enfocados e as pesquisas são menos abrangentes do que as análises feitas pelo InWeb.

Mas Almeida cita outra pesquisa semelhante à sua, feitas nos Estados Unidos durante as eleições para o senado americano. Lá, uma análise de sentimentos mostrou uma equivalência de aproximadamente 80% entre a opinião dos usuários de redes sociais e as tendências de voto apontadas por pesquisas de opinião pública.

Eleições 2010

Em ano de eleições, o projeto também disponibiliza uma consulta sobre a visibilidade de alguns candidatos que disputam a corrida presidencial. A popularidade de Dilma Rousseff, José Serra, Marina Silva e Plínio Arruda vem sendo acompanhada e comparada pela ferramenta.

O projeto disponibiliza uma consulta sobre a visibilidade dos candidatos à presidência

Mesmo antes das eleições e do fim da Copa, os pesquisadores já comemoram os resultados do projeto, que despertam o interesse de empresas. Um bom sinal, segundo Almeida: “É importante que a tecnologia desenvolvida na universidade seja devolvida à sociedade.”

O próximo assunto para continuar os estudos do Observatório da Web já foi definido: celebridades. A partir de setembro, será possível ver os gráficos gerados pelo programa a partir do que pensam, dizem e maldizem os internautas a respeito dos chiques e famosos. A conferir.

Debora Antunes
Ciência Hoje On-line