Dia 3 de junho foi um grande dia. Conseguimos reunir uma turma de craques no laboratório de pesquisa da IBM Brasil para discutir análise de sentimentos em redes sociais. De quebra, ainda tivemos uma sessão prática dessa experiência ao acompanhar ao vivo o comportamento do Twitter durante o jogo Brasil e Panamá. Confesso que eu estava motivadíssimo, nunca imaginei que conseguiria reunir esse grupo numa mesma mesa.
Sinto ser piegas, mas tínhamos uma seleção na sala e a seleção brasileira na TV. Até brinquei dizendo que com aquele grupo como “speakers” nós poderíamos fazer um evento de mercado e colocar milhares de pessoas no auditório. Enfim, era um privilégio tê-los todos juntos e rolava uma insegurança de fazermos uma discussão à altura da expectativa deles.
O debate começou com Rodrigo Kede, presidente da IBM Brasil, dando uma panorâmica das novas tecnologias e como elas estão mudando a sociedade. A conversa esquentou quando a discussão entrou em computação cognitiva. O IBM Watson é hoje um dos projetos de vanguarda nessa área. Rodrigo citou alguns exemplos e mostrou um vídeo onde o Watson já está atuando no diagnóstico de doenças, tornando-se um aliado importante dos médicos. O impacto é tão grande que o grupo começou a discutir o papel dos médicos nesse novo cenário. Edney Souza provocou a mesa dizendo que o papel dos médicos vai mudar e muitos médicos poderão até perder seu trabalho. A conversa pegou fogo e teve um instante em que várias discussões rolaram aos mesmo tempo, todos falando juntos 🙂
Claudio Pinhanez veio em seguida para entrar fundo no tema da reunião. Claudio é cientista do Laboratório de Pesquisa da IBM Brasil e líder de pesquisa na área de Análises de Redes Sociais. Ele contou o que está por trás de um projeto de análise de sentimentos e a complexidade inerente a uma empreitada como essa. Em 2013 ele liderou o primeiro projeto do laboratório na Copa das Confederações, onde a proposta era analisar o sentimento dos torcedores no Twitter em relação à seleção brasileira durante a Copa.
Milhões de tweets foram analisados em tempo real e muito se aprendeu sobre a tecnologia naquela época. Claudio entrou nos detalhes do projeto, falou sobre os algoritmos, a assertividade das análises, os recursos envolvidos, etc. A discussão foi ótima, ainda mais tendo feras do mundo digital na mesa.
No novo projeto, o objetivo agora é fazer a análise de sentimentos no Twitter durante toda a Copa, não só da seleção brasileira, mas de todos os jogos da competição.
Alguns desafios são evidentes, como a capacidade de lidar com a língua portuguesa, fazer a análise em tempo real manipulando um enorme volume de posts em curto espaço de tempo, suportar picos de tráfego nos momentos de gol e em outras situações que causam entusiasmo nos torcedores internautas, ter excepcional capacidade de processamento e desenvolver insights com alto grau de assertividade. O projeto roda em cloud, necessita intensa capacidade analítica, trabalha com big data intensivo e os resultados são apresentados através de tecnologias de mobilidade e redes sociais. Este é um projeto ícone porque usa todas as novas tecnologias. Na Copa das Confederações, o projeto analisou milhões de tweets, mas na Copa do Mundo o volume será estupidamente maior. Se o Brasil chegar ao final da competição, estima-se que apenas no jogo final o numero de tweets poderá chegar a 30 milhões.
A IBM não está nisso por acaso. A aplicabilidade da tecnologia de análise de sentimentos é imensa, em várias dimensões. As empresas podem usar a tecnologia para monitorar suas marcas, no atendimento aos clientes, na avaliação dos produtos, etc. Governos podem usar para ouvir o cidadão, identificar necessidades, etc. Existem aplicações diversas em todos os ramos de indústria e da sociedade em geral, afinal estamos falando de capturar a percepção e o sentimento das pessoas a respeito de qualquer coisa. No entanto, cabe dizer que não é simples. Já existem provedores no mercado oferecendo soluções e serviços de análise de redes sociais, a maioria em inglês, apesar de já existirem serviços em português, mas a maioria fica na análise semântica, o que é bem diferente da análise de sentimentos. Além disso, o Twitter e outras redes sociais têm linguagem própria. A frase “Ai , Jesus, quase” publicada no Twitter é positiva ou negativa? Depende. Era uma jogada de quase gol do Brasil? Porque a mesma frase tem uma conotação bem diferente se o lance for a favor do adversário. E se o post fosse assim: “Ai, Jzs, quase”? Como você interpretaria o post “o que aconteceu com a seleção!” ? Ou seja, a análise não é trivial.
Um projeto de análise de sentimentos não é um produto de prateleira. A linguagem pode variar conforme o público analisado. Analisar futebol é uma coisa completamente distinta de se analisar a percepção do público sobre determinada marca ou produto. Um projeto desse tipo exige um estudo e aprendizado. Nós estamos no início da curva de evolução desse tipo de serviço. Analisar o comportamento do Twitter pode ser pequeno frente à enorme produção de dados não estruturados que temos nos inúmeros dispositivos que todos nós usamos diariamente. Estou falando de vídeos, fotos, blogs, comentários em rede sociais, etc. Todos nós, como cidadãos e consumidores, estamos emitindo o tempo todo nossas opiniões e percepções sobre as coisas em nossos gadgets eletrônicos. Ter a capacidade de capturar, analisar e processar toda essa massa de dados é um tesouro enterrado. Claro que surgem questões como privacidade, nesse contexto, mas estamos diante de um tsunami transformacional.
A reunião terminou com todos nós acompanhando em tempo real o comportamento do Twitter no segundo tempo do jogo Brasil e Panamá. Numa das telas, víamos o jogo, enquanto na outra tela olhávamos um dashboard mostrando a análise de sentimentos dos torcedores em relação à seleção brasileira… em tempo real. No jogo foram quase 350 mil tweets analisados. O jogador com maior percepção positiva foi o David Luiz. Incrivelmente Neymar não foi bem avaliado – apenas no seu gol de falta e no passe para o gol de Huk ele teve picos de posts positivos. Cabe dizer que existe uma tendência natural das pessoas criticarem mais do que elogiarem.
Foi muito interessante ver os gols acontecendo e os picos de tweets ocorrerem 2 a 4 minutos depois, que era o tempo das pessoas postarem no Twitter e a ferramenta capturar os dados, analisar, processar e publicar no dashboard. A discussão do grupo foi intensa pois somos todos aprendizes nessa tecnologia. Agradeço muito a presença e participação da Beth Saad, Cris De Luca (que entrou ao vivo na rádio CBN para falar sobre o evento), Martha Gabriel, Edney Souza, Erich Beting, Gil Giardelli e Pyr Marcondes. Foi uma honra recebê-los. Nos divertimos e aprendemos muito… juntos!