Parece ficção científica, mas não é: pesquisa sobre Framenet auxilia máquinas a compreenderem o mecanismo do raciocínio humano (Foto: Freepik)

Parece ficção científica, mas não é: pesquisa sobre Framenet auxilia máquinas a compreenderem alguns dos mecanismos de linguística do raciocínio humano (Foto: Freepik)

Um visitante incauto não deixaria de se surpreender ao encontrar, no interior da Faculdade de Letras da Universidade Federal de Juiz de Fora (UFJF), um pequeno laboratório compartilhado por professores e estudantes de Linguística e de vários campos da Matemática. Menos ainda suspeitaria que ali existem pessoas contribuindo, ativamente, para que robôs entendam o comportamento humano. Mas é exatamente isso: a futura dominação do mundo pelas máquinas — ou, com menos exagero, a evolução da inteligência artificial — dialoga muito mais com o campo da linguística do que você imagina. Toda essa interação é possível por intermédio de uma área que está em tudo, desde as Ciências Exatas até as Artes: a matemática.

Ah, a Matemática… Linguagem dominada por alguns, e porta de entrada das Ciências Humanas para outros, esse campo do conhecimento parece estar em tudo. Com as ramificações da Tecnologia da Informação, as equações de segundo grau e os logaritmos encontraram espaço em áreas inusitadas. Uma delas é o Laboratório FrameNet Brasil de Linguística Computacional. Criado em 2007, o local lembra uma pequena startup, na qual processadores, cabos de rede e organogramas explicando a construção de softwares dominam o ambiente. Nesse laboratório, coordenado pelo professor Tiago Torrent, pesquisadores observam a linguagem a partir da matemática.

“Hoje, nós temos uma equipe que é meio a meio, composta tanto por linguistas quanto por desenvolvedores. E essas pessoas precisam conversar. Por isso, eu falo pra todos os alunos que vem trabalhar comigo ‘quando você terminou seu Ensino Médio e viu sua aprovação para Letras, você fez uma fogueira simbólica das suas apostilas de Matemática? Então, escolha errada’”, conta Torrent. “Para muitas pessoas, são áreas diametralmente opostas: ou você gosta de Matemática, ou você gosta de Letras. E, apesar disso, um dos maiores linguistas da atualidade, o Noam Chomsky, estudou Lógica”, informa, referindo-se à uma das áreas da Matemática.

 O m.knob é um guia nativo e intérprete virtual para turistas que chegam ao Brasil (Foto: Divulgação)

O m.knob é um guia nativo e intérprete virtual para turistas que chegam ao Brasil (Foto: Divulgação)

Banco de dados trilíngue
Focada em aplicar esses conhecimentos no campo do turismo, desde 2013, a FrameNet Brasil se dedica a construir um banco de dados trilíngue, Português-Inglês-Espanhol, que permita ao visitante estrangeiro compreender termos essenciais para sua integração na cultura brasileira. Como um dos frutos desse trabalho, nasceu o aplicativo Dicionário da Copa, lançado para o Mundial de 2014, e agora transformado no m.knob: um guia nativo e intérprete virtual para turistas que aportam no país.

“Para tratar de experiência turística, nós trabalhamos com 300 frames, ou modelos de conhecimento, combinados. Eles podem envolver coisas diretamente ligadas ao turismo — como fazer check-in, obter passaportes –, que totalizam 52 frames. Os outros quase 250 estão relacionados à experiência cotidiana — como percebemos beleza, como percebemos o clima, como falamos do tempo. Com isso, nós percebemos que, para falar de turismo, evocamos coisas do cotidiano. Então pegamos nosso jeito de falar sobre as coisas e geramos um modelo computacional dele.”

Um dos ícones da ficção científica, HAL 9000 é um computador com inteligência artificial avançada, sendo capaz de até mesmo interpretar emoções (Foto: Divulgação)

Um dos ícones da ficção científica, HAL 9000 é um computador com inteligência artificial avançada, sendo capaz de até mesmo interpretar emoções (Foto: Divulgação)

“Androides sonham com ovelhas elétricas?”
Criado na Universidade de Berkeley (EUA), em 1997, o projeto da FrameNet pretendia criar um dicionário para o Inglês, em que as palavras fossem organizadas não em ordem alfabética, mas de acordo com os conceitos necessários para compreender o significado dessa palavra.

Imagine, por exemplo, que você está assistindo a uma aula na UFJF. Em um dado momento, seu professor anuncia: “Gente, agora vocês podem ir para o recreio.” Essa escolha de palavras, provavelmente, te causaria alguma estranheza, apesar de o dicionário apresentar ‘recreio’ como sinônimo de ‘intervalo’. Torrent explica que esse estranhamento não se dá pela definição da palavra, mas pela discrepância no conceito que serve de pano de fundo para ela. Afinal, de acordo com nossas experiências, a palavra “recreio” é utilizada em um contexto que não é o universitário, mas sim de uma escola de ensino fundamental ou médio, quando os estudantes são mais novos. “Então, na realidade, a discrepância está em uma propriedade de um dos participantes da cena da escola, que é o aluno”, aponta Torrent.

Nascida no campo da Inteligência Artificial — desenvolvida em 1974 pelo pesquisador do Instituto de Tecnologia de Massachusetts (MIT – EUA), Marvin Minsky –, a teoria dos frames propunha a ideia de cenas, com participantes dotados de propriedades, formando assim uma estrutura de conhecimento. Ao apresentar essa tese, Misky defendia a inutilidade de entregar listas de conhecimentos (como dicionários) a uma máquina, quando se pretendia ensiná-la a pensar como um humano.

Ao invés disso, os pesquisadores de Berkeley — e, mais recentemente, da UFJF — construíram um banco de dados alimentado por diversas cenas, articuladas em várias combinações. Dessa forma, quando questionada sobre o significado de um termo, a máquina deveria perceber padrões nessa rede de frames e ser capaz de oferecer uma resposta com contexto. Posteriormente, a máquina repetiria esse processo de forma cíclica e automática, refinando suas respostas até, de fato, aprender.

Apresentado dessa forma, o conceito pode parecer algo de ficção científica, mas já é um recurso utilizado de forma corriqueira por boa parte da população mundial. Na UFJF, a FrameNet é organizada de forma similar a um sistema neural, aplicando uma técnica matemática de modelagem chamada Ativação Propagada. O método de processamento do cérebro humano ocorre quando um estímulo cria um desbalanceamento químico entre os neurônios, fazendo com que a informação salte de uma célula para outra. Na rede de frames, ligados entre si e formando nós, os pesquisadores simulam o processamento cerebral, atribuindo valores numéricos a cada termo e a cada possível propriedade sintática que ele venha a ter.

Ligação de frames simula processamento cerebral humano (Foto: Arquivo pessoal)

Ligação de frames simula processamento cerebral humano (Foto: Arquivo pessoal)

“Cada vez que uma palavra passa por um nó, ela ‘perde energia’. A quantidade de energia perdida depende da natureza do nó e de quantos saltos a palavra deu até chegar ali. Porém, dependendo da palavra seguinte na sentença, ela ganha mais energia e continua avançando. Dessa forma, nós conseguimos criar desambiguações”, explica Torrent.

Coube ao expoente da Engenharia Civil e doutor em Linguística, Ely Matos, um dos responsáveis pela estruturação computacional do projeto, traduzir um pouco da linguagem matemática por trás da FrameNet. “Nós trabalhamos muito — só pra usar um termo matemático — com as equações diferenciais parciais, justamente porque esses fenômenos naturais não são fáceis de prever, fazendo parte do campo da Matemática chamado Teoria do Caos. Então, nós aplicamos estatísticas e probabilidades e o modelo de Redes Complexas, simulando as redes neurais, para modelar a linguagem.”

Uma pesquisa recente, realizada por uma das bolsistas participantes da FrameNet Brasil, pediu que alguns entrevistados explicassem o significado de algumas frases e, posteriormente, comparou as respostas oferecidas por eles com as respostas fornecidas pelo programa. Mais de 90% das explicações de entrevistados e do programa coincidiram. Os 10% restantes, explica Torrent, ocorreram em situações de ambiguidade que confundiram até os humanos, como piadas. Resta saber como explicar este último dado — afinal, nós (ainda!) não sabemos o senso de humor dos robôs.

Outras informações:

FrameNet Brasil

“A diferença entre o segundo lugar e a medalha de ouro é a matemática”