UFJF - Universidade Federal de Juiz de Fora

Frames e Construções

Você está em: Projetos > Frames e Construções

O projeto Frames e Construções objetiva implementar um repertório de construções para o Português do Brasil – um Constructicon –, o qual seja eletronicamente acessível e constitua um input confiável para o desenvolvimento de soluções em Tecnologia da Informação (TI) focadas no Processamento da Linguagem Natural (PLN). Assim, caracteriza-se como projeto de inovação tecnológica, na medida em que busca aplicar as teorias da Semântica de Frames e da Gramática das Construções ao desenvolvimento de produtos de TI.

Em linhas gerais, o projeto busca, a partir da análise de sentenças extraídas de corpora, identificar pareamentos de forma e sentido – construções – cuja utilização evoque cenas estruturadas da experiência humana – frames. Identificadas as construções, estas são formalizadas em termos computacionais com o auxílio do software FrameNet Desktop, sendo armazenadas em um Constructicon.

Dessa forma, esse empreendimento complementa o macro-projeto dentro do qual é desenvolvido: a FrameNet Brasil (FN-Br). Enquanto a FN-Br levanta e formaliza lexemas – ou Unidades Lexicais – que evocam frames, um Constructicon caracteriza-se como um repertório de combinações de lexemas ou mesmo de posições sintáticas, estruturas cujo reconhecimento, tratamento e interpretação são fundamentais para o processamento da linguagem natural.

Além de se vincular à FN-Br, o projeto se vincula também a duas iniciativas internacionais. A primeira delas é a Berkeley FrameNet (FN), criada em 1997, a partir do Inglês, por um grupo de pesquisadores do ICSI (International Computer Science Institute), sob a liderança do linguista Charles Fillmore. No escopo da FN, um Constructicon encontra-se em desenvolvimento desde 2006 e já anotou cerca de uma centena de construções da Língua Inglesa. A relação do projeto Frames e Construções com a FN de Berkeley é desenvolvida no sentido de se aproveitar a experiência previamente acumulada pelo grupo americano na construção de recursos sintáticos. Ademais, algumas das construções a serem anotadas no Constructicon do Português do Brasil encontram análogos no Constructicon do Inglês, o que acrescenta ao projeto um viés contrastivo, fundamental quando se objetiva, no longo prazo, a produção de ferramentas de processamento da linguagem natural multilíngues.

O segundo projeto com o qual nos relacionamos é a Swedish FrameNet ++, projeto em desenvolvimento na University of Gothenburg que também objetiva desenvolver um Constructicon, porém, para o Sueco. Nossa interface com esse projeto também visa ao desenvolvimento de estudos contrastivos entre as construções do Sueco e do Português do Brasil.

A abordagem contrastiva se faz presente em todos os aspectos do projeto, ou seja, serão contrastados não apenas os repertórios de construções produzidos para cada uma das línguas envolvidas, mas também as abordagens da Línguística Computacional e da Linguística Teórica para os elementos da língua que se situam no meio da clássica distinção entre léxico e gramática. Trata-se daqueles elementos maiores do que uma única palavra, porém, menos generalizantes do que uma regra gramatical.

No lado da Linguística Computacional, tais elementos são chamados Entidades Multilexêmicas – ou MWEs, sigla em Inglês para Multi-Word Entity – e têm sido alvo de uma série de workshops em congressos internacionais, além de figurarem como tema de volumes especiais de periódicos. No que concerne à Linguística Teórica, em especial ao conjunto de abordagens dissidentes do Gerativismo agrupadas sob o título de Linguística Cognitiva, MWEs costumam ser tratadas como Construções, pareamentos aprendidos de forma e sentido. Em uma Gramática de Construções, a distinção entre elementos pertencentes ao léxico e regras da gramática perde sua validade, uma vez que qualquer item linguístico composto por uma forma à qual se associa um sentido ou função pode ser tratado como uma construção. Nesse sentido, tanto morfemas, quanto palavras, MWEs, expressões idiomáticas, padrões de estrutura argumental e mesmo gêneros textuais podem ser analisados segundo o mesmo aparato teórico metodológico.

Ainda, há que se ressaltar que, além de abordarem o fenômeno em causa a partir de construtos teóricos distintos, a Linguística Computacional e a Linguística Teórica também diferem no que tange à metodologia empregada nessa tarefa. Enquanto esta se funda nas considerações do analista acerca das construções da língua sobre a qual se debruça, aquela se preocupa em desenvolver ferramentas que permitam a identificação automática de MWEs em grandes corpora. Assim, apesar de compartilharem objetos de estudo, as duas abordagens citadas têm, em larga medida, desenvolvido trabalhos em linhas de investigação separadas.

Um dos objetivos deste projeto é, portanto, aliar os avanços em Linguística Computacional e em Linguística Cognitiva no tratamento de MWEs/Construções, buscando uma sinergia que fará avançar as pesquisas em ambas as áreas.

Compartilhe:

    FrameNet Brasil