Análise morfossintática computacional do nheengatu no modelo Universal Dependencies

Unidade Acadêmica: Campus do Benfica - Centro de Humanidades

Departamento: DEPTO DE LETRAS ESTRANGEIRAS

Grande Área: Linguistica, Letras e Artes

Resumo: 

Poucas línguas indígenas dispõem de treebanks, imprescindíveis para a pesquisa linguística e inclusão digital dessas línguas. O pré-requisito para a construção de um treebank representativo é um parser robusto. Este projeto visa, primeiramente, ampliar a diversidade linguística do treebank do nheengatu iniciado em 2022. Para tanto, anotaremos 500 sentenças de textos do século XIX e início do século XX. Com isso, esperamos superar em 10% o desempenho de um parser anterior.

Palavras-Chave:  Linguística computacional, Parsing sintático, Linguística tupi, Treebanks

Data de Aprovação na UFC: 21/11/2024

Início do Projeto: 12/11/2024

Fim do Projeto: 11/11/2025

Situação: Encerrado

Projeto Financiado: Não

Voltar