Coordenador: LEONEL FIGUEIREDO DE ALENCAR ARARIPE
Unidade Acadêmica: Campus do Benfica - Centro de Humanidades
Departamento: DEPTO DE LETRAS ESTRANGEIRAS
Grande Área: Linguistica, Letras e Artes
Resumo:
Poucas línguas indígenas dispõem de treebanks, imprescindíveis para a pesquisa linguística e inclusão digital dessas línguas. O pré-requisito para a construção de um treebank representativo é um parser robusto. Este projeto visa, primeiramente, ampliar a diversidade linguística do treebank do nheengatu iniciado em 2022. Para tanto, anotaremos 500 sentenças de textos do século XIX e início do século XX. Com isso, esperamos superar em 10% o desempenho de um parser anterior.
Palavras-Chave: Linguística computacional, Parsing sintático, Linguística tupi, Treebanks
Data de Aprovação na UFC: 21/11/2024
Início do Projeto: 12/11/2024
Fim do Projeto: 11/11/2025
Situação: Encerrado
Projeto Financiado: Não