Prédio: Prédio ED III
Sala: Auditório Manoel Vereza de Oliveira
Data: 2012-11-30 10:20 – 10:50
Última alteração: 2012-11-01
Resumo
O foco deste trabalho é a proposição de uma abordagem para a etiquetagem de categorias verbais do português brasileiro, focando não só os aspectos morfossintáticos, mas captando também os valores de tempo, aspecto e modalidade, que, em função das mudanças que vem ocorrendo no paradigma verbal do português, não são unívocos e associados apenas a um traço morfológico. Diferentes projetos têm se dedicado ao tratamento de informação de tempo, aspecto e modalidade, com propostas de anotação (manual e automática) especialmente em corpora do inglês e do espanhol (cf. Saurí; Pustjovsky (2008), Baker et alii (2010), Saurí; Verhagen; Pustejovsky (2006), Morante; Daelemans (2012), Vázquez; Montraveta (2009), entre outros). Propomos o desenvolvimento de uma árvore de decisões que contemple os traços de tempo, aspecto e modalidade que são codificados pelas formas verbais do português, de modo a possibilitar a etiquetagem do corpus constituído para o estudo das formas verbais do português, aos moldes do que tem sido feito pelo projeto SenSem (Vázquez; Montraveta (2009). Especificamente, espera-se: i) elaborar uma árvore de decisões que propicie etiquetas semântico-discursivas para os verbos do português culto na modalidade falada, considerando o plano narrativo, os tipos de sequência discursiva/textual e os tipos de ponto de referência, com base nos resultados descritivos do projeto “Variação na expressão do tempo verbal passado na fala e escrita de Itabaiana/SE: funções e formas concorrentes"; ii) etiquetar o Banco de Dados Falantes Cultos de Itabaiana/SE com as etiquetas semântico-discursivas desenvolvidas; iii) validar as etiquetas desenvolvidas e compartilhar com a comunidade acadêmica que desenvolve pesquisas na área de processamento de línguas naturais, particularmente com os desenvolvedores de sotftwares taggers e parsers.