Prédio: Prédio ED III
Sala: Auditório Manoel Vereza de Oliveira
Data: 2012-11-29 02:00 – 02:30
Última alteração: 2012-10-31
Resumo
Inicio a apresentação com a caracterização desse tipo específico de modelagem do conhecimento léxico-gramatical que envolve a participação de estudiosos de diferentes especialidades na tarefa que envolve tanto a seleção, a descrição e a formalização dos diferentes tipos de informações que se associam às unidades léxicas, quanto o gerenciamento constante e a manipulação rápida e seletiva dessas informações.
Destaco que os produtos desse empreendimento – bases de dados léxico-gramaticais que integram o módulo de conhecimento linguístico de sistemas de PLN –, também subsidiam os estudos linguísticos do léxico e da gramática e a compilação de obras lexicográficas, pois, enquanto recursos de grande porte, armazenam, de modo explícito e sistemático, parcela significativa do acervo léxico-gramatical da língua.
Após pontuar os principais recursos dessa natureza em desenvolvimento (WordNet, VerbNet, FrameNet, PropBank e SemLink), descrevo os componentes e pontuo as repercussões das wordnets e dos seus desdobramentos em wordnets multilíngues.
Por fim, complementando a apresentação com um exemplo concreto de desenvolvimento de um recurso léxico-gramatical bilíngue, pontuo a modelagem da wordnet bilíngue (português-inglês) em construção para o português brasileiro.