Book chapters details

  • Redes Neuronais e um Léxico na Etiquetagem Morfossintática para o Estudo da Subcategorização Verbal
  • Jan 2005
  • O principal problema com os etiquetadores morfossintácticos disponíveis é o esforço necessário para a adaptação destes sistemas a novas línguas, tipos ou géneros de texto. Estes sistemas necessitam ou de largas quantidades de texto etiquetado para aprenderem ou da construção de complexos sistemas de regras de desambiguação. Neste artigo mostra-se como a cooperação entre um sistema de análise lexical e uma rede neuronal, permite a aprendizagem de etiquetadores neuronais treinados com corpora a partir de 5400 palavras etiquetadas manualmente. O valor médio da precisão obtida em 20 amostras distintas de texto real, com palavras desconhecidas, é de 91% quando o sistema é treinado com um corpus com 5400 palavras e de 96% num corpus com 18865 palavras etiquetadas. Estes resultados foram aplicados num sistema destinado à aprendizagem das classes de subcategorização verbais. A avaliação dos resultados obtidos por este sistema permitiu a avaliação cruzada, qualitativa, dos resultados obtidos pelo etiquetador proposto quando aplicado a uma tarefa concreta.
  • A Língua Portuguesa no Computador
  • Mercado das Letras: Campinas, São Paulo
  • Nuno C Marques, Gabriel Pereira Lopes
  • Antonio Paulo Berber Sardinha
  • Colecção As Faces da Linguística Aplicada
  • ISBN 85-7591-044-2
  • 71 to 79
  • 1 Jan 2005