Procesamento da linguaxe natural: Diferenzas entre revisións

subdisciplina da enxeñería lingüística computacional
Contido eliminado Contido engadido
Stoni (conversa | contribucións)
Sen resumo de edición
(Sen diferenzas.)

Revisión como estaba o 23 de decembro de 2005 ás 20:18

O Procesamento da Linguaxe Natural, (PLN, ou NLP; Natural Language Processing), é unha subdisciplina da Intelixencia Artificial é unha das aplicacións máis útiles da lingüística computacional. O PLN ocupase da formulación e investigación de mecanismos eficaces computacionalmente para la comunicación entre persoas ou entre personas e máquinas por medio de linguaxe natural. O PLN non trata dea comunicación por medio de lenguaxes naturais dunha forma abstracta, senon de deseñar mecanismos para comunicarse que sexan eficaces computacionalmente -que podense realizar por medio de programas que executen ou simulen a comunicación. Os modelos aplicados se enfocan non so á comprensión da linguaxe de por sí, senon a aspectos xerais cognitivos humanos e á organización da memoria. A linguaxe natural sirve so de medio para estudiar estos fenómenos.


Historia

O Procesamiento da Linguaxe Natural (PLN) é unha das pedras angulares tempranas da intelixencia artificial (IA). A Traducción Automática, por exemplo, naceu a finais da década dos corenta, antes de que se acuñara a propia expresión «Intelixencia Artificial». Non obstante, o PLN desempeñou múltiples papeis no contexto da IA, e a sua importancia dentro de este campo ten crecido e decrecido a consecuencia de cambios tecnolóxicos e científicos. Los primeros intentos de traducir textos por ordenador a finais dos anos corenta e durante los cincuenta fracasaron debido a la escasa potencia de los ordenadores y a la escasa sofistificación lingüística. Sen embargo, os esfuerzos realizados nas décadas dos sesenta e os setenta para producir interfaces en lenguaje natural para bases de datos y otras aplicaciones informáticas obtuvieron un cierto grado significativo de éxito. A década dos oitenta e a principios dos noventa viu rexurdir a investigación no terreo da Traducción Automática.

Dificultades no procesamiento de linguaxes naturais

Ambigüedade

A linguaxe natural es inherentemente ambiguo a diferentes niveis:

  • A nivel léxico, unha misma palabra pode tener varios significados, e a selección do apropiado debese deducir a partir do contexto oracional ou coñecemento básico. Moitas investigacións no campo do procesamento de linguaxes naturais teñen estudiado métodos de resolver as ambigüedades léxicas mediante diccionarios, gramáticas, bases do coñecemento e correlacións estadísticas.
  • A nivel referencial, a resolución de [[anáfora]s] e catáforass implica determinar a entidade lingüística previa ou posterior a que fan referencia.
  • A nivel estructural, requirese da semántica para desambiguar a dependencia dos sintagmas preposicionais que conducen á construcción de distintos árboles sintácticos.
  • A nivel pragmático, unha oración, a miudo, non significa o que realmente estase a dicir. Elementos tales como a ironía teñen un papel importanteena interpretación da mensaxe.

Para resolver estos tipos de ambigüedades e outros, o problema central no PLN é traducción de entradas en linguaxe natural a unha representación interna sin ambigüedade, como árboles de análisis.

Detección de separación entre as palabras

Na lingua falada, non se acostuman facer pausas entre palabra e palabra. O lugar no que se debe separar as palabras a miudo depende de cal é a posibilidade que manteña un sentido lóxico tanto gramatical como contextual. Na lingua escrita, idiomas como o chino mandarín tampouco teñen separacións entre as palabras.

Recepción imperfecta de datos

Acentos extranxeros, rexionalismos ou dificultades na producción da fala, errores de mecanografiado ou expresións non gramaticais, errores na lectura de textos mediante OCR

Componentes

O análisis das palabras para extraer raíces, rasgos reflexivos, unidades léxicas compuestas e outros fenómenos.

O análise da estructura sintáctica da frase mediante unha gramática da lingua en cuestión.

A extracción do significado da frase, e a resolución de ambigüedades léxicas e estructurais.

O análise do texto máis alá dos límites da frase, por exemplo, para determinar os antecedentes referenciais dos pronomes.

  • Planificación da frase

Estructurar cada frase do texto co fin de expresar-lo significado adecuado.

  • Xeración da frase

A xeración da cadena lineal de palabras a partir da estrutura xeral da frase, cos seus correspondentes flexións, concordancias e restantes fenómenos sintácticos e morfolóxicos.


Aplicacións

As principais tarefas de traballo na area do PLN son:

Véxase tamén


Ligazóns externas


Referencias