Procesamento da linguaxe natural: Diferenzas entre revisións

Contido eliminado Contido engadido
Maañón (conversa | contribucións)
Sen resumo de edición
Correccións da lingua
Liña 1:
O '''Procesamento da Linguaxe Natural''', (''PLN'', ou ''NLP''; ''Natural Language Processing''), é unha subdisciplina da [[intelixencia artificial]] e unha das aplicacións máis útiles da [[lingüística computacional]]. O '''PLN''' ocúpase da formulación e investigación de mecanismos eficaces computacionalmente para a comunicación entre persoas ou entre personaspersoas e máquinas por medio de [[linguaxe natural]]. O '''PLN''' non trata deada comunicación por medio de linguaxes naturais dunha forma abstracta, senon deque procura deseñar mecanismos para comunicarse que sexan eficaces computacionalmente -que se podanpoidan realizar por medio de programas que executen ou simulen a comunicación. Os modelos aplicados enfócanse non só á comprensión da linguaxe de por si, senon a aspectos xerais cognitivos humanos e á organización da memoria. A linguaxe natural sirveserve so de medio para estudiarestudar estosestes fenómenos.
 
==Historia==
O '''Procesamiento da Linguaxe Natural (PLN)''' é unha das pedras angulares tempranastemperás da [[intelixencia artificial]] (IA). A [[Tradución Automática]], por exemplo, naceu a fins da década dos corenta, antes de que se acuñara a propia expresión «Intelixencia Artificial». Non obstante, o '''PLN''' desempeñou múltiples papeis no contexto da IA, e a sua importancia dentro deste campo ten crecido e decrecido a consecuencia de cambios tecnolóxicos e científicos. Os primeiros intentos de traducir textos por ordenador a fins dos anos corenta e durante os cincuenta fracasaron debido á escasa potencia dos ordenadores e á escasa sofistificación lingüística. Sen embargoPorén, os esforzos realizados nas décadas dos sesenta e os setenta para producir interfaces en linguaxe natural para bases de datos e outras aplicacions informáticas obtiveron un ciertocerto grao significativo de éxito. A década dos oitenta e a principios dos noventa veu rexurdir a investigación no terreo da TraducciónTradución Automática.
 
==Dificultades no procesamientoprocesamento de linguaxes naturais==
===AmbigüedadeAmbigüidade===
A linguaxe natural esé inherentemente ambiguoambigua a diferentes niveis:
 
* A nivel [[léxico]], unha mesma palabra pode tenerter varios significados, e a selección do apropiado debese deducir a partir do contexto oracional ou coñecemento básico. Moitas investigacións no campo do '''procesamento de linguaxes naturais''' teñen estudado métodos de resolver as ambigüedadesambigüidades léxicas mediante dicionarios, gramáticas, bases do coñecemento e correlacións estadísticasestatísticas.
* A nivel referencial, a resolución de [[anáfora]s] e [[catáforas]]s implica determinar a entidade lingüística previa ou posterior aá que fan referencia.
* A nivel estructuralestrutural, requireserequírese da [[semántica]] para desambiguar a dependencia dos sintagmas preposicionais que conducen á construción de distintas [[árbore sintáctica|árbores sintácticas]].
* A nivel pragmático, unha oración, a miudo, non significa o que realmente estasese está a dicir. Elementos tales como a [[Figura retórica|ironía]] teñen un papel importante na interpretación da mensaxe.
 
Para resolver estes tipos de ambigüedadesambigüidades e outros, o problema central no '''PLN''' é tradución de entradas en linguaxe natural a unha representación interna sinsen ambigüedade, como [[árbore sintáctica|árbores de análise]].
 
===Detección de separación entre as palabras===
Na lingua falada, non se acostuman facer pausas entre palabra e palabra. O lugar no que se debe separar as palabras a miudo depende de cal é a posibilidade que manteña un sentido lóxico tanto gramatical como contextual. Na lingua escrita, idiomas como o [[idioma chinochinés mandarín|chinochinés mandarín]] tampouco teñen separacións entre as palabras.
 
===Recepción imperfecta de datos===
Acentos extranxerosestranxeros, rexionalismos ou dificultades na producciónprodución da fala, erroreserros de mecanografiadomecanografado ou expresións non gramaticais, erroreserros na lectura de textos mediante [[OCR]]
 
==Compoñentes==
*[[Morfoloxía_lingüística|Análise morfolóxica]]
A análise das palabras para extraer raíces, rasgos flexivos, unidades léxicas compuestascompostas e outros fenómenos.
*[[SintaxisSintaxe|Análise sintáctica]]
A análise da estrutura sintáctica da frase mediante unha gramática da lingua en cuestión.
*[[Semántica|Análise semántica]]
A extracción do significado da frase, e a resolución de ambigüedadesambigüidades léxicas e estructuraisestruturais.
*[[Pragmática|Análise pragmática]]
A análise do texto máis alá dos límites da frase, por exemplo, para determinar os antecedentes referenciais dos pronomes.
*Planificación da frase
EstrucurarEstruturar cada frase do texto co fin de expresar o significado adecuado.
*Xeración da frase
A xeración da cadena lineal de palabras a partir da estrutura xeral da frase, coas súas correspondentes flexións, concordancias e restantes fenómenos sintácticos e morfolóxicos.
 
==Aplicacións==
As principais tarefas de traballo na área do '''PLN''' son:
*[[SíntesisSíntese do discurso]]
*[[AnálisisAnálise da lenguaxelinguaxe]]
*[[Comprensión da linguaxe]]
*[[Recoñecemento da fala]]
*[[TraducciónTradución automática]]
*[[Extracción de información]]