COMPRENSIÓN Y PRODUCCIÓN DE ORACIONES

Algunas preguntas importantes que intentaremos contestar al estudiar el lenguaje a nivel de oración van a ser: ¿es necesario computar la estructura sintáctica de una oración para determinar el mensaje que intenta transmitir?. ¿Puede comprenderse una oración sin necesidad de establecer de antemano las relaciones estructurales existentes entre las palabras que la componen?,¿ la sintaxis es independiente de la semántica como defiende Chomsky?, ¿cómo está el conocimiento de la sintaxis representado en la mente?, ¿cómo utilizan las personas ese conocimiento para comprender y producir las oraciones que se consideran aceptables dentro de una lengua?.


1. Computación de la estructura sintáctica de la oración.

Cuando una secuencia de palabras llega al oyente se produce la segmentación de las mismas en estructuras sintácticas, tales como los sintagmas. La teoría de Chomsky sobre las estructuras del lenguaje, expresada en su libro Syntactic structures interesó tanto a los psicólogos del lenguaje como a los estudiosos de la inteligencia artificial, poco después surgieron dos líneas de trabajo claramente delimitadas:

1) La desarrollada por algunos psicólogos del lenguaje, que intentaron comprobar la importancia de la sintaxis y de la estructura del lenguaje en la comprensión de las oraciones y las estrategias que los hablantes de una lengua utilizan para comprender el significado de las frases.

2) La desarrollada por aquellos estudiosos de la inteligencia artificial y psicólogos computacionales, interesados en la construcción de analizadores sintácticos automáticos capaces de afrontar el problema del análisis sintáctico de oraciones.

Los primeros estudios psicolinguísticos.

Uno de los procesos básicos en la comprensión del lenguaje es el análisis gramatical; consiste este en determinar las estructuras gramaticales de las oraciones comenzando por el análisis de los constituyentes de las mismas. La conclusión es que cuando las oraciones aparecen divididas por lugares que no corresponden a sus constituyentes, su comprensión es lenta y difícil. Por el contrario, cuando las oraciones aparecen divididas en lugares que coinciden con los finales de sus constituyentes, resultan más fáciles de comprender.

La tesis de la autonomía formal, defendida por Chomsky, supone que el estudio de la sintaxis es independiente del estudio del significado del lenguaje (de la semántica).

El psicólogo George Miller se preocupó de comprobar, de manera experimental, el papel de la sintaxis en la comprensión de frases del lenguaje natural.

En un experimento presentaron a los sujetos una serie de oraciones en un ambiente de ruido y después les pidieron que repitieran tantas como pudieran, los resultados mostraron que los sujetos recordaron más palabras correspondientes a las oraciones normales, seguidas de las oraciones gramaticales sin sentido, mientras que la peor actuación correspondió a las no gramaticales sin sentido. Según Miller, estos resultados mostraban la influencia de la sintaxis en la comprensión, y parecían favorecen la tesis chomskyana de la independencia de la sintaxis respecto a la semántica. En la actualidad, los psicólogos del lenguaje piensan que las reglas que utilizan las personas cuando procesan el lenguaje son diferentes de las reglas elegantes que proponen los linguistas en sus sofisticas gramáticas.

Roles temáticos y marcos verbales.

Las palabras que forman una oración tienen en sí mismas un valor semántico o significado particular, además de este valor de cada palabra, existe también en la oración información semántica sobre los roles temáticos que desempeñan las palabras dentro de la frase. Por roles temáticos se entiende cual es la persona, animal u objeto que está realizando una acción, etc. Los marcos verbales sirven para organizar la información sintáctica en torno a los roles temáticos.

2. Construcción de analizadores sintacticos automáticos.

Poco después de la aparición del trabajo de Chomsky aparecieron los primeros programas de ordenador inspirados en los presupuestos de la gramática de Chomsky.

Analizadores basados en redes de transición ampliadas (ATN):La idea principal de los primeros programas computacionales capaces de analizar el lenguaje natural era que estos instrumentos tuvieran realidad psicológica. Es decir, que funcionaran de modo semejante a como procesa el ser humano las frases que componen el lenguaje. El primer programa importante para la psicología, construido con la intención de que sirviera para analizar gramaticamente oraciones, fue construido por Thorne (1968), se basó en redes de transaición ampliada, una red de transición ampliada es un sistema formal basado en reglas de producción formadas por pares condición-acción para realizar análisis gramaticales, consiste en una serie de nodos conectados mediante flechas en forma de arco, estas flechas son las que indican las reglas o condiciones que permiten pasar de un nodo a otro, cada transición corresponde a la aceptación de una palabra dentro de la frase. Esta red analiza las palabras de la frase de una en una. Funciona de arriba-abajo, porque el programa primero considera una estructura sintáctica (genéra una hipótesis) y después comprueba si la palabra que está procesando se ajusta a esa estructura. Se trata de instrumentos tan poderosos como la gramatica transformacional y se han utilizado también como modelos del análisis gramatical humano.

Redes de este tipo se han utilizado en aplicaciones prácticas como el programa LUNAR, que respondía a preguntas sobre rocas lunares. Un problema es que pueden quedar aprapadas en callejones sin salida en aquellos lugares de la red en que son posibles varias alternativas, además esta exploración sucesiva de los distintos caminos supone un esfuerzo computacional excesivo, estas características hacen que las redes funcionen de manera bastante diferente a como lo hace el procesador humano, ya que este no pierde tiempo explorando caminos ineficaces ni comete demasiados errores y cuando los comete es capaz de corregirlos directamente sobre la marcha.

El analizador PERSIFAL de Marcus: La comprobación de los problemas de las redes de transición ampliadas llevaron a Marcus a pensar en la creación de un analizador determinístico llamado PARSIFAL, se trata de un analizador gramatical que, además de funcionar arriba-abajo, funciona también por principios guiados abajo-arriba. Es un analizador que evita quedar atrapado en callejones sin salida y no tiene que estar constantemente revisando sus decisiones porque, “puede mirar hacia delante” para evitar cometer equivocaciones, aunque sólo tres constituyentes, que podían ser palabras o grupos de palabras, estos tres constituyentes formaban el llamado almacén constituyente, o estructura de datos y es lo que le distingue de los analizadores que le precedieron, este analizador funcionaba bien en aquellas oraciones que las personas pueden manejar sin problemas, sin embargo, cuando las oraciones son ambiguas no puede resolverse la ambigüedad con sólo tres constituyentes.

Otros programas más perfeccionados: El programa de IA de Winograd (1972), SHRDLU suscitó un gran interés porque, a la necesidad de conocimiento sintáctico unía también la necesidad de que este tipo de conocimiento interaccionara con el conocimiento semántico y contextual, su capacidad sintactica era muy grande y podía enfrentarse a frases muy complejas a pesar de que su semántica y capacidad de memoria eran limitadas, el programa era capaz de resolver adecuadamente expresiones anafóricas. El último programa de este tipo es el llamado MARGIE, preparado por Schank (1975), este programa contaba con un procesador semántico encargado de convertir las oraciones en sus representaciones significativas, llamadas diagrama de dependencia conceptual. Constaba también de un mecanismo inferencial que elaboraba esos diagramas, aprovechando el conocimiento del mundo, el tercer elemento es un generador de respuestas.

3. Procesamiento semántico y contextual.

El programa de IA de Winograd supuso un claro desafío a la tersis chomskyana de la independencia de la sintaxis, porque la comprensión de las frases requiere la interacción de tres tipos de conocimientos: el sintáctico, el semántico y el contextual, los trabajos de Marslen-Wilson, realizados desde la perspectiva de la psicología del lenguaje, han mostrado la falta de validez de la tesis de la autonomía formal. Los experimentos de este investigador consistían en pedir a los sujetos que realizaran tareas de “sseguimiento” sobre la marcha, los resultados indican que no hubieran podido ser obtenido si los sujetos no hubieran utilizado información semántica para corregir los errores.

4. Procesos psicológicos implicados en la comprensión de oraciones.

El resultado de Slobin, junto a otros semejantes, parece indicar que la sintaxis por sí sola no puede explicar el uso del lenguaje, por tanto, algunos teoricos piensan que no está justificada la existencia de un procesador del lenguaje que funcione de manera autónoma sino más bien los resultados parecen favorecer la existencia de mecanismos de inferencia de propósito general, estos mecanismos podrían acceder a la información sintáctica para completar así la información semántica y pragmática de las palabras.

El problema de la autonomía o la interacción de la sintaxis y la semántica es un tema que no está totalmente resuelto, sobre el que se investiga en estos momentos. Fster (1979) ha propuesto un modelo modular autónomo de comprensión del lenguaje, según el cual existen tres tipos de subprocesadores encargados de la comprensión del lenguaje: a) el léxico, b) el sintáctico, y c) procesador del mensaje. Según este modelo estos subprocesadores sólo interactúan a través del output, estos tres subprocesadores no estarían influidos ni por los otros subprocesadores ni por el conocimiento del mundo. El flujo de información se produce de abajo-arriba en la comprensión del lenguaje, y de arriba-abajo en la producción. Finalmente cada uno de los tres subprocesadores envía el producto de su salida al solucionador general de problemas, GPS, que evalúa el resultado del procesamiento.

5. Producción de oraciones.

Una forma de estudiar la producción de oraciones consiste en estudiar los errores que se cometen al hablar. Garrett (1984) ha estudiado los tipos de errores más frecuentes que se producen espontaneamente en el lenguaje natural y a la vista de estos errores ha propuesto un modelo de producción del lenguaje.







Representación de nivel del mensaje









Representación de nivel funcional







Representación de nivel posicional









Representación de nivel fonético









Representación articulatoria

Según este modelo, existen cinco niveles de representación implicados en la producción de oraciones. Estos cinco niveles se dan en un orden:

1) Nivel del mensaje, se trata de un nivel en el que el hablante especifíca los conceptos de los que va a hablar.

2) Nivel funcional. Se trata de un esbozo de la estructura gramatical de la oración que se intenta pronunciar. En este esbozo se tiene en cuenta los lugares donde iran colocadas las distintas formas gramaticales, pero todavía no se cuenta con las palabras reales que van a ocupar esos huecos.

3) Nivel posicional. En este nivel las palabras reales que se van a utilizar se seleccionan del léxico y se incorporan a los huecos que estaban destinados psra ellas en el nivel anterior.

4) Nivel fonético. Se especifican las formas fonéticas de las palabras.

5) Nivel articulatorio. En el se especifican una serie de instrucciones sobre las ordenes motoras necesarias para articular las palabras que componen la frase.

Esta compleja teoría no se a puesto a prueba en su totalidad aunque existe bastante evidencia experimental para sus propuestas principales.

Garrett ha recogido un gran número de errores, a continuación veremos algunos de los más frecuentes:

a) Los errores de anticipación, son aquellos que se producen cuando sonidos o palabras que deben aparecer en posiciones posteriores de la oración se introducen en posiciones más tempranas de la misma, o cuando se pronuncia alguna palabra en una posición anterior a la qie le corresponde en la frase, este error en la teoría de Garrett se produce en el nivel funcional.

b) Cambio de morfemas, consiste en cambiar las raíces de las palabras, mientras se conservan sus terminaciones, este tipo de errores se produce en el nivel posicional.

c) Pausas, se ha observado que casi la mitad del tiempo para hablar se dedica a las pausas, se ha interpretado como que este tiempo lo dedica el hablante a planificar la oración siguiente.

0 comentarios: