Palabras clave Resumen - ELiES

Palabras clave Resumen - ELiES Palabras clave Resumen - ELiES

11.07.2015 Views

María A. Barriosgramática está integrada en el léxico por medio de los llamados esquemas de régimen 21 .Todo esto es consecuencia de que, a diferencia de otros modelos que no pretenden hacerdiccionarios, el MST no sólo es lexicológico sino sobre todo lexicográfico.La tarea de elaborar entradas de diccionario, comporta ciertos problemas.Destacaremos aquellos que nos han movido a la realización de este trabajo.El primer problema es metodológico: el grado de dificultad del marco teóricoimpone una excesiva lentitud en la tarea lexicográfica. En algo más de treinta años sehan descrito alrededor de mil entradas del francés en Dicouébe, pero no se ha podidoelaborar ningún diccionario completo, dejando de lado los programas elaborados por elLaboratorio de Lingüística Computacional [LLC] del Instituto de Problemas deTransferencia de Información para el ruso y el inglés, que no coinciden exactamente conlos diccionarios de la TST 22 . En principio no parece previsible que un investigador quetrabaje de este modo pueda ver un lexicón de una lengua completamente terminado.En este sentido conviene recordar que las aplicaciones del Dicouèbe y del DiCEse han podido desarrollar de un modo más ágil que las del DECFC, no sólo por que seha transformado el diccionario en una base de datos −con la consiguiente ventaja queaporta el uso de dicha herramienta informática−, sino también porque no se incluyendefiniciones, una de las partes más difíciles de estos diccionarios. En su lugar en elDiCo se han insertado etiquetas semánticas y formas proposicionales:a) Una etiqueta semántica es una fórmula de paráfrasis mínima quecontiene el género próximo de una unidad léxica (Polguère, 2003b). Sirve paraidentificar el tipo de significado de una UL (Mel’čuk, Polguère, 2007, 32-33). Porejemplo a cordero corresponden tres etiquetas semánticas, ‘animal’ (rebaño decorderos), ‘alimento’ (comer cordero) y ‘piel’ (piel de cordero).21 Para un estudio completo de los tipos de diccionarios y de cómo se integran en cada entradalexicográfica la sintaxis, la semántica y la combinatoria, véase Mel’čuk et al., 1995. Una explicación másbreve y con ejemplos del español se encuentra en Alonso Ramos (1989) y en Barrios (2006).22 El Laboratorio de Lingüística Comparada [LLC] del Instituto de Problemas de Transferencia deInformación de la Academia de Ciencias de Rusia, al que pertenecen, entre otros, Jury Apresjan e IgorBoguslavsky, ha desarrollado diversos proyectos de lingüística computacional. Su metodología de trabajovaría enormemente con respecto a la de Montreal, como se aprecia en Apresjan et al. (2003): no se buscatanto la descripción exhaustiva de cada entrada de diccionario cuanto lograr un perfecto ensamblaje de lainformación lexicográfica con la gramatical, para lograr un modelo integral y práctico, orientado a latraducción y el aprendizaje. Por eso los diccionarios de uno y otro laboratorio varían considerablementeen contenidos y en estructura: aunque el LLC se sirve de las FFLL, no siempre lo hacen del mismo modoque el OLST, como se irá viendo a lo largo de este trabajo. Con su particular metodología, el LLC halogrado desarrollar ETAP-3, un sistema que ha dado frutos muy satisfactorios en traducción automática(se puede consultar un traductor automático ruso-inglés en http://proling.iitp.ru/etap/index.html), usadotambién para elaborar CALLEX¸ un software para el aprendizaje de una lengua, que se presentará másadelante.12

Introducciónb) Una forma proposicional representa la estructura actancial de la UL, esdecir, la palabra clave y sus actantes (Mel’čuk, Polguère, 2007, 33-35). Por ejemplo,cordero ‘animal’, al ser ‘cría de’, es un predicado con un actante, ‘oveja’; y por ser unanimal de ganadería tiene un segundo actante, ‘pastor’. La forma proposicional sería laque se muestra en (7) −que se podría parafrasear por ‘cría de la oveja X pastoreada porY’−, donde el símbolo (∼) sustituye a la UL cordero:(7) ~ CRÍA DEL animal X PASTOREADA POR EL individuo YDe este modo se ha pasado de un diccionario en el que las definicionesconstituyen la tercera parte de la información de cada entrada, a una base de datos en laque el grueso de la información lo constituyen las FFLL, tanto las sintagmáticas comolas paradigmáticas. Además, en ambos casos se ha pensado en el posible uso de la basede datos por parte de personas que no trabajan en el marco de la TST, por lo que se hantraducido las FFLL al lenguaje natural por medio de las paráfrasis y glosas 23 . Pero apesar de todas estas indudables mejoras, la tarea lexicográfica sigue siendo ardua ylenta.El segundo problema es el del solapamiento de las FFLL: en muchas ocasioneslas tareas lexicográficas se ralentizan porque no resulta fácil seleccionar la FL másadecuada para una relación léxica. Esto podría ser consecuencia de lo que Polguère(2007a) llama la “suave formalización” propia de la TST. El autor reconoce cierta faltade rigor formal en el uso de las FFLL. El problema aflora especialmente cuando sondos o más las FFLL candidatas a cubrir dicho puesto.Kahane (2003) estudia la entrada blessure del DECFC. La colocación heridamortal 24 se ha formalizado en dicho diccionario como Magn (que significa ‘intenso’),pero el autor defiende que responde a A 1 Fact 1 (adjetivo que expresa que la heridaafecta como se espera que afecte a su primer actante). Esto es coherente con el valormatar 25 para Fact 1 (‘afectar al primer actante como se espera que afecte’): si una23 Los conceptos de definición de una FL, paráfrasis y glosa se han presentado en la página 10.24 Traducimos los ejemplos de Kahane al español puesto que son idénticas a las colocaciones francesaspropuestas por el autor.25 Las propuestas del DECFC para herida y enfermedad vinculan matar con la FL Fact porque seconsidera que lo esperable de una enfermedad o de una herida es que mate. En BADELE.3000 se haconsiderado, sin embargo, que lo esperable no es que maten sino alguien cure esa enfermedad o esaherida (véanse las explicaciones de la página 132). Por eso en nuestra base de datos hemos formalizadocurar una herida/enfermedad como un caso de Real, por lo que lógicamente matar es un valor de13

María A. Barriosgramática está integrada en el léxico por medio de los llamados esquemas de régimen 21 .Todo esto es consecuencia de que, a diferencia de otros modelos que no pretenden hacerdiccionarios, el MST no sólo es lexicológico sino sobre todo lexicográfico.La tarea de elaborar entradas de diccionario, comporta ciertos problemas.Destacaremos aquellos que nos han movido a la realización de este trabajo.El primer problema es metodológico: el grado de dificultad del marco teóricoimpone una excesiva lentitud en la tarea lexicográfica. En algo más de treinta años sehan descrito alrededor de mil entradas del francés en Dicouébe, pero no se ha podidoelaborar ningún diccionario completo, dejando de lado los programas elaborados por elLaboratorio de Lingüística Computacional [LLC] del Instituto de Problemas deTransferencia de Información para el ruso y el inglés, que no coinciden exactamente conlos diccionarios de la TST 22 . En principio no parece previsible que un investigador quetrabaje de este modo pueda ver un lexicón de una lengua completamente terminado.En este sentido conviene recordar que las aplicaciones del Dicouèbe y del DiCEse han podido desarrollar de un modo más ágil que las del DECFC, no sólo por que seha transformado el diccionario en una base de datos −con la consiguiente ventaja queaporta el uso de dicha herramienta informática−, sino también porque no se incluyendefiniciones, una de las partes más difíciles de estos diccionarios. En su lugar en elDiCo se han insertado etiquetas semánticas y formas proposicionales:a) Una etiqueta semántica es una fórmula de paráfrasis mínima quecontiene el género próximo de una unidad léxica (Polguère, 2003b). Sirve paraidentificar el tipo de significado de una UL (Mel’čuk, Polguère, 2007, 32-33). Porejemplo a cordero corresponden tres etiquetas semánticas, ‘animal’ (rebaño decorderos), ‘alimento’ (comer cordero) y ‘piel’ (piel de cordero).21 Para un estudio completo de los tipos de diccionarios y de cómo se integran en cada entradalexicográfica la sintaxis, la semántica y la combinatoria, véase Mel’čuk et al., 1995. Una explicación másbreve y con ejemplos del español se encuentra en Alonso Ramos (1989) y en Barrios (2006).22 El Laboratorio de Lingüística Comparada [LLC] del Instituto de Problemas de Transferencia deInformación de la Academia de Ciencias de Rusia, al que pertenecen, entre otros, Jury Apresjan e IgorBoguslavsky, ha desarrollado diversos proyectos de lingüística computacional. Su metodología de trabajovaría enormemente con respecto a la de Montreal, como se aprecia en Apresjan et al. (2003): no se buscatanto la descripción exhaustiva de cada entrada de diccionario cuanto lograr un perfecto ensamblaje de lainformación lexicográfica con la gramatical, para lograr un modelo integral y práctico, orientado a latraducción y el aprendizaje. Por eso los diccionarios de uno y otro laboratorio varían considerablementeen contenidos y en estructura: aunque el LLC se sirve de las FFLL, no siempre lo hacen del mismo modoque el OLST, como se irá viendo a lo largo de este trabajo. Con su particular metodología, el LLC halogrado desarrollar ETAP-3, un sistema que ha dado frutos muy satisfactorios en traducción automática(se puede consultar un traductor automático ruso-inglés en http://proling.iitp.ru/etap/index.html), usadotambién para elaborar CALLEX¸ un software para el aprendizaje de una lengua, que se presentará másadelante.12

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!