dc.description.abstract |
El carácter polisémico en las palabras se ha de nido como la integración en un símbolo de diversas significaciones. Así, el mismo símbolo puede ser utilizado en varios contextos para hacer referencia a conceptos disímiles. En el campo de la lingüística computacional, al proceso de adjudicación del correcto significado se denomina Desambiguación de los Sentidos de las Palabras (WSD por sus siglas en inglés - Word Sense Disambiguation).
La WSD es una tarea ampliamente necesaria en aplicaciones relacionadas con procesamiento de lenguaje natural. Destaca su extensamente usanza en ejercicios de traducción artificial y recuperación de información. Por tanto, constituye uno de los pilares en el aseguramiento de la calidad de dichas aplicaciones.
Muchos métodos han sido propuestos para llevar a cabo la WSD y entre ellos, los supervisados han sido de los más sobresalientes; con la presente dificultad de que requieren datos etiquetados de sentidos, adquiridos de forma manual en la gran mayoría de las ocasiones. En este trabajo, se presenta un algoritmo de desambiguación que combina las ventajas de las aproximaciones supervisadas y no supervisadas. Como resultado, se produce un sistema que toma un corpus paralelo bilingüe o multilingüe, se alinea a nivel de palabras y genera como salida las etiquetas de sentidos para todos los idiomas implicados.
Aunque el método puede ser aplicado sobre cualquier par de idiomas, se han utilizado textos de origen en español durante los experimentos realizados. Se emplearon, como textos meta, traducciones a los idiomas italiano, inglés y hebreo. La selección de estas lenguas estuvo basada en la diferenciación de las mismas según el grupo y familia de correspondencia con referencia al español. |
es |