EcoLexicon: nuevos retos para la reutilización del conocimiento

Por Arianne Reimerink y Miriam Buendía

Universidad de Granada // Universidad de Castilla-La Mancha.

Comunicación Congreso Internacional Territorios Digitales 2017 Ciencias Sociales Digitales

EcoLexicon es una base de conocimiento terminológico (BCT) sobre el Medio Ambiente con términos en seis idiomas. Es la aplicación práctica de la Terminología Basada en Marcos, que combina una versión modificada de los marcos de Fillmore con las premisas de la Lingüística Cognitiva para representar dominios especializados a través de plantillas definicionales y crear una representación situada para conceptos especializados. La metodología para la extracción del conocimiento consiste, entre otros, en la identificación de conceptos, términos y relaciones con patrones de conocimiento de corpora especializados y la factorización de definiciones de otros recursos especializados. EcoLexicon muestra las entradas como redes semánticas que especifican las relaciones entre conceptos medioambientales. Todas las entradas se vinculan con su correspondiente (sub)evento y categoría conceptual. En otras palabras, la estructura de la información conceptual, gráfica y lingüística se basa en un marco conceptual subyacente. La información gráfica incluye fotografías, imágenes y videos, y la lingüística especifica la categoría gramatical de cada término e incluye información fraseológica y contextual. La BCT también permite acceder al corpus especializado recopilado para su desarrollo a través de un motor de búsqueda.
La BCT es de libre acceso en línea, pero existen muchas otras formas de reutilizar esta gran cantidad de conocimiento estructurado, por ejemplo en entornos de traducción y procesamiento del lenguaje natural. Para ello estamos en proceso de crear un prototipo de asistencia terminológica para la traducción de textos especializados. Otro reto en esta misma línea de reutilización es vincularla con otros recursos a través de datos enlazados (Linked Data). Próximamente, los datos de la versión ontológica de EcoLexicon serán accesibles a través de consultas SPARQL y se enlazarán con DBpedia con el fin de ofrecer un recurso abierto integrado en la Linguistic Linked Open Data Cloud.

http://lexicon.ugr.es/reimerink

EcoLexicon: nuevos retos para la reutilización del conocimiento