El uso de herramientas terminológicas como estrategia para la difusión web del patrimonio cultural

Partiendo de la información recogida en el sitio web del Patronato de la Alhambra se llevó a cabo la extracción y análisis de dicho corpus. Éste estaba constituido por muy numerosos archivos en muy diversos formatos, y casi setenta mil palabras en español e inglés. El análisis textual incluyó un proceso de tokenización o segmentación, mientras que el análisis de frecuencias permitió agilizar la construcción del corpus terminológico final mediante la supresión de palabras vacías o la eliminación de palabras muy poco frecuentes.

Tras este proceso se obtuvieron más de quinientos términos en lengua española a partir de los que se diseñó y creó la base de datos bilingüe (español–inglés) que incluye información básica de cada término (definición, categoría gramatical, categorías conceptuales, ilustración, entre otros datos). Además, se han incorporado las relaciones conceptuales entre los diversos términos y se les ha asignado la notación correspondiente a su campo temático según un sistema normalizado de clasificación ampliamente utilizado. Dada la riqueza léxica de nuestro objeto de estudio y las múltiples áreas temáticas implicadas, se han creado varios mapas conceptuales de acuerdo a diferentes campos, donde todos los términos analizados se encuentran relacionados entre sí de un modo u otro. La implementación de una herramienta terminológica multilingüe integrada en los sitios web con información sobre patrimonio facilitaría a los usuarios potenciales el acceso a la información web incrementando por tanto la difusión y visibilidad de la misma.