El profesional de la información


Abril 1995

MultiTerm: Terminología multilingüe en un entorno gráfico

Por Javier Gómez Guinovart

Javier Gómez GuinovartToda comunidad lingüística que inventa, descubre o recibe nuevos objetos o conceptos necesita crear términos para designar las nuevas realidades; necesita adoptar éstas en el seno de su propio sistema de conceptos, valores y formas lingüísticas. En muchos casos, incluso el lanzamiento comercial de un producto supone la acuñación de nuevos términos por parte de la empresa fabricante.

Los organismos nacionales de estandarización de terminología, como Aenor en España, Afnor en Francia o Termcat en Cataluña, intentan sistematizar en forma de glosarios temáticos la explosión terminológica motivada por el rápido avance de la ciencia y la tecnología. Sin embargo, el ritmo de publicación de los distintos vocabularios impresos se aleja bastante de la velocidad de evolución de la lengua viva.

Una solución para este desajuste pasa por mantener una base de datos terminológicos (BDT) personal o propia de nuestra empresa, utilizando programas de gestión de BDT como MultiTerm o Term‑PC. Otra posibilidad, en ningún caso excluyente, consiste en acceder a las diversas grandes BDT de acceso remoto a través de Internet.

MultiTerm for Windows

La empresa alemana Trados acaba de presentar la versión 1.5 de MultiTerm for Windows Professional (151.200 PTA), un sistema de gestión de bases de datos terminológicos (BDT) específicamente diseñado para crear, administrar y consultar vocabularios plurilingües electrónicos, que pueden contener gráficos e ilustraciones.

El formato de MultiTerm se utiliza para distribuir más de 100 diccionarios en soporte magnético, entre los cuales se encuentran diversos repertorios plurilingües de Elsevier's y partes de Eurodicautom, una BDT de la Comisión de las Comunidades Europeas que contiene más de 700.000 registros con vocabulario científico‑técnico y abreviaturas en las nueve lenguas comunitarias. Otros sistemas de gestión de BDT para ordenadores personales son Term‑PC para Windows, desarrollado por Siemens, y LexBase para DOS de Micro‑Aid. MultiTerm Lite (67.200 PTA) es una versión reducida de MultiTerm for Windows Professional destinada a usuarios con necesidades de gestión terminológica más limitadas.

La configuración mínima para instalar la versión 1.5 de MultiTerm for Windows Professional consiste en un PC compatible con procesador 386SX o superior, 4 MB de RAM, 3,5 MB de espacio disponible en disco duro y Windows versión 3.0 o posterior. Durante su instalación, se debe seleccionar la lengua de los menús, de los mensajes y de la ayuda entre el inglés, el francés y el alemán. En la actualidad, INK Catalunya, la empresa que distribuye este producto en España, está traduciendo MultiTerm al catalán (gracias a una subvención de la Generalitat de Catalunya y con la colaboración de Termcat) y al castellano, y está haciendo las gestiones necesarias para traducirlo también al gallego.

Las fichas terminológicas

Una BDT es un inventario informatizado de fichas terminológicas. Cada una de estas fichas o registros contiene las distintas informaciones recopiladas sobre un término. Existen tantos modelos de fichas terminológicas como traductores, terminólogos, empresas, organismos, etc. MultiTerm ofrece un modelo abierto de ficha que permite que el usuario estructure la información en la forma más adecuada a sus necesidades.

Una ficha terminológica de MultiTerm puede incluir un máximo de 500 campos de longitud variable. Los campos no pueden sobrepasar los 4.096 caracteres y el total de caracteres de una ficha no debe superar la cantidad de 32.000. Cada ficha se corresponde con un único concepto y puede contener los términos correspondientes a ese concepto en un máximo de veinte idiomas. MultiTerm indexa las BDT por todos los términos en los diferentes idiomas, por lo que es posible realizar búsquedas rápidas a partir de cualquiera de las lenguas indexadas.

Al margen de los campos que contienen los términos que describen un concepto en las distintas lenguas, una ficha terminológica de MultiTerm también puede incluir campos de texto. Estos campos sirven para almacenar información textual como la definición del término, el contexto en el que fue encontrado, la fuente de la definición o del contexto, observaciones respecto a su uso, etc.

Otro tipo de campos que puede incluir una ficha son los atributos. Estos campos permiten establecer listas cerradas de valores aceptables definidos por el usuario. Por ejemplo, se puede definir la categoría sintáctica del término como una lista cerrada de categorías de entre las que el usuario tiene que seleccionar una. De este modo, el administrador de la BDT se aseguraría de que distintos usuarios no introdujeran la misma categoría sintáctica con distintas abreviaturas. También se podría definir un campo de atributos con los títulos de las diversas obras de referencia utilizadas durante la elaboración de la BDT, de manera que no fuera preciso volver a escribir el título de la fuente cada vez que se rellena una ficha.

Como ya hemos apuntado, los campos gráficos también pueden formar parte de una ficha terminológica. Cada ficha puede llevar asociada una imagen en cualquiera de los siguientes formatos gráficos: BMP, WMF, PCX, TIF, EPS, PS y GIF. Los campos gráficos están concebidos para introducir figuras que puedan contribuir a aclarar o ilustrar el concepto glosado en la ficha.

Por último, cada ficha terminológica de MultiTerm incluye unos campos que el sistema genera automáticamente para almacenar información técnica sobre el registro, como el autor de la ficha, el número del registro, la fecha de creación, la fecha de la última modificación y el usuario que ha realizado la última modificación

Consultando la base de datos

El usuario de MultiTerm puede controlar con absoluta precisión el aspecto que presentarán sus BDT en la pantalla del ordenador. Para ello, basta con seleccionar las opciones deseadas en un cuadro de diálogo que permite especificar para cada campo (en realidad, para cada nombre de campo y para cada contenido de campo) el tipo, tamaño, aspecto y color de las letras, el margen izquierdo, el sangrado relativo al final del párrafo previo, el espaciado entre párrafos, el espaciado interlineal y los saltos de línea entre párrafos. También se puede determinar si el campo es visible o invisible, si el nombre del campo aparece o no en pantalla, o si es un campo oculto cuyo contenido se revelará al pulsar el ratón sobre el rótulo que indica su existencia.

MultiTerm permite efectuar distintos tipos de búsquedas en las BDT. La búsqueda más sencilla (y también la más rápida) consiste en buscar un término en cualquiera de los idiomas de la BDT. Si el término buscado contiene uno o más asteriscos (el carácter comodín para cualquier cadena de cero o más caracteres), el resultado será la lista de términos que coincidan con el patrón buscado. Así, una búsqueda del patrón *programa*, nos ofrecería una lista con términos como analista programador, lenguaje de programación, programa residente, etc.

Una novedad de esta versión consiste en la posibilidad de realizar búsquedas de términos por similitud (fuzzy search). Esto significa que se pueden localizar los términos que posean un cierto parecido con la cadena buscada. Por ejemplo, una búsqueda del patrón #raton del botin (donde el carácter # provoca la búsqueda por semejanza) nos permitiría encontrar el término botón del ratón. Antes de poder efectuar búsquedas por similitud, se debe construir un índice borroso (fuzzy index) de la BDT. Este índice es estático, por lo que conviene reconstruirlo periódicamente, siempre que se añadan nuevos registros a la BDT.

Otra manera de localizar un término es a través de una referencia hipertextual incluida en un campo de texto. Así, un campo de texto para la definición de un término podría incorporar referencias a términos en cualquiera de los idiomas indexados de la BDT. La manera de activar estos vínculos hipertextuales es la usual en el entorno Windows: no hay más que pulsar el ratón sobre la llamada.

Al mismo tiempo, MultiTerm permite el diseño de filtros para seleccionar el subconjunto de la BDT que cumpla unos criterios determinados. Estos criterios se establecen como condiciones que han de cumplir los campos y pueden encadenarse mediante los operadores lógicos AND y OR. Las búsquedas realizadas con un filtro activo se efectuarán únicamente en el subconjunto de la BDT que cumpla los requisitos establecidos en el filtro.

Integración de formatos

MultiTerm ofrece la posibilidad de crear o ampliar sus BDT a partir de un fichero de texto ASCII o ANSI. El formato que debe respetar este fichero es simple: la primera línea de cada entrada debe estar constituida por dos asteriscos, y cada campo debe estar formado por el nombre del campo entre dos corchetes triangulares, un espacio y el contenido del campo. Antes de iniciar la importación, el usuario puede decidir si las entradas con términos ya existentes en la BDT se combinan o se reemplazan, o si las entradas que se importan necesitan cumplir los criterios especificados en un filtro.

Igualmente, las BDT de MultiTerm pueden ser exportadas a cualquier formato de texto definido por el usuario. Para crear un formato de exportación, se deben establecer diversas opciones, como si se exportan los nombres de los campos o no, qué caracteres deben aparecer antes o después del nombre o del contenido de cada campo, si se ordenan las entradas por el número del registro o por el índice activo, etc. Todas estas opciones pueden almacenarse en un fichero para su posterior utilización. MultiTerm se distribuye con algunos ficheros de opciones de exportación estándar, para poder convertir las BDT al formato de impresión de diccionarios de Ventura Publisher o al formato TEI de etiquetado de documentos electrónicos (TEI o Text Encoding Initiative es una especificación del estándar ISO denominado sgml o standard generalized markup language).

Por último, MultiTerm incorpora interfaces DDE para el intercambio dinámico de datos con las versiones 2.0 y 6.0 de Word para Windows y con la versión 6.0 de WordPerfect para Windows. Las funciones de intercambio permiten, por ejemplo, seleccionar una palabra en el procesador de textos, visualizar su traducción en la BDT de MultiTerm y, si el usuario lo desea, reemplazar la palabra consultada por su traducción en la BDT. El usuario puede acceder a todas las funciones DDE de MultiTerm a través de la barra de herramientas del procesador.

En el capítulo de los vínculos de MultiTerm con otras aplicaciones, hay que destacar también su completa integración en Translator's Workbench for Windows, un entorno de traducción asistida por ordenador diseñado también por Trados que aprovecha los recursos de una base de datos bilingüe de las oraciones previamente traducidas o memoria de traducción.

El distribuidor de MultiTerm es:

INK Catalunya Traduccions. Còrsega 411, 1º 1ª. 08037 Barcelona.

Tel: +34-3-459 09 64; fax: 459 09 76.

Javier Gómez Guinovart. Universidad de Vigo, Facultad de Humanidades, Apartado 874, 36200 Vigo.

Tel: +34-86-81 23 60; fax: 81 23 80

uvifejgg ARROBA cesga.es

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1995/abril/multiterm_terminologa_multilinge_en_un_entorno_grfico.html