Marzo 1994
Acrobat, un "superestándar" de documento electrónico
Por Pedro Hípola
Las editoriales John Wiley & Sons y Chapman & Hall han anunciado recientemente proyectos piloto para la publicación de revistas electrónicas en formato PDF (portable document format), el formato del sistema Acrobat de Adobe. Según la nota conjunta de prensa, "por fin las editoriales ya no necesitarán plantearse qué máquinas lectoras tienen ni qué aplicaciones o sistemas operativos utilizan". De todas formas hay que recordar que Acrobat es un sistema "propietario", que compite con las propuestas de otros fabricantes que también están interesados en protagonizar el movimiento de normalización del documento electrónico.
John Wiley & Sons y Chapman & Hall participan en el proyecto Cajun (Cd-rom Acrobat Journals Using Networks, liderado por el profesor David Brailsford.
Wiley tiene el propósito de distribuir a través de las redes, en PDF, su revista Electronic Publishing: Origination, Dissemination & Design, que es publicada hace 6 años y cuyo editor-jefe es el mismo Brailsford. Por su parte, Chapman & Hall ofrecerá con el nuevo formato Optical and Quantum Electronics y Collaborative Computing. Esta última revista ha comenzado a editarse en 1994.
"El nuestro es un experimento a una escala relativamente pequeña afirma Brailsford. Pero sus implicaciones para la industria de la impresión y la industria editorial son tremendas. No cabe duda de que Acrobat es uno de los más importantes desarrollos que nunca se han realizado en el campo de la publicación electrónica".
La normalización del documento electrónico
La historia que ahora nos ocupa "viene de lejos". Cada vez es mayor la cantidad de información que circula en soporte legible por ordenador, tanto información numérica y textual como gráficos, imágenes e incluso sonido. Pero, como ya resaltábamos en IWE-9, p. 4, sucede con facilidad que los diversos productos de información electrónica que aparecen en el mercado quedan aislados del resto por no estar ajustados a normas que faciliten la gestión homogénea de productos heterogéneos. De esta forma se produce la paradójica situación de que aumentan los productos y servicios de información electrónica, pero no podemos decir que aumenten en la misma proporción las facilidades para que el público en su conjunto acceda a todos ellos.
La mayor parte de las normas disponibles para la gestión de información electrónica sirven para solucionar problemas de incompatibilidad de sistemas informáticos en su más bajo nivel : compatibilidad de hardware, sistemas de codificación de caracteres, normas para las señales físicas en telecomunicaciones, etc. Tal nivel de normalización resulta imprescindible. En este sentido la aceptación general de normas como el juego de caracteres ascii ha supuesto sin duda un avance considerable para facilitar la transferencia y el acceso a la información en soporte digital.
Sin embargo, es interesante observar la creciente importancia que van adquiriendo nuevas familias de normas aparecidas en los últimos años, destinadas así mismo a facilitar el intercambio de información electrónica de forma abierta, no sujeto a las especificaciones de un solo fabricante, pero a un nivel superior. Algunas de estas normas, las menos pretenciosas, tratan de homogeneizar el formato y la estructura de los documentos que incluyen únicamente caracteres alfanuméricos. Otras, más completas, abarcan todas las posibilidades de un entorno multimedia, como es el caso de algunas normas dirigidas a hacer compatibles los diversos productos hipermedia en cd-rom.
Así por ejemplo las normas del Comité Consultivo Internacional de Teléfonos y Telégrafos (Ccitt) para la representación de imágenes facsímiles, llamadas fax, son utilizadas frecuentemente en la elaboración de productos de edición electrónica, como es el caso de algunos discos cd-rom que incluyen imágenes digitalizadas. Su uso tan extendido contrasta, sin embargo, con el bajo nivel en el que se sitúa el esfuerzo normalizador. La información codificada no permite ni la más mínima estructuración de los datos.
Por el contrario las especificaciones de otras normas, como es el caso del sgml (standard generalised mark-up language), dentro del mundo de la edición electrónica, o ISO 2709 la norma marco de las diversas versiones del formato Marc, tan extendida en el entorno bibliotecario y documental, suponen un paso adelante para la representación de elementos documentales suficientemente estructurados.
Sgml
Ya nos ocupamos de Sgml en IWE-9, p. 14. Recordemos ahora que es un conjunto de normas utilizadas por autores y editores para preparar documentos electrónicos. Su objetivo es crear ficheros fácilmente transferibles y procesables por un amplio abanico de sistemas. Hace 8 años fue aceptado como norma internacional ISO [ISO 8879:1986] para la información documental.
La propia ISO define sgml así: "Lenguaje independiente de la aplicación que provee una sintaxis coherente y sin ambigüedades, apta para describir documentos construidos de acuerdo a ODA (office document architecture), o cualquier otro modelo de documento, que pueden ser creados y leídos tanto por seres humanos como máquinas [ISO/TC97/SC18 N424].
A diferencia de la forma convencional de señalar textos, en la cual las instrucciones se dan directamente al tipógrafo, sgml utiliza códigos que indican la estructura del documento. Los diversos elementos del mismo (título principal, títulos secundarios, notas de pie de página, etc.) reciben una serie de codificaciones específicas. Esto hace que cada documento sea como un "registro" con sus respectivos campos. Con sólo un conjunto de códigos, el documento, incluyendo tanto texto como gráficos, puede ser utilizado para crear diversos productos en diferentes medios o soportes.
Sgml supone un gran avance para los editores, ya que no sólo ahorra tiempo y reduce costos de producción (no es necesario volver a teclear los documentos) sino que el mismo original puede ser utilizado tanto para productos electrónicos como para impresos en papel.
¿Para qué sirve Acrobat?
Las prestaciones de Acrobat son en cierta forma complementarias a las de sgml. De hecho Adobe está trabajando, con la ayuda de la empresa Avalanche, para que Acrobat pueda incluir codificación sgml. De esta manera el producto de Adobe asumiría las prestaciones que ofrece la norma ISO.
Adobe Systems (Mountain View, California) comenzó la campaña de marketing de Acrobat, el pasado mes de junio, haciendo énfasis en que su nuevo sistema abarataría mucho los gastos de impresión en diversos tipos de organizaciones. Esto, que sin duda es cierto, es sólo una parte de lo que ofrece este nuevo sistema de intercambio de documentos completos formateados.
Muchos de los formatos electrónicos anteriormente usados para el intercambio y visualización de documentos digitalizados eran sólo, como hemos dicho antes, sistemas para "acumular" imágenes de páginas que habían sido previamente escaneadas. La situación de la industria mejoró con la aparición, en 1988, del lenguaje de descripción de páginas PostScript, lanzado al mercado también por Adobe.
PostScript ha sido hasta ahora el principal estándar de facto para el intercambio de documentos electrónicos ya formateados. El lenguaje ha servido fundamentalmente para que diversos sistemas informáticos puedan imprimir los documentos utilizando sistemas informáticos de diferentes fabricantes.
Con Acrobat se pretende llegar más lejos, facilitando el intercambio de documentos electrónicos entre sistemas software y hardware que son incompatibles entre sí. Haciendo uso de Acrobat se pueden ver en la pantalla del ordenador, con gran fidelidad a la tipografía, estilo, gráficos y colores del original, documentos que han sido creados en un sistema completamente incompatible.
Todos los sistemas actuales de tratamiento de textos y autoedición ofrecen facilidades para importar y exportar documentos. Sin embargo, en cuanto éstos son medianamente complejos con gráficos, tablas, etc., los problemas resultan insolubles. Al importar los documentos las tablas se trastocan, se pierde la composición de las páginas que habían sido maquetadas con cierta complejidad. No siempre es posible intercambiar documentos completos de manera que el sistema que los recibe pueda visualizarlos como si él los hubiera creado.
Esta carencia viene a ser cubierta en parte por nuevos formatos, como los de los ficheros PDF de Acrobat. El reciente sistema de Adobe incluye todas las funcionalidades que ofrece su predecesor PostScript para gestionar textos con gran riqueza tipográfica, así como gráficos complejos. Permite crear índices para búsquedas textuales representando grandes tamaños de página con suficiente calidad de imagen. Y sirve, en definitiva, para que un fichero PostScript sea presentado, con todas sus ilustraciones y tipos de caracteres no habituales, en la pantalla de máquinas que antes habrían sido incapaces de ofrecer tales prestaciones.
En la medida en que los usuarios puedan y sepan utilizarlos, los ficheros PDF circularán por las redes de ordenadores, o serán distribuidos a través de cualquier otro soporte informático.
Gran capacidad de compresión
Los ficheros PDF se caracterizan por su alto nivel de compresión. La tecnología utilizada se vale de las técnicas compresoras de la norma fax grupo 4, del Ccitt, y de Jpeg (Joint photographic experts group). En algunos casos lo que antes con PostScript ocupaba 80 megas ahora puede caber en un disquete de 3,50''.
Además el formato utiliza sólo caracteres Ascii de 7 bits, lo cual hace posible una portabilidad universal, pues no tiene que depender de las variantes de diferentes juegos de caracteres de 8 bits diseñadas para usos específicos internacionales.
Componentes de Acrobat
Consta de varios programas:
Acrobat Exchange: permite generar ficheros en formato PDF a partir de documentos creados por otras aplicaciones, así como visualizarlos en diversos tamaños, manipularlos cortar y pegar, hacer anotaciones, búsquedas, navegación... e imprimirlos.
Acrobat Reader: versión limitada del módulo Exchange, que sirve para visualizar los documentos en formato PDF e imprimirlos. No permite crear ficheros PDF, ni manipularlos. El módulo lector estará disponible para Windows, DOS, Unix y Macintosh a precio muy reducido.
Acrobat Distiller: traduce a PDF ficheros estructurados en lenguaje PostScript. Puede comprimirlos o reducir la resolución de las imágenes. Sin embargo no ofrece la función de visualización ni otras prestaciones de Exchange.
Dataware asume Acrobat
Varias empresas están haciendo pruebas con el nuevo sistema de Adobe. Dentro del mundo del cd-rom, como ya anunciamos en IWE-18, p. 10, Dataware Technologies está trabajando para incorporar el software lector de Acrobat dentro de su sistema de recuperación CD‑Answer.
La "competencia" de Acrobat
Existen dos productos que en cierta manera compiten con Acrobat : Replica y Common Ground.
Replica está basado en la tecnología TrueType, el sistema de caracteres escalables incluido en el System 7 de Apple y en Windows a partir de la versión 3.1. Permite recortar y pegar textos formateados y gráficos. Sin embargo, no es posible hacer anotaciones. El módulo de visualización es gratis y puede ser suministrado junto con el documento cuando éste es distribuido.
Common Ground también ofrece la posibilidad de que se entregue un módulo visualizador "embebido" en el documento. El sistema completo permite recortar y pegar, así como hacer búsquedas de cadenas de caracteres. Reproduce exactamente el original.
Nota : Este informe ha sido elaborado por la redacción de IWE usando como fuentes informaciones publicadas en las revistas Electronic Documents, Information World en Español, Information World Review y Multitechs, así como notas suministradas por algunas de las empresas citadas en el informe.
Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1994/marzo/acrobat_un_superestndar_de_documento_electrnico.html