El profesional de la información


Septiembre 1997

Gestion de informacion grafica: los formatos

Por José A. Senso

El tratamiento del color

El color es la percepción de las diferentes longitudes de onda de la luz. Es posible generar todos los colores mediante la composición de colores primarios. Los colores transmitidos (los que se capturan por medio de un escáner, por ejemplo) usan el método RGB (red, green and blue), y los colores reflejados (impresión de un gráfico, por ejemplo) el CMY (cyan, magenta and yellow).

Los monitores utilizan el sistema RGB, mientras que las impresoras el Cmyk (cyan, magenta, yellow and black).

El espectacular aumento de las posibilidades gráficas que se han conseguido en la informática ha traído consigo una exagerada cantidad de formatos.

La mayoría de las veces no nos damos cuenta, pero cuando queremos realizar alguna presentación, preparar un gráfico, o cuando, simplemente, nos los encontramos en internet, no sabemos qué hacer con ellos.

Es prácticamente imposible conocer todos los formatos, pero sí creemos interesante revisar el proceso de formación de las imágenes y comentar alguno de los formatos más conocidos del mercado.

Codificación del color

Extensiones de los principales formatos gráficos

Es el proceso mediante el cual los colores que constituyen una imagen se convierten en números, que es con lo que trabaja el ordenador. Existen varios métodos de codificación del color, entre los que destacamos los tres más utilizados:

  • RGB (red, green and blue): los colores se presentan como intensidades variables de puntos rojos, verdes y azules. Cuando estos tres colores se encuentran en sus intensidades máximas, el color resultante es el blanco. Si su intensidad es mínima, se producen diferentes tonos de gris. La intensidad oscila en una escala del 0 al 255.
  • A pesar de que las especificaciones de los formatos presentan diferentes opciones de compresión, esta posibilidad siempre está condicionada por las capacidades que ofrezca cada programa.

  • CMYK (cyan, magenta, yellow and black): para crear el blanco se reduce la intensidad del cian, magenta, amarillo y negro. Es el sistema de mezcla de colores usado para imprimir.
  • HSB (hue saturation brightness), también conocido como HSL (hue saturation and luminance): los tonos (hue) se distribuyen a través de una rueda de colores donde encontramos el rojo a 0 grados, el amarillo a 60, el verde a 120, el cian a 180, el azul a 240 y el magenta a 300. La saturación (saturation) depende de la cantidad de colores utilizados: el 0% es la cantidad menor y el 100% la mayor. El brillo (brightness-luminance) se obtiene incrementando el porcentaje de tonos blancos.

La cantidad de colores disponibles para representar un gráfico puede variar, lo que hará que se necesite diferente número de bits para codificarlos:

Bits por píxel Máximo número de
colores simultáneos
1 2
4 16
8 256
16 32.768 ó 65.536
(depende del formato)
24 16.777.216
32 16.777.216

Las imágenes GIF animadas se crean siguiendo la filosofía de los dibujos animados clásicos: las diferentes imágenes se almacenan en un solo fichero.

Clases de imágenes

El tipo de gráfico más difundido es el Bitmap o mapa de bits, o sea una cadena de números que representa una imagen. Si, por ejemplo, queremos representar los colores rojo, amarillo y negro, en el sistema RGB, el rojo tendría la codificación 255,0,0, el amarillo 0,255,0 y el negro 0,0,0. El mapa de bits resultante sería (255,0,0),(0,255,0),(0,0,0). Los dígitos variarán dependiendo del sistema de codificación escogido.

Vector graphics, o gráficos vectoriales, es el sistema utilizado principalmente para el diseño asistido por ordenador (CAD). Cada segmento de imagen se representa como un vector, definido por sus dos puntos extremos en una matriz x-y. La imagen se almacena como una lista de vectores, denominada display list (lista de presentación), donde se agregan ecuaciones matemáticas que evitan la distorsión de los vectores durante las diferentes etapas de edición. Uno de los problemas que presentan estos gráficos es que, en su mayoría, son propietarios -o sea, de marcas concretas-, así que deben tratarse con aplicaciones específicas.

Estos dos sistemas no son los únicos, pero sí los más utilizados, por lo que no nos detendremos a analizar el resto, que no son más que variaciones sobre estos dos.

¿Mapa de bits o gráficos vectoriales?

Depende. Cada sistema ofrece diferentes opciones, que, según el tipo de gráfico o imagen que se quiera elaborar, condicionará su tratamiento. En los gráficos vectoriales se pueden crear objetos, trasladarlos de lugar, borrarlos o modificarlos. Sin embargo, en los mapas de bits no existe el concepto de objeto, por lo que no podremos trasladarlos ni modificarlos.

Las características definidas por las principales aplicaciones, y las propias de los mapas de bits, hacen que éstos sean los más adecuados para retoque de imágenes fotográficas o para la creación de gráficos de reducido tamaño.

Los gráficos vectoriales, por su parte, se utilizan cuando es esencial tener pleno conocimiento geométrico del objeto creado. Además son los más adecuados cuando se necesite mayor libertad a la hora de manipular la imagen.

Paleta de colores y True Color

Estos dos conceptos se encuentran íntimamente ligados a los mapas de bits.

La codificación de los colores depende del sistema elegido. A la izquierda de la imagen aparecen los tres sistemas principales (HSB, RGB y CMYK). Los números que se encuentran a continuación de cada letra indican la cantidad de ese color primario necesario para representar el color especificado.

El pixel es el elemento gráfico más pequeño que podemos encontrar en la pantalla de un monitor.

Un pixel puede estar formado por uno o más puntos, pero siempre se trata como una unidad. Así, puede ser un punto en una pantalla monocromática, o también tres puntos (rojo, verde y azul) o una agrupación de esos puntos, en una pantalla de color.

El sistema de presentación más económico es el monocromo, en el cual cada pixel se encuentra codificado en un solo bit (blanco o negro). En las presentaciones de color se puede llegar a emplear hasta cuatro bytes completos para cada punto rojo, verde y azul.

Cada pixel puede presentar miles de millones de tonos diferentes.

Se suele denominar paleta al conjunto total de colores que pueden ser representados por cada sistema gráfico. La paleta de un mapa de bits está compuesta, normalmente, por una tabla de 256 colores que se incluye dentro del propio mapa de bits.

En esa tabla están codificados todos los colores y las posibles combinaciones. Al mismo tiempo, se divide el mapa de bits en casillas, cada una de las cuales presenta un código que remite a la tabla en la que se encuentra el color que le corresponde.

El número de colores de la paleta puede variar, lo que hará que cambie el número de bits necesarios para codificar cada casilla (ver cuadro).

El concepto de True Color viene a significar lo mismo que calidad fotográfica o color real. Esta calidad se consigue en un mapa de bits cuando codificamos un color completo en cada casilla, teniendo en cuenta que existen tres colores básicos, que necesitamos un byte para cada uno de esos tres colores, y 3 bytes para codificar el color completo.

Gracias a este sistema de codificación, se pueden representar simultáneamente 16 millones de colores. La experiencia nos dice que 256 colores son suficientes para mostrar cualquier tipo de imagen. No obstante, la posibilidad de contar con una gama tan amplia de colores es una gran ventaja en trabajos de imprenta o de diseño gráfico, y, por supuesto, para la gestión profesional de videograbaciones.

Formatos de mapas de bits

Entre los formatos de mapas de bits más conocidos destacan:

BMP (windows bitmap format): la principal ventaja que tiene este formato de Microsoft es que supone una garantía de compatibilidad. El sistema, que tiene paletas de 1, 4 y 8 bits, permite el almacenamiento de gráficos con compresión, usando el algoritmo RLE (run length encoded), que evita la pérdida de información y la consiguiente disminución de la calidad de los colores.

El principal inconveniente es que la ratio de compresión no es demasiado elevada, y los ficheros pueden llegar a tener un tamaño considerable.

Se trata de la mejor opción para almacenar gráficos sencillos y con poca profundidad de color. Los ficheros con este formato llevan la extensión .bmp.

También existe una especificación de este formato, denominada XBM (x window bit map), adaptada para X Window (si bien puede ser utilizada en cualquier sistema operativo). Permite que los gráficos generados en un ordenador cualquiera puedan mostrarse en otra estación de trabajo que funcione en la misma red.

Tiff (tagged image file format): este formato, con paletas de 1, 4 y 8 bits, es, sin lugar a dudas, el que posee ratios de compresión más elevadas cuando se trata de imágenes en blanco y negro, y, además, sin pérdida de información.

A pesar de utilizar el mismo sistema de compresión que GIF, el algoritmo LZW (lempel ziv welch), que comentaremos más adelante, es el sistema que más opciones de compresión ofrece (LZW, RLE, grupos III y IV de fax), aunque esta posibilidad siempre está condicionada por el programa que se utilice.

Los ficheros de este sistema, creado por Aldus y Microsoft, tienen la extensión .tif.

El algoritmo LZW debe su nombre a Jacob Ziv y Abraham Lempel, creadores de las dos técnicas, nacidas en 1977 y 1978, sobre las que se cimenta el sistema de compresión.

ACR: más que un formato, este acrónimo corresponde a la norma creada en 1988 por la Nema (National Electrical Manufacturers Association) con el fin de facilitar el intercambio de imágenes médicas realizadas por equipos de diferentes marcas.

La sencillez de la norma es absoluta, ya que las imágenes que abarca son mapas de bits sin compresión, y acepta un máximo de dos dimensiones (hay sistemas que permiten representar las tres dimensiones).

PCX: este formato, de la marca Zsoft, que soporta profundidades de color que varían de 1 a 24 bits, es uno de los más antiguos. Su éxito vino de la mano de los primeros programas de dibujo para ms-dos.

El sistema de compresión que utiliza es bastante simple y, aunque apenas tiene pérdidas de color, no es el formato más recomendable en la actualidad, ya que se ha visto superado por otros que han sabido adaptarse mejor a las nuevas circunstancias del mercado.

Técnicamente, más que un mapa de bits, los gráficos almacenados en este formato se denominan raster, que es el término que designa la técnica de representar figuras como una matriz de puntos. Dentro de este apartado destaca el formato Sun Raster, de la casa Sun Microsystems.

TGA: más conocido como Targa, ya que la empresa que lo ha desarrollado es TrueVision Targa. Además de una paleta de 1, 4 y 8 bits, gestiona imágenes con calidad fotográfica en 24 y 32 bits.

Se trata de uno de los pocos sistemas que, a la hora de almacenar, permite especificar si se desea hacer con o sin compresión.

Ni es GIF todo lo que reluce...

A pesar de que la mayoría de estos sistemas son conocidos, no cabe la menor duda de que el formato de mapa de bits más extendido y polémico es el GIF.

En 1985, Sperry (compañía fusionada con Burroughs para formar Unisys) creó un algoritmo de compresión de imágenes llamado LZW (lempel ziv welch). Desde ese mismo año, la empresa Unisys conserva los derechos sobre dicho algoritmo.

Dos años más tarde, CompuServe creó un formato propio, denominado GIF (graphics interchange format), y que tenía como finalidad el envío de imágenes a través de servicios online. Este formato de mapa de bits usaba un sistema de compresión sin pérdida que reducía el tamaño y, por tanto, el tiempo de transmisión.

La primera versión, que se denominó GIF87, tenía como algoritmo de compresión el LZW. Dos años más tarde la empresa americana desarrolló la segunda versión, GIF89, que con el mismo sistema de compresión logró situar su formato gráfico entre los de más uso en el mundo de las comunicaciones.

Hasta aquí todo era perfecto, salvo por un pequeño detalle: a nadie se le había ocurrido pensar que LZW estuviese patentado. En 1993, Unisys descubrió el uso ilegal que se estaba haciendo de su producto, y comenzaron las negociaciones entre las dos empresas para llegar a un acuerdo de explotación.

El acuerdo llegó un año más tarde, cuando se decidió que CompuServe debería pagar un 1% del precio de su software por copia. Además, Unisys determinó que todo usuario final que, con cualquier objetivo, utilice las versiones de este formato anteriores a 1995 no tendría que pagar licencia. Así mismo, las aplicaciones que, con carácter lucrativo y con fecha posterior al 1 de enero de 1995, exploten dicho formato deberían abonarla.

Como comentamos anteriormente, el formato Tiff utiliza también el "algoritmo de la discordia". Sin embargo sus creadores llegaron a un acuerdo con Unisys en 1991 y no han tenido problemas a la hora de desarrollar posteriores especificaciones. De hecho, este formato se encuentra actualmente en su quinta versión.

CompuServe, por su parte, está a punto de finalizar el desarrollo de una nueva versión, GIF24, que utilizará un algoritmo de compresión propio y, parece ser, con mejores resultados.

Dentro del desarrollo de formatos nuevos, hay que destacar la reciente aparición del sistema PNG (portable network graphics). Entre las características del formato PNG, que pretende ser el sucesor de GIF, destacamos:

  • mejor compresión que el formato GIF
  • soporta imágenes de escala de grises hasta 16 bits por píxel, lo que proporciona más de 65.000 tonos diferentes
  • independencia total de la plataforma usada
  • imágenes de color con calidad fotográfica o color real de hasta 48 bits por píxel
  • imágenes con paleta de 256 colores
  • la compresión la realiza sin pérdida de información

Por último, señalar que el grupo que desarrolla PNG está formado por CompuServe, Spyglass, Netscape y el consorcio WWW.

...ni Javascript todo lo que se mueve

A nadie se le escapa que, desde hace dos o tres años, las páginas en internet han mejorado su aspecto de forma notable. Esto se debe, en parte, al incremento de opciones que ofrecen las nuevas versiones del lenguaje html, y al aumento de las capacidades gráficas de los navegadores.

Una de las novedades que hemos podido apreciar es la de imágenes que, sorprendentemente, se mueven. En lo primero que pensamos cuando nos las encontramos es que están realizadas en JavaScript o Java. Nada más lejos de la realidad. Esas animaciones generalmente están formadas por un conjunto de imágenes GIF89 que se superponen unas a otras creando la sensación de movimiento. Preparadas siguiendo la filosofía de los dibujos animados clásicos, se almacenan en un solo fichero, creando lo que se ha dado en llamar Animated GIF.

La realización de este tipo de animaciones es bastante sencilla. Lo complicado reside en la edición de la propia imagen, aunque con los programas gráficos existentes se reduce notablemente la dificultad de su manipulación. Para "unir" todos los gráficos en uno han aparecido diferentes programas, entre los que destaca GIF Construction, de la empresa Alchemy.

Formatos de gráficos vectoriales

El concepto de paleta de colores no existe en este tipo de gráficos, ya que su orientación es diferente. La mayoría de los formatos están pensados para el diseño gráfico y las presentaciones.

CDR: es un ejemplo claro de formato orientado al diseño. Este sistema, que coincide con la extensión de sus ficheros, pertenece a la empresa Corel y está desarrollado para una aplicación específica: CorelDraw.

DRW: desarrollado por Micrografx y orientado al diseño. Fue creado para una su uso con el programa Micrografx Designer.

DWF (drawing web format): se trata de un formato de 32 bits para imágenes en dos dimensiones. Permite a sus usuarios realizar zooms de forma dinámica, sin necesidad de esperar a cargar completamente la imagen del servidor. Estas imágenes, que se comprimen en DWG, permiten compartir, a través de internet, gráficos creados por programas de diseño asistido por ordenador. El software de desarrollo de esta tecnología incluye librerías de enlace dinámico y el plug-in Whip! para facilitar la introducción de imágenes en páginas html.

EPS: de la empresa Adobe Systems. Muy popular. Todo el mundo ha necesitado alguna vez imprimir imágenes "encapsulated Postscript".

PPT: usado en el programa de presentaciones PowerPoint de Microsoft (otras aplicaciones del mismo tipo, como es el caso de Freelance Graphics o Harvard Graphics, utilizan también formatos propietarios).

DXF (drawing interchange format): desarrollado para el programa de diseño asistido por ordenador más famoso del mercado, AutoCAD. Es uno de los formatos para gráficos vectoriales más versátiles que existen, ya que además de almacenar el gráfico, que puede ser tridimensional, puede incluir información variada sobre el mismo. También se emplea para el intercambio de gráficos entre la aplicación específica y otros programas.

Metafiles

Como en cualquier otra faceta de la vida, en informática no sólo existe el blanco o el negro. Es decir, no sólo hay mapas de bits y vectoriales; existe otra variedad, los metafiles, que pueden almacenar más de un tipo de información. Esto quiere decir que pueden coexistir imágenes vectoriales y de mapas de bits.

Los dos formatos más conocidos son CGM y WMF.

CGM (computer graphics metafile): se trata de un sistema orientado, básicamente, a la importación y exportación de ficheros de un formato a otro. Utiliza tres tipos de codificación diferentes a la hora de realizar la compresión. El primero facilita la transmisión de datos; el segundo, binario, proporciona un acceso rápido a cualquier punto del gráfico; y, por último, existe una tercera fase que permite la edición.

A pesar de que este sistema no soporta imágenes en tres dimensiones, se han realizado diferentes intentos de crear un formato, relacionado con GKS (graphics kernel system), que reúna esas características.

WMF (windows metafile): lo más interesante de este formato creado por Microsoft es que incluye llamadas a funciones gráficas del entorno Windows.

Aunque pueda parecer lo contrario, este sistema no está concebido para una aplicación específica. Su uso, como ocurre con la mayoría de los metafiles, está orientado a la importación y exportación de unos formatos a otros.

Además de estos dos formatos existe otro en desarrollo, 3DMF (3D metafile), analizado en el número 43 de IWE (p. 25).

¿Qué pasa con Jpeg?

Supongo que a estas alturas debe haber alguien que se esté haciendo esta pregunta.

Jpeg (joint photographic experts group) no es un formato, sino el algoritmo de compresión de imágenes con el que se puede adquirir las ratios más elevadas.

El sistema tiene dos opciones: comprimir la imagen sin pérdida de información, lo que hace que la compresión sea menor; y comprimir con pérdida, para lo cual se analiza la imagen y se detectan y eliminan las partes que no se consideran esenciales (otra posibilidad es que, si la imagen tiene muchos colores, se eliminen unos y se difuminen los que queden alrededor con el fin de que la modificación no se note excesivamente).

Sea con pérdida de información (color) o sin ella, el proceso de compresión pasa por cuatro fases:

  • la primera afecta al color
  • en la segunda, se convierten los datos al dominio de la frecuencia
  • en la tercera, se aplica el porcentaje de calidad que el propio usuario ha determinado. Esta opción dependerá del programa con el que se esté trabajando
  • por último, se comprimen los datos resultantes.

Además de éste existen otros métodos de compresión, como el LZW, comentado anteriormente, el sistema RLE, usado por el formato BMP, o el algoritmo H.261, también llamado px64, creado por el Ccitt (Consultative Committee on International Telephony and Telegraphy), órgano de la Conferencia Europea de Correos y Telégrafos (Cept), que luego se integró en la Unión Internacional de Telecomunicaciones (ITU).

En otro artículo nos ocuparemos con más detalle de otros temas relacionados con éste, como formatos de imágenes animadas, el desarrollo de la especificación de los formatos GIF y PNG, y, ¿por qué no?, los fractales, que IWE ya presentó hace años (v. IWE-7, septiembre de 1992, p. 9).

José A. Senso

jsenso@sarenet.es

Enlace del artículo:
http://www.elprofesionaldelainformacion.com/contenidos/1997/septiembre/gestion_de_informacion_grafica_los_formatos.html