|

La foto que encabeza este artículo está comprimida. Con respecto a la original, usa un 3% de los colores y omite numerosos detalles. Por otro lado, solo ocupa un 5% del espacio en disco. Que la foto ocupe tan poco espacio no es un milagro: se debe a la compresión de datos, una técnica computacional que se aplica también a la música y vídeos que disfrutas a diario.

En este artículo te explico cómo funciona la compresión de archivos (normales y multimedia), por qué es tan importante y cómo puedes sacarle el máximo provecho en tu día a día.

¿Qué significa comprimir un archivo?

Comprimir es lograr que un archivo ocupe menos sin corromperlo.

Los archivos almacenados en tu disco duro ocupan un espacio determinado sobre la superficie del disco. Si se siguen añadiendo más datos, llegará un momento en el que ya no quedará espacio.

Antes de que se inventara la compresión de archivos, solo había dos opciones: borrar los archivos o añadir más espacio comprando un nuevo disco duro. Dos opciones poco prácticas.

La compresión aplica métodos matemáticos -algoritmos- a los datos para conseguir que estos ocupen menos espacio en el disco, quitando la necesidad de borrar o ampliar el espacio.

Compresión sin pérdida (lossless) vs. Compresión con pérdida (lossy)

Existen dos tipos principales de compresión: sin pérdida de datos (lossless) y con pérdida de datos (lossy). Ambos tipos de compresión tienen sus ventajas e inconvenientes. En la siguiente tabla puedes ver algunos ejemplos de formatos de archivo y su tipo de compresión:

Ten en cuenta que, a veces, se usa un formato para juntar varios archivos en uno sin compresión, cosa que ocurre, por ejemplo, con el formato ISO. En ese caso hablamos de empaquetado de archivos, operación para la que también sirve el formato ZIP.

Compresión sin pérdida o lossless: inflar y desinflar globos

La compresión sin pérdida o lossless consiste en analizar el archivo en busca de repeticiones y patrones que se puedan resumir. Es lo más parecido a comprimir un acordeón. Mira, por ejemplo, este documento con varios tipos de datos:

Cuando lo comprimimos en formato ZIP, que es lossless, esto es lo que ocurre al “acordeón” original que es nuestro archivo de ejemplo:

Como ves, los sectores que se repetían se han reducido mucho, pero los datos no se han perdido: el formato ZIP ha guardado instrucciones que indican cómo “reinflar” el archivo para usarlo.

Nota también cómo algunos de esos sectores (los grises) no se han comprimido apenas: esto se debe a que el nivel de redundancia de esas partes es menor. En otras palabras, si no hay nada que se repita, el compresor no hace nada. Eso explica por qué comprimir archivos muy optimizados, como los JPG, es inútil.

Encontrar repeticiones en un texto es fácil. Por eso la compresión es muy eficaz con los TXT

Otra razón por la que pueden quedar partes sin comprimir es que cada tipo de dato requiere un enfoque distinto a la hora de ser comprimido sin pérdida. Es por ello que hoy en día se prefiere usar compresores específicos para determinados tipos de archivos, llamados comúnmente códecs.

Prácticamente todos los compresores de archivos (WinZip, WinRAR, 7Z) recurren a la compresión lossless porque es fiable y segura: la integridad de los datos se mantiene, y esa es su mayor ventaja. Si necesitas disminuir el espacio ocupado por documentos importantes, la compresión lossless debe ser tu primera elección.

El inconveniente principal de la compresión lossless es que no siempre resulta eficaz, y que el ahorro de espacio que consigue es inferior al que obtienen las técnicas lossy.

Compresión con pérdida o lossy: quitar las piezas no-esenciales

La compresión lossy disminuye el espacio ocupado por un archivo usando una técnica bastante más radical: elimina información que resulta irrelevante para los sentidos humanos.

Por ejemplo, la compresión JPG reduce las variaciones de brillo y color de una foto, mientras que el formato MP3 elimina frecuencias de sonido inaudibles para el oído humano.

Arriba, la forma de onda de un archivo WAV sin compresión; abajo, la versión MP3 a 40kbps (fuente: Audio Grains)

Una cosa a tener en cuenta es que mientras la compresión lossless siempre es máxima, la compresión lossy es ajustable por el usuario como si de un control de televisión se tratara.

La diferencia entre la primera y la segunda Lenna es imperceptible a simple vista

Al comprimir con un algoritmo lossy, hay que preguntarse siempre qué nivel de calidad consideramos aceptable para el uso que vamos a dar al documento comprimido. Es importante consultar una vista previa y no sobrescribir el original.

El compresor de imágenes RIOT en acción. Nota la diferencia de tamaño entre las dos imágenes

La ventaja innegable de la compresión lossy es que consigue reducir el tamaño de los archivos de manera espectacular sin que el contenido pierda sentido.

Gracias a su potencia, la compresión lossy posibilitó el crecimiento de Internet a finales de los 90 gracias a las imágenes JPG. El formato MP3, por otro lado, revolucionó el panorama de la música digital (e hizo posible Napster y el iPod).

Y, desde hace unos años, los formatos de vídeo comprimido han transformado la industria del cine y la televisión. Al poder enviar más datos en menos tiempo y ocupando menos espacio, autores y consumidores audiovisuales han salido ganando.

La baja fidelidad, un fenómeno al que nos hemos adaptado

El problema de la compresión lossy radica en la pérdida de fidelidad con respecto al original, una pérdida que no se puede recuperar de ninguna manera.

La información eliminada por un algoritmo lossy se pierde para siempre. Y empeora al guardar el archivo. Mira lo que ocurre al sobrescribir un archivo JPG más de 500 veces:

Una “culpa” que se puede achacar a la compresión con pérdida de datos es que nos ha acostumbrado a una menor fidelidad audiovisual: que una película presente artefactos de compresión y tenga un sonido aplanado no nos parece importar. Es más, hay incluso quien convierte estas imperfecciones en una herramienta artística.

Un ejemplo de datamoshing, esto es, el uso deliberado de artefactos de compresión para crear videoarte

Mientras tanto, los puristas siguen alabando la fotografía analógica en gran formato y los discos compactos, dos tecnologías que, a pesar de ser obsoletas, mantienen una fidelidad máxima con el original. Y cuidado con decirle a un fan del Hi-Fi que escuche canciones MP3 con un bitrate inferior a 320kbps: torcerá la nariz y volverá a sus mini-disc.

Pero ¿guardarías tú todas tus fotos en formato BMP / RAW, tus vídeos en AVI y toda tu música en formato WAV? Obviamente no: necesitarías un disco duro veinte veces más grande que el que tienes actualmente. Y para disfrutar de esos contenidos en Internet, necesitarías una conexión de fibra óptica como las que usan las universidades.

Así pues, la compresión lossy es el pequeño precio que tenemos que pagar por disponer de una cantidad enorme de información audiovisual sin tener que gastar un dineral en infraestructuras de reproducción y conexiones ultra-rápidas a Internet. Para algunos ese precio es demasiado alto; para otros, aceptable. Y ahí radica, quizá, la gracia de la compresión.

Comentarios

  • eduo |
    10/01/13
    eduo

    Excelente post de esos conceptos que algunos damos ya tan por sentados que se nos olvida que no nacimos sabiéndolos y que hay mucha desinformación por ahí. Me lo guardo para compartir con usuarios nuevos en el mundillo.

    Algo que siempre hay que enfatizar (lo has hecho, no es crítica) es que la compresión "lossy" se llama así por las pérdidas y estas pérdidas son permanentes. Es fácil pensar en JPG o MP3 como un ZIP pero la realidad es que su forma de comprimir se parece más a podar un árbol: Si se hace bien lo que se quita no se nota mucho y el resultado final es aceptable, si se hace mal lo que queda da pena verlo, pero en ambos casos lo que se quita se quita para siempre, para bien o para mal.

    Sigo viendo gente, a día de hoy, que comprime un JPG al guardarlo y luego se extraña que al intentar volver a guardarlo "sin comprimir" no recupere la información, y eso viene justamente de esta incomprensión de los tipos de compresión.

  • Fabrizio Ferri |
    10/01/13
    Fabrizio Ferri

    Eduo: totalmente de acuerdo. La confusión entre lossless y lossy ha causado una degradación involuntaria de muchos documentos.

  • 10 o 12? |
    10/01/13
    10 o 12?

    Ya, ya... Pero en la comparativa entre MP3 y WAV hay 12 Ipods y no 10!! xDDDD

  • Fabrizio Ferri |
    10/01/13
    Fabrizio Ferri

    Uy, corregido. ¡Gracias! :-)

  • *Brayan* |
    10/01/13
    *Brayan*

    muy buen post tomare en cuenta esto de las compresiones lossless y lossy cuando quiara reducir mis archivos

  • antonio |
    10/01/13
    antonio

    Excelente. Todos los dias se aprende algo nuevo. Saludos.

  • rigoberto66 |
    10/01/13
    rigoberto66

    Excelente post! Mejor explicado, imposible!! Gracias Fabrizio!

  • eecescudero |
    10/01/13
    eecescudero

    Fabrizio, esto es un excelente artículo hiciste un excelente trabajo al presentarnos todos los detalles de esta herramienta tan útil de la que es la comprensión ya que muchas personas no tienen espacio suficiente en su computador para guardar toneladas de archivos. ¡Excelente Trabajo!

  • UnLector |
    10/01/13
    UnLector

    Articulo de 10, perfecto!

    Seguid así, Onsoftware :)

  • Erik |
    10/01/13
    Erik

    Buen post, refuerza lo sabido de muy buena manera ;)

  • pidisibm |
    10/01/13
    pidisibm

    waww..gracias por la info...

  • Rodrigo |
    10/01/13
    Rodrigo

    Una pregunta: hoy en día la mayoría de las cámaras digitales (al menos las compactas) guardan tus fotos en formato jpg. ¿Quiere decir que con la misma cámara, se podrían tomar fotos de mejor calidad si las guardásemos en otro formato?

  • Fabrizio Ferri |
    10/01/13
    Fabrizio Ferri

    Rodrigo: los JPG que guardan las cámaras digitales tienen varios niveles de calidad. En calidad alta, la compresión es mínima.

    Si quieres fotos de calidad muy alta, necesitas una cámara capaz de sacar fotos en formato RAW, que contiene más información sin comprimir sobre brillo, colores, etcétera.

  • soywiz |
    10/01/13
    soywiz

    Añadir que la compresión lossless, además de repeticiones (RLE) y patrones (LZ) también contempla otras técnicas como la compresión (huffman) búsqueda de progresiones. Además hay un formato de imagen lossless por excelencia: PNG. PNG usa zlib que usa una combinación Huffman+RLE+LZ. Y además una técnica de filtrado de líneas que permite mejorar la compresión basándose en píxeles anteriores para generar valores repetidos y pequeños y así mejorar la eficiencia de las técnicas mencionadas: Huffman, RLE y LZ.

  • inma |
    10/01/13
    inma

    Si no me equivoco el H264 es con perdidas.

  • Queen Chrysalis |
    10/01/13
    Queen Chrysalis

    Tengo una notebook, esto posiblemente me sea útil.

  • Oxentiel |
    11/01/13
    Oxentiel

    Exelente articulo, y pues si es algo confuso eso de la compresion en mis inicios cometi algunos errores con eso y pues digamos que los resultados no fueron muy buenos, aunque pues en el asunto de la musica prefiero sin compresion se escucha mejor aunque muchos digan lo contrario, por eso aun tengo un discman eso si tambien tengo un ipod par alos viajes es imposible cargar con un monton de pilas a todas partes.

  • peresosojejejeje |
    11/01/13
    peresosojejejeje

    ya me asia falta una esplicasion muchas grasias

  • Leonardo |
    11/01/13
    Leonardo

    peresosojejej<br />eje en el próximo capítulo... cómo comprar un diccionario y no morir en el intento.

  • Paquin |
    11/01/13
    Paquin

    Buen Resumen y muy clarito para todos.

    Pero añadiria una cosa respecto a los JPG, y es que aun que les de un nivel de compresion (perdida lossy) que sea inperceptible al ojo, a la hora de imprimir la cosa cambia.

    Mucha gente mete compresiones de un 30% de perdida,que bien es cierto que es imposible notar la diferencia en el PC, pero luego a la hora de imprimirla si que se nota y mucho. Sobre todo si la pretendes imprimir al tamaño 100% (real) que dan las dimensiones originales de largo x ancho de la foto. ASi que mucho cuidado con comprimir fotos que quizas algun dia pudieramos pensar en imprimir.

  • Ra |
    11/01/13
    Ra

    No soy un experto en el tema, pero creo que h264 es un codec de compresion con perdida y MP4 es un contenedor, no un codec, así que si comprime con perdida o no depende del codec que lleve dentro

  • ManelPablo |
    11/01/13
    ManelPablo

    Sencillo, claro, fácil y transparente artículo. Creo que todos nos habíamos acostumbrado al jpg por su comodidad peso, y además porque es la opción de serie en la mayoría de cámaras digitales.

    Muy buen artículo. Manel.

  • Nick McCormick |
    11/01/13
    Nick McCormick

    La foto de Lenna con sus samples de JPG, pensé que la guardarían redundantemente en JPG... estaba en PNG :P

  • CyberSickness |
    12/01/13
    CyberSickness

    gran articulo

  • juan orozco |
    13/01/13
    juan orozco

    muy claro, comprensible, excelente articulo, mis felicitaciones

  • Jose Luis Ruiz |
    13/01/13
    Jose Luis Ruiz

    Magnífico artículo, muy bien explicado, y además con rigor. Lo he difundido y recomendado. Felicitaciones Sr. Fabrizio.

  • Framcisco |
    13/01/13
    Framcisco

    Increíble, excelente y no se con cuantos adjeticos mas calificarlo a este artículo. Ojalá que se repita con mas frecuencia en OnSoftware.

    ¡Felicitaciones!

  • Ivan |
    13/01/13
    Ivan

    Muy buen articulo, felicidades al autor. Queda muy claro el concepto de compresion de informacion, gracias.

  • Joaquin Crespo |
    13/01/13
    Joaquin Crespo

    Exelente artículo. Una pregunta ¿ el formato HD es un formato que no usa compresión con pérdidas?

  • GABRIEL MELGAREJO |
    13/01/13
    GABRIEL MELGAREJO

    excelente articulo, estoy aprendiendo muchas cosas con estos coemtarios y publicaciones, sigan asi que ayudan a ignorante, como es mi caso, de la informatica y demas, GRACIAS !!!

  • tanyi |
    15/01/13
    tanyi

    exelente explicacion

  • javier |
    15/01/13
    javier

    Que tal! soy nuevo en esto, por lo tanto quiero dar a entender bien mi problema. Lei tu articulo sobre Hardwipe pero creo que no funciona en mi pc. Es mas, con Recuva me di cuenta que en la papelera de reciclaje se almacenan como fotografias las imagenes de toda pagina que visite, en efecto es asi o mi pc tiene algun virus?. que es lo hecho? hasta el momento 1 pasada en "random overwrite" para limpiar el espacio borrado lo que me limpio aprox 5BG. Ayer otra pasada pero no hubo cambio alguno, que debo hacer?

  • javier |
    15/01/13
    javier

    (ufff error en parte) sobre lo anterior rectificar, debi decir: en el espacio libre del disco se almacenan como fotografias toda imagen de pagina que visite, es normal eso o mi pc tiene algun virus? que pasos debo dar para limpiar el disco libre? gracias!

  • Fidel |
    16/01/13
    Fidel

    Muy didáctico y sano uno se acostumbra a dar por sentado los programas pero no se da el tiempo de analizarlos profundamente , se agradece ...

  • Juan Gustavo |
    19/01/13
    Juan Gustavo

    Queda claro que en esto de la comprensión es mejor el camino de en medio. Ni tan poca que deje los archivos muy voluminosos ni tanta que deje el resultado muy pobre.

  • Juan Gustavo |
    19/01/13
    Juan Gustavo

    Ups, era compresión no comprensión.

  • elaiel2530 |
    24/01/13
    elaiel2530

    Hola Fabrizio. Te doy las gracias por tus excelentes explicaciones de los productos y sus pro y contras. Te envío un abrazo. Graciela.

  • Gerber Valladares desde Guatemala |
    28/01/13
    Gerber Valladares desde Guatemala

    Excelente artículo Fabrizio y se deben publicar mas de este tipo para que nuestros conocimientos sean mas amplios. Con respecto a las compresiones todo depende porque el que tiene buen oido si nota cuando una reproducción de música es FLAC o MP3 a 320 pero depende de la música que se esté escuchando porque si es tipo disco, pop, rock pues no se nota pero si escuchas una obra clásica definitivamente en mp3 se escucha fatal. Felicitaciones y sigan adelante.

  • Andres |
    29/01/13
    Andres

    Muy Buena la explicación, sencilla y fácil de digerir... y aunque resulte redundante....muchas Felicitaciones!!!!

  • ELSA |
    29/01/13
    ELSA

    MUCHAS GRACIAS POR COMPARTIR TUS CONOCIMIENTOS .ME FUE DE GRAN AYUDA .SE MUY POCO DE PC, Y A VECES QUISIERA ACLARAR CIERTAS DUDAS,CONCEPTOS COMO QUE ES COMPRIMIR ,DESCOMPRIMIR UN ARCHIVO Y AHORA ME QUEDO CLARO EXCELENTE EXPLICACION

  • Sergi |
    29/01/13
    Sergi

    A mi me encanta cuando descargas un mp3 a 320kbps y suena como con cristalitos. Y es que la gente no sabe que cuando la comprimes a 56kbps ya no se pueden recuperar datos (lossy) y sin embargo, por la red pululan......

  • Alex - Sotogrande |
    29/01/13
    Alex - Sotogrande

    Como siempre eficiencia y profesionalidad a la enésima potencia. Muchas gracias por la información. Saludos. Alex

  • Jaime Edu |
    01/02/13
    Jaime Edu

    Para los que sabemos muy poco, esta es una excelente explicación sobre la compresión de archivos. Gracias

  • Jose ignacio lopez saiz |
    01/02/13
    Jose ignacio lopez saiz

    Vaya articulo,…"Por que no lo publicas?"

  • victor |
    02/02/13
    victor

    gracias por la orientacion ya que solo asi se puede enterder mas sobre el funcionamiento de los archivos

  • ayto |
    05/02/13
    ayto

    saludos. hay algo de lo que no sé habló, y es la compresión por cojo..... en mis tiempos(hace unos 35 años) éste tipo de comprimir que cómo su nombre indica es un poco cómo: o si o si. Era algo parecido a cuando juegas al domino;me explicó.Imaginate que cuando tienes una larga fila de fichas y no cogen de ningún modo en la mesa, lo que haces es lo siguiente: entre dos personas(cada una por el principio y fin de la de la larga fila) sé comienza a ejercer una muy considerable fuerza, hasta que la compresión sé ha realizado. Lo que acabo de explicar, fue literalmente cómo hace tiempo(en los que todos, teníamos respuestas para todo lo relacionado con la info. y además nos quedábamos con la boca abierta. éste tonto pero real casi y aplicado a todo son los que al cabo de unos años,nos hace pensar 1 porqué tarde 2 años más en saber cómo era 2 (y más importante) porqué no sé me ocurrió decir al postillón que en el domino no es para nada necesario poner las fichas en línea recta. Me pregunto que hubiera contestado. porqué hace años no me lo explicarían así. Disculpas si éste momento informal, a molestado a alguien. PERO ES QUE FUE ASÍ.

    saludos. roberto.

  • Enrique |
    06/02/13
    Enrique

    Muchas gracias mi hermano, realmente me sorprendió lo fácil que fué entenderte los conceptos de la compresión. Yo sé muy poco de los asuntos técnicos del pc y he cometido muchos errores al escoger el formato para grabar imágenes y música ya que no quedaba satisfecho con el resultado y no sabía las causas, pero con esta valiosa información voy a irme corrigiendo. Te mando un fuerte abrazo y bendiciones para ti y toda esta linda comunidad informática que tanto ayuda a los menos aptos como yo. Que DIOS les siga permitiendo compartir su trabajo y esfuerzo. Saludos de Enrique

  • nenerina |
    07/02/13
    nenerina

    como puedo abrir hezos archivos o descomprimilos

  • hahm |
    11/02/13
    hahm

    saludos !!!

  • Ana |
    11/02/13
    Ana

    graciaas!!

23/04/14
Tu imagen de usuario
  1. 1
  2. 2
  3. Siguiente