¿Cuánto se comprime un archivo zip?

El formato de archivo zip fue desarrollado por Pkware. El desarrollo inicial del formato se completó en 1986. Permite que los datos se compriman y archiven, lo que ahorra espacio en el disco y facilita la realización de copias de seguridad y la transferencia de archivos grandes o de varias partes. Hay muchos factores que afectan el grado de compresión que se puede lograr.

Tipos de compresión

Hay dos tipos de compresión de archivos: sin pérdida y con pérdida. El formato zip es un ejemplo de compresión sin pérdidas, lo que significa que los datos comprimidos pueden volver a su estado anterior exacto sin fallas. La compresión con pérdida favorece la eficiencia sobre la precisión, lo que permite que los datos se sustituyan o eliminen por completo. Un formato sin pérdidas no permite métodos de compresión que no permitan una recreación perfecta de los datos originales, incluso si esos métodos fueran más efectivos.

Video del día

Métodos

El formato zip incluye especificaciones para múltiples métodos algorítmicos de compresión de archivos. El método utilizado puede tener un efecto significativo en el nivel de compresión alcanzado. Algunos de los métodos disponibles incluyen encoger, reducir, implosionar y desinflar. De estos, desinflar es el más utilizado. Es el método de compresión predeterminado que se utiliza en Pkzip, WinZip e Info-Zip.

Variabilidad

El grado de compresión de un archivo varía según el tipo de archivo. Por ejemplo, los archivos de texto por defecto carecen de compresión, y cada carácter se representa individualmente en hexadecimal. Hex, o hexadecimal, es un sistema numérico compuesto por 16 identificadores únicos de un solo carácter capaces de representar cada byte en un archivo. Las tasas de compresión en este tipo de archivo son generalmente muy buenas.

Muchos formatos multimedia, como MP3, incluyen la compresión como parte del formato estándar. Las tasas de compresión de estos archivos suelen ser bajas, lo que puede resultar en un archivo zip "comprimido" que es más grande que el original debido a los datos adicionales en el archivo zip.

Comparación

El formato zip no es el único formato de compresión en uso. Otros formatos de compresión comunes incluyen RAR y 7-zip. Según Igor Pavlov, desarrollador de 7-zip, el formato zip estándar tiene un rendimiento inferior al de los otros dos formatos entre un 30 y un 40 por ciento, según el tipo de datos que se comprimen.

En una prueba, Pavlov comprimió una instalación completa de Google Earth 3.0.0616. Los datos totalizaron 23,5 MB antes de la compresión. El formato zip estándar proporcionó aproximadamente un 62 por ciento de compresión. En comparación, RAR resultó en una tasa de compresión del 71 por ciento y 7-zip tuvo el 76 por ciento.

Limitaciones

Las primeras encarnaciones del formato zip se limitaban a manejar datos de no más de 4 gigabytes a la vez. Esto incluía el tamaño de archivo individual comprimido y sin comprimir y el tamaño total del archivo después de la compresión. Esta limitación se elimina en versiones más recientes del formato con la adición de la extensión zip64. El soporte para la extensión zip64 aún es limitado.