Насколько сильно сжимается Zip-файл?

Формат файла zip был разработан компанией Pkware. Ранняя разработка формата была завершена в 1986 году. Это позволяет сжимать и архивировать данные, экономя дисковое пространство и упрощая резервное копирование и передачу больших или состоящих из нескольких частей файлов. Есть много факторов, которые влияют на достижимую степень сжатия.

Типы сжатия

Существует два типа сжатия файлов: без потерь и с потерями. Формат zip является примером сжатия без потерь, что означает, что сжатые данные могут быть возвращены в их точное предыдущее состояние без ошибок. Сжатие с потерями отдает предпочтение эффективности, а не точности, позволяя полностью заменить или исключить данные. Формат без потерь не допускает методов сжатия, которые не позволяют полностью воссоздать исходные данные, даже если эти методы были бы более эффективными.

Видео дня

Методы

Формат zip включает спецификации для нескольких алгоритмических методов сжатия файлов. Используемый метод может существенно повлиять на достигаемый уровень сжатия. Некоторые из доступных методов включают сжатие, уменьшение, сжатие и сдувание. Из них наиболее широко используется дефлят. Это метод сжатия по умолчанию, используемый в Pkzip, WinZip и Info-Zip.

Изменчивость

Степень сжатия файла зависит от типа файла. Например, в текстовых файлах по умолчанию отсутствует какое-либо сжатие, и каждый символ представлен индивидуально в шестнадцатеричном формате. Шестнадцатеричный или шестнадцатеричный - это система счисления, состоящая из 16 уникальных односимвольных идентификаторов, способных представлять каждый байт в файле. Степень сжатия файлов такого типа обычно очень хорошая.

Многие медиа-форматы, такие как MP3, включают сжатие как часть стандарта формата. Степень сжатия этих файлов обычно низкая, что может даже привести к тому, что «сжатый» zip-файл окажется больше оригинала из-за дополнительных данных в zip-архиве.

Сравнение

Формат zip - не единственный используемый формат сжатия. Другие распространенные форматы сжатия включают RAR и 7-zip. По словам Игоря Павлова, разработчика 7-zip, стандартный формат zip уступает двум другим форматам на 30-40%, в зависимости от типа сжимаемых данных.

В ходе тестирования Павлов сжал полную версию Google Планета Земля 3.0.0616. Объем данных до сжатия составил 23,5 МБ. Стандартный формат zip обеспечивает примерно 62-процентное сжатие. Для сравнения, RAR дает степень сжатия 71%, а 7-zip - 76%.

Ограничения

Ранние воплощения формата zip ограничивались обработкой данных размером не более 4 гигабайт за раз. Сюда входят отдельные размеры сжатых и несжатых файлов, а также общий размер архива после сжатия. Это ограничение снято в более поздних версиях формата с добавлением расширения zip64. Поддержка расширения zip64 все еще ограничена.