Hoeveel comprimeert een zipbestand?

Het zip-bestandsformaat is ontwikkeld door Pkware. Vroege ontwikkeling van het formaat werd in 1986 voltooid. Hiermee kunnen gegevens worden gecomprimeerd en gearchiveerd, waardoor schijfruimte wordt bespaard en het gemakkelijker wordt om grote of meerdelige bestanden te back-uppen en over te dragen. Er zijn veel factoren die van invloed zijn op de mate van compressie die kan worden bereikt.

Compressietypen

Er zijn twee soorten bestandscompressie: lossless en lossy. Het zip-formaat is een voorbeeld van verliesvrije compressie, wat betekent dat de gecomprimeerde gegevens zonder fouten in de exacte vorige staat kunnen worden teruggebracht. Compressie met verlies geeft de voorkeur aan efficiëntie boven nauwkeurigheid, waardoor gegevens volledig kunnen worden vervangen of geëlimineerd. Een verliesvrij formaat staat geen compressiemethoden toe die geen perfecte reproductie van de originele gegevens mogelijk maken, zelfs als die methoden effectiever zouden zijn.

Video van de dag

Methoden:

Het zip-formaat bevat specificaties voor meerdere algoritmische methoden voor bestandscompressie. De gebruikte methode kan een significant effect hebben op het bereikte compressieniveau. Enkele van de beschikbare methoden zijn krimpen, verkleinen, imploderen en leeglopen. Hiervan wordt leeglopen het meest gebruikt. Het is de standaard compressiemethode die wordt gebruikt in Pkzip, WinZip en Info-Zip.

variabiliteit

De mate waarin een bestand kan worden gecomprimeerd, verschilt per bestandstype. Tekstbestanden hebben bijvoorbeeld standaard geen compressie, waarbij elk teken afzonderlijk in hex wordt weergegeven. Hex, of hexadecimaal, is een numeriek systeem dat bestaat uit 16 unieke identificatiecodes van één teken die elke byte in een bestand kunnen vertegenwoordigen. De compressiesnelheden van dit soort bestanden zijn over het algemeen erg goed.

Veel mediaformaten, zoals MP3's, bevatten compressie als onderdeel van de formaatstandaard. Compressiesnelheden voor deze bestanden zijn meestal slecht, wat mogelijk zelfs resulteert in een "gecomprimeerd" zipbestand dat groter is dan het origineel vanwege de extra gegevens in het zip-archief.

Vergelijking

Het zip-formaat is niet het enige compressieformaat dat wordt gebruikt. Andere veelgebruikte compressie-indelingen zijn RAR en 7-zip. Volgens Igor Pavlov, ontwikkelaar van 7-zip, presteert het standaard zip-formaat wel 30 tot 40 procent slechter dan de andere twee formaten, afhankelijk van het type gegevens dat wordt gecomprimeerd.

In een test comprimeerde Pavlov een volledige installatie van Google Earth 3.0.0616. De gegevens waren in totaal 23,5 MB vóór compressie. Het standaard zip-formaat bood ongeveer 62 procent compressie. Ter vergelijking: RAR resulteerde in een compressiepercentage van 71 procent en 7-zip had 76 procent.

Beperkingen

Vroege incarnaties van het zip-formaat waren beperkt tot het verwerken van gegevens die niet groter waren dan 4 gigabyte per keer. Dit omvatte gecomprimeerde en ongecomprimeerde individuele bestandsgrootte en de totale grootte van het archief na compressie. Deze beperking wordt verwijderd in recentere versies van het formaat met de toevoeging van de zip64-extensie. Ondersteuning voor de zip64-extensie is nog steeds beperkt.