Datenkompression


Kriterien

Übersicht Formate

Grundlagen

Kompressionsverfahren

Datenformate

Dateien

BZIP2

Kompression

Datenstruktur

Datensicherheit

Applikationen

GZIP

ZIP

Audiodaten

Bilddaten

Videodaten


Glossar

Stichwortverzeichnis


Download


www.BinaryEssence.de

BZIP2: Kompression


Der bestimmende Algorithmus von BZIP2 ist die Burrows-Wheeler-Transformation (BWT), mit dessen Hilfe die Ausgangsdaten in eine geeignete Form für die nachfolgende Kodierung umgewandelt werden. In der aktuellen Version wird dazu ein Huffman-Kode angewendet.


In früheren Phasen der Entwicklung ist die effizientere arithmetische Kodierung eingesetzt worden. Diese ist jedoch durch Patente reglementiert und eignet sich deshalb nicht für Open-Source-Projekte. Außerdem enthält BZIP2 Optionen für eine Lauflängenkodierung (RLE), die aber mittlerweile obsolet sind.


Die erreichbare Kompressionsrate von BZIP2 liegt deutlich oberhalb der von konventionellen Formaten wie z.B. Deflate oder Deflate64™ (GZIP, ZIP) und geringfügig unterhalb der besten aktuell verfügbaren Verfahren (PPM, LZMA).


Gemessen an den heutzutage verfügbaren Speicherkapazitäten ist der Aufwand für die Kompression mit weniger als 8 MByte als eher gering anzusehen, liegt damit aber deutlich oberhalb von Deflate. Der massive Speicherbedarf von LZMA und insbesondere PPM wird allerdings nicht erreicht.


Der interne Algorithmus kodiert die Daten in voneinander unabhängigen Blöcken. Die Blockgrößen lassen sich in einem Bereich von 100.000 - 900.000 Byte (1-9) einstellen; Standard sind Blöcke mit 900.000 Zeichen. Mit niedriger Blockgröße sinkt auch der Speicherbedarf.


Die Verarbeitungsgeschwindigkeit ist weitesgehend proportional zur erreichbaren Kompression und zu den vergleichbaren Verfahren (langsamer als Deflate, schneller als PPM). Die Dekodierung ist mehr als doppelt so schnell wie die Enkodierung (insbesondere im Gegensatz zu PPM).


 <   ^   > 

Burrows-Wheeler-Transformation (BWT) [Burrows-Wheeler-Transformation (BWT)]

Huffman-Kodierung [Huffman-Kodierung]

adaptive Huffman-Kodierung [adaptive Huffman-Kodierung]

arithmetische Kodierung (AC) [arithmetische Kodierung (AC)]

Run Length Encoding [RLE - Lauflängenkodierung]

GZIP [Datenformat: GZIP]

ZIP [Datenformat: ZIP]

Externe Links:

BinaryEssence ist nicht verantwortlich
für die Inhalte externer Internetseiten:

BZIP2, LIBBZIP2 (bei Red Hat Sourceware, Englisch) []

BZIP2 BZIP2 BZIP2: Datenstruktur



Anzeigen:

Informations- und Kodierungstheorie