Datenkompression


Kriterien

Übersicht Formate

Grundlagen

Grundbegriffe

Zeichen

Zeichenvorrat

Alphabet

Kode

Kodierung

Redundanz

Informationstheorie

Nachricht

Wahrscheinlichkeit

Informationsgehalt

Entropie

Redundanzreduktion

Irrelevanzreduktion

Entropiekodierung

Kodes mit variabler Länge

Kodebäume

Kompressionsverfahren

Datenformate


Glossar

Stichwortverzeichnis


Download


www.BinaryEssence.de

Zeichen


Im Zusammenhang mit der Datenkompression bzw. der Informationstheorie stellt das Zeichen die kleinste Einheit dar, in der Daten gegliedert sind. Jede Datenmenge setzt sich aus einer bestimmten Menge von Zeichen zusammen. Aufbau und Sturktur der Zeichen hängen von der Implementation ab.


Die meisten Verfahren arbeiten mit einem Byte als Basiseinheit. Diese Annahme ist begründet durch die konventionelle Rechnerarchitektur, die als kleinste adressierbare Einheit das Byte kennt. Bei größeren Einheiten ergeben sich dementsprechend ganzahlige Vielfache von einem Byte. Verfahren, die für Daten eines speziellen Typs (z.B. Pixelgraphiken) ausgelegt sind, orientieren sich zwar an anderen Datenstrukturen, aber auch bei ihnen liegt intern zumeist eine Byte-orientierte Struktur zugrunde.


Bei unkomprimierten Daten werden in der Regel Zeichen der gleichen Länge verwendet, z.B. ein Byte. In Zuge der meisten Kompressionsverfahren werden diese in Zeichen mit unterschiedlicher Länge übertragen. Damit bilden die Verfahren die unterschiedliche Häufigkeit ab, mit der die einzelnen Zeichen auftreten.


 <   ^   > 

Übersicht Grundbegriffe Übersicht Grundbegriffe Zeichenvorrat



Anzeigen:

Informations- und Kodierungstheorie