Datenkompression


Kriterien

Übersicht Formate

Grundlagen

Kompressionsverfahren

Datenformate


Applikationen und Projekte

Freeware Applikationen

Freeware Bibliotheken

prof. Applikationen

Referenzdatensätze

Calgary Corpus

Vergleiche Calgary Corpus


Glossar

Stichwortverzeichnis


Download


www.BinaryEssence.de

Referenzdatensätze


Die Aufgabe eines Referenzdatensatzes ist es, eine möglichst objektive Grundlage für die Beurteilung der Kompressionsleistung von Datenformaten und Applikationen zu bieten. Die Leistung soll dabei weitesgehend unabhängig von der jeweiligen Implementierung wiedergegeben werden.


Die meisten Datenformate und Anwendungen reagieren in höchst unterschiedlichem Maße auf die unterschiedlichen Ausgangsdaten. Die Ergebnisse sind abhängig von der lokalen Verteilung der Redundanz, den Distanzen zwischen redundanten Teilen, sich wiederholenden Zeichen, der Zeichenmenge und vielen anderen Eigenschaften. Deshalb müssen sich die Datensammlungen aus Dateien mit unterschiedlichen Inhalten rekrutieren, die diese Umstände wiederspiegeln.


Die gebräuchlichsten Dateisammlungen sind:


Calgary Corpus

Canterbury Corpus



 <   ^   > 

Externe Links:

BinaryEssence ist nicht verantwortlich
für die Inhalte externer Internetseiten:

Download University of Calgary (FTP) []

Applikationen und Projekte professionelle Applikationen und Bibliotheken Calgary Corpus



Anzeigen:

Informations- und Kodierungstheorie