SQL-Datenbanken

Wann sich Datenkomprimierung lohnt

Dr. Klaus Manhart hat an der LMU München Logik/Wissenschaftstheorie studiert. Seit 1999 ist er freier Fachautor für IT und Wissenschaft und seit 2005 Lehrbeauftragter an der Uni München für Computersimulation. Schwerpunkte im Bereich IT-Journalismus sind Internet, Business-Computing, Linux und Mobilanwendungen.

Tabellenkompression – Effekt Speicherreduktion

Platzersparnis und Performance-Gewinn sind die beiden wesentlichen Ziele der Kompression. Wie stark die Kompression den Speicherbedarf reduziert, hängt von den jeweiligen Daten ab. Datenbanken mit vielen redundanten Informationen oder großen Datenbank-Blockgrößen profitieren stärker von der Komprimierung.

Als grobe Vorabschätzung kann bei durchschnittlich redundanten Tabellen mit 50 Prozent Platzersparnis gerechnet werden. Im Data-Warehouse-Bereich, in dem hoch redundante Tabellen üblich sind, werden deutlich höhere Komprimierungsraten erreicht. So stellte 2003 der Oracle-Kunde OfficeMax fest, dass Tabellenkompression im SAP Business Information Warehouse (SAP BW) eine Platzeinsparung von 70 Prozent bringt.

Ein ähnliches Ergebnis brachte die Komprimierung eines 5-TByte-Systems, das als Scalability Showcase der SAP auf der SAPphire 2002 diente. Heute werden im Data-Warehouse-Umfeld bei hoch redundanten Tabellen Komprimierungsraten von mehr als 85 Prozent erreicht. Das bedeutet, dass die komprimierte Tabelle achtmal kleiner ist als die unkomprimierte.

Kein Wunder also, dass Datenkompression besonders in Business-Intelligence-Anwendungen eine große Rolle spielt. Entsprechend zählt das Whitepaper „Oracles Top Ten Features for Large Scale Data Warehousing“ die Tabellenkompression zu den Top Ten Features und „essential feature for a data warehousing platform“. Beispielapplikationen erreichen demnach sogar eine Komprimierungsrate vom Faktor 12.

Einige Statistiken, was Komprimierung beim Erstellen, Einfügen und Ändern von Daten genau bringt, finden Sie in der Trivadis-Studie „Einsetzbarkeit von Table Compression im Data-Warehouse-Umfeld“.

Zur Startseite