Business Intelligence

BI-Schätze heben

Holger Eriksdotter ist freier Journalist in Hamburg.

Schlechte Datenqualität

Denn das Data Warehouse (DW) ist häufig der Ort der höchsten Datenqualität im Unternehmen. Der Vorgang der Datenintegration nimmt beim Aufsetzen eines DW den größten Teil des Projekts in Anspruch. 50 bis 80 Prozent des Projektaufwandes steckten in der Aufbereitung der Daten, schätzt Bange. „Meist ist die Datenqualität der Vorsysteme weit schlechter, als die Verantwortlichen vermuten.“ Durch Zentralisierung und Kontrolle der Datenflüsse können beim Befüllen des Data Warehouse Plausibilitätsprüfungen und Routinen zur qualitativen Datenverbesserung installiert werden. Diese Funktionen zur Verbesserung der Datenqualität sind dabei immer häufiger in Datenintegrationssoftware eingebunden.

Meist verstärken sich die Anbieter durch den Zukauf von Unternehmen mit spezialisierten Softwarewerkzeugen für das Messen der Qualität vorhandener Daten (Data Profiling) und die Verbesserung der Datenqualität durch KonsolidierungKonsolidierung, regelgesteuerte Transformation oder den Abgleich mit Referenzdatenbeständen (Data Cleansing). Schon 2000 hatte SAS DataFlux übernommen, Ascential (jetzt bei IBM) hatte Vality und MetaGenix im Jahre 2002 zugekauft. In einem umgekehrten Fall hat der Anbieter von Datenqualitätssoftware Group1 2003 den ETL-Anbieter Sagent übernommen. Anfang 2006 haben auch Informatica und Business Objects durch Akquisition der Datenqualitätsspezialisten Similarity Systems und Firstlogic ihre Produktpalette erweitert. Andere Datenintegrationsanbieter komplettieren ihr Angebot durch Eigenentwicklungen. So sind Data-Profiling-Methoden inzwischen auch im Oracle Warehouse Builder oder bei Ab Initio zu finden. Alles zu Konsolidierung auf CIO.de

ERP- wie Datenbankanbieter sehen im Data Warehousing einen wichtigen Teil ihres Lösungsangebotes. „Der Markt wird daher heute von so gut wie allen großen Softwareanbietern adressiert. Vor allem die Datenbankanbieter Oracle und Microsoft verfolgen eine hybride Strategie zur Kombination von relationalen und multidimensionalen Datenbanken“, hat Bange beobachtet. Zudem existierten zahlreiche spezialisierte Anbieter für multidimensionale Datenbanken, die vor allem für Data Marts in Fachabteilungen oder für Planungsanwendungen eingesetzt werden, wie Applix, MIS oder Hyperion.

Besonders die umsatzstärksten Datenbankanbieter IBM, Oracle und MicrosoftMicrosoft forcieren den Ausbau ihrer Datenbanken zu umfassenden Data-Warehouse-Plattformen, die Datenintegrationswerkzeuge, relationale und multidimensionale Speicherkomponenten, Data-Mining-Workbenches sowie weitere Werkzeuge und Komponenten enthalten. Alles zu Microsoft auf CIO.de

Zur Startseite