Scorecard mit 100 KPIs

Xing macht Datenanalyse 100fach schneller

22.12.2010 von Holger Eriksdotter
Dauerte eine Monatsauswertung bisher sechs Stunden unter Volllast, so braucht jetzt das neue Business-Intelligence-System dafür weniger als 10 Minuten, ohne die Auslastungsgrenze zu erreichen.
Rund 10 Millionen Teilnehmer weltweit nutzen das Karriereportal XING für Networking, E-Recruiting, Online-Communities und Unternehmenspräsentation.
Foto: Xing AG

Die Hamburger Xing AG wertet im Jahr mehrere zehn Milliarden Datensätze aus. Mit mehr als 300 Mitarbeitern betreibt das Unternehmen die Internet-Plattform XING für Geschäfts-, Berufs- und Karrierekontakte, die in sechzehn Sprachen angeboten wird. Weltweit nutzen rund 10 Millionen Teilnehmer die Funktionen des Karriereportals für Networking, E-Recruiting, Online-Communities und Unternehmenspräsentation.

"Business Intelligence hat für uns als Web 2.0-Unternehmen einen zentralen Stellenwert", sagt Ulrich Fricke, Abteilungsleiter BI und Data Warehouse bei Xing. "BI ist direkt in fast alle Unternehmensprozesse von der Produktentwicklung bis zur Unternehmenssteuerung, integriert und arbeitet eng mit allen Abteilungen zusammen." Mit der steigenden Nutzerzahl und ständig erweitertem Funktionsangebot stieß das vorhandene Datenbanksystem an seine Grenzen.

Die Performance des Systems erwies sich als Nadelöhr für die steigenden Anforderungen, die tägliche Verarbeitung der Daten überschritt schon die 24 Stunden-Marke, komplexe Ad-hoc-Abfragen konnten in vertretbarer Zeit nicht mehr ausgeführt werden. "Zudem stieg der Administrations- und Optimierungsaufwand überproportional und band hochqualifiziertes Personal und Zeit", blickt Fricke zurück.

Die Zielvorgaben für das neue BI-System waren anspruchsvoll: mindestens eine 100-fach verbesserte Performance, bei steigendem Datenvolumen, mehr BI-Nutzern und komplexeren Abfragen. Gleichzeitig durfte der Administrationsaufwand nicht steigen, weswegen Funktionen zur automatischen Index-Erstellung und Selbst-Optimierung ebenso zum Kriterienkatalog gehörten wie Mechanismen für den sicheren 24/7-Betrieb ohne Single-Point of-Failure und automatische Recovery-Funktionen.

20 BI-Systeme hat XING in die Auswahl genommen, von denen dann fünf in die engere Wahl kamen und in einem Proof of Concept getestet wurden. Entschieden hat sich XING letztlich für ein System des auf BI spezialisierten Anbieters Exasol. Dabei ging es zwar vorrangig um die die Leistungsfähigkeit des Systems, aber es wurde auch die Performance relativ zum Preis mit einem TCO auf fünf Jahre durchgerechnet. Überzeugt hat den BI-Chef auch der geringe Wartungsaufwand und die einfache Skalierbarkeit der Lösung.

"BI hat für uns einen zentralen Stellenwert und ist direkt in fast alle Unternehmensprozesse eingebunden", sagt Ulrich Fricke, Abteilungsleiter BI und Data Warehouse bei XING.
Foto: Xing AG

"Die Migration auf das neue BI-System und die Integration in unsere IT-Landschaft war nicht ganz einfach, da wir gleichzeitig Verbesserungen wie eine erweiterte Metadatenverwaltung und ein Austausch des ETL-Tools vorgenommen haben. Besonders die integrierte Projektplanung war insgesamt eine große Herausforderung", sagt Fricke. Nach gründlicher Planung und Vorbereitung dauerte es dennoch dauerte nur rund vier Wochen, bist das neue System in vollem Umfang einsatzbereit war.

10 Minuten statt 6 Stunden

Die rasant gestiegene Verarbeitungsgeschwindigkeit ist das Ergebnis mehrerer Optimierungs-Technologien, die sich die BI-Lösung zu Nutze macht. Für die Verarbeitung werden die Daten in komprimierter Form in den Hauptspeicher geladen, so dass bei lesenden Abfragen der langsamere Zugriff auf Festplatten völlig entfällt. Die In-Memory-Technologie sorgt in Zusammenhang mit dem von Exasol entwickelten Kompressions-Algorithmus nicht nur für eine schnellere Verarbeitung, sondern auch für eine effiziente Nutzung der Hardware.

Die Exasol-Lösung benötigt kein externes Speichermedium wie etwa ein SAN, sondern besteht ausschließlich Standard-x64-Hardware, die geclustert wird. Das Cluster bei Xing besteht derzeit aus zehn Knoten mit je zwei Quadcore-CPUs und ist nahezu beliebig ausbaubar.

Dabei ermittelt das Datenbanksystem selbständig die ideale Systemkonfiguration für die Verarbeitung und verteilt die Daten automatisch im Cluster, so dass die Hardware-Ressourcen immer optimal ausgeschöpft werden. Das System ist zudem "selbstlernend": Es passt sich an das Nutzerverhalten an, komprimiert Daten selbsttätig und legt Indizes an; ein Query-Optimizer sorgt für eine Optimierung der Abfragen im Hinblick auf die Verarbeitungsgeschwindigkeit.

Hauptaufgabe des Systems ist die wöchentliche Erstellung der unternehmensweiten Scorecard mit über 100 KPIs (Key Performance Indicators). Während die die Datenbereitstellung beispielsweise für einen Betrachtungszeitraum von einem Monat im Altsystem mehr als sechs Stunden unter Volllast erforderte, braucht das neue System dafür jetzt weniger als 10 Minuten, ohne die Auslastungsgrenze zu erreichen.

Täglich 300 Gigabyte verarbeiten

Auch die Bereitstellung historischer Werte mehrerer Jahre für neue KPIs stellt damit kein Problem mehr da. Zurzeit verarbeitet das System täglich etwa 300 Gigabyte Daten. Das Gesamtvolumen der Daten im System beläuft sich auf rund acht Terabyte.

Etwa 100 Mitarbeiter sind an das System angeschlossen; 15 sogenannte Power-User nutzen die BI-Lösung für alle Arten von Ad-hoc-Reportings. Waren "etwa 20 Prozent der Arbeitszeit der BI Mitarbeiter, die bisher für Betrieb und Optimierung verwendet werden musste, stehen jetzt für andere Themen wie etwa detaillierte Datenanalysen zur Verfügung", sagt Fricke.

Die Performance des Systems hat so drastisch zugenommen, dass heute auch sehr komplexe Abfragen machbar sind, die früher völlig undenkbar waren. "Geringerer Wartungs- und Administrationsaufwand, schnellere Verarbeitung und einfache Skalierbarkeit waren schließlich auch das Ziel der BI-Aufrüstung", sagt der BI-Teamleiter. "Wir sind damit in der Lage, unser Angebot noch besser auf die Bedürfnisse einer zunehmenden Zahl von Online-Nutzern auszurichten."