Funktionalitäten eines "echten" Wissensmanagements

Inhalte wirklich finden

01.04.2009 von Klaus Manhart
Ohne geeignete Indexierung und Verschlagwortung lässt sich ein Dokument nicht finden. Zudem greifen verschiedene Mitarbeiter auf ein und dasselbe digitale "Werk" zurück, verändern es, entwickeln es weiter. Ausgereifte ECM-Systeme vollziehen die Änderungen nach und - erkennen Dokumente an ihrem einzigartigen Profil.
Das AIM-Modell: Die fünf ECM-Komponenten mit den zentralen, ringförmig angeordneten Manage-Technologien. Die Abbildung zeigt die Komponenten grafisch und verdeutlicht gleichzeitig deren Interaktion und den zeitlichen Ablauf. Die Informationen werden (von links nach rechts bzw. von oben nach unten) erfasst (capture), gemanaged, gespeichert (store), archiviert (preserve) und ausgeliefert (deliver). Die Bestandteile der zentralen Manage-Komponente finden Sie in der Grafik ringförmig um die Store-Komponente aufgelistet. Sie bedeuten im einzelnen: Dokumenten-Management (DM), Collaboration (Collab), Web Content Management (WCM), Records Management (RM) und Workflow (WF) / Business Process Management (BPM).

Die Informationsflut macht vor keinem Unternehmen halt. Tagein, tagaus landen unzählige Briefe, Faxe, Verträge, E-Mails, Bilder und Fotos in den Postfächern der Mitarbeiter, von denen viele aufbewahrt und archiviert werden müssen. Doch bei dieser Masse an Daten wird das zuverlässige Auffinden der Informationen zum Problem. Zwar liegen immer mehr Daten in digitalisierter Form vor, doch das heißt noch lange nicht, dass diese schnell und leicht zugänglich sind.

Professionelles Dokumentenmanagement (DM) bietet hier einen Ausweg. Moderne DM-Systeme geben Unternehmen die Möglichkeit, platzsparend und ressourcenschonend Dokumente und andere Informationsarten digital abzulegen und zentral zu archivieren. Sie gehen dabei weit über reine Archivsysteme hinaus.

Beispielsweise erfassen DM-Systeme Dokumente rasch und ökonomisch, stellen immer die neueste Version bereit, vergeben Zugriffsrechte, lagern Dateien nach angemessener Zeit aus und administrieren auch Informationen auf Papier. Vor allem aber sollte ein DM-System alle Arten von Dokumenten auf allen Computern im Unternehmen schnell und zuverlässig wiederfinden. So hilft ein DM-System beispielsweise finanzielle Sanktionen zu vermeiden, wenn ein Brief aufgrund gesetzlicher Erfordernisse nach langer Zeit einer Behörde vorgelegt werden muss.

Vieles verschwindet in Datenbanken

Die DM-Funktionalitäten zum Suchen und Finden von Dokumenten beginnen zunächst mit einer übersichtlichen, auf Ordnern basierenden Ablage, in der vorhandene Strukturen für die Anwender in gewohnter Form dargestellt werden. So finden sie sich leicht zurecht. Verknüpfungen sollten es ermöglichen, identische Inhalte in verschiedenen Ordnern zur Verfügung zu stellen. Ablegen lassen sich natürlich alle Dateiformate - egal ob Texte, Office-Dokumente, Zeichnungen oder Videos.

Oracle

Universal Content Management

www.oracle.com/products/middleware/content-management/universal-content-management.html

SAP

Netwaeaver

www.sap.com/germany/plattform/netweaver/index.epx

Open Text

Open Text

www.opentext.de

EMC

Documentum

www.documentum.com

IBM

Websphere, Filenet

www-01.ibm.com/software/de/

Microsoft

Office Sharepoint Server

http://office.microsoft.com/de-de/sharepointserver/FX100492001031.aspx

Das Wiederfinden eines Dokumentes erfolgt in der Praxis aber weniger über Ordner und Dateinamen, sondern fast ausschließlich über das Recherchieren in einer Datenbank. DM-Systeme müssen deshalb Funktionen bereitstellen, die das Erfassen und Archivieren von Dokumenten ermöglichen, um später dann gezielt darauf zugreifen zu können.

Im DMS-Umfeld wird grundsätzlich zwischen dem physischen (Papier-) Dokument und dem digitalen Dokument unterschieden. Physische Dokumente liegen in der Regel in Papierform oder anderen analogen Formaten vor. Die im Dokument enthaltenen Informationen können nur persönlich verarbeitet werden. Sie lassen sich jedoch durch Scanner in eine digitale Form überführen.

Dokumente sind längst nicht alle digitalisiert

Um Medienbrüche zu vermeiden, wird heute in vielen Unternehmen eine komplette Digitalisierung angestrebt. Bei den digitalen, direkt elektronisch weiterverarbeitbaren Dokumenten wird zwischen "Non-Coded-Information"-Dokumenten (NCI) und "Coded-Information"-Dokumenten (CI) unterschieden.

NCI-Dokumente sind digitalisierte Abbilder, also Faksimiles, des papiergebundenen Originals. Sie können zwar auf dem Computer-Monitor oder dem Drucker reproduziert werden, eine weitere maschinelle Verarbeitung oder Interpretation ist jedoch nicht ohne zusätzliche Software-technische Nachbearbeitung möglich. Der Grund: Wird ein Papierdokument eingescannt und als Datei abgespeichert, liegt nur ein Rasterbild vor, das aus einer Folge von Pixeldaten besteht. Um die Datei elektronisch bearbeitbar zu machen oder sie beispielsweise per Volltextsuche wieder zu finden muss das NCI-Dokument mittels OCR-Software (Optical Character Recognition) in CI-Dokumente transferiert werden.

Ein CI-Dokument ist ein digital erstelltes Dokument, das durch Zeichensätze kodiert ist und von Programmen direkt ausgewertet werden kann. Typische CI-Dokumente sind mit einen Textverarbeitungsprogramm erstellte Briefe oder Tabellen. Durch Techniken wie OCR lassen sich aber NCI-Dokumente in CI-Dokumente überführen.

Warnung vor dem "Google-Effekt"

In CI-Dokumenten ist im Unterschied zu NCI-Dokumenten eine Volltextrecherche möglich. Bei einer Volltextsuche muss allerdings mit dem üblichen "Google-Effekt" gerechnet werden - man bekommt viele irrelevante Dokumente gelistet. Das Einsparpotenzial, das sich für den Zeitaufwand bei der Recherche durch ein DM-System ergeben soll, ist dann schnell verpufft.

Exakte Verschlagwortung bildet deshalb beim digitalen Archiv die zentrale Grundlage von späteren Sucherfolgen. Diese ist bei NCI-Dokumenten auch die einzige Möglichkeit, bestimmte Dateien wiederzufinden, da das Dokument nur als Pixelbild gespeichert wird.

In der Praxis wird oft die Indexsuche auf Basis von Schlagworten eingesetzt. Für die Indexsuche müssen einem Dokument Suchmerkmale wie Autor, Titel, Erstellungsdatum und vor allem inhaltlich relevante Begriffe zugeordnet sein. Diese Schlagworte oder Attribute werden bei der Aufnahme eines Dokuments in ein DM-System erfasst - ein Vorgang, der als Indexierung, gelegentlich auch als Indizierung, bezeichnet wird.

Die Schlagworte werden getrennt von den Dokumenten in einer Datenbank gespeichert. Die Summe der Schlagworte eines Dokuments ergibt das Dokumentenprofil. Zu einem späteren Zeitpunkt kann ein Dokument bei einer Recherche über ein einzelnes oder eine Kombination von Schlagworten wiedergefunden werden.

Die Erstindizierung erfolgt in Abhängigkeit von der Art des Dokumentes und dessen Umfang entweder manuell, teil-automatisch oder automatisch. Bei der automatischen Indexierung übernimmt der Rechner die Verschlagwortung. Diese wird häufig bei CI-Dokumenten in Form einer automatischen Volltextindexierung eingesetzt. Dabei werden bis auf unbedeutende "Stoppwörter" - zum Beispiel "der, die, das" "und", "in" oder "auf" - alle Wörter eines Textes in den Index aufgenommen.

Schlagworte exakt wählen

Bei NCI-Dokumenten muss manuell indexiert werden. Die Art und Anzahl der dabei verwendeten Attribute ist abhängig vom Inhalt und dem Einsatzzweck des Dokuments. Für das Auffinden einer Rechnung sind beispielsweise die Rechnungs- und Kundennummer ausreichend, während technische Zeichnungen mit wesentlich mehr Attributen versehen werden sollten. Da die Verschlagwortung mit beliebigen Wörtern sehr ungenau ist, sollten diese besser einem kontrollierten Vokabular - wie etwa der Schlagwortnormdatei - entnommen werden.

Weitere, wesentliche Eigenschaften von DM-Systemen sind Check-In- und Check-Out-Funktionen und die Versionierung. Check in sorgt dafür, dass ein Dokument exklusiv durch einen Mitarbeiter bearbeitet werden kann. Beispielsweise kann ein Workflow verschiedenen Mitarbeitern nacheinander ein Dokument zur Bearbeitung vorlegen. Dieses wird aus dem Archiv editierbar geöffnet und in einem separaten Bereich für den Bearbeiter gespeichert (Check in). Andere Mitarbeiter können das Dokument zur Bearbeitungszeit zwar einsehen, dieses aber nicht verändern. Erst nachdem es aufbereitet und die aktuelle Version des Dokuments im Archiv gespeichert ist, ist der Zugriff zur weiteren Verwendung wieder möglich (Check out).

Versionierung verwaltet verschiedene Varianten und bestimmte Versionen von Dokumenten. Dank der Versionierung kann etwa nachvollzogen werden, wer was wann verändert hat. Die verschiedenen Versionen eines Dokumentes werden archiviert und können so miteinander verglichen werden. Alle Benutzer sind dabei grundsätzlich registriert, der Zugriff erfolgt rechte- und rollenbasiert.

Unternehmen, die ein professionelles DM-System mit guten Suchfunktionen einsetzen, können nur gewinnen. Sie sind damit nicht nur in der Lage, das gesamte Wissen ihrer Mitarbeiter effektiv zu nutzen, sondern verbessern auch die Firmenkultur, weil Informationen Einzelner nun dem ganzen Unternehmen zur Verfügung stehen.

Dachzeile

Die wichtigsten ECM-Funktionalitäten im Überblick

Das oberste Ziel von ECM ist es, verstreute und unterschiedlich positionierte Ansätze wie Dokumenten-Management, Workflow, Collaboration, Archivierung oder Dokumentenaustausch zu integrieren und aufeinander abzustimmen. Die Zusammenstellung all dieser Teillösungen zu einer Rahmenarchitektur für Dokumente und Geschäftsprozesse ist die eigentliche Innovation von ECM.

Die ECM-Leitorganisation AIIM schlägt fünf Komponenten vor, aus denen eine solche Rahmenarchitektur besteht und die zusammen kombiniert ein vollständiges ECM-System ergeben. Die fünf Komponenten sind im Einzelnen:

1. Capture: Erfassung von Information. Dabei werden zum Beispiel Erkennungstechnologien wie OCR (Optical Character Recognition), ICR (Intelligent Character Recognition) oder OMR (Optical Mark Recognition) eingesetzt.

2. Manage: Bearbeitung und Nutzung der Information. In der Manage-Komponente werden die im Capture-Prozess erfassten Informationen administriert, bearbeitet und genutzt. Zur Manage-Komponente gehören die fünf Anwendungsfelder Dokumenten-Management, Collaboration, Web Content Management, Records Management und Workflow.

3. Store: Speicherung. Die Store-Komponente speichert die Daten, die nicht für eine langfristige Archivierung vorgesehen sind, zeitlich begrenzt.

4. Preserve: Archivierung. Die Komponente Preserve ist auf die langfristige, sichere Archivierung von Daten ausgelegt. Die Informationen müssen stabil, geschützt und in vielen Fällen unveränderbar aufbewahrt werden. Dabei sind auch die rechtlichen Vorgaben für die Archivierung von Dokumenten zu beachten.

5. Deliver: Bereitstellung. Die Deliver- oder Ausgabe-Komponente stellt die Informationen aus den Manage-, Store- und Preserve-Komponenten bereit. Sie wird auch als Output-Management bezeichnet. Aufgabe der Deliver-Komponente ist es, die Informationen für den Empfänger optimal aufbereitet zur Verfügung zu stellen