Die Klassifikation im Google-Zeitalter
Datum: 3. August 2012
Autor: Erwin König
Kategorien: Fachartikel

Klassifikationen sind seit weit über 100 Jahren eines der wichtigsten Arbeitsmittel für alle Arten von Informationsspezialisten wie Archivare, Bibliothekare, Dokumentare oder Wissensmanager. Oder anders ausgedrückt: Klassifikationen und die formale Erschließung von Dokumenten sind zentral für die Wissensorganisation in Informationseinrichtungen, Unternehmen und Organisationen. In den letzten Jahren verzichten Bibliotheken auf der praktischen Ebene immer öfter darauf, ihre Materialien zu klassifizieren oder mit manuell vergebenen Metadaten anzureichern. Aber auch auf der theoretischen Ebene wird immer öfter am Nutzen von der Erstellung von Klassifikationen gezweifelt. Es herrscht sowohl unter Wissenschaftlern als auch Nutzern die Meinung, dass dies viel einfacher mit Suchmaschinen erreicht werden könnte. Ob diese Zweifel gerechtfertigt sind oder ob Klassifikationen auch im Zeitalter von Google noch relevant sind, untersucht dieser Artikel.

Die Wissensorganisation, d.h. Klassifikation, Indexierung, Dokumentenbeschreibung und Metadatenvergabe, kann man wohl als das Herz des Bibliotheks- und Informationswesens bezeichnen. Bibliotheken wären ohne diese Arbeit nicht der Ort des Wissens und Lernen von heute, wenn die dort vorhandenen Inhalte und Materialien nicht so konsequent und genau für ihre Benutzer erschlossen wären. Und Klassifikation ist auch heute noch ein akademischer Fachbereich in der Ausbildung jedes Bibliotheks- und Informationsstudiengangs. Neue digitale Technologien lassen die Zukunft der klassischen, bibliothekarischen Wissensorganisation aber unsicher erscheinen. Im Rückblick muss man sich heute sogar fragen, ob die theoretischen Grundlagen der Wissensorganisation überhaupt ausreichend sind.

Zuerst werden anhand der Beispiele zweier großer dänischer Bibliotheken, der Royal Library in Kopenhagen und der State Library in Aarhus, die Herausforderungen und Auswirkungen des digitalen Zeitalters auf der praktischen Ebene auf die Klassifikationssysteme diskutiert. Früher haben diese beiden Informationseinrichtungen über selbst entwickelte Klassifikationen verfügt sowie ihre Bücher auch selbst klassifiziert. Diese Arbeiten wurden in den vergangenen Jahren aber fast vollständig eingestellt. Die Entscheidung, diese Arbeiten nicht mehr selbst zu machen, dürfte auf folgenden Annahmen basieren:

  • Viele Bibliotheken nutzen heute lieber die von der Library of Congress entwickelte Dewey Dezimal Klassifikation und tauschen ihre bibliographischen Angaben im MARC-Format aus.
  • Viele Bibliotheksdirektoren rechnen in der Zukunft damit, dass aufgrund großer Digitalisierungsprojekte  – wie dem Google Books-Projekt –  in Zukunft Volltextsuchmöglichkeiten für einen großen Teil der in Bibliotheken vorhandenen Bestände existieren werden. Von daher erscheint es als eine Verschwendung von Arbeit und Zeit zu sein, diese Dokumente eigenständig erschließen oder indexieren zu wollen.
  • Neue soziale Anwendungen, wie das User-Tagging, werden von Informationseinrichtungen als eine Art brauchbarer Ersatz für die professionelle Schlagwortvergabe angesehen.
  • Viele Benutzer suchen schon heute ihre Bücher oft mit Internet-Tools, und nicht mit dem eigentlich dafür vorgesehenen Online-Bibliothekskatalog (OPAC) der Bibliotheken.

Anschließend folgt eine Beschreibung, was eine Klassifikation ist, welche Arten es gibt und wie Wissensorganisationssysteme aufgebaut sind. Entscheidend ist aber nicht die Form oder der formale Aufbau einer Klassifikation, sondern ob sie in der Lage ist bestimmte Beziehungen abzubilden, um zu entscheiden, ob ein Element in die Gruppe A oder B gehört. Erwähnt wird in diesem Zusammenhang auch der von Ellis (1996) benutzte Cranfield-Test, mit dem untersucht worden ist, ob die Freitextsuche oder Klassifikationssysteme, wie die Facetten-Klassifikation, genauere und präzisere Ergebnisse liefern. In dieser umstrittenen und heftig kritisierten Arbeit schnitt die Freitextsuche besser ab als die Universelle Dezimalklassifikation und die Facettenklassifikation. Was in der Folge dazu führte, dass das Information Retrieval wichtiger wurde und gleichzeitig die bibliothekarischen Klassifikationen an Bedeutung verloren.

Der Autor bemängelt, dass es heute nicht mehr ausreichend ist, ein System wie die Universelle Dezimalklassifikation "nur" mit neuen Kategorien zu aktualisieren. Diese Systeme sind ursprünglich aus der Ansicht entwickelt worden, dass Klassifikationen neutral, objektiv und von bestimmten Inhalten unabhängig sein sollen. Diese Annahmen sind heute nicht mehr haltbar, da viele Wissensgebiete zwar eine gleiche Terminologie verwenden, aber diese in dem jeweiligen Fach eine unterschiedliche Bedeutung besitzen. Eine moderne Klassifikation sollte daher weniger ordnend sein, sondern eher beschreibend und Zusammenhänge berücksichtigen. Dieser Kontext kann z.B. durch bibliometrische Studien, historische Wörterbücher und andere Analysen eines Wissensgebiets erfasst werden. Weiterhin wird auch die hierarchische Struktur der Klassifikationen hinterfragt. Begriffe stehen eben nicht immer in einer festgefügten semantischen Beziehung zueinander. Vielmehr sollte ein kontrolliertes Vokabular als eine Interpretation für semantische Beziehungen verstanden werden. Eine Interpretation ist aber oft eine empirische Frage sowie eine Frage verschiedener Sichtweisen und Interessen. Hierzu nennt der Autor das Beispiel des Edelgases Helium. In der Chemie wird es als Edelgas eingestuft, laut der Periodentabelle gehört es aber zu den Erdalkalimetallen. Die Wissenschaft hat bisher dieses Problem der Einordnung von Helium nicht gelöst, so dass es eigentlich keine wirklich richtige Antwort auf diese Frage gibt. Inzwischen gibt es eine Vielzahl von neuen Ansätzen für Klassifikationen, die solche interpretierbaren Ansichten berücksichtigen. Bisher haben diese Vorschläge aber weder in der Praxis, noch in der Fachliteratur eine große Resonanz erfahren.

Können solche neuen Klassifikationen geschaffen werden, so sind sie laut dem Autor den automatisierten Volltextsuchen überlegen. Die bestehenden Klassifikationen dürften aber über kurz oder lang kaum den Algorithmen von Suchmaschinen Paroli bieten.

Der Beitrag verdeutlicht die Herausforderungen für die Bibliotheks- und Informationswissenschaften bei der Konstruktion von zukünftigen Klassifikationen und/oder anderen Wissensorganisationssystemen. Klassifikationen haben im Prinzip eine Hauptaufgabe zu erfüllen, nämlich relevantes Wissen transparent zu machen. Der Autor begründet seine Überlegungen für die weiter bestehende Notwendigkeit von Klassifikationen ausschließlich theoretisch. Er schlägt dazu diverse Maßnahmen vor, um Klassifikationen für unsere heutige Zeit weiterzuentwickeln. Das kann allerdings nur der erste Schritt sein. Ohne empirische Nachweise, dass Klassifikationen – egal ob alt oder neu – bei der Informationssuche der Volltextsuche das Wasser reichen können, dürfte der Trend zu automatisierten Verfahren à la Google kaum zu brechen sein. Tatsächlich liegt der Wert des vorliegenden Beitrags darin, mit den bestehenden Konzepten der Klassifikation zu brechen und eine Modernisierung dieser Wissensorganisationssysteme durch die Informationswissenschaft zu fordern.

Quelle:
Birger Hjørland: "Is classification necessary after Google?"; in: Journal of Documentation, 2012, Vol. 68, No. 3, 299 - 317

Mehr zum Thema:

Wie Open Science die Gesellschaft verändert

Open Science (OS) soll die gesellschaftliche Wirkung akademischer Forschung erhöhen, indem es den Zugang zu Wissen demokratisiert und evidenzbasierte Politikgestaltung unterstützt. Obwohl Regierungen, Geldgeber und Institutionen OS fördern, bleibt die Messung ihrer...

ChatGPT und systematische Literaturrecherche

Die Nutzung von ChatGPT zur Unterstützung systematischer Literaturrecherchen steht im Fokus einer aktuellen Untersuchung, die sowohl das Potenzial als auch die Grenzen dieser Technologie beleuchtet. Eine umfassende Recherche der aktuellen Peer-Review- und Grauen...