Die Klassifikation im Google-Zeitalter - Library Essentials

Die Klassifikation im Google-Zeitalter

Datum: 3. August 2012

Autor: Erwin König

Kategorien: Fachartikel

Klassifikationen sind seit weit über 100 Jahren eines der wichtigsten Arbeitsmittel für alle Arten von Informationsspezialisten wie Archivare, Bibliothekare, Dokumentare oder Wissensmanager. Oder anders ausgedrückt: Klassifikationen und die formale Erschließung von Dokumenten sind zentral für die Wissensorganisation in Informationseinrichtungen, Unternehmen und Organisationen. In den letzten Jahren verzichten Bibliotheken auf der praktischen Ebene immer öfter darauf, ihre Materialien zu klassifizieren oder mit manuell vergebenen Metadaten anzureichern. Aber auch auf der theoretischen Ebene wird immer öfter am Nutzen von der Erstellung von Klassifikationen gezweifelt. Es herrscht sowohl unter Wissenschaftlern als auch Nutzern die Meinung, dass dies viel einfacher mit Suchmaschinen erreicht werden könnte. Ob diese Zweifel gerechtfertigt sind oder ob Klassifikationen auch im Zeitalter von Google noch relevant sind, untersucht dieser Artikel.

Die Wissensorganisation, d.h. Klassifikation, Indexierung, Dokumentenbeschreibung und Metadatenvergabe, kann man wohl als das Herz des Bibliotheks- und Informationswesens bezeichnen. Bibliotheken wären ohne diese Arbeit nicht der Ort des Wissens und Lernen von heute, wenn die dort vorhandenen Inhalte und Materialien nicht so konsequent und genau für ihre Benutzer erschlossen wären. Und Klassifikation ist auch heute noch ein akademischer Fachbereich in der Ausbildung jedes Bibliotheks- und Informationsstudiengangs. Neue digitale Technologien lassen die Zukunft der klassischen, bibliothekarischen Wissensorganisation aber unsicher erscheinen. Im Rückblick muss man sich heute sogar fragen, ob die theoretischen Grundlagen der Wissensorganisation überhaupt ausreichend sind.

Zuerst werden anhand der Beispiele zweier großer dänischer Bibliotheken, der Royal Library in Kopenhagen und der State Library in Aarhus, die Herausforderungen und Auswirkungen des digitalen Zeitalters auf der praktischen Ebene auf die Klassifikationssysteme diskutiert. Früher haben diese beiden Informationseinrichtungen über selbst entwickelte Klassifikationen verfügt sowie ihre Bücher auch selbst klassifiziert. Diese Arbeiten wurden in den vergangenen Jahren aber fast vollständig eingestellt. Die Entscheidung, diese Arbeiten nicht mehr selbst zu machen, dürfte auf folgenden Annahmen basieren:

Viele Bibliotheken nutzen heute lieber die von der Library of Congress entwickelte Dewey Dezimal Klassifikation und tauschen ihre bibliographischen Angaben im MARC-Format aus.
Viele Bibliotheksdirektoren rechnen in der Zukunft damit, dass aufgrund großer Digitalisierungsprojekte – wie dem Google Books-Projekt – in Zukunft Volltextsuchmöglichkeiten für einen großen Teil der in Bibliotheken vorhandenen Bestände existieren werden. Von daher erscheint es als eine Verschwendung von Arbeit und Zeit zu sein, diese Dokumente eigenständig erschließen oder indexieren zu wollen.
Neue soziale Anwendungen, wie das User-Tagging, werden von Informationseinrichtungen als eine Art brauchbarer Ersatz für die professionelle Schlagwortvergabe angesehen.
Viele Benutzer suchen schon heute ihre Bücher oft mit Internet-Tools, und nicht mit dem eigentlich dafür vorgesehenen Online-Bibliothekskatalog (OPAC) der Bibliotheken.

Anschließend folgt eine Beschreibung, was eine Klassifikation ist, welche Arten es gibt und wie Wissensorganisationssysteme aufgebaut sind. Entscheidend ist aber nicht die Form oder der formale Aufbau einer Klassifikation, sondern ob sie in der Lage ist bestimmte Beziehungen abzubilden, um zu entscheiden, ob ein Element in die Gruppe A oder B gehört. Erwähnt wird in diesem Zusammenhang auch der von Ellis (1996) benutzte Cranfield-Test, mit dem untersucht worden ist, ob die Freitextsuche oder Klassifikationssysteme, wie die Facetten-Klassifikation, genauere und präzisere Ergebnisse liefern. In dieser umstrittenen und heftig kritisierten Arbeit schnitt die Freitextsuche besser ab als die Universelle Dezimalklassifikation und die Facettenklassifikation. Was in der Folge dazu führte, dass das Information Retrieval wichtiger wurde und gleichzeitig die bibliothekarischen Klassifikationen an Bedeutung verloren.

Der Autor bemängelt, dass es heute nicht mehr ausreichend ist, ein System wie die Universelle Dezimalklassifikation "nur" mit neuen Kategorien zu aktualisieren. Diese Systeme sind ursprünglich aus der Ansicht entwickelt worden, dass Klassifikationen neutral, objektiv und von bestimmten Inhalten unabhängig sein sollen. Diese Annahmen sind heute nicht mehr haltbar, da viele Wissensgebiete zwar eine gleiche Terminologie verwenden, aber diese in dem jeweiligen Fach eine unterschiedliche Bedeutung besitzen. Eine moderne Klassifikation sollte daher weniger ordnend sein, sondern eher beschreibend und Zusammenhänge berücksichtigen. Dieser Kontext kann z.B. durch bibliometrische Studien, historische Wörterbücher und andere Analysen eines Wissensgebiets erfasst werden. Weiterhin wird auch die hierarchische Struktur der Klassifikationen hinterfragt. Begriffe stehen eben nicht immer in einer festgefügten semantischen Beziehung zueinander. Vielmehr sollte ein kontrolliertes Vokabular als eine Interpretation für semantische Beziehungen verstanden werden. Eine Interpretation ist aber oft eine empirische Frage sowie eine Frage verschiedener Sichtweisen und Interessen. Hierzu nennt der Autor das Beispiel des Edelgases Helium. In der Chemie wird es als Edelgas eingestuft, laut der Periodentabelle gehört es aber zu den Erdalkalimetallen. Die Wissenschaft hat bisher dieses Problem der Einordnung von Helium nicht gelöst, so dass es eigentlich keine wirklich richtige Antwort auf diese Frage gibt. Inzwischen gibt es eine Vielzahl von neuen Ansätzen für Klassifikationen, die solche interpretierbaren Ansichten berücksichtigen. Bisher haben diese Vorschläge aber weder in der Praxis, noch in der Fachliteratur eine große Resonanz erfahren.

Können solche neuen Klassifikationen geschaffen werden, so sind sie laut dem Autor den automatisierten Volltextsuchen überlegen. Die bestehenden Klassifikationen dürften aber über kurz oder lang kaum den Algorithmen von Suchmaschinen Paroli bieten.

Der Beitrag verdeutlicht die Herausforderungen für die Bibliotheks- und Informationswissenschaften bei der Konstruktion von zukünftigen Klassifikationen und/oder anderen Wissensorganisationssystemen. Klassifikationen haben im Prinzip eine Hauptaufgabe zu erfüllen, nämlich relevantes Wissen transparent zu machen. Der Autor begründet seine Überlegungen für die weiter bestehende Notwendigkeit von Klassifikationen ausschließlich theoretisch. Er schlägt dazu diverse Maßnahmen vor, um Klassifikationen für unsere heutige Zeit weiterzuentwickeln. Das kann allerdings nur der erste Schritt sein. Ohne empirische Nachweise, dass Klassifikationen – egal ob alt oder neu – bei der Informationssuche der Volltextsuche das Wasser reichen können, dürfte der Trend zu automatisierten Verfahren à la Google kaum zu brechen sein. Tatsächlich liegt der Wert des vorliegenden Beitrags darin, mit den bestehenden Konzepten der Klassifikation zu brechen und eine Modernisierung dieser Wissensorganisationssysteme durch die Informationswissenschaft zu fordern.

Quelle:
Birger Hjørland: "Is classification necessary after Google?"; in: Journal of Documentation, 2012, Vol. 68, No. 3, 299 - 317

libess_library_essentials_website_ecke_gelb

Schlagworte: 06-2012 | Google | Informationsspezialisten | klassifikation

Mehr zum Thema:

„Need to have” statt „nice to have”. Die Evolution der Daten in der Forschungsliteratur

Die Forderung nach Open Access für Forschungsdaten markiert einen Wendepunkt in der wissenschaftlichen Publikation, der die Art und Weise, wie Forschungsergebnisse geteilt und genutzt werden, grundlegend verändert. Während digitale Technologien die Grenzen zwischen...

Open-Access-Publikationen: Schlüssel zu höheren Zitationsraten

Die Frage, wie Open-Access-Publikationen die Verbreitung und Zitierhäufigkeit von Forschungsergebnissen beeinflussen, gewinnt zunehmend an Bedeutung in der wissenschaftlichen Gemeinschaft. Eine kürzlich durchgeführte Studie wirft ein neues Licht auf diese Diskussion,...

AI Literacy in Bibliotheken und Wissenschaft

Bibliotheken experimentieren schon seit geraumer Zeit mit KI-Technologien. In einer Experimentierphase von Mitte der 1980er bis Mitte der 1990er Jahre konzentrierte sich hauptsächlich auf den Einsatz von Expertensystemen. Viele Projekte verwendeten...

Bibliotheken und das Metaversum

Es mag an Science-Fiction und visionäre Konzepte erinnern, doch für manche stellt es den zukünftigen Weg für Bibliotheken dar: Mit dem Voranschreiten in immer digitalere Umgebungen und dem Nutzen der Möglichkeiten, die erweiterte Realitäten bieten, entstehen Ideen,...

Library Publishing und das Problem der Langzeitarchivierung von Open-Access-Publikationen

Der Artikel Preserving What We Publish befasst sich mit der Langzeitarchivierung von Publikationen, insbesondere im Zusammenhang mit Library Publishing1. Die Autoren sind Mitglieder der amerikanischen Library Publishing Coalition Preservation Task Force. Sie haben...