Die Erstellung von Metadaten für Webarchive ist bislang ein aufwändiger Prozess, teuer, langsam und stark abhängig von menschlicher Arbeitskraft. Ein Forschungsteam in Singapur hat nun untersucht, wie sich dieser Prozess mithilfe von GPT-4o automatisieren lässt. In einem groß angelegten Versuch wurden von Ashwin Nair, Zhen Rhog Gho und Abigail Yongping Huang über hundert Archivdateien analysiert, Titel und Abstracts per Promptgenerierung erzeugt, mit beeindruckender Kostenersparnis. Doch der Einsatz von KI zeigt auch Grenzen: Ungenaue Inhalte, Halluzinationen und Übersetzungsprobleme werfen Fragen zur Verlässlichkeit auf. Der Ansatz ist damit kein Ersatz für menschliche Erschließung, wohl aber ein vielversprechendes Tool zur Unterstützung. Die Studie wurde auf „ital – Information Technology and Libraries” veröffentlicht und liefert praxisnahe Erkenntnisse für Bibliotheken und Archive, die Künstliche Intelligenz gezielt einsetzen wollen, und stellt den Code zur freien Weiterentwicklung zur Verfügung.
...Um den Artikel in voller Länge lesen zu können, benötigen Sie ein Abo. Jetzt Abo abschließen oder mit bestehendem Konto anmelden!
