Die transparente Dokumentation von Cultural Heritage Datasets
Datum: 30. Januar 2024
Autor: Erwin König
Kategorien: Studien

Angesichts der Probleme in Bezug auf Datenqualität und unzureichende Dokumentation von Datensätzen hat die Machine Learning Community begonnen, standardisierte Verfahren zur Erstellung von Datenblättern für maschinelles Lernen zu entwickeln. Das Hauptziel besteht darin, Kontextinformationen und Angaben zur Herkunft, Zweck, Zusammensetzung, Datensammlung, empfohlenen Anwendungsfällen sowie möglichen gesellschaftlichen Vorurteilen in Trainingsdatensätzen bereitzustellen. Dieser Ansatz ähnelt den etablierten Praktiken und Verfahren in GLAM-Institutionen (Galleries, Libraries, Archives, Museums), wie beispielsweise der Erstellung von Sammlungsbeschreibungen. Allerdings weisen digitale Cultural Heritage Datasets besondere Merkmale auf: Sie entstehen oft durch eine komplexe Auswahl, dienen möglicherweise anderen Zwecken als der reinen statistischen Analyse und sind heterogen und veränderlich.

...

Um den Artikel in voller Länge lesen zu können, benötigen Sie ein Abo. Jetzt Abo abschließen oder mit bestehendem Konto anmelden!

Mehr zum Thema:

Wie digital ist Deutschland – und wie fühlt es sich an?

Eine neue Studie, durchgeführt von september Strategie & Forschung im Auftrag der Vodafone GmbH untersucht das Smartphone-Verhalten verschiedener Generationen: Welche Plattformen werden genutzt, welche Apps dominieren – und wie erleben die Nutzer:innen selbst ihr...

Gefälschte Publikationen und institutionelle Retraction-Welle

In der Wissenschaftswelt wächst die Sorge um die Qualität von Forschungsarbeiten. Ein aktueller Bericht von „Nature“ zeigt eine beunruhigende Zunahme von Retractions in wissenschaftlichen Publikationen und identifiziert Institutionen mit besonders hohen...

Open Research Management: Eine neue Jisc-Studie

Eine von Jisc (Joint Information Systems Committee) beauftragte Studie zeigt: Open Data über Forschungsmanagement in Großbritannien sind wertvoll, aber schwer zugänglich. Uneinheitliche Standards, Lizenzierungsprobleme und mangelnde Interoperabilität erschweren die...

Thema-Klassifikation und Bibliodiversität

Wie spiegelt sich Bibliodiversität im globalen Konsum von Open-Access-Büchern wider? In einer aktuellen Studie analysiert Ronald Snijder, wie das Thema Klassifikationssystem genutzt wird, um regionale Konsummuster und Themenschwerpunkte zu untersuchen. Mithilfe...