Angesichts der Probleme in Bezug auf Datenqualität und unzureichende Dokumentation von Datensätzen hat die Machine Learning Community begonnen, standardisierte Verfahren zur Erstellung von Datenblättern für maschinelles Lernen zu entwickeln. Das Hauptziel besteht darin, Kontextinformationen und Angaben zur Herkunft, Zweck, Zusammensetzung, Datensammlung, empfohlenen Anwendungsfällen sowie möglichen gesellschaftlichen Vorurteilen in Trainingsdatensätzen bereitzustellen. Dieser Ansatz ähnelt den...

mehr lesen