Transparente Daten für vertrauenswürdiges maschinelles Lernen: Wie wissenschaftliche Dokumentation den ML-Standard verbessern kann
Datum: 15. März 2025
Autor: Erwin König

Transparente und verantwortungsbewusste Nutzung von Machine-Learning-(ML)-Systemen hängt maßgeblich von der Qualität und Transparenz der zugrundeliegenden Trainingsdaten ab. Während in vielen wissenschaftlichen Disziplinen die Publikation von Data Papers (Veröffentlichung von dokumentierten Datensätzen in einem Data Journal) längst etabliert ist, stellt sich die Frage, ob diese Standards den Anforderungen der ML-Community und regulatorischen Vorgaben gerecht werden. Eine aktuelle Studie analysiert über 4000 wissenschaftliche Data Papers und vergleicht sie mit ML-spezifischen Dataset-Beschreibungen. Die Ergebnisse zeigen sowohl Fortschritte als auch Lücken in der Dokumentation und bieten klare Empfehlungen, wie Datenersteller und Verlage die Nachvollziehbarkeit und Fairness von ML-Modellen künftig verbessern können. Welche Maßnahmen nötig sind und wie sich die wissenschaftliche Praxis auf die technologische Entwicklung auswirkt, erfahren Sie in unserem Artikel. 

...

Um den Artikel in voller Länge lesen zu können, benötigen Sie ein Abo. Jetzt Abo abschließen oder mit bestehendem Konto anmelden!

Mehr zum Thema:

Anxiety in der Hochschullehre: zögerlicher Einsatz von ChatGPT

Eine aktuelle Studie von Domingo Verano-Tacoronte, Alicia Bolívar-Cruz und Silvia Sosa-Cabrera im Journal „Education and Information Technologies” untersucht, wie technologiebezogene Ängste die Bereitschaft von Hochschullehrenden beeinflussen, ChatGPT im Unterricht...

KI-Kompetenz als Kernaufgabe wissenschaftlicher Bibliotheken

Ein Fachartikel von Leo S. Lo, Leiter des College of University Libraries and Learning Sciences an der University of New Mexico, thematisiert die zunehmende Bedeutung der KI-Kompetenz und deren Integration in wissenschaftliche Bibliotheken. Er argumentiert, dass...

Data Literacy: Datenkompetenz – von der Hochschule in den Job

Inmitten zunehmender Anforderungen an den Umgang mit Daten rückt die Frage nach praxisrelevanten Datenkompetenzen immer stärker in den Fokus – sowohl in der Wissenschaft als auch in der Wirtschaft. Eine neue Studie von Wendy Pothier und Patricia Condon untersucht, ob...