Transparente und verantwortungsbewusste Nutzung von Machine-Learning-(ML)-Systemen hängt maßgeblich von der Qualität und Transparenz der zugrundeliegenden Trainingsdaten ab. Während in vielen wissenschaftlichen Disziplinen die Publikation von Data Papers (Veröffentlichung von dokumentierten Datensätzen in einem Data Journal) längst etabliert ist, stellt sich die Frage, ob diese Standards den Anforderungen der ML-Community und regulatorischen Vorgaben gerecht werden. Eine aktuelle Studie...
Kategorie
Bibliotheken und Social-Media Forschung
Ob #MeToo, #BlackLivesMatter oder der Kampf gegen Fehlinformationen – soziale Medien beeinflussen unsere Meinungsbildung und politische Bewegungen in nie dagewesener Weise. Doch wie genau wirken Algorithmen auf unser Denken? Die Digital Public Library of America (DPLA) setzt sich für freien Zugang zu den Daten ein, die diese Mechanismen sichtbar machen. Denn oft blockieren Tech-Unternehmen unabhängige Forschung – mit weitreichenden Folgen für Wissenschaft, Politik und Gesellschaft. ...
Leitfaden für zukunftsfähige bibliografische Datenbanken
Bibliografische Datenbanken sind unverzichtbar für die Forschungsbewertung und Mittelvergabe. Sie unterscheiden sich stark in ihrer Funktionalität, technischen Realisierung und Zielsetzung, da sie auf die spezifischen Anforderungen ihres Kontextes abgestimmt sind. In einem Leitfaden von Linda Sīle, Raf Guns, Dragan Ivanović, Janne Pölönen und Tim Engels werden 30 zentrale Aspekte vorgestellt, die bei der Entwicklung, Pflege und Nutzung solcher Datenbanken berücksichtigt werden sollten. ...
Die EU-KI-Verordnung: wegweisende Regeln für vertrauenswürdige Künstliche Intelligenz
Mit der Verabschiedung der neuen KI-Verordnung hat die Europäische Union einen historischen Meilenstein gesetzt. In ihrem Beitrag „Anspruchsvolle Regeln für vertrauenswürdige Künstliche Intelligenz“ beleuchtet Prof. Dr. Ulrike Verch von der Hochschule für Angewandte Wissenschaften Hamburg die zentralen Inhalte und Implikationen dieses weltweit ersten umfassenden Rechtsrahmens für Künstliche Intelligenz (KI). Der Artikel, erschienen im API Magazin (Juli 2024), bietet eine detaillierte Analyse...
Neues Tool identifiziert potenziell problematische Artikel in Fachzeitschriften
Ein innovatives Tool namens Argos, entwickelt von Scitility, bringt frischen Wind in die Welt der wissenschaftlichen Verlage, indem es fragwürdige wissenschaftliche Arbeiten identifiziert. Das Start-up aus der Stadt Sparks im US-Bundesstaat Nevada hat sein Tool geschaffen, um Verlage dabei zu unterstützen, potenziell problematische Publikationen zu entdecken und an der Forschungsintegrität zu arbeiten. Argos analysiert die Publikationshistorie von Autoren und untersucht, ob diese Zitate aus...
ChatGPT liefert häufig ungenaue Quellenangaben für Verlagsinhalte
Eine Studie des Tow Center for Digital Journalism an der Columbia University in New York hat untersucht, wie der KI-Chatbot ChatGPT mit Quellenangaben und Referenzierung von Verlagsinhalten umgeht. Dabei wurden zahlreiche Fälle aufgedeckt, in denen ChatGPT die Quelle von Verlagsinhalten ungenau zitierte oder falsch darstellte, unabhängig davon, ob der Verlag einen Lizenzvertrag mit OpenAI (dem Ersteller von ChatGPT) hatte oder nicht. Die Forscher untersuchten 200 Zitate von 20...
Forscher warnen vor vereinfachter Kategorisierung von Diamond Open Access
Eine Gruppe von Wissenschaftlern um Marc-André Simard von der Université de Montréal hat in einem kürzlich veröffentlichten Artikel in der Zeitschrift Quantitative Science Studies auf Probleme bei der Identifizierung und Kategorisierung von sogenannten Diamond Open Access (OA) Zeitschriften hingewiesen. Diamond OA bezeichnet ein Publikationsmodell, bei dem weder Leser noch Autoren Gebühren zahlen müssen. Dieses Modell gewinnt zunehmend an Bedeutung in der Open-Access-Bewegung, da es...
Bibliotheken bewerten Verlage: Transparenz und Partnerschaft fördern
Eine neue Initiative namens „Library Partnership Rating" (LPR) soll die Zusammenarbeit zwischen Bibliotheken und wissenschaftlichen Verlagen verbessern. Entwickelt von Bibliothekaren, bewertet die LPR-Rubrik die Praktiken von Zeitschriftenverlagen anhand von Kriterien, die auf bibliothekarischen Werten basieren. Ziel ist es, Transparenz zu fördern und Verlage zu identifizieren, die als gute Partner für Bibliotheken gelten können. Warum eine neue Bewertung? Bibliotheken verhandeln...
Die transparente Dokumentation von Cultural Heritage Datasets
Angesichts der Probleme in Bezug auf Datenqualität und unzureichende Dokumentation von Datensätzen hat die Machine Learning Community begonnen, standardisierte Verfahren zur Erstellung von Datenblättern für maschinelles Lernen zu entwickeln. Das Hauptziel besteht darin, Kontextinformationen und Angaben zur Herkunft, Zweck, Zusammensetzung, Datensammlung, empfohlenen Anwendungsfällen sowie möglichen gesellschaftlichen Vorurteilen in Trainingsdatensätzen bereitzustellen. Dieser Ansatz ähnelt den...
Die Rolle der Bibliotheken im Bereich reproduzierbarer Forschung
Die Studie Emerging Roles and Responsibilities of Libraries in Support of Reproducible Research von Birgit Schmidt und Kollegen1 beleuchtet die wachsende Rolle von Bibliotheken bei der Unterstützung reproduzierbarer Forschung. Reproduzierbare Forschung, auch bekannt als reproduzierbare Wissenschaft, bezieht sich auf das Prinzip, wonach die Ergebnisse wissenschaftlicher Forschung so dokumentiert und veröffentlicht werden, dass andere Forscher die Experimente unter denselben Bedingungen...