Kategorie

Reproduzierbarkeit

Transparente Daten für vertrauenswürdiges maschinelles Lernen: Wie wissenschaftliche Dokumentation den ML-Standard verbessern kann

Transparente und verantwortungsbewusste Nutzung von Machine-Learning-(ML)-Systemen hängt maßgeblich von der Qualität und Transparenz der zugrundeliegenden Trainingsdaten ab. Während in vielen wissenschaftlichen Disziplinen die Publikation von Data Papers (Veröffentlichung von dokumentierten Datensätzen in einem Data Journal) längst etabliert ist, stellt sich die Frage, ob diese Standards den Anforderungen der ML-Community und regulatorischen Vorgaben gerecht werden. Eine aktuelle Studie...

mehr lesen

Lokale KI-Modelle gewinnen in der Forschung an Bedeutung

Während große Sprachmodelle wie ChatGPT meist online genutzt werden, setzen immer mehr Forscher auf kleinere KI-Modelle, die sie direkt auf ihren Laptops ausführen können. Diese Entwicklung eröffnet neue Möglichkeiten für die wissenschaftliche Arbeit, wie ein aktueller Bericht in der Zeitschrift Nature aufzeigt. Zwei Trends treiben diese Entwicklung voran: Einerseits veröffentlichen Organisationen zunehmend „Open Weights"-Versionen von Sprachmodellen, die frei heruntergeladen und lokal...

mehr lesen

Geisteswissenschaften haben bei der Veröffentlichung von Forschungsdaten Aufholbedarf

Die Digitalisierung in Verbindung mit neuen Kommunikationstechnologien erlaubt es heute, große Mengen an Daten auf einfache Weise mit anderen zu teilen. In der Privatwirtschaft wird bei Daten häufig vom „Öl des 21. Jahrhunderts“ gesprochen. Dieser Vergleich ist zwar unzutreffend, da Daten praktisch unendlich und natürliche Rohstoffe wie Öl nur begrenzt verfügbar sind, aber er verdeutlicht die enorme Bedeutung des „Rohstoffs Daten“. Laut einer aktuellen Untersuchung wollen Unternehmen Daten...

mehr lesen

Empfehlungen, um die Glaubwürdigkeit der Wissenschaft zu stärken

Falschinformationen und Fälschungen sind heute allgegenwärtig. Davon ist auch die Wissenschaft nicht ausgenommen. In den letzten Jahren hat es mehrere öffentlichkeitswirksame Fälle gegeben, in denen sich herausstellte, dass scheinbar seriöse Studien gefälschte Daten enthielten. In der Wissenschaft wird zwar das Peer-Review-Verfahren eingesetzt, um solche Betrügereien aufzudecken, doch auch dieses Begutachtungssystem bietet keinen hundertprozentigen Schutz vor solchen Täuschungen. Jeder...

mehr lesen

Studie zur mangelnden Reproduzierbarkeit der modernen Wissenschaft

Eine aktuelle Untersuchung1 der Universität Cambridge, bei der Forschungsarbeiten zur Zellbiologie von Brustkrebs ausgewertet wurden, zeigt: Weniger als ein Drittel der ausgewerteten Arbeiten sind reproduzierbar. Diese Analyse steht in einer Reihe weiterer Untersuchungen, sie spricht von einer Krise der Reproduzierbarkeit in der Wissenschaft. Auch wenn man Arbeiten, die nicht reproduzierbare sind, nicht automatisch mit minderwertiger oder nutzloser Forschung gleichsetzen darf – es sollte mehr...

mehr lesen

Forschung mit Open Data

Open Data, d. h. offene Daten, sind genau wie Open Access ein Thema, das nicht nur in der bibliotheks- und informationswissenschaftlichen Fachliteratur inzwischen omnipräsent ist. Laut einer gemeinsamen Umfrage von Figshare, einem Forschungsrepositorium, sowie von Digital Science, ein zur Holtzbrinck-Gruppe gehörendes Technologieunternehmen, wächst die Bereitschaft von Forschern kontinuierlich, ihre Daten gemeinsam mit anderen zu nutzen. Ebenso nimmt die allgemeine Beachtung von offenen Daten...

mehr lesen