Das Managen von Forschungsdaten (FDM) erfordert in sämtlichen Stadien des Forschungsprozesses die Umsetzung verschiedener Maßnahmen.
Dieses Video zum Thema „Datenorganisation“ gibt einen Überblick darüber, was beim Forschungsdatenmanagement besonders zu beachten ist:
Zu einem effektiven Datenmanagement gehört also neben einer guten Dokumentation zum Beispiel auch die Festlegung von Dateinamen und -strukturen, die Einhaltung von Datenschutzbestimmungen und ethischen Grundsätzen und die Wahl geeigneter Speicherlösungen. Mit diesen Maßnahmen trägt FDM dazu bei, Forschungsergebnisse besser nachvollziehbar und auch überprüfbar zu machen. Außerdem sorgt es dafür, dass Forschungsdaten reproduziert und so von Anderen genutzt werden können, um neue Erkenntnisse zu generieren.
Die Schritte, die notwendig sind, um nachhaltige und wiederverwendbare Daten zu gewährleisten, werden mit dem Akronym FAIR gut zusammengefasst.
Das Akronym FAIR
Findable
Accessible
Interoperable
Reusable
Daten sind leicht auffindbar
Daten sind zugänglich
Daten sind zwischen verschiedenen technischen Systemen verwendbar
Daten sind wiederverwendbar
Findable (Auffindbar)
Die Vergabe von persistenten Identifikatoren (PID): Daten erhalten eine globale und eindeutige Kennung, auch als persistente Identifikatoren oder Persistent Identifier bekannt, um ihre dauerhafte Identifizierung sicherzustellen. Ein PID besteht aus einem Code von Ziffern und alphanumerischen Zeichen. Weit verbreitet ist z.B. der sogenannte DOI (Digital Objekt Identifier), der Publikationen und Forschungsdaten eine feste, unveränderbare Adresse gibt.
Umfangreiche Metadaten: Metadaten sind zusätzliche Informationen zu den Daten, die mit diesen hinterlegt werden – sozusagen Daten über Daten. Metadaten beschreiben Daten, indem sie Kontext und Zusatzinformationen über die Eigenschaften, den Inhalt, die Herkunft, die Struktur und die Bedeutung von Daten bieten.
Strukturierte Speicherung: Daten werden sinnvoll benannt und strukturiert gespeichert, um ihre Organisation und Auffindbarkeit zu verbessern.
Accessible (Zugänglich)
Forschungsdaten sollten für alle Interessierten zugänglich sein. Dies erfordert klare Zugangsregeln und offene Lizenzen, die die Wiederverwendung ermöglichen. Forschungsdaten können z.B. in Forschungsdaten-Repositorien veröffentlicht werden.
Nicht alle Forschungsdaten sind für eine uneingeschränkte Veröffentlichung geeignet, insbesondere wenn es sich um sensible, personenbezogene Daten handelt oder wenn Rechte Dritter involviert sind.
FAIR bedeutet nicht automatisch Open Access, da es auch Fälle gibt, in denen Daten aufgrund von Restriktionen wie Urheberrechten oder Datenschutzrichtlinien nicht frei zugänglich gemacht werden können. Open Access bezeichnet den Ansatz, wissenschaftliche Informationen, einschließlich Forschungsdaten und Publikationen, allen Interessierten ohne finanzielle, rechtliche oder technische Barrieren zugänglich zu machen. In Fällen, in denen Daten nicht im Sinne von Open Access bereitgestellt werden können, können Hinweise auf die Urheber:innen in den Metadaten angegeben werden, um Interessierte an die für die Daten zuständigen Personen zu verweisen und gegebenenfalls den Zugang zu den Daten zu klären.
Interoperable (Interoperabel)
Auch hier spielen Metadaten eine entscheidende Rolle: Interoperabilität wird unter anderem durch die Verwendung standardisierter Metadaten erreicht. Daten und Metadaten sollten daher eine formale, allgemein anwendbare Sprache verwenden. Dies erleichtert das Verständnis und die Interpretation der Daten sowohl für Menschen als auch für Maschinen.
Reusable (Wiederverwendbar)
Die Forschungsdaten und die zugehörigen Metadaten sollten so umfassend dokumentiert und beschrieben werden, dass sie für zukünftige Forschungsvorhaben von Mensch und Maschine wiederverwendet und weiterverarbeitet werden können.
Die Daten sind mit einer eindeutigen und zugänglichen Datennutzungslizenz veröffentlicht. Diese Lizenz klärt, unter welchen Bedingungen die Daten genutzt werden dürfen.
Das folgende Video fasst die wichtigsten Aspekte der FAIR-Prinzipien nochmal zusammen:
Der Begriff FAIR wurde von der FORCE 11-Community (Force11 The Future of Research Communication and e-Scholarship) geprägt, die auch die Definition der FAIR-Prinzipien entwickelt hat. Diese Prinzipien wurden 2016 formuliert, um den Umgang mit Forschungsdaten zu verbessern sowie diese für alle leicht zugänglich und verständlich zu machen. Ausführlich werden die FAIR-Prinzipien hier beschrieben:
Insgesamt bilden die FAIR-Prinzipien eine wichtige Grundlage für den verantwortungsvollen Umgang mit Forschungsdaten. Sie helfen, Daten so aufzubereiten, dass sie nicht nur von Menschen, sondern auch von Maschinen leicht gefunden, abgerufen und weiterverwendet werden können. Dies fördert nicht nur die Transparenz in der Forschung, sondern auch die Effizienz und Zusammenarbeit innerhalb der wissenschaftlichen Gemeinschaft.