Forschungsdaten Workshop Bertelmann

MPDL

Referent: Roland Bertelmann (Geowissenschaftler) =Quick-Links=
 * Forschungsdaten-WIKI
 * EWIG - Entwicklung von Workflowkomponenten für die Langzeitarchivierung von Forschungsdaten in den Geowissenschaften
 * Radieschen - Rahmenbedingungen einer disziplinübergreifenden Forschungsdateninfrastruktur
 * KomFor - Kompetenzzentrum für Forschungsdaten aus Erde und Umwelt
 * re3data.org - Registry of Research Data Repositories (wird gerade mit Databib zusammengeführt) - soll Wissenschaftlern helfen, die relevanten Datenrepositories zu finden
 * Forschungsdaten-Repositorium der GFZ(eingebunden in die PubMan-Instanz der GFZ)
 * Figshare - Datenpublikationsplattform "store, share, discover  research" - Forschungsdaten in der Cloud verwalten, teilen und veröffentlichen
 * Zenodo - Datenpublikationsplattform "research shared" - über alle Fachgebiete
 * Buchempfehlung zu Forschungsdaten: "Science as an open enterprise"

=Status= Empfehlung zur Sicherung und Aufbewahrung von Primärdaten: Primärdaten als Grundlagen für Veröffentlichungen sollen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, zehn Jahre lang aufbewahrt werden. --> Absolut unrealistisch im Moment --> DIE Daten gibt es nicht
 * Daten sind sehr fachspezifisch. Teilweise sogar innerhalb der Institute heterogene Daten
 * Intelligent Openess als Verkaufsargument (z.B. Verfahrensweise mit geheimen Daten) - siehe Buchempfehlung oben
 * Granularität sehr unterschiedlich:  small data vs. big data

=Datenökosystem=
 * Vertrauen in Infrastruktur etablieren (bezogen auf Daten, Systeme, Menschen)
 * Daten sollen entdeckbar sein (discoverable)
 * z.B. über Metadaten, Datenzeitschriften, Datenpublikationen (figshare, Zenodo - siehe oben)
 * nicht zwingend zugänglich, aber man weiß, dass sie vorhanden sind
 * Daten sollen erhalten werden (preserved)
 * Daten sollenvom Grundsatz her offen sein (für Menschen und Maschinen zugänglich)
 * Daten sollen nachnutzbar und verständlich aufbereitet werden
 * Angemessene Wahrnehmung, Wertschätzung und Einbindung in Wissenschaftsmetriken fur das erstellen, sammeln und kuratieren von Forschungsdaten

=Infrastruktur, Domänen, Rollen und Akteure=
 * Infrastruktur muss erst entwickelt werden (laut Bertelmann könnten Bibliotheken hier eine wichtige Rolle übernehmen)
 * Verschiedene Domänen müssen berücksichtigt werden (kann auch positiv genutzt werden --> intelligent openess)
 * research domain
 * permanent domain
 * public domain
 * evtl. weitere Zwischenstufen vorhanden
 * Varianz der Daten, deren Formate, passenden Metadaten, zugehörigen Identifikatoren und auch die rechtlichen Aspekte müssen berücksichtigt werden

=Ziel= Forschungsdaten als integralen Teil des "record of science" eines Wissenschaftlers etablieren. --> Ein erster Schritt könnte sein, klassische Publikation und Forschungsdaten enger zu verknüpfen. Wichtig hierfür sind auch Zeichen aus der Politik, wie die Open Data Charta, welche auf dem letzten G8-Gipfel verabschiedet wurde.

=Perspektiven / Zukunft=
 * Forschungsdaten und Open Science
 * Re-Use (in Bezug auf soziale, rechtliche, technische Aspekte / Text- und Datamining)

=Sonstiges= viel DOI-Werbung
 * DOI als den Forschungsdaten-PID
 * MPG als Lizenznehmer für DOI (um sie selbst zu vergeben)
 * (seltsamer) Vergleich zwischen "Internet der Dinge" und "persistent identifier" (DOI <-> QR-Code bzw. IP)