Edmond Overview

MPDL

Scope
Ein institutionelles Repository der MPG zum Publizieren von Forschungsdaten Alles ist Open Access Zitierbarkeit Erfahrungswerte: Ähnliche Produkte: siehe Softwareumgebung Forschungsdaten:
 * Niemand will MD vergeben
 * Einzige Anforderung: Referenzierbarkeit
 * Automatische Vergabe von DOIs

Eigenschaften

 * Vertrauenswürdige und zuverlässige Umgebung
 * Verbreitung der Daten

Verbreitung
Motivation für die Publikation von FD (Benefits): Beispiele für schön formulierte Benefits: Bekannte Journals mit einer Policy für FD Publikationen: Was ist in der Vergangenheit schon passiert?
 * 1) Policies der Journals
 * 2) Anforderungen der Förderer (z.B. Horizon 2020)
 * 3) Gesetzesinitiativen (Policies in den Bundesländern: Berlin, Baden Würtenberg, Schleswigholstein)
 * 4) Policies von Partnereinrichtungen (z.B. Unies)
 * 5) Einzigartige Sammlungen aus Bibliotheken und Archiven können so online zugänglich gemacht werden und für die Zukunft aufbewahrt werden
 * DSpace
 * eLife
 * Plos
 * Frontiers
 * Imeji Vorstellung in Martinsried und Golm (alle 3 Institute) mit mäßigem Erfolg

Metadaten
Ein MD Profil ist nicht mehr Pflicht --> die MD sind nicht entsprechend gepflegt (wurde von den Nutzern nicht gewünscht), die Nachnutzung ist schwierig Die wenigsten Datensätze verfügen über eine Lizenz, ein entsprechendes MD Feld dafür fehlt (die Lizenz sollte eine URL sein)

Präsentation
Der Hilfetext bezieht sich noch auf Imeji, nicht aber auf Edmond. Es fehlen Informationen über:
 * Welche Metadaten sind wichtig
 * Welche Repositorien gibt es dafür (fachliche Publikationsrepositorien sind keine Konkurrenz, sondern passen oft besser und deren Verwendung soll deshalb auch gefördert werden)
 * Evtl Policies (siehe z.b. DataShare)

LZA
Bit Stream Preservation und Backup macht die GWDG für uns Es gibt gute Richtlinien von der DFG (gibt es auch MPG Richtlinien zu dem Thema?) Mittelfristig: was passiert, wenn ein Datenformat nicht mehr lesbar ist? Welche Datenformate sind im Sinne der LZA sinnvoll? Offene und leicht zu interpretierende Formate wie Trustworthy Repository Audit and Certification (TRAC) Checklist is a tool by which repositories measure their ability to fulfill their responsibilities to their clients and stakeholders based on the Open Archival Information System (OAIS). Forderungen an die Langzeitarchivierung: Interessante Links:
 * xlsx (ISO Standard, der auch ohne Excel geöffnet werden kann)
 * PDF/A
 * Ablegen der Metadaten in maschinen- und menschenlesbarer Form, hier als XML
 * Einfach verständliche Verbindung zwischen Binär- und Metadaten
 * Versehen der Daten mit prozessualen Metadaten, in unserem Fall PREMIS
 * Versionierung der Datensätze zur Nachvollziehbarkeit der Geschichte
 * Verwendung von URIs als persistente Identifikatoren zur global eindeutigen Bestimmbarkeit von Datensätzen
 * Extraktion technischer Metadaten aus den binären Originalen
 * Die ausschließliche Verwendung von Open Source Software erleichtert ex-post das Verständnis über die Funktionsweise der Software
 * Verwendung von allgemein bekannten Daten- und Metadatenstandards
 * Allgemein verfügbare Dokumentation der Metadatenstruktur durch „Application Profiles“ oder Schemata.
 * Verfolgen des Vollständigkeitsprinzips, d.h. alle wichtigen Informationen befinden sich innerhalb eines Datensatzes, es gibt keine ausschließlich externen Referenzen
 * https://wiki.duraspace.org/display/DSPACE/User+FAQ#UserFAQ-HowdoesDSpacepreservedigitalmaterial?

ToDos
Verbreitung: Metadaten: Präsentation: LZA:
 * 1) Benefits für Researchers formulieren und auf Edmond stellen
 * 2) Re3Data pflegen
 * 3) Erstellen eines Posters (Verteiler der geschäftsführenden Sekretariate aller Institute, Verteiler der Forschungskoordinatoren, der OA Ambassadors, IT Verteiler)
 * 4) Kontakt zu relevanten Journals aufnehmen und Entwicklung eines Workflows für MPG Mitarbeiter
 * 5) Vorträge auf externen Konferenzen, evtl, beim IT Treffen der MPG
 * 1) Einführung eines Metadatenfeldes für die Lizenz
 * 2) * Wir haben ein Feld "further informations" das dafür verwendet werden könnte, allerdings ohne Verweis auf mögliche Lizensen (ohne kontrolliertes Vokabular)
 * 3) * Mögliche Lizenzen recherchieren + klären, ob die Lizenz immer in jedem Datensatz stehen muss (wie bei Publikationen), oder nur in den MT
 * 1) Überarbeitung der Hilfe (gemeinsames Konzept für Hilfe erstellen)
 * 2) Überarbeitung der Infotexte (besser an die Zielgruppe anpassen)
 * 3) Erstellen von Policies
 * 4) Überarbeitung der Oberfläche und der Benutzerfreundlichkeit (durch einen externen Anbieter)
 * 1) Info auf Edmond, welche Datenformate im Sinne der LZA sinnvoll sind und welche nicht
 * 2) Klären, was passiert, wenn imeji nicht mehr funktioniert? Können die gespeicherten MD noch irgendwie lesbar gemacht werden? --> Bastien

Anforderungen an die Imeji Software

 * Einführung eines Metadatenfeldes für die Lizenz
 * Verlinkung zu Publikationen und Filmen
 * Albenfunktion entfernen
 * Automatische DOI Vergabe (incl. Dublikatsprüfung)

Imeji Sammelsurium

 * REST-Schnittstelle: Daten können importiert werden (gibt’s die schon?)
 * API: Schnittstelle, wenn jemand seine Daten schon strukturiert vorliegen hat (Eingabe erfolgt automatisch, muss nicht manuell gemacht werden)
 * Anzeige von technischen MD ist nicht durchsuchbar
 * Utilities Embeded: wenn man das Bild irgendwo einbinden möchte
 * Upload: nur ein Bild auf einmal; wenn ich keine Collecion für mein Bild habe wird automatisch eine erstellt, die ich später umbenennen kann
 * MD Profil: es ist möglich ein Profil für mehrere Sammlungen zu nutzen
 * Featuresammlung: auf imeji.org (Natasa)
 * MD Profil pro Dateiformat, nicht pro Sammlung
 * Automatisches extrahieren von MD und Integration in ein erstelltes MD Profil