Unterschiede eSciDoc-INGe

From MPDLMediaWiki
Jump to navigation Jump to search

Diese Seite beinhaltet Informationen darüber, welche Änderungen sich für die Nutzer mit der Ablösung von eSciDoc durch INGe ergeben.
Die Liste wird vom MPDL-Team nach und nach ergänzt und vervollständigt werden.

Allgemein[edit]

  • HTTPS über die gesamte Applikation (auch für CoNE)
  • eSciDoc-IDs werden ersetzt (s.u., im Abschnitt XML)
  • Veränderte URLs - Beispiele s.u.
    • wegen veränderter Syntax der IDs in der URL
    • Wechsel der Domain von pubman.mpdl.mpg.de zu pure.mpg.de
    • Re-directs werden eingerichtet

Einbindung von Publikationen auf den Webseiten[edit]

Als neues Standard-Export-Format wird JSON zur Verfügung stehen. Dieses stellt aus unserer Sicht die einfachste Möglichkeit dar und wird daher für alle künftig erstellten Anbindungen von uns empfohlen.
Aber um die Umstellung für Sie so einfach wie möglich zu machen, werden wir das eSciDoc-Format, bis auf sehr kleine Änderungen (siehe XML), weiterhin auch zur Verfügung stellen.

REST[edit]

REST-Anfragen sind nicht mehr als Lesezeichen (URL) speicherbar, da es kein GET-Request mehr ist, sondern ein POST-Request. Dies ist nötig aufgrund der sehr umfangreichen Suchanfragen.
Es wird auch künftig eine Größenbeschränkung für einzelne Abrufe geben (vermutlich 5000). Eventuell wird es ratsam sein, kleinere Schritte (1000) zu wählen, um die Performance zu verbessern.

Zum Anschauen (Hier handelt es sich um unsere interne Test-Umgebung, die hin und wieder nicht erreichbar sein könnte. Sie stellt einen vorläufigen Stand dar, bei dem sich kleine Dinge durchaus noch ändern können:



XML[edit]

Hinweis: Bisher waren 2 eSciDoc-Formate für PuRe im Umlauf. Das hat jedoch nur diejenigen betroffen, welche sowohl die "Suchen und Exportieren"-Schnittstelle (REST) von PuRe direkt, als auch die eSciDoc-Coreservice-Schnittstelle genutzt hatten. Da der direkte Zugriff seit geraumer Zeit nur noch für einen sehr eingeschränkten Nutzerkreis möglich war, werden wir nur die "Suchen und Exportieren"-Schnittstelle mit der neuen INGe-Schnittstelle vergleichen. Hier jedoch ein Beispiel für den unterschied der beiden "alten" Formate:

SEARCH AND EXPORT
<escidocItem:item objid="escidoc:123" last-modification-date="2018-01-01T00:00:00.00Z">


ESCIDOC DIREKT
<escidocItem:item xmlns:escidocItem="http://www.escidoc.de/schemas/item/0.10" xlink:title="Zellzyklusabhängige Untersuchungen zur Aufnahme von Nanopartikeln" xlink:href="/ir/item/escidoc:123" last-modification-date="2018-01-01T00:00:00.00Z">


Außerdem werden wir uns folgend nur auf das <escidocItem:item> und nicht den Wrapper darum beziehen.

[|Ein direkter DIFF beider XMLs] (links: alt/eSciDoc; rechts: neu/INGe)




An allen Stellen, an denen entweder "objid" oder "href" stand, ist in der INGe Repräsentation beides zu finden.

Außerdem werden neue IDs für INGe eingeführt, welche die bisherigen eSciDoc-IDs ersetzen. Der hintere Teil der bestehenden IDs (nach "escidoc:") bleibt dabei bestehen. Die IDs sind typisiert und starten je nach Typ mit:

  • ctx_ - für Kontexte
  • file_ - für Dateien
  • item_ - für Publikationen
  • ou_ - für Organistation
  • user_ - für Personen

EDIT - (Änderung zum Originaldokument)
Autoren-IDs (CoNE-IDs) werden in den Publikationen angepasst. Diese werden nun als relative IDs angegeben, um von der einzelnen Instanz unabhängig zu sein.

SEARCH AND EXPORT
<dc:identifier xsi:type="eterms:CONE">http://pubman.mpdl.mpg.de/cone/persons/resource/persons1234</dc:identifier>


INGe
<dc:identifier xsi:type="eterms:CONE">/cone/persons/resource/persons1234</dc:identifier>

EDIT - END




SEARCH AND EXPORT
<escidocItem:item objid="escidoc:123" last-modification-date="2018-01-01T00:00:00.00Z">


INGe
<escidocItem:item xlink:href="item_123" objid="item_123" last-modification-date="2018-01-01T00:00:00.00Z">





SEARCH AND EXPORT
<srel:created-by objid="escidoc:123"/>


INGe
<srel:created-by xlink:href="user_123" objid="user_123"/>





SEARCH AND EXPORT
<srel:context objid="escidoc:123"/>


INGe
<srel:context xlink:href="ctx_123" objid="ctx_123"/>





SEARCH AND EXPORT
<srel:content-model objid="escidoc:123"/>


INGe
<srel:content-model xlink:href="" objid=""/> - ist immer leer, da es in INGe kein Content-Model mehr gibt





SEARCH AND EXPORT
<prop:lock-status>unlocked</prop:lock-status>


INGe
FÄLLT WEG





SEARCH AND EXPORT
<prop:version objid="escidoc:123:1">


INGe
<prop:version xlink:href="item_123_1" objid="item_123_1">





SEARCH AND EXPORT
<srel:modified-by objid="escidoc:123"/>


INGe
<srel:modified-by xlink:href="user_123" objid="user_123"/>





SEARCH AND EXPORT
<prop:latest-version objid="escidoc:123:1">


INGe
<prop:latest-version xlink:href="item_123_1" objid="item_123_1">





SEARCH AND EXPORT
<prop:latest-release objid="escidoc:123:1">


INGe
<prop:latest-release xlink:href="item_123_1" objid="item_123_1">





SEARCH AND EXPORT
<dc:identifier>escidoc:123</dc:identifier>


INGe
<dc:identifier>ou_123</dc:identifier> - für Organisationen





EDIT - (Änderung zum Originaldokument)

SEARCH AND EXPORT
<escidocComponents:component objid="escidoc:1234">
    <escidocComponents:properties>
        ...
        <!-- created-by does not exist -->
        ...
    </escidocComponents:properties>
    <escidocComponents:content xlink:type="simple" xlink:title="xyz.pdf" xlink:href="/ir/item/escidoc:1234/components/component/escidoc:1234/content" storage="internal-managed"/>
    ...
    </escidocMetadataRecords:md-records>
</escidocComponents:component>


INGe
<escidocComponents:component xlink:href="file_1234" objid="file_1234">
    <escidocComponents:properties>
        ...
        <srel:created-by xlink:href="user_1234" objid="user_1234"/>
        ...
    </escidocComponents:properties>
    <escidocComponents:content xlink:type="simple" xlink:title="xyz.pdf" xlink:href="/rest/items/item_1234/component/file_1234/content" storage="internal-managed"/>
    ...
    </escidocMetadataRecords:md-records>
</escidocComponents:component>

EDIT - END




Für Dateien und externe Referenzen gültig: (betrifft alle Typen)

SEARCH AND EXPORT
<prop:content-category>http://purl.org/escidoc/metadata/ves/content-categories/any-fulltext</prop:content-category>


INGe
<prop:content-category>any-fulltext</prop:content-category>





INGe
Zusätzlich auch in den Metadaten für Dateien und externe Referenzen ( <escidocMetadataRecords:md-record> )
<eterms:content-category>any-fulltext</eterms:content-category>





INGe
Zusätzlich in den Properties für Dateien und externe Referenzen
<srel:created-by xlink:href="user_123" objid="user_123"/>





EDIT - (Änderung zum Originaldokument - 18.10.2018)
Für Dateien:
Der durch den Nutzer ggf. veränderbare Dateiname wurde früher in drei Felder gemappt:

<prop:file-name>Kontexte_MPI-IDs.xlsx</prop:file-name>
<escidocComponents:content xlink:type="simple" xlink:title="Kontexte_MPI-IDs.xlsx" ... storage="internal-managed"/>
<dc:title>Kontexte_MPI-IDs.xlsx</dc:title>


Der unveränderliche Titel einer Datei (übernommen beim Hochladen in PuRe) findet sich bei neuen Datensätzen nun in:

<prop:file-name>Kontexte_MPI-IDs.xlsx</prop:file-name>


und

<escidocComponents:content xlink:type="simple" xlink:title="Kontexte_MPI-IDs.xlsx" ... storage="internal-managed"/>


Der durch den Nutzer veränderbare Name findet sich weiterhin in:

<dc:title>Verlags-PDF</dc:title>

EDIT - END



Für externe Referenzen fallen folgende Ausgaben in INGe weg, da Sie für externe Referenzen eh nicht bekannt waren und nur standardmäßig befüllt waren.


SEARCH AND EXPORT
<prop:mime-type>application/octet-stream</prop:mime-type>
<prop:checksum>ExceptionReadingStream</prop:checksum>
<prop:checksum-algorithm>MD5</prop:checksum-algorithm>


EDIT - (Änderung zum Originaldokument - 26.09.2018)

Der file-name fällt ebenfalls weg, da er eine Doppelung mit dem Title dargestellt hat.

<prop:file-name>https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3170912</prop:file-name>


Nur für externe Referenzen gültig: (betrifft alle Typen)

SEARCH AND EXPORT
<escidocComponents:content xlink:type="simple" xlink:title="xyz.pdf" xlink:href="/ir/item/escidoc:1234/components/component/escidoc:1234/content" storage="internal-managed"/>
INGe
<escidocComponents:content xlink:type="simple" xlink:href="/ir/item/escidoc:1234/components/component/escidoc:1234/content" storage="internal-managed"/>

EDIT - END


URLs[edit]

  • Beispiel: Datensatz-URL:

ALT: http://pubman.mpdl.mpg.de/pubman/faces/viewItemFullPage.jsp?itemId=escidoc:1690400
NEU: https://pure.mpg.de/pubman/faces/ViewItemFullPage.jsp?itemId=item_1690400

  • Beispiel: Versions-URL:

ALT: http://pubman.mpdl.mpg.de/pubman/faces/viewItemFullPage.jsp?itemId=escidoc:1690400:6
NEU: https://pure.mpg.de/pubman/faces/ViewItemFullPage.jsp?itemId=item_1690400_6

  • Beispiel: Volltext-URL:

ALT: http://pubman.mpdl.mpg.de/pubman/item/escidoc:1690400:6/component/escidoc:1690401/1690400.pdf
NEU: https://pure.mpg.de/pubman/item/item_1690400_6/component/file_1690401/1690400.pdf

Suche[edit]

Basiert komplett auf elasticsearch, wodurch sich einige grundlegende Änderungen ergeben.

  • Neue Abfragesprache
  • Alte Suchabfragen funktionieren nicht mehr und müssen mit der neuen Abfragesprache neu erstellt werden

Admin-Suche: Die Suche über Accounts von KollegInnen ("Erstellt von"; "zuletzt geändert von") ist nicht mehr möglich -> Datenschutz!

  • Identifikator: Eine Auswahl steht zur Verfügung.

Volltexte[edit]

Zugriff auf "eingeschränkte" Volltexte erfolgt (auch) IP-gesteuert. Der Menüpunkt "sharing" fällt deshalb weg. Die Auswahl der gewünschten Zielgruppe erfolgt direkt in der Eingabemaske.

Workflow[edit]

  • Neue Version für eine Publikation werden nur noch nach der (erneuten) Freigabe der Publikation erzeugt.
  • Es kann in allen Status-Stufen (außer "verworfen") (zwischen-)gespeichert werden, ohne eine neue Version zu erzeugen.
  • Beim Speichern einer bereits freigegebenen Version verbleibt der letzte Stand im Status "schwebend" (für Depositoren) oder "eingestellt" (für Moderatoren) - Das ist unabhängig vom Workflow (Simple oder Standard).
  • Beim Wiederherstellen einer alten Version verbleibt der letzte Stand im Status "schwebend" oder "eingestellt" (s.o.)
  • Es ist Moderatoren möglich, Datensätze im Status "Submitted" zu löschen, sofern der betroffene Datensatz vorher noch nicht freigegeben worden ist.

Validierung[edit]

  • Zum Speichern ist lediglich der Titel der Publikation als Pflichtfeld erforderlich (alle Publikationstypen)

Export[edit]

  • JSON als internes Format, ist auch im Export verfügbar. Dies ist die schnellste Option für Exporte, da keine Transfomrationen nötig sind. Zudem ist es die einzige völlig verlustfreie Option, Daten zu exportieren.
  • REST-Anfragen sind nicht mehr als Lesezeichen speicherbar, da es kein GET-Request mehr ist, sondern ein POST-Request. Dies ist nötig aufgrund der sehr umfangreichen Suchanfragen.
  • Feeds: Such-Feeds werden nur noch als Atom (1.0) angeboten

Jahrbuch[edit]

  • Rolle "Yearbook Editor" ersetzt die Kombination Usergroup Admin+User Account Admin+Depositor für Context (Bisher als Local Yearbook Admin bezeichnet - nur ein Account pro MPI)
  • Der Rolle "Yearbook Editor" wird automatisch das MPI, mit dem der Nutzer verknüpft ist, zugewiesen.
  • Es gibt künftig nur noch diese Rolle zum Erstellen, Bearbeiten und Abschließen des Jahrbuchs.
  • Es kann beliebig viele Jahrbuch-Editoren pro MPI geben.
  • Für die Rolle "Yearbook Editor" kann man ein MPI auswählen. Das bedeutet, dass derselbe Account jetzt die Jahrbücher für mehrere MPIs über dieselbe Oberfläche erstellen und verwalten kann. Die Funktionsaccounts für Bibliotheken, die mehrere MPIs betreuen, werden somit überflüssig.
  • Das "Archiv" enbtfällt: Alle alten und aktuellen Jahrbücher sind in einem gemeinsamen Bereich sichtbar.

Verschiedenes[edit]

  • "Revision of" fällt weg
  • Statistiken:
    • werden künftig aus Matomo erzeugt
    • beziehen sich nur noch auf eindeutige Besuche
    • Keine Unterscheidung mehr nach eingeloggten und nicht-eingeloggten Zugriffen
    • ?die Daten werden erst mit der Umstellung auf INGe neu erzeugt werden: Alle bisherigen Statistikdaten fallen leider weg?
  • Der Begriff "Collections" wurde durch Kontext ersetzt.
  • ISSN-URL ("http://purl.org/escidoc/metadata/terms/0.1/ISSN") muss nicht mehr mitangegeben werden im Zeitschriften Datensatz in CoNE. Wenn als ID Type "ISSN" angegeben wird, dann wird die Nummer im ISSN Identifier hinterlegt.
  • Die Veraltete "Hilfe" in der Kopfzeile fällt weg. Die Dokumentation wird künftig vor allem im Benutzerhandbuch gepflegt.
  • Das Benutzerhandbuch wird über GitBook zur Verfügung gestellt
  • Die SWORD-Schnittstelle fällt vorerst weg. Umfassende Push- und Update-Operationen sind über REST möglich.
  • Datensätze können gespeichert werden auch ohne alle Pflichtfelder ausgefüllt zu haben.