Latest revision as of 14:46, 11 August 2011

Diese Seite dient der Spezifikation eines Dubletten-Check-Mechanismus in PubMan.

Grundannahmen[edit]

Es gibt zwei Arten von Dubletten:
- Gewollte Dubletten: Kooperierende Publikationen mehrerer Institute. Jedes Institut gibt die entsprechende Publikation für seine Wissenschaftler ein; es entstehen mehrere Datensätze zur selben Publikation. Diese Datensätze werden vom eingebenden Institut als Dubletten gekennzeichnet (und damit auf technischer Ebene miteinander verknüpft und als Dublette 'gemarked'), bleiben jedoch alle im System erhalten.
- Ungewollte Dubletten: Nicht erwünschte versehentliche Doppelteingaben von Publikationen, welche von vornherein vermieden bzw. automatisiert als Dublette identifiziert werden sollen.

In den folgenden Datenbeständen wird nach Dubletten gesucht:
- 'on demand' -> wählbar; entweder im Gesamtdatenbestand von PubMan oder innerhalb der eigenen Kontexte
- während der Eingabe -> in den eigenen Kontexten
- beim Release eines Datensatzes -> im Gesamtdatenbestand auf PubMan
- beim Import -> im Gesamtdatenbestand auf PubMan

Definition der Suchkriterien:
- Gesamtdatenbestand = alle Datensätze im Status 'Released' im gesamten PubMan + Datensätze der eigenen Kontexte im Status 'Submitted'
- eigene Kontexte = alle Datensätze in den eigenen Kontexten unabhängig vom Status (sowohl 'Released' als auch 'Submitted')

Möglichkeiten zum Handling von identifizierten Dubletten während eine Mehrfach-Imports:
- Auswahl des Imports im Dubletten-Arbeitsbereich
- Einzel- und Batch-Handling
- gleiche Optionen wie bei Submission (ignore, discard, create revision, edit, duplicate, use as template)

Darstellung eines Dublettenfundes:
- alle Items sollen in Kurz/Mittelansicht (neues internes Browser-Fenster; ähnlich wir bei den Import-Details) aufrufbar sein
- Metadaten, die darauf hinweisen, dass es sich um eine Dublette handeln könnte, sind farbig gekennzeichnet
- Handling eventuell wie bei EndNote -> es wird immer zwischen zwei Alternativen entschieden

Steuerung des Dublettenchecks 'on demand'
- dabei ist auswählbar in welchen Inhalten nach Dubletten gesucht werden soll:
  - Gesamtdatenbestand
  - eigene Kontexte

Nice-to-Have / 2nd Prio: Individuelles Festlegen der geprüften Metadaten im Arbeitsbereich

Institut entscheidet selbst, ob es in dem einzugebenden Datensatz die Autoren der anderen Institute mit CoNE (sofern Eintrag vorhanden) verknüpfen möchte
dadurch entstehende Dubletten im Researcher Portfolio werden dort herausgefiltet
- Voraussetzung dafür: die entsprechenden Datensätze müssen als gewollte Dublette markiert sein

@@ Line 80: / Line 80: @@
 = CoNE Personen / Researcher Portfolio =
 * Institut entscheidet selbst, ob es in dem einzugebenden Datensatz die Autoren der anderen Institute mit CoNE (sofern Eintrag vorhanden) verknüpfen möchte
-* dadurch entstehende Dubletten im Researcher Portfolio werden dort rausgefiltet
+* dadurch entstehende Dubletten im Researcher Portfolio werden dort herausgefiltet
 ** Voraussetzung dafür: die entsprechenden Datensätze müssen als gewollte Dublette markiert sein
 [[Category:PubMan_Functional_Specification|Dublettencheck]]