Digitization Lifecycle Telco (batch-ingest) 2012-03-08

From MPDLMediaWiki
Jump to navigation Jump to search

Allgemeine Infos[edit]

  • Termin: Donnerstag, 08.03.2012
  • Uhrzeit: 10-12 Uhr

Einwahldaten

  • Zugangstelefonnummer: 069 27113800
  • Für alle Teilnehmer gilt der Code: 54175#
  • 0 Operatorhilfe: Bei Problemen bzw. Fragen zum Handling der Telefonkonferenz können alle Teilnehmer mit dieser Tastenfolge Operatorhilfe anfordern.
  • 6 Nur zuhören: Teilnehmer Können so selbst ihr Telefon in den reinen Hörmodus versetzen. Erneute Eingabe von *6 deaktiviert den Hörmodus.

Teilnehmer Bitte melden Sie sich an, indem Sie Ihren Namen hier eintragen.

  • Andrea Kulas (MPDL)
  • Sigrid Amedick
  • Ingo Caesar
  • Lisa Pegelow
  • Wilhelm Frank
  • Klaus Werner
  • Anna Klug

Agenda

1. Ingest der bibliographischen Metadaten. Wie sollen die Daten vorliegen? Varianten und Szenarios

Schritte vor dem Ingest Manipulation möglich
  • 1. MAB Daten werden aus dem Bibliothekssystem exportiert

Bei Öffnen, Manipulieren und Speichern (z.B. mittels Word-Pad MCF editor) wird das Datei -Format umgeschrieben. Eine Manipulation ist stark fehlerbehaftet.

  • 2. Transformation der nicht manipulierten MAB Datei zu MABxml

Die MABxml Datei kann umfassend manipuliert werden (z.B. durch Hinzufügen von Feldern zur Sekundärausgabe). Sie muss nur anschließend entsprechend der vorliegenden Zeichenkodierung gespeichert werden (z.B. UTF-8). Die entsprechenden Transformationstools, die auch die MPDL verwendet, liegen bei der DNB. Die Transformation geht schnell. Eine MAB-Datei mit vielen Datensätzen wird zu einer Datei mit vielen MABxml Datensätzen.

  • 3. Transformation zu UTF-8, wenn zuvor nicht bereits UTF-8 kodiert.

Falsche Kodierung = Fehler in der Anzeige. Die MPDL prüft mit Hilfe eines Code Checkers, welche Kodierung vorliegt, damit die Zeichen am Ende richtig dargestellt werden können. Auch für die Kodierung nach UTF-8 bietet die DNB auf derselben Seite ein Transformationstool an.

  • 4. Transformation MABxml zu MODS

Denkbar ist eine Lieferung der Bibl. Metadaten direkt im MODS-Format. Welche Bibliothekssysteme (neben dem PICA/Berlin) unterstützen dies?


1.1 Alternativen zum bisherigen Ansatz

  • MARC, MARCxml, MABxml, MODS (am simpelsten) sind möglich.


1.2 Dublettenproblem (Florenz/Rom) und eindeutige ID pro Werk

  • Unter einem Datensatz hängen mehrere Expemplare (eins aus Rom und eines aus Florenz). Für jedes in DLC ingestete Werk bedarf es aber einer eineindeutigen ID. Lösungsidee: Erstellen einer neuen Aufnahme für die Sekundärausgabe (für jedes Exemplar einzeln: Sekundärformen gelten als eigene Ausgaben nach RAK-NBM (§2NBM 4,b). Im Aleph-Verbund erhalten diese Ausgaben dann jeweils eine eineindeutige Nummer.


1.3. Möglichkeiten zum Hinzufügen von Angaben zur Sekundärausgabe

  • Faksimile der Hauptaufnahme mit Sekundärausgabe in einem ausgebbaren Feld (z. B. Feld 501: Anmerkung/Fußnote).
  • Beim manuellen Ingest: Nachträgliches Hinzufügen von Angaben möglich. Diese Felder müssten festgelegt werden. Beim Batch Ingest schwierig.
  • Manipulierte MABxml Dateien


2. Aufsätze als weitere Kategorie beim manuellen Anlegen (neben volume, multivolume und monograph)

  • Die Kategorie ist nur sinnvoll, wenn es sich um *einen Aufsatz* handelt, der eine Entität bleibt. Insofern könnte er als monograph behandelt werden. Als Aufsatz in einem ingesteten Band wir die Aufsatzaufnahme zu einem Teil der Struktur(keine Entität). Zudem kann es zu Dopplungen (aufsatz, und volume, worinnen der Aufsatz zu finden ist) kommen. Offen ist, wie oft es in Zukunft passieren wird, dass ein Wissenschaftler einen einzelnen Aufsatz hochlädt, der einzeln bleibt.


3. Bezugseinheit von multivolume zu multivolume

  • Braucht es eine Bezugseinheit von multivolume zu multivolume? Usecase: Eine Gesamtausgabe besteht aus mehreren Abteilungen, die wiederum aus einzelnen Bänden bestehen.
  • --Lisapegelow 12:13, 8 March 2012 (CET) in PICA wird dieser UseCase nicht abgebildet. Wenn ein multivolume aus 3 Stufen besteht(1. Stufe: gesammelte Werke, 2. Stufe: Abteilung, 3. Stufe: einzelner Band), dann wird dieses multivolume wie ein einfaches mehrbändiges Werk behandelt, es gibt in PICA nur 2 Stufen (Gesammelte Werke, Bände (u in den einzelnen Bänden wird in einer Kategorie die Abteilung vermerkt)).


Protokoll


Termin nächste TelCos