Digitization Lifecycle Anforderungen

MPDL,Digitization Lifecycle

Koordination
Andreas Thielemann (mit Unterstützung von Andrea Kulas)

Arbeitspaket 1

 * Kontextualisierung von Objekten und ihrer Benutzung
 * Teilnehmer:
 * Lisa Pegelow
 * Anna Klug
 * Klaus Werner
 * Ingo Caesar

Arbeitspaket 2

 * Detaillierte Beschreibung der Objekte
 * Teilnehmer:
 * Sigrid Amedick
 * Jan Simane
 * Ursula Flitner

Folgend werden die gesammelten Ziele und Anforderungen der Institute an das Projekt aufgeführt. Informationen von zwei CoLab-Seiten wurden hier zusammengefasst (Anforderungen & Szenarien).

Nach Abschluss der Phase der Sammlung von Anforderungen, werden diese kategorisiert. Innerhalb der Kategorien kann dann eine Priorisierung und Konsolidierung der Anforderungen stattfinden. Für die gefundenen Kategorien werden dann Szenarien geschrieben. Im letzten Schritt können dann daraus Spezifikationen entstehen.

=Sammlung der Anforderungen=
 * Kategorisierung nach Lösungsbereichen (TEI; Layer; Viewer)

Eingereichte Beschreibungen der "Anforderungen an die Objekte"

 * MPIB


 * MPIeR


 * KHI-Florenz

Layer
--Wfrank 12:26, 13 October 2011 (CEST) Rechtemanagement: wer darf wo was machen, und wer darf/soll das sehen oder evtl. auch verändern?
 * individuell erstellbar
 * gemeinsam bearbeitbar (Rechtemanagement)
 * Beiträge können hinsichtlich Autorschaft gekennzeichnet werden
 * Veröffentlichung der Beiträge oder des ganzen Layers kann entschieden werden
 * verschiedene Sichtbarkeitsgrade möglich (Rechtemanagement)

Editor

 * mehrsprachig (Benutzeroberfläche?)--Wfrank 12:28, 13 October 2011 (CEST) default!
 * Durchsuchbarkeit (des gerade bearbeiteten Dokuments?)--Wfrank 12:28, 13 October 2011 (CEST) wird von MPDL geprüft.
 * Hilfe-Funktion--Wfrank 12:28, 13 October 2011 (CEST) default!
 * Toolbox--Wfrank 12:28, 13 October 2011 (CEST) ???

Viewer

 * allgemeine Portalseite/individueller Institutszugang--Wfrank 12:33, 13 October 2011 (CEST) was darfs denn sein?
 * mehrsprachige Oberfläche--Wfrank 12:33, 13 October 2011 (CEST) default!
 * Indizes, Suche (aus TEI/Layer)--Wfrank 12:33, 13 October 2011 (CEST) ???
 * benutzerdefinierte Indizes?--Wfrank 12:33, 13 October 2011 (CEST) ???
 * Annotation (Layer)--Wfrank 12:33, 13 October 2011 (CEST) Annotationen werden dem Rechtemanagement entsprechend angezeigt.
 * Layeranzeige (über den Scan/über dem Volltext/parallel im separaten Fenster/)--Wfrank 12:33, 13 October 2011 (CEST) was darfs denn sein?
 * Suche im Volltext/Strukturdaten--Wfrank 12:33, 13 October 2011 (CEST) default!

Eigenschaften des Systems

 * Persistente Adresse--Wfrank 12:39, 13 October 2011 (CEST) default (via PID)
 * Zitierbarkeit des Digitalisats/des Originals--Wfrank 12:39, 13 October 2011 (CEST) ???
 * PDF--Wfrank 12:39, 13 October 2011 (CEST) als Exportformat? oder soll PDF auch angezeigt werden?
 * Kompatibilität mit DFG-Viewer--Wfrank 12:39, 13 October 2011 (CEST) OK!
 * (mehrere zusammengebundene Werke?)--Wfrank 12:39, 13 October 2011 (CEST) MPDL prüft Umgang des DFG-Viewers mit zusammengebundenen Werken

= MPI für europäische Rechtsgeschichte =

Zeitschriftenprojekt (DFG-finanziert)

 * Gesamt-Digitalisierung aller Juristischen Zeitschriften mit Erscheinungsbeginn 1703 bis 1830
 * Partner: Staatsbibliothek zu Berlin, Kooperationspartner MPDL und GWDG

Menge
218 Zeitschriften = 1130 Bd. (= 500.000 Seiten) sind noch zu bearbeiten: Image-Digitalisierung der Zeitschriften sowie die formale Erschließung der Einzelbeiträge (Aufsätze, Miszellen, Rezensionen etc.) durch die Erstellung von Metadaten.

Zeitplan
Stand 02/2011: 482 bibliographische Einheiten mit 148.500 Seiten gescannt, Strukturdaten vorbereitet (Lieferung 1-10). Ingest in eSciDoc erfolgt in Kürze (wichtig für den Zwischenbericht an die DFG, April 2011)
 * Phase I (05/2010 – 04/2012): 1.-2. Jahr 330.000 Seiten digitalisieren (im Rahmen dieses Projekts)
 * Phase II (05/2012 – 04/2013): 3. Jahr Digitalisierung des Rests sowie (noch nicht bewilligt)
 * Phase III: Nichtvorhandene Titel auftreiben und digitalisieren (geplant)

Verteilung der Arbeit
Stabi
 * ZDB Katalogisierung + spätere Datenergänzungen
 * Bereitstellung ihrer juristischen Zeitschriften

MPIeR
 * Vorbereitung der Exemplare für Digitalisierung und Metadatenerfassung
 * Beauftragung von Dienstleistern für die Digitalisierung und Metadatenerfassung
 * Qualitätskontrolle

MPDL
 * Bereitstellung der digitalisierten Zeitschriften im Internet (open access), geschieht als „eSciDoc Solution“

GWDG
 * Vorhalten der Bilddaten (3 TB nach Phase 1), Langzeitarchivierung als unkomprimiertes Baseline-Tiff und MODS/METS

Ziele

 * Erstellung von Bibl.,-, Struktur- und Metadaten für die einzelnen Zeitschriftenbeiträge.
 * Recherchefähige Aufbereitung von Inhaltsverzeichnissen.
 * Ergänzung des geplanten VD 18 (evtl. nicht in der Schedule machbar)
 * Nachweis sämtlicher digitalisierter Zeitschriften in den Katalogen beider Institutionen.
 * Bereitstellung der Digitalisate sowie der Bibl., Struktur- und Metadaten auf der Basis von ViRR, mittelfristig auf Basis einer DigiLife Lösung.

Metadaten
Hauptsachtitel der Zeitschrift, Titelzusatz, Herausgeber, Verlagsort / Druckort, Verlag / Drucker, Bandangabe, Berichts- / Erscheinungsjahr, Fußnote, ZDB-ID (gedruckte Ausgabe), ZDB-ID (elektronische Ausgabe), ISSN
 * Bibliographische Daten der Zeitschriften werden zusätzlich in ein MODS-Format gebracht. Diese Metadaten beschreiben den digitalisierten Zeitschriftenband als Ganzes und enthalten unter anderem:


 * Inhaltliche Erschließung durch Schaffung struktureller und deskriptiver Metadaten, orientiert an der inhaltlichen Struktur der Vorlage.
 * Band-Elemente werden nach DFG-Viewer-Schema - kategorisiert.
 * Die in den Zeitschriften enthaltenen unselbständigen Werke werden den Schriftgattungen: Aufsatz – Miszelle – Rezension / Sammelrezension – Gesetzgebung – Rechtsprechung zuge-ordnet.
 * Es werden die folgenden Kategorien verwendet, wobei nicht jede Schriftgattung alle Kategorien erfordert: Verfasser, Titel, Titelzusatz, Verfasser in Vorlageform

Ergebnis der deskriptiven und strukturellen Beschreibungen sind MODS/METS-Daten, auf de-ren Grundlage die Digitale Sammlung im Internet präsentiert wird. Sie ermöglichen das Browsen in der Sammlung und die Suche nach bestimmten Zeitschriften oder ihren Teilen. Das aus MODS/METS-Daten generierte, elektronische Inhaltsverzeichnis eines typischen Zeitschriftenbandes könnte also die folgende Struktur aufweisen: Titelblatt, Inhaltsverzeichnis, Aufsatz, Miszelle, Rezension, Rezension, Gesetzgebung, Rechtspre-chung, Nachruf


 * Provenienz der Digitalisierungsvorlage wird im Metadatenset erfasst

Austausch und Weitergabe von Metadaten, Bekanntmachung

 * Nachweis in zvdd, ViFa Recht, DFG-Viewer, OAI, html (zur Findability in Suchmaschinen)

Zitieren, persistente Adressierung

 * Eindeutige Adressierung aller Images durch die Gestaltung der Dateinamen (ZDB-ID der elekt-ronischen Ausgabe + Bandzählung + Jahr + fortlaufender Nummer des Images in der Bildse-quenz. Beispiel: 2173628_01+1808_0001)
 * Die vorgeschlagene Zitierform für das Werk bzw. die Seite wird auf der entsprechenden Internet-Seite angegeben.
 * Vergabe von persistent identifiern auf Basis des Handle-Systems. eSciDoc unterstützt das Handle-System direkt, allen Daten können somit beliebig feingranulare persistente IDs zuge-wiesen werden.

Bereitstellung

 * Browsing: Vom Zeitschriftentitel führen Links zu den Einzelbänden, zu Inhaltsverzeichnissen und schließlich zu den digitalen Faksimiles.
 * Suche nach: Zeitschriftentitel
 * Stichwortsuche
 * Verfassersuche
 * Eingrenzende Suche innerhalb einer Auswahl von Zeitschriften bzw. Schriftgattungen.
 * Navigation: Verknüpfung von Metadaten und Images: Vom elektronischen Inhaltsverzeichnis wird auf die jeweiligen Images verlinkt.
 * Vor- und zurückblättern, Sprung auf die erste bzw. letzte Seite.
 * Jeder Bildansicht werden in der Kopfzeile die wichtigsten Metadaten-Informationen sowie ein Zitiervorschlag für das Digitale Dokument bzw. die einzelne Seite beigegeben.
 * Präsentation: Zur Präsentation im Internet werden die digital master Images in ein webtaugliches Format umgerechnet (Jpeg), Jpeg-Dateien werden in drei Auflösungen angeboten.
 * PDF-Download: einzelne Seiten, alle Seiten eines Beitrags, alle Seiten eines Zeitschriftenbandes
 * Anzeige der Provenienz der Digitalisierungsvorlage

Projekt Beichthandbücher (in Planung)
Projektgegenstand: Es sollen 6-7 Beichthandbücher mit jeweils ca. 300 Seiten als Faksimile Scan und als Volltext online zugänglich gemacht werden. Dazu soll kollaborativ ein Register mit wichtigen Begriffen erstellt werden. Ziel ist einen mit Metadaten angereicherten durchsuchbaren Textkorpus im open access zur Verfügung zu stellen. Der Textkorpus ist überwiegend in Latein, die Benutzeroberfläche sollte in Deutsch und Englisch zur Verfügung stehen.

Projektstand: Diese Woche gehen erste Musterseiten zusammen mit einer Aufstellung der zu erfas-senden Zeichen („Setzkasten“) an den Dienstleister (Kompetenzzentrum Trier), der die Texte in China im double-blind keying Verfahren erfassen lässt. Die für die Edition ausgewählten Werke befinden sich im Besitz des MPIeR.

Projektplanung: Das Projekt hat keine feste Terminierung, es ist aber auf ca. 3 Jahre angelegt. Es ist zugleich ein Testballon für das geplante Akademie-Projekt "Schule von Salamanca" einer umfangreichen internetbasierten Bibliothek der spanischen Spätscholastik.

Suchfunktionen: Durchsuchbar werden sollen Strukturdaten auf Ebene der Inhaltsangaben, der Rubriken und der Überschriften. Zudem sollen Struktur- und Metadaten zur Textgenese (Fundstellen, Bezug zum Urtext, Auflage, Ausgabe) sowie Text-Erläuterungen (z.B. Biogr. Register) entstehen. Die in Verbindung stehenden Beichtbücher werden querverlinkt.

Kollaboration und Rechtemanagement: Freigabe von Teilen einer Kollektion, Teilen von Erschließungsdaten, persönsilche interne Daten nicht veröffentlichen.

Ein Download der Digitalisate z.B. als PDF sollte möglich sein. Angebot einer Print on Demand Ausgabe.

Hier zwei Demoscans aus dem Projekt:
 * Seite I
 * Seite II

Projekt Wörterbuch zum frühneuzeitlichen Religionsrecht in Hispanoamerika (in Planung)
Projektgegenstand: Es soll ein kollaborativ erarbeitetes religionsrechtliches Wörterbuch mit ca. 120-200 Lemmata und ggf. weiteren Unterlemmata entstehen. Das Wörterbuch soll Online im open access und gedruckt zur Ver-fügung stehen. Vom Wörterbuch, den Lemmata, soll auf die Fundstellen und von den Fundstellen auf die Lemmata verlinkt werden. Die Lemmata sollen extern von unterschiedlichen Beiträgern bearbeitet werden und in der Darstellung einem formalen Schema folgen: 1. Fundstellen zusammenstellen, 2. Bedeutungen zusammenfassen, 3. Interpretation, 4. Quellenhinweise und Literaturanhang. Hinzu-kommen sollen biographische Erläuterungen. Als Grundlage für das Wörterbuch sollen ca. 20 frühneuzeitliche Druckwerke als Faksimile Scan und als Volltext erfasst online im OA zugänglich gemacht und mit den Lemmata verlinkt werden. Der Text-korpus ist in Latein und Spanisch und relativ heterogen: a) normative Texte (Konzilien, Synoden), b) juristische Kommentare, c) moraltheologische Texte und Texte aus der juristischen Praxis. Die Benut-zeroberfläche sollte in Deutsch, Spanisch und Englisch zur Verfügung stehen.

Projektstand: Bisher ist nur der Rahmen abgesteckt. In den nächsten Wochen soll der Textkorpus näher bestimmt und Fragen der Zugänglichkeit und Rechtslage von benötigten Drucken geklärt werden.

Projektplanung: Das Projekt ist auf ca. 5 Jahre angelegt. Mit der Festlegung der einzuscannenden Texte ist frühestens in einem Jahr zu rechnen.

Suchfunktionen: Die Berücksichtigung unterschiedlicher Wortformen, die auf einen Wörterbuch-Begriff referenzieren sollen, ist wichtig: Unscharfe Suche oder Lemmatisierung mit Wörterbuch.

Kollaboration und Rechtemanagement: Freigabe von Teilen einer Kollektion, Teilen von Erschließungsdaten, persönsilche interne Daten nicht veröffentlichen.

Weitere Mehrwert Dienste: Verknüpfung von Volltexten mit Geoinformationen (z.B. mit historischem Kartenmaterial) z.B. im Kontext: Von wo kamen die Teilnehmer einer Synode? Beim religionsrechtlichen Wörterbuch wird es sehr viele Verweise auf Fundstellen in der Literatur ge-ben. Evtl. könnte hier online eine ausführlichere Bibliographie erstellt werden, als dies in einer Prin-tausgabe angemessen ist. Auflösung von Abkürzungen und Allegationen.

Download der Digitalisate z.B. als PDF sollte möglich sein. Angebot einer Print on Demand Ausgabe.

Online ab: Sobald Faksimile Digitalisate zur Verfügung stehen, sollen diese intern Online bereitgestellt werden. Das ist insbesondere für die verteilt arbeitende Gruppe des kirchenrechtlichen Wörterbuchs wichtig. Eine öffentliche Präsentation sollte erst erfolgen, wenn ein Mindestmaß an Funktionalität und Inhalt erreicht ist: Digitalisat + Volltext + einfache Suchfunktion.

Editor

 * Dreiteiliger Arbeitsgang (Paginieren, Gliedern und paginierte Seiten Gliederungspunkten zuweisen) sollte in einer Funktionalität/Ansicht zusammengeführt werden.

Strukturtypen

 * Terminologien trennen: Trennung von formalen und inhaltlichen Strukturelementen, evtl. durch mehrere Auswahlsets


 * Sprachwechsler: Ebene der Übersetzungen verwendeter Strukturtypen berücksichtigen und semantisch mappen

Ingest

 * Ingest sollte von den Instituten selbständig ausgelöst werden können.

Mengenoperationen (Batch processing)

 * Einfügen, Löschen, Umbenennen, Umsortieren, Ersetzen von Mengen an Titelangaben, Feldinhalten, Metadaten, Schlagworten, Scans etc.

Viewer
Visuelle Orientierung innerhalb eines Werks Orientierung innerhalb eines Werks anhand der Gliederung Seitenfunktion Leistungsanforderungen
 * Scrollen durch die Seiten (Thumbnails/Coverflow)
 * Springen erste/letzte Seite; vor- und zurück und Möglichkeit der individuellen Seiteneingabe
 * Entsprechend des Digitalisats, welches betrachtet wird, wird der damit verknüpfte Gliederungspunkt gehighlighted
 * Autopsie einer Seite: Verschieben der Seite per drag and drop/Handwerkzeug, Vergrößern/verkleinern via Mausrad
 * Verwendung von Ausschnitten aus dem Digitalisat: Ausschnitte als Graphik in Zwischenablage kopieren oder lokal speichern
 * Sichtung im Querformat, Betrachtung von Marginalien oder handschriftl. Anmerkungen: Drehen um 90° oder genau per drag and drop/Handwerkzeug
 * Sichtung eines Digitalisats innerhalb des ursprünglichen Fensters (z.B. wie beim Stabi Viewer )
 * Leistung: Nur Bilder aus der Sektion, die ich mir gerade anschaue, sollten geladen werden, nicht das gesamte Buch.
 * Ein/Ausblenden bstimmter Teile (Digitalisat/Gliederung, Digitalisat/Volltext, Nur Digitalisat, Digitalisat mehrere Seiten, Digitalisat und Digitalisat eines anderen Werkes, Thumbnails/Digitalisat, Thumbnails/Volltext)

Referenzieren

 * Get URL (Werk, Abschnitt, Seite, Bild, Annotation, Überschrift …, markierte Stelle im Digitalisat, markierte Stelle im Volltext …)

Frontend User

 * PDF-Ausgabe (Seite, Abschnitt, Werk …)
 * Angebot verschiedener Export-Formate für Literaturverwaltungssprogramme (Citavi, Endnote)
 * Merklisten
 * Literaturlistenausgaben/-speicherung

Suchmaske

 * Suchmöglichkeiten nach auswählbaren Kategorien


 * Ergebnis/Titelanzeige nach auswählbaren Sortierkategorien

Zeitplan
Das Produktivsystem sollte innerhalb eines Jahres stehen. Anschließend stehen noch zeitintensive Migrationen an.

= Kunsthistorisches Institut =

Zur momentanen Situation
Das KHI besitzt eine ca. 7.500 Bände umfassende Sammlung alter Buchdrucke und einiger weiniger Handschriften, die zwischen ca. 1480 und 1930 entstanden sind. Die Werke gehören allgemein zur 'Quellenliteratur' für kunsthistorische Fragestellungen (topographische Werke, Sammlungskataloge, theologische (insb. hagiographische)Traktate, philosophische Abhandlungen, literarische Werke der frühen Neuzeit, aber auch Originalwerke des Futurismus und vieles andere mehr). Aus dem Freihandbestand der Bibliothek extrahiert, wird dieser 'Rara-Bestand' seit 2009 in einem klimatisierten Rara-Magazin aufbewahrt und kann aus konservatorischen Gründen nur auf Anfrage konsultiert werden. Um den Nutzern weiterhin und auch über die Entfernung uneingeschränkten Zugang zu den Beständen zu gewähren, ist das Institut bestrebt, die komplette Sammlung digital zur Verfügung zu stellen. Dabei sollen Dokumente und Anwendungsmöglichkeiten aus bestehenden Digitalisierungsprojekten des Instituts, die Teilaspekte der Sammlung beleuchten, überführt werden.

Einzelprojekte, die für eSciDoc konvertiert werden sollen

 * GIGLIO - Historische Guiden- und Inventarliteratur
 * PRO FIRENZE FUTURISTA - Digitales Archiv zum Futurismus in Florenz
 * STEMMARIO - Wappen Florentiner Familien, Bruderschaften und Hospitäler
 * translatio nummorum – Die Aneignung der antiken Kultur durch Antiquare der Renaissance im Medium der Münzen

Überblick: Rara-Sammlung
Rara: ca. 7.500 Bände

davon: ca. 120 Bände bereits gescannt

(Die derzeit vorhandenen Digitalisate werden teilweise innerhalb der bereits vorhandenen Einzelprojekte verwendet und präsentiert.)

Digitalisierung inhouse (ab spätestens Juni ca. 400-500 Scans pro Tag)

Images
 * Alte Drucke (vorwiegend Topographie und Geschichte italienischer Städte, kunsttheoretische Quellenschriften, Künstlermonographien)
 * Periodika (Ende 19., 1. H. 20. Jh.)
 * Manuskripte (darunter Wappensammlungen, Briefe, Chroniken, Memoiren, Auszüge aus Kirchenbüchern)
 * Zeitungsartikel
 * Bildbände mit graphischen Darstellungen
 * Photographien
 * Kartenmaterial/Stadtpläne
 * Zeichnungen (Architekturzeichnungen; Pläne)
 * Fotodokumentation Restaurierung, digital vorhanden

Textdateien
 * Restaurierungsberichte (Excel-Dateien)

Editor zur Exemplarbeschreibung
Aktuelles Format: Access-Datenbank
 * Die Konvertierung in ein xml-Format sowie die Bereitstellung (als Gesamtdatenbank oder in Form von Einzelmodulen) zur Nutzung durch die Projektpartner ist ein Ziel des Lifecycle-Projekts.
 * Die Datenbank verfolgt in erster Linie konservatorische Zwecke und dient einer ausführlichen Bestandsaufnahme der gesamten Rara-Sammlung der Bibliothek des KHI.
 * Die Datenbank ermöglicht die Erstellung von Metadaten zu den exemplarspezifischen Eigenschaften eines Buches und zielt auf eine möglichst genaue Erfassung der Besonderheiten des jeweils vorliegenden Bandes (darunter Buchblock: Material, Schnittgestaltung, handschriftliche Einträge, etc. - Provenienz - Einband: Bindungstechnik und Einbanddekor - Erhaltungszustand - Restaurierungsaspekte).
 * Spezielles Augenmerk wird auf die Erfassung der Geschichte des jeweiligen Buches gelegt, ablesbar an den Gebrauchsspuren, die einzelne Vorbesitzer und vorbesitzende Institutionen in dem Buch ggf. hinterlassen haben.
 * Die Datenbank ist modular angelegt und streng hierarchisch aufgebaut: Einem Oberelement sind mehrere Unterelemente zugeordnet. Der hierarchische Aufbau der Datenbank mit sämtlichen Unterkategorien ist in einem Schema der semantischen Feldbezeichnungen, kombiniert mit Feld-Typ-Angaben, aufgeführt [vgl. vom KHI vorgelegte Excel-Tabelle, besprochen auf der Novembersitzung 2010 in Berlin]. Dieses Dokument bietet eine erste Orientierungsgrundlage für das Mapping der Access-Datenbank auf ein XML-Format.
 * Aus Gründen einer besseren Durchsuchbarkeit und des grundsätzlichen Bedarfs nach einer einheitlichen Terminologie greift der Bearbeiter im Zuge der Buchbeschreibung auf kontrollierte Vokabularien zurück. Diese sind
 * durch Pulldown-Menüs, derzeit editierbar durch den Bearbeiter,
 * durch Checkboxen (Auswahl mehrerer Begriffe) abrufbar.
 * Zur detaillierteren Beschreibung stehen in den jeweiligen Oberelementen Freitextfelder zur Verfügung.
 * Es existieren relative Links zu lokal gespeicherten Dateien, die der Dokumentation der Restaurierungsvorgänge dienen (aktuell Fotos und Excel-Dateien).
 * Eine Verknüpfung zum Opac ist über die Identnummer des jeweiligen Bandes sichergestellt.
 * Aktuell können bibliographische Metadaten im Editor nicht angezeigt werden, dies ist ein zukünftiges Anliegen.
 * Gewünscht ist eine Integration der Digitalisate zur eventuellen Markierung ausgewählter Bereiche (wie Ex-Libris-Aufkleber oder Besitzeinträge). Diese markierten Bereiche sollen speziell gefiltert und im Viewer parallel zu den entsprechenden kodikologischen Metadaten angezeigt werden können.

Editor zur Provenienz-Datenbank

 * Es handelt es sich um eine GUI zum Zugriff auf eine innerhalb der Exemplarbeschreibungs-Datenbank liegenden tabellarischen Struktur, die der Erfassung von Personennamen und Körperschaften im Rahmen der Provenienzerschließung dient.
 * Die Anlegung der Namenseinträge erfolgt unter Einbindung von Normdaten (Personennamendatei, PND, und Schlagwortnormdatei, SWD).
 * Sofern keine Identifizierung eines Besitz-, Stiftungs-, Ex-Libris-Eintrags mit vorhandenen Normdateien möglich ist, erfolgt die Erstellung datenbankinterner Normdaten für Personen und Körperschaften (Vorbesitzer und vorbesitzende Institutionen).
 * Die Zuweisung der generierten Namenseinträge erfolgt über die Identnummer des jeweiligen Bandes.

Bibliographische Metadaten
Quelle: Opac

Format ab Sommer 2011: Aleph

Benötigte Verknüpfungen:
 * Verlinkung mit Digitalisaten im User-Interface (Zuweisung erfolgt über Identnr.)
 * Verlinkung mit dem Strukturdaten-Editor
 * Verlinkung mit dem Editor zu Exemplarbeschreibung

Metadaten der Sacherschließung
Quelle: Opac

Format ab Sommer 2011: Aleph

Benötigte Verknüpfung:
 * PND (Personennamendatei)
 * SWD (Schlagwortnormdatei)
 * Verlinkung mit Digitalisaten im User-Interface (Zuweisung erfolgt über Identnr.)

Metadaten zur Exemplarbeschreibung
Quelle: aktuell reine Access-Arbeitsdatenbank

künftig konvertiert in XML-Format im Rahmen von Lifecycle, ggf. TEI (Modul MsDesc)

Benötigte Verknüpfungen:
 * Verlinkung mit Digitalisaten des jeweiligen Bandes im Webportal (Zuweisung erfolgt über Identnr.)
 * Verlinkung zu Restaurierungsfotos (jpg, gespeichert auf dem KHI-Server)
 * Verlinkung zu Restaurierungsberichten (Excel-Dateien, gespeichert auf dem KHI-Server)
 * Verlinkung mit retrospektiven Nationalbibliographien (externe Datenbanken, z. B. VD16, VD17, VD18, EDIT16, ICCU, ISCT, ESTC)

Provenienz-Metadaten
Quelle: aktuell Access-Arbeitsdatenbank

künftig konvertiert in XML-Format

ggf. Einsatz von CONE zur Anlegung der Namenseinträge (es gilt zuvor zu prüfen, ob PND/SWD/CERL in CONE integrierbar sind)

Benötigte Verknüpfungen:
 * Verlinkung mit Digitalisat zum Besitz- /Widmungs- /Stiftungseintrag / Ex-Libris
 * Verlinkung mit interner Provenienz-Datenbank (innerhalb von Access)
 * Verlinkung mit PND und SWD, Quelle: aktuell über den Institutsopac aus Allegro/ ab Juni Aleph
 * Verlinkung mit externen Provenienz-Datenbanken (z. B. CERL, Verknüpfung über CERL-Identnr. CNP)

Arbeitsprozess der Digitalisierung am Institut

 * 1) Die zu digitalisierenden Bücher und Dokumente werden ausgewählt. (Auswahl und Reihenfolge bestimmt jedes Institut selbst; regelmäßige Up-Dates über den Stand der Dinge)
 * 2) Die Bücher und Dokumente werden hausintern, Seite für Seite, mit dem Wolfenbütteler Buchspiegel abfotografiert.
 * 3) Die im RAW-Format gespeicherten Einzelbilder werden mit Photoshop nachbearbeitet; d.h. gespiegelt, gedreht, beschnitten, benannt und im TIFF sowie jpg-Format gespeichert
 * 4) Ab nun gilt das TIFF als Original; das jpg-Format dient der Arbeitserleichterung bei der Strukturdateneingabe

Szenarium: Vorbereitung der Online-Konsultation und einer weiteren Struktur- und Metadateneingabe

 * 1) Die Ausgangs-Bildbenennung der verschiedenen Institute soll einheitlich sein!
 * 2) Die Dateiformate und -größen sollen institutsintern einheitlich, oder zumindest bewusst gewählt, sein!
 * 3) Ein xml-Dokument, das alle zum Buch-Original bzw. physischen Dokumentenoriginal gehörigen Bilder einbindet, wird automatisch erstellt.
 * 4) Ingest: Das xml-Dokument (noch ohne Strukturmetadaten) wird auf die gemeinsame Projektwebseite gestellt und ist ab diesem Zeitpunkt online konsultierbar.
 * 5) Der Bearbeitungsstatus der Digitalisate wird (zumindest für die Bearbeiter) kenntlich gemacht
 * 6) Die Opac-Daten werden in diesem Moment zugespielt und sind gemeinsam mit dem Digitalisat konsultierbar.
 * 7) Bereits vorhandene Exemplar- und Provenienzdaten werden zugespielt.(Voraussetzung: xml-Konvertierung des Florentiner Access-Editors)
 * 8) Strukturmetadaten zur Gliederung des digitalen Faksimiles werden zugefügt. S. ff.:

Szenarium: Strukturierung des digitalen Faksimiles
Ein Editor ermöglicht die Weiterbearbeitung des Digitalisats. Mit ihm werden wichtige Informationen der semantischen Struktur des Originaldokuments aufbereitet. Dazu gehören das Inhaltsverzeichnis, aber auch Bilder sowie Informationen zum verlegerischen und organisatorischen Apparat. Da im ersten Stadium des Digitalisierungsprojekts keine Volltexte erfasst werden, erfolgt die Eingabe ausgewählter Primärdaten manuell.

Vorgehensweise
Mithilfe des Editors werden zunächst alle Scans für eine künftige Anzeige im Frontend, der Seitennummerierung des Originaldokuments entsprechend, paginiert. Danach werden Originaldokument-immanente Strukturdaten eingegeben. Dies erleichtert die Online-Navigation im digitalen Faksimile. Einzelne Strukturen des Originaldokuments (Inhaltsverzeichnis, Kapitel, Bilder, etc.) können nach der Bearbeitung vom Endnutzer online über Mausklick direkt angesteuert werden.

Verhältnis von Metadaten und Volltextelementen
Als Szenarium stellt sich das KHI vor, in einem künftigen Editor ein Strukturmetadatenset zur Verfügung zu haben, das die englische Buchstrukturnomenklatur übernimmt. Der Benutzer soll im Frontend aber nicht die englischen Benennungen verfolgen, sondern die Originaldokument-immanente Bezeichnung des jeweiligen Strukturelements angezeigt bekommen.

Graphischer Editor
Ein graphischer Editor braucht im beschriebenen Fall eine Übersetzungsmaske, in der die Originalbenennung des Strukturelements in einem Freitextfeld eingetragen wird. Alle gleich benannten Strukturelemente können dann automatisch für die Anzeige im Frontend umbenannt werden. Bei bewusster Deaktivierung des Automatismus kann aber auch jedes eingetragene Strukturmetadatum einzeln benannt werden. Ein ähnlicher Mechanismus übernimmt die Originalnummerierung der Strukturelemente.

Eingabe von Primärdaten
Jedem eingetragenen Strukturmetadatum wird ein Freitextfeld beigefügt, in dem der im Buch eingetragene Titel des Strukturelements abgetippt wird. Dieser erscheint im Frontend hinter der jeweiligen Originalstrukturelementbezeichnung.

Metadatenset
Folgende Strukturmetadatenelemente werden im Editor benötigt:

Allgemein:
 * book
 * volume

Strukturelemente zur Grobgliederung (Untergliederung: s.u.):
 * front
 * body
 * back

In den Bereichen "front" und "back" relevante Strukturelemente:
 * boardpaper
 * cover
 * content
 * dedication
 * endsheet
 * flyleaf
 * index
 * privileges
 * preface
 * titlepage
 * engraved_titlepage

Im Bereich "body" relevante Strukturelemente:
 * part
 * chapter
 * section

In allen Buchteilen relevante Strukturelemente:
 * illustration
 * map
 * table
 * verse

Erklärung
Das für den Editor vorgeschlagene Strukturmetadatenset ist den bereits erprobten division types des Hertziana-Editors entlehnt und muss, trotz angestrebter Verknappung, ausgebaut werden können. Dabei ist, zugunsten späterer Suchfunktionen, auf einen weitestgehenden Abgleich des Metadatensets mit den anderen Instituten zu achten. Außerdem sollten die gewählten Strukturelemente nach Möglichkeit auch vom DFG-Viewer unterstützt werden: vgl. 

Insgesamt vermeidet die angestrebte Systematik ein ausuferndes Metadatenset in den Dropdown-Menüs eines graphischen Editors und erlaubt eine Strukturierung im Sinne eines digitalen Faksimiles, die dem Nutzer die originaldokument-immanenten Strukturbezeichnungen zur Verfügung stellt.

Allgemeiner Aufbau

 * 1) Home: Projektbeschreibung, aufgefächert in den gemeinsamen Teil und eine Beschreibung der Teilprojekte der Institute
 * 2) Auflistung der Institute
 * 3) In den einzelnen Institutsrubriken: Auflistung der institutseigenen Digitalisate nach einer noch zu bestimmenden Systematik(Informationen für bestimmte Auflistungskategorien z.B. aus der Opac-Verschlagwortung bzw. der ebenfalls dort vermerkten zeitlichen Einteilung)(Der Bearbeitungstatus des Digitalisats sei mitvermerkt)

Angaben zum jeweiligen Digitalisat in der Liste (gilt auch für Trefferlisten bei Suchergebnissen):

untereinander aufgelistet: Autor / Titel.


 * Titelzusatz. Erscheinungsort: Drucker, Erscheinungsjahr

Beispielebene: Das Digitale Faksimile eines Buchs wird geöffnet
Graphische Oberfläche zum Einzelwerk: Navigation innerhalb eines Bandes:
 * Titel mit bibliographischer Beschreibung (aus dem OPAC) und Faksimile des Titelblattes als Thumbnail
 * bei Mehrbandwerken Links auf die Einzelbände
 * Doppelseitige Ansicht als Standardansicht (DigiLib-Viewer mit ausgebauten Features)


 * Die unten mitlaufende Zeile transkribiert die Originalseitenzahl.


 * Das Buch kann Seite für Seite durchgeblättert werden.


 * Zuklicken von Zusatzinformationen: Buttons der Aktionen als permanentes Navigationsmenü (ggf. mit „Häkchenfunktion“ aktivierbar bzw.deaktivierbar)
 * Interaktives Inhaltsverzeichnis (Daten aus dem Strukturdateneditor; Navigationsmöglichkeit innerhalb des Inhaltsverzeichnisses und zu Bildseiten)
 * Physische Beschreibung (Exemplarbeschreibung)
 * Durchscrollbare Liste untereinander angeordneter Thumbnails
 * Andere Ansichten:
 * Reine Thumbnailansicht /Thumbnailansicht mit Häkchenfunktion und Vergrößerung bestimmter ausgewählter Seiten (Erklärung: Zum Bildvergleich müssen auch unabhängig von der originären Buchbindung Seiten wahlweise nebeneinander gestellt werden können.)
 * Exportmöglichkeit zum DFG-Viewer

Suche
Charakteristika: Suchoptionen:
 * multilinguale Suche in 3-4 Sprachen (deutsch, italienisch, englisch, französisch)
 * Suchunterstützung mit Suggestion-Boxes
 * bibliographische Metadaten (Autor, Titel, Erscheinungsort, Erscheinungsjahr, Drucker/Verleger, Signatur), Quelle: Opac
 * Schlagwortsuche (ggf. Integration der Opac-Systematik), Quelle: Opac
 * exemplarspezifische Metadaten mit Indexsuche (Einband, Wasserzeichen, Provenienz Person/Körperschaft, Wappen), Quelle: aktuell Access-/ künftig XML-Datenbank
 * Bildsuche (Stadium 1): Alle in den Bilduntertiteln wortwörtlich erfassten Bildinhalte können gesucht werden.

Frontend einer erweiterten Digitalen Forschungsumgebung (Stadium 2)

 * Interaktives Kartenmaterial: Verlinkung bestimmter Orte mit bestimmten Dokumenten/Ereignissen
 * Bildsuche (Stadium 2):


 * Im Arbeitsschritt zu einer erweiterten Bildsuche können vorab im Strukturdateneditor als illustration gekennzeichnete Einzelscans (oder als illustration gekennzeichnete Teile von Einzelscans) gefiltert und nachträglich innerhalb der Digitalen Faksimiles verschlagwortet werden:


 * Verschlagwortung von Gattung, Künstler, Technik und Ikonographie;


 * Zuhilfenahme von SWD, PND und Iconclass


 * Ausgebaute Schlagwortsuche, die auf Einzelscans oder Abschnitte verweist:


 * Diese den Text betreffende erweiterte Schlagwortsuche wird erst nach der Erstellung des Digitalen Faksimiles über das Digitalisat gelegt und verweist beispielsweise auf Abschnitte, in denen es zu einem bestimmten Thema geht.(möglich über manuelle Verschlagwortung oder Volltextsuche)


 * Nebeneinanderstellen von Digitalisat und Volltext

Vernetzung mit anderen Datenquellen und Webseiten im Internet
Projektbekanntmachung und Verlinkung aus Virtuellen Fachbibliotheken u.a.
 * arthistoricum
 * ViFaRom

= MPI Biblioteca Hertziana =

Einzelprojekte

 * Rara


 * Schudt


 * Living Book (Abruzzen und Molise)


 * Alhacen

Überblick

 * Entwicklung des Strukturschemas in XML Schemasprache (z.B. RelaxNG, XMLSchema): einfache, auch human lesbare aber dennoch verbindliche Beschreibung


 * Beispiel: Strukturdaten der Hertziana als RelaxNG file [], als Schema in graphischer Form [], sowie in graphischem Editor [], [], []. Hier auch die Steuerdatei [] zur Benutzung mit dem XMLMind Editor


 * Basis-Struktur (Rom/Frankfurt), bibliopgraphische Daten (OPAC/ALEPH) sowie codicologische Daten (Florenz) in jeweils eigenen Modulen (ev. auch Namespaces): unkomplizierte parallele * Abwicklung der verschiedenen Anforderungen
 * Moeglichkeit, zu einem spaeteren Zeitpunkt auf Volltext upzudaten unter Beibehaltung bzw. mit einer Ausweitung der Strukturdaten
 * System zur pixel- (bzw. wortgenauen bei Volltexten) Referenzierung von einzelnen Abschnitten, Seiten oder Ausschnitten
 * Generischer web-basierter Editor zur Generierung der XML Dokumente mithilfe der Interpretation der Schemasprache und den dort ausgewaehlten Modulen (kein hartkodierter Editor): der Editor passt sich automatisch der Schemasprache und den (in laufender Entwicklung befindlichen) verschiedenen Modulen an (parallele statt serielle Entwicklung)
 * Generischer Viewer fuer alle Beteiligte der unbekannte Module/Elemente/Namespaces lediglich ignoriert - aber nicht generell die Anzeige abbricht


 * Standardisiertes Datenformat


 * Metadaten (bibliothekarisch-werkbezogen, buchwissenschaftlich-exemplarbezogen)


 * Strukturdaten, die das vorliegende Exemplar in allen Teilen genau abbilden


 * Volltext in die Struktur integriert (TEI-Format)


 * Images über Digilib zoombar, referenzierbar, auch in Ausschnitten/Einzelpunkten


 * Tools
 * zur Generierung des Datenformats (Editor)
 * wissenschaftliche Verwendung (Viewer)
 * Kommentier-Funktion
 * projektbasierte Vernetzung (Editionsvergleich, Datenbanken)
 * Vernetzung mit externen Datenquellen (Wörterbücher, Normdaten, lingustische Analyse, GEO-Informationen)
 * Export in andere Formate (PDF, METS/MODS für DFG-Viewer, ZVDD, Europeana etc.)

Editor

 * generischer Editor, der RelaxNG/XML-Schema Strukturvorgaben umsetzen kann? z. B. realisiert mit Orbeon Forms
 * Hinzuschalten beliebiger Metadaten-Sets mit eigenem Formularschema, Editor paßt sich an

Viewer

 * Basisfunktionalitäten?
 * doppelseitige Anzeige (nicht nur 2 Scans nebeneinander!)
 * Erweiterungsmöglichkeiten
 * Integration von Digilib

Scans

 * Hosting auf verschiedenen externen Servern
 * Integration von Digilib
 * Hervorhebung von relevanten Partien (visual markup)

Datenformat
Digitization_Lifecycle_Data_Format

Generalisierung im Rahmen von Lifecycle

 * Referenzierung nicht nur von kompletten Digitalisaten sondern auch von einzelnen Seiten, Abschnitten oder auch nur einzelnen Passagen/Worten


 * Verlinkung in Digitalisate sowohl aus dem Intranet (etwa Forschungsdatenbanken) als auch aus dem Internet (beliebige Webdokumente). In dieser Phase lediglich Links aus intra/internet-Dokumenten in Digitalisate

Ev. als Weiterentwicklung von Lifecycle

 * ein System von separaten sog. Layers (vd. Digitization Lifecycle Requirements) das wissenschaftliches Arbeiten mit den Digitalisaten ermoeglicht (Virtual Workbench):


 * Verlinkung sowohl in Digitalisate als auch aus Digitalisaten heraus mit generischen Webdokumenten sowie (Intranet-)Datenbanken


 * Kommentierung von Passagen (Abschnitten, Seiten, Ausschnitten bis hin zu einzelnen Woertern) und Verlinkung mit weiteren Digitalisaten (Wissenschaftliche Edition!)


 * einfach bedienbares Tool zur Erstellung beliebiger (auch persoenlicher) Layer: auch externe Benutzer koennen Layer zu dem ihnen angezeigten Digitalisat kreieren und untereinander austauschen


 * Vorbereitung eines Layer-Editors zur Verlinkung und Kommentierung von Abschnitten, Seiten, Passagen


 * Layer-Viewer der einen ausgewaehlten Layer sowie die darin referenzierten Dokumente nebeneinander anzuzeigen vermag (ev. Layer-Editor und Layer-Viewer als gemeinsames Produkt)

= MPI für Bildungsforschung =

Projekte

 * Schriftenreihen des Instituts
 * Zwei Schriftenreihen des Instituts (147 vol. mit ca 41.000 Seiten) wurden bereits digitalisiert und mit grundlegenden Meta-/Strukturdaten (Verknüpfung mit OPAC-Daten, Sprungmarken zu Titel, Inhaltsverzeichnis, Literaturverzeichnis...) versehen. Sie sollen mit weiteren Strukturdaten, namentlich durch Erfassung von Inhaltsverzeichnissen, angereichert werden.


 * Ratgeberliteratur
 * Das MPIB plant die Image-Digitalisierung und die Erschließung von Erbauungsliteratur (in Fraktur) im Erscheinungszeitraum 19. und frühes 20. Jahrhundert. Es handelt sich derzeit um 23 Werke (ca. 7.000 Seiten). Diese Ratgeber sollen formal erfasst und mit Metadaten angereichert und als digitale Sammlung zugänglich gemacht werden. Dabei sollen Texte unterschiedlicher Eigentümer und Standorte in einer virtuellen Sammlung zusammengeführt werden. Hierfür zu führende Verhandlungen / zu treffende Vereinbarungen mit Leihgebern bilden einen Schwerpunkt des Projekts. Ein weiterer Schwerpunkt stellt die Erprobung von Fertigung, Anreicherung und Bereitstellung von Volltexten (Antiqua und Fraktur) dar. Das Projekt ist eingebettet in den Forschungsbereich ‚Geschichte der Gefühle‘.

Arbeitsschritte am Institut

 * Auswahl der Titel (durch WissenschaftlerInnen),
 * Prüfung ihrer Verfügbarkeit /Standortnachweise,
 * Identifikation von Leihgebern,
 * Vertragliche Vereinbarung über Ausleihe von Titeln, Versicherung und Überlassung von Digitalisaten (Kopien) bzw. Nutzungsrechte,
 * Ausleihe der Titel,
 * Auszeichnen von zu erfassenden Strukturdaten auf Kopien von Titelei und Inhaltsverzeichnissen,
 * Ggf. Auflistung weiterer, zu erfassender Meta-/Strutkurdaten auf separatem Laufzettel,
 * Abgabe der Titel an einen externen Dienstleister (nach Einholen von Angeboten) zur Image-Digitalisierung und Erfassung von ersten Strukturdaten,
 * Übermittlung der Scans/Digitalisate in TIFF und JPEG an das Institut,
 * Qualitätsprüfung durch Institut,
 * Ingest der JPEGs sowie der Titeldaten im MAB-Format aus dem OPAC bzw. aus einer externen Datenbank zur weiteren Bearbeitung mit Editor
 * weiterer Schwerpunkt: Volltexterfassung der in Fraktur vorliegenden Werke. Im Rahmen des Projektes sollen unterschiedliche OCR-Software getestet werden (z. B. Abbyy Fine Reader XIX, Adobe Acrobat-OCR). Die Ergebnisse (Qualität, Kosten, Vergleich zum double keying) werden in Form eines Leitfadens zusammengestellt.

Bibliographische und Strukturdaten

 * Bibliographische Daten als Export aus OPAC
 * Die Strukturdatenerfassung erfolgt (nach Auszeichnung durch Institut, s.o.) in einem ersten Schritt durch einen externen Dienstleister, in einem zweiten Schritt dann inhouse für die ggf. weitergehende Erschliessung.
 * Metadatenset umfassender, aber kompatibel mit DFG-Set. Soll personalisierbar und erweiterbar sein. Sinnvoll wäre ein benutzerdefiniertes Strukturdatenset pro Institut/pro Bearbeiter/pro Band/Werk/Gattung.


 * vorläufiges Strukturdatenset:
 * Abschnitt
 * Anhang
 * Band
 * Danksagung
 * Deckel
 * Einband
 * Einleitung
 * Frontispiz
 * Gebet/Gedicht
 * Illustration
 * Imprimatur/Druckerlaubnis
 * Inhaltsverzeichnis
 * Initial(schmuck)
 * Kapitel
 * Leere Seite (Vakat)
 * Monographie
 * Sonstiges
 * Teil
 * Titelblatt
 * Verlagsanzeige/Werbung
 * Vorsatz/Nachsatz
 * Vortitelblatt
 * Vorwort
 * Widmung
 * Zwischentitelblatt


 * Schnittstellen zum Austausch der Metadaten in andere Verzeichnisse, Portale, allg. Kontexte

Editor

 * benutzerdefiniertes Strukturdatenset
 * Editor muss selbst durchsuchbar sein
 * es muss möglich sein, später erfassten Volltext einzubinden
 * Hilfe-Funktion dazufügen
 * Hinzufügen einer immer sichtbaren toolbox
 * Anreicherung mit Normdaten (--> Referenznetzwerk)
 * Editor sollte über eine XML-Schnittstelle für den Datenaustausch verfügen
 * Das Digitalisat (JPEG) mit vereinheitlichter Dateibenennung muss problemlos in den Editor eingespeist werden (z. B. über eine XML-Schnittstelle) und optimal bearbeitet werden können im Editor. Dazu soll der Editor generisch programmiert sein, und möglichst offen sein für denkbare Erweiterungen, die im nicht konkret voraussehbaren Einzelfall wünschenswert sind . Nach dem Motto: Der Editor passt sich dem User und seinen Wünschen an.
 * Das Digitalisat muss einfach und intuitiv zu handhaben sein beim Bearbeiten, u. a. immer zu sehen und größenvariierbar.
 * Die Arbeitsschritte sollten so einfach wie möglich gehalten und zusammen ausgeführt werden können, Arbeitsschritte sollten nicht wiederholt werden müssen (z. B. ist eine Trennung von Paginierung und Gliederung und Seiten zuweisen nicht sinnvoll). Automatisierte Paginierung für anzugebende, durchgehende von-bis-Abschnitte wünschenswert für Bearbeitung von massenhaften Titeln.

Frontend / Viewer / Forschungsumgebung

 * Gemeinsame Portalseite als Einstieg in einzelne, auch direkt ansteuerbare Institutsportale; möglichst gleiche Viewer-Oberflächen in den unterschiedlichen Projekten.
 * Einstiegsseite des Instituts mit Projektbeschreibungen, Kooperationspartnern (Leihgebern) und Sucheinstiegen (Suche und Browsing).
 * Der Viewer muss im Text blättern und springen, den Text verkleinern, vergrößern und zoomen können.
 * Er muss die Möglichkeit bieten, in andere Datenbanken zu springen (und wieder zurückzufinden, neuer Tab), Bezüge zu anderen Werken anzuzeigen und dahin zu verlinken. So sollten z. B. Literaturangaben im Werk erfasst werden, recherchierbar und verlinkbar sein mit Normdaten einerseits und ggf. eigenen oder extern verfügbaren Digitalisaten andererseits.
 * Der Viewer muss Links/Bezüge zu anderen relevanten Werken (Referenzliste) ermöglichen.
 * Ziel sollte es sein, eine Bestandszusammenführung auf einer homogenen Benutzeroberfläche zu ermöglichen.
 * Indices für Namen, Geographica...
 * Wäre ein Tool denkbar, das autorisierten EndnutzerInnen das Definieren und Füllen von recherchierbaren Indices erlaubt? Ggf. Zusammenarbeit verschiedener Endnutzer? (nicht öffentlich sichtbar – oder zuschaltbar und als crowd-sourcing?)
 * Annotationsmöglichkeit für Endnutzer.
 * Elektronische Referenzierbarkeit auf Seiten- und Wortebene bzw. kleinstmögliche „Referenzeinheit“.
 * Persistente URLs.
 * Sichtbarkeit von Bereitsteller der Digitalisate und – ggf. abweichend – Eigentümer des Buches, sowie Vorschlag zu seiner Zitierung.
 * Unsere Ergebnisse sollen (als gemeinfreie Texte) über Portale und verschiedene andere Schnittstellen öffentlich zur Verfügung gestellt werden.

Datenformat / Datenmodell
Digitization_Lifecycle_Data_Format
 * Austausch verschiedener Datenformate muss möglich sein (unter Berücksichtigung des DFG-Viewers)

Volltexte

 * müssen integriert werden können in Editor
 * muss der Editor anzeigen und durchsuchen können
 * Testen verschiedener OCR hinsichtlich ihrer Fähigkeit, Fraktur zu erkennen (z. B. Abbyy Fine Reader XIX, ocropus)

Sich daraus ergebende Anforderungen - Zusammenfassung

 * Recherchefähige Aufbereitung von Inhaltsverzeichnissen
 * Verknüpfung mit/Nachweis in lokalen Katalogsystemen, Verbunddatenbanken, gemeinsamen Portalen der virtuellen Fachbibliotheken, Fachportalen (welche sind das???)
 * Verlinkung von erwähnten Orten in den Büchern zu GoogleMaps/Geodaten
 * (nach Erfassung von Volltext:) Nebeneinanderstellen von Digitalisat und Volltext
 * Übliche Navigationsmöglichkeiten
 * Verschiedene Größendarstellungen inkl. Zoomen, Thumbnails, doppelseitiger Ansicht der Scans (Eindruck eines Buches)
 * Browserkompatibilität
 * Suchoptionen: Schlagwortsuche, bibliographische Metadaten, Bildsuche, Personensuche, Suche im Literaturverzeichnis, Themensuche (in Form eines sog. Referenznetzwerkes, welches es erlaubt, in andere zum Thema passende Datenbanken zu springen)
 * Provenienz der Digitalisierungsvorlage im Metadatenset erfassen
 * persistente Adressierung
 * mehrsprachiger Editor und Viewer
 * Kompatibilität mit dem DFG-Viewer (inkl. Link auf lokale Präsentationsansicht)
 * Referenzierte Literaturliste (die in einem Werk zitierten Werke müssen erfassbar und recherchierbar sein)
 * Navigation erst innerhalb des Werkes, dann erst nach außen gehen
 * Erstellung von benutzerdefinierten Indices
 * Eigenschaft von / Qualität der Indices: erweiterbar
 * Kommentier-Funktion/Markierungen setzen
 * Download als pdf (seitenweise, Ganzes Dokument)
 * Export-Möglichkeiten als DTD, METS/MODS, DFG-Viewer

= Ergebnisse aus dem Protokoll vom 11./12.11.10 =

Paginierung

 * Wissenschaftliche Zitierbarkeit (Zitierlink - handle)
 * Button „Plausibilitätsprüfung“: Kontrolle über die Häufigkeit, Vollständigkeit und Plausibilität (z.B. Abbildung einer linearen Struktur) der Zuweisungen von Seitenzahlen zu Kapiteln und anderen Strukturtypen (Regelwerk notwendig).
 * Thumbnails in der Paginierungsübersicht (s. ECHO) – dienen auch der Plausibilitätsprüfung
 * Verso-Recto-Paginierung: welche Seiten teilen sich ein Blatt Papier, usw.
 * Spaltenzählung (z.B. für Zeitungen); Mehrfachpaginierungen
 * Nachträgliches Einfügen/Nummerieren von Seiten
 * Umgang mit nicht nummerierten, eingelegten bzw. auszufaltenden Seiten (evtl. via Paginierung > Format > Freier Text zu lösen)

Strukturdaten

 * gemeinsame Definition eines Basis-Sets von Strukturtypen Digitization_Lifecycle_Structural_Types
 * Schnellstmögliche Klärung der PND-Frage: Entweder Nutzung der PND oder von CONE (Control of Named Entities) (falls PND dort komplett abgebildet ist).
 * Live-Anbindung der PND – Zu überlegen ist, ob die Ablösung durch die GND (Gemeinsame Norm-Datei) abgewartet wird (Echtbetrieb ab Mitte 2011 geplant )
 * Konkordanzservice für verschiedene IDs/CONE kann als Normdatenkonkordanz fungieren
 * Ausreichende Kapazitäten für Strukturelemente schaffen:
 * Eingabefeld, z. B. für das Titelfeld mit flexibler Größe, das sich an die einzugebende Textmenge anpasst
 * Direktes Erstellen mehrerer Elemente eines bestimmten Strukturtyps (z. B. Kapitel), sowie die Voreinstellung, auf welcher Ebene neue Strukturtypen in der Gliederung angelegt werden sollen.
 * Sichtbarkeit von Urheber-IDs zur Unterscheidbarkeit gleichnamiger Autoren
 * Möglichkeit der Aufnahme von verschiedenen Identnummern in die Metadatenfelder; z. B. PND IDs anstelle von Namen
 * Versionierung
 * Einheitlichkeit der Masken
 * Je nach Medientyp soll das vorgegebene Set der Metadatenelemente ein anderes sein.