Digitization Lifecycle Projektleiter Telco 2011-07-01

Digitization Lifecycle,MPDL

Allgemeine Infos

 * Termin: Freitag, 01.07.2011
 * Uhrzeit: 14:00-16:00 Uhr

Einwahldaten:
 * Zugangstelefonnummer: 069 27113800
 * Für alle Teilnehmer gilt der Code: 54175#
 * 0 Operatorhilfe: Bei Problemen bzw. Fragen zum Handling der Telefonkonferenz können alle Teilnehmer mit dieser Tastenfolge Operatorhilfe anfordern.

Teilnehmer:
 * Malte Dreyer (MPDL)
 * Andrea Kulas (MPDL)
 * Andreas Thielemann (Hertziana)
 * Ursula Flitner (MPI für Bildungsforschung)
 * Sigrid Amedick (MPIeR)
 * Jan Simane (KHI)

Agenda:
 * Workshop 2012: Terminfestlegung; Besprechung Vorgehen für die Einladung von Vortragenden
 * eSciDoc Days 2011: Vortrag (Was? + Wer?) (+ Workshop?)
 * Herbsttreffen 2011: Festlegung Ort & Zeit & Themen
 * Entscheidungsgrundlage Digitalisierungsleitfaden: Abstimmung/Feedback bis zum 05.07.2011
 * GWDG als Host für DLC-Scans: kann MPDL mit GWDG i.A. aller Projektteilnehmer verhandeln?
 * Diskussion Strukturdaten und Strukturdaten-webEditor

Protokoll
Organisatorisches
 * die Telefonkonferenzen für die ProjektleiterInnen sollten auf diesen Personenkreis + eine Protokollierende Person beschränkt sein (d.h. insgesamt 6 Personen). Für die Projektmitarbeiter findet eine eigene Telefonkonferenz statt. Für die jeweilige Transparenz sind die Protokolle entscheidend.

Herbsttreffen 2011: Festlegung Ort & Zeit & Themen
 * Favorisierter Termin: 18.-20. Oktober (Di - Do), 1. Tag Beginn Mittag, 2. Tag komplett, 3. Tag Ende Mittag
 * Favorisierter Ort: weiterhin Rom (-> Andreas Thielmann klärt bis Montag ab, ob die Reservierung des Spiegelsaals möglich ist); Alternative: Florenz
 * Themen: Themenfestlegung Ende August / Anfang September. Fokusierung auf bestimmte Themen. Haben sich bis dahin die unten genannten Themen erledigt?

Workshop 2012: Termin & Ort; Besprechung Vorgehen für die Einladung von Vortragenden
 * Terminfestlegung: 22-24. Februar 2012
 * Ort: Harnack-Haus in Berlin
 * Vorgehen für die Einladungen von Vortragenden: Für jeden Vortrag gibt es einen Kümmerer. Diese Person macht einen Vorschlag für eine Definition/Inhaltliche Beschreibung des Themas und kontaktiert dann die entsprechenden Personen (siehe unten). Pro Sessionen gibt es immer zwei Vortragende (à 45 min.). Die nächste Telefonkonferenz ist am 15.7.2011. Die ersten Ergebnisse (Themen etc.) werden dann besprochen.
 * TEI/Linguistische Verfahren, Sprachtechnologie (Zwei Blöcke)
 * Laurent Romary (Thema: Stand und zukünftige Entwicklung von TEI) -> Malte Dreyer
 * Deutsches Textarchiv -> Ursula Flitner (Vorschlag für Thema + Person)
 * Weblicht Tübingen (Vorstellung der Plattform für linguistische Analysen) -> Malte Dreyer (Vorschlag für Thema + Person)
 * Mapping the Republic of Letters, Stanford Humanities Center -> Jan Simane (Vorschlag für Thema + Person)
 * Dateninfrastrukturen, Verwaltung großer Datenmengen (Ein Block)
 * Peter Wittenburg, Vorstellung des ESFRI Clarin Projekts -> Malte Dreyer
 * Jemand von BSB? -> keine direktorale Ebene -> Vorschlag: Markus Brantl -> Sigrid Amedick
 * Bilder (Layer, geschnipselte Digitaisate, Objektbetrachtung, Bildmanagement und -verarbeitung, Präsentationsumgebung) (Zwei Blöcke)
 * Lineamenta -> Andreas Thielmann (Vorschlag für Thema + Person)
 * Cenobium -> Jan Simane (Vorschlag für Thema + Person)
 * [Imeji als Reservemöglichkeit -> Malte Dreyer]
 * Hypercities -> Ursula Flitner (Vorschlag für Thema + Person)
 * RIBA (Royal Institute of Britisch Architects) Direktorin der Bibliothek? -> Jan Simane (Vorschlag für Thema + Person)
 * Referenzieren, Referenzdaten/Annotieren (Zwei Blöcke)
 * Herbert Van de Sompel (Open Annotation Colaboration) -> Malte Dreyer
 * Getty -> Jan Simane (Vorschlag für Thema + Person)
 * Dehli Maps -> Ursula Flitner (Vorschlag für Thema + Person)
 * Google -> Malte Dreyer (Frage: Pläne von Google, etwas Intelligentes mit Texten zu machen?) (Vorschlag für Thema + Person)
 * Michael Götze (Europeana Local Deutschland an der Zentral- und Landesbibliothek Berlin) -> Sigrid Amedick
 * Themen und Beitragende auf der Warteliste
 * Bamboo -> Malte Dreyer
 * Million Books Projekt
 * Johns Hopkins Univ.?
 * Eröffnungsvortrag: Dieser Vortrag sollte von DLC kommen. Wichtig ist, dass wir uns auch bemerkbar machen bzw. darstellen.


 * Titel für die Veranstaltung: Englischer Titel + kurz (zwei Worte?) (möglich: Untertitel zur weiteren Eingrenzung)
 * Namensvorschläge, Anregungen: Seminar, Humanities, MPG, eHumanities, Humanities online, bringing resources online, MPG eScience Seminars, Excellent services for excellent research, research online, digital tools for Humanities
 * Weiteres Vorgehen: Bis Freitag, 8.7.2011, Vormittag schickt Jeder ein paar Namensvorschläge per Email an den Kreis der ProjektleiterInnen


 * Infoflyer/Infoblatt für die Veranstaltung (bis 15.7.2011)
 * Für die Veranstaltung sollte ein Infoflyer/Infoblatt angefertigt werden, um die Vortragenden besser ansprechen zu können -> AG Veranstaltungen (Caesar/Kulas). Das Infoblatt enthält folgende Elemente: Ziel/Allgemeines/Thema/Titel der Veranstaltung, Zielgruppe, Zeit, Ort, Message statement für die einzelnen Sessions bzw. Blöcke. Grober Tagungsplan (als erste Richtschnurr für die Vortragenden)
 * Reisekosten Pauschalen für die Vortragenden: Überblick über die Höhe der Reisekosten -> AG Veranstaltungen (Caesar/Kulas) (bis 15.7.2011)

 Urlaubszeiten & Erreichbarkeiten


 * Jan Simane ab 8.7.2011 (für vier wochen)
 * Andreas Thielemann ab 8.7.2011 (bis 23.8.)
 * Sigrid Amedick 1. Augusthälfte
 * Malte Dreyer ganzer August
 * Ursula Flitner?

'''ESciDoc Days 2011 (26.-27. Oktober 2011): Projektdarstellung 5 - 10 Minuten im Rahmen der ESciDoc Talks -> Vortragende: Andrea Kulas, gebrieft von BibliotheksleiterInnen auf dem zuvor stattfindenden Romtreffen

Feedback Digitalisierungsleitfaden
 * Allgemein: regelmäßiger Entscheidungsvorlagen für die ProjektleiterInnen einfordern! Die Gruppenleiter der AGs sollten die Möglichkeit nutzen, an die ProjektleiterInnen regelmäßige Berichte zu schicken. Aktuell ist die Transparenz hier noch subotimal -> Gute Aktion der AG Digitalisierungsleitfaden. Praktisch gibt es jedoch noch einige Punkte an der Vorlage zu verbessern.
 * Zielgruppe: Leitfaden für Infospezialisten/Biliothekare der MPG + wissenschaftler, welche sich mit DLC Tools beschäftigen wollen bzw. diese für Ihre Forschung einsetzen wollen. Entscheidungsträger werden nicht spezifisch mit dem Leitfaden angesprochen.
 * Es gibt nicht den Leitfaden!!!! 1. Frage: Leser muss ich klar werden, was er vorhat, anhang Selbstklärung verschiedene Einstiegspunkte in Text, Entscheidungsmatrix am Anfang (-> Idee Leitfaden als ein Art Wegweiser gute Idee). Eine Unterscheidung wäre z.B. kleine Projekte, Massenprojekte (verschiedene Vorhaben).
 * Themen das Leitfadens (Umbenennung zu Handbuch ?): Leitfaden zu DLC, was brauchen wir dazu?, was muss man für Daten haben (wie haben wir Daten dazu vorbereitet)? Vetragstemplates, Abfallprodukte, die wir sowieso haben. Dienstleister, OCR Software, Erfahrung mit Lösung einzelner praktischer Details (Erinnerungsstütze in CoLab), Literaturliste zusammenstellen, Gebrauchsanweisung unserer Tools dabei? (hier Dopplung mit Hilfefunktion in DLC vermeiden); Ziel: unsere Produkte sollen genutzt werden. Roter Faden in der Themenführung des Leitfadens muss noch entstehen.
 * Hinweis: ETH Zürich Best Practices Digalisierung.
 * Feedback für AG Digitalisierungsleitfaden über das Protokoll und über Frau Flitner

'''GWDG als Host für DLC-Scans: zentrale oder dezentrale Speicherung Frage der Institute: Warum die scharfe Trennung zwischen Derivaten + Originalserver?
 * Frankfurt: zentrale Lösung bevorzugt
 * Berlin: zentrale Lösung bevorzugt + Lösung jetzt benötigt -> MPDL klärt das ab + schickt Informationen an die Institute ! + Berlin und Frankfurt belegen gemeinsamen Server bei der GWDG
 * Rom: eigene Lösung für die Speicherung der Tiffs
 * Florenz: eigene Lösung für die Speicherung der Tiffs

Diskussion Strukturdaten und Strukturdaten-Webeditor


 * Ausgangspunkt Frankfurt: Virr editor (Strukturtypen & details) lassen sich in einen Web-Editor überführen (mit TEI als Exportmöglichkeit, TEI besteht in diesem Fall aus einem Minimal-Set an TEI Elementen). Frage von Frankfurt: Können Strukturdaten hinreichend genug in TEI untergebracht werden? Aktuell gibt es nun mehrere Vorschläge, keine der Lösung scheint befriedigend zu sein. Wichtig ist, dass hier keine Lösung gefunden wird, welche von der DLc-Anwendung abgekoppelt ist bzw. nicht Standards entspricht. Können wir eine gute Lösung für den speziellen Fall der bibliographische Metadaten unselbstständiger Werke finden? Ziel: nicht proprietäres Format + Webeditor mit dem man Strukturdaten erfassen kann. Gemeinsames Set ist hier angestrebt.
 * Eine Editierbarkeit der Strukturdaten & Details unbhängig vom Volltext TEI ist unproblematisch (könnte in separater TEI Datei abgespeichert werden -> Klärung erfolgt noch durch die MPDL). Schwierigkeiten entstehen in der Kombination mit TEI Volltext d.h. wenn diese Informationen mit dem TEI Volltext verknüpft werden sollen (aktuelle Lösungsvorstellung der MPDL: IDs zuweisen). Spezielle Problematik: wenn Vollltext TEI nach der Erstellung der Strukturdaten online hochgeladen wird oder wenn Volltext TEI später ausgetauscht wird. Alte Informationen sind dann überschrieben. -> Die MPDL wird ihre Vorstellungen bzw. Möglichkeiten in dieser Frage den Instituten zukommen lassen.
 * Zu klärende Frage für den online-Editor allgemein: -> welche Unterteilungen gibt es (Strukturtypen) + was will ich reicher auszeichen (Details)? (diese Fragen sollte in der AG Editing geklärt werden)

Datenformat

Ursprünglich sollte es ein TEI Datenformat mit ca. 20 Elementen geben. Ingesamt ist das TEI Datenformat nun auf 180 Elemente angewachsen. Frage: Was ist das gemeinsame DLC Schema? Hier ist noch keine Abstimmung erfolgt. -> Von der AG Datenformat wird ein Zwischenbericht erwartet.

Ziel: Minimum TEI Set definieren (für Export aus DLC + online Editor). TEI Volltext mit 180 TEI Elemente wird ingested, gespeichert und angezeigt. Die Struktur im Web-Editor wird vrsl. ebenfalls in einem separaten TEI mit einem minimalen Set an Elementen abgespeichert. Die online erstellte Struktur + erstellte Paginierung kann somit online bearbeitet werden. Das TEI mit 180 Elementen (dieses Format ist nicht proprietär) kann dagegen nur auf dem Desktop berarbeitet werden.

Nächste Telefonkonferenzen
 * Freitag, 15. Juli 13 Uhr (Teilnehmer alle außer Jan Simane und Andreas Thielemann): erste Ergebnisse workshop 2012 Themen & Personenrecherche
 * Ende August/Anfang September nächste gemeinsame Telefonkonferenz (alle ProjektleiterInnen), schriftlicher Zwischenstand auf Wiki-Seite (Stand workshop 2012)