Digitization Lifecycle Meeting 2011-10-18/19/20

Digitization Lifecycle,MPDL

Allgemeine Angaben
Datum: 18.-20.10.2011 (Dienstag Beginn 13 Uhr; Mittwoch ganz, Donnerstag Ende Mittag; Donnerstag Nachmittag könnten sich vielleicht noch Arbeitsgruppen treffen?) Ort: Bibliotheca Hertziana, Rom

Teilnehmer
Bitte melden Sie sich an, indem Sie Ihren Namen hier eintragen.
 * Andrea Kulas (MPDL)
 * Anette Creutzburg (KHI)
 * Andreas Thielemann (Hertziana)
 * Klaus Werner (Hertziana)
 * Martin Raspe (Hertziana)
 * Lisa Pegelow (MPIB)
 * Rupert Kiefl (MPDL)
 * Sigrid Amedick (MPIeR)
 * Ingo Caesar (MPIeR)
 * Malte Dreyer (MPDL)
 * Markus Haarländer (MPDL)
 * Lu Yu (MPDL)
 * Wilhelm Frank (MPDL)
 * Kristina Koller (MPDL)
 * Jan Simane (KHI)
 * Ursula Flitner (MPIB)
 * Anna Klug (KHI)
 * Wolfram Zieger (KHI)

Affiliated Partner

Weitere Teilnehmer

Themenvorschläge für das Projekttreffen

 * Präsentationen der Arbeitsgruppen (15 Präsentation, 20 Minuten Diskussion; kritische Punkte bzw. umfassendere Themen sollten als separate Punkte in der Agenda erscheinen)


 * Workshop 2012 (Statusbericht, nächste Schritte)

MPDL

 * Demo-Anwendung Benutzeroberfläche (GUI Prototyp)


 * Demo-Anwendung Technischer Prototyp (Ingest(manuell) + Viewingumgebung (Scans, Volltext, TOC, Navigation etc.)) (20-30 Minuten + Diskussion)


 * Session Priorisierung Wissenschaftliche Funktionen; Gründung der AG Wissenschaftliche Funktionen und Vorstellung der aktuellen Priorisierungsentscheidungen, d.h Ergebnisse aus dem letzten Projekttreffen. Für diesen Punkt sollten ca. 1,5 Stunden zur Verfügung stehen.

Bibliotheca Hertziana

 * Demo-Anwendung Annotationen/Layers (20 Minuten)


 * Präsentation METS/MODS-Generation aus TEI, PDF-Erstellung aus TEI, automatisches Rendering im DFG-Viewer (15 Minuten)


 * "Werkstatt-Gespräch Neue Medien" (offen für gesamte Institut) am 18.10, 18-19:15. Themen werden sein: Faceted Browsing Rara Bibliotheca Hertziana; Portal VERO VERO.

Viewing Gruppe

 * Was bedeutet es, wenn unter DLC viele Institute gemeinsam arbeiten (Integration, gemeinsame Indexierung, zentraler Zugang, Suche in allen Sammlungen, Einfluss auf bestimmte Funktionalitäten)?
 * Suche / Filterfunktionen

Agenda
verabschiedet auf der Telko der Projektleitenden vom 29.09.11

Programm des Projekttreffens Rom, Bibliotheca Hertziana, 18.-20.10.2011 (Gesamtmoderation: Andrea Kulas)
 * Hinweis: Das Programm sieht explizite mail-Pausen vor; die Nutzung von Notebooks, iPads, Smartphones etc. während der Sitzungen ist nicht erwünscht.

Dienstag, 18.10.2011, 13.00 – 19.15 h

'''13.00 – 13:10 h: Begrüßung --Andrea 13:51, 12 October 2011 (CEST) Dieser Bereich ist neu eingefügt (dadurch hat sich die Zeit für die AG Viewing um 10 Minuten verkürzt)
 * 13:00 - 13:05 h: Begrüßung durch Herrn Thielemann
 * 13:05 - 13:10 h: Kurze Einführung und Statusbericht (Andrea Kulas)

13.10 – 14.45 h: Arbeitsgrupppen I: Bilanz und offene Fragen (Moderation: Andreas Thielemann)
 * 13.10 – 13.30 h: AG Digitalisierungsleitfaden (Lisa Pegelow)
 * 13.30– 13.50 h: AG Bibliographische Metadaten (Sigrid Amedick)
 * 13.50 – 14.45 h: AG Viewing (Anette Creutzburg)


 * 14.45 – 15.15 h: Erholungspause
 * 15.15 - 15.30 h: mail-Pause

15.30 – 17.30: Arbeitsgrupppen II: Bilanz und offene Fragen (Moderation: Jan Simane)


 * 15.30 – 16.15 h: AG Edit (Ingo Caesar)
 * 16.15 – 17.00 h: AG Format (inkl. Präsentation Hertziana: METS/MODS-Generation aus TEI, PDF-Erstellung aus TEI, automatisches Rendering im DFG-Viewer)(Klaus Werner)
 * 17.00 – 17.15 h: Export (Ingo Caesar)
 * 17.15 – 17.30 h: Ingest (Ingo Caesar)

18.00 – 19.15h: Werkstatt-Gespräch Neue Medien (Andreas Thielemann)

Gemeinsames Abendessen

Mittwoch, 19.10.2011, 9.00 – 18.00 h


 * 9.00 – 10.45 h: OCR (Moderation: Ursula Flitner)


 * 9.00 – 10.15 h: Dr. Markus Brantl: OCR-Einsatz bei Digitalisierungsprojekten der Bayerischen Staatsbibliothek


 * 10.15 – 10.45 h: OCR: Berichte aus der Projektgruppe


 * 10.45 – 11.15 h: Erholungspause
 * 11.15 – 11.30 h: mail-Pause


 * 11.30 – 13.00 h: Demo-Anwendung technischer Prototyp (Ingest, Viewing) (Markus Haarländer, Lu Yu) (Moderation: Jan Simane) --Andrea 13:51, 12 October 2011 (CEST) Die beiden Demo-Anwendungen habe ich in der Reihenfolge geändert.


 * 13.00 – 14.00 h: Mittagspause in der Bibliotheca Hertziana


 * 14.00 – 14.15 h: mail-Pause


 * 14.15 – 15.45 h: Demo-Anwendung Benutzeroberfläche (Rupert Kiefl) (Moderation: Malte Dreyer)


 * 15.45 – 16.15 h: Erholungspause
 * 16.15 – 16.30 h: mail-Pause


 * 16.30 – 18.00 h: Themenoffener slot: Vertiefung bisheriger Themen (Moderation: Andrea Kulas)


 * 18.15 h: Führung durch die Bibliotheca Hertziana

Donnerstag, 20.10.2011, 9.00 – 13.00 h

9.00 – 12.30 h: Wissenschaftliche Anforderungen (Moderation bis 10:30: Andrea Kulas)

[Ziel ist noch nicht die Erstellung einer Prioritätenliste, sondern das Anstoßen der Diskussion und der Entwurf einer Road map.]


 * 9.00 – 9.30 h: Uebersicht Entwicklungs/Nutzungsstand Annotationen / Layers (Klaus Werner))


 * 9.30 – 10.00 h: Ergebnisse der Dokumentenanalyse (Andreas Thielemann)

[Vorbereitung: http://colab.mpdl.mpg.de/mediawiki/Digitization_Lifecycle_Anforderungen hier die Tabelle „Sammlung der Anforderungen“ sowie die eingereichten Ur-Dokumente ansehen]
 * 10.00 – 10.30 h: eHumanities Projekte: Stand und Perspektiven (Malte Dreyer)


 * 10.30 – 11.15 h: Erholungspause
 * 11.15 – 11.30 h: mail-Pause


 * 11.30 – 12.00 h: Road map wissenschaftliche Anforderungen (Moderation ab 10:30): Sigrid Amedick)


 * 12.00 – 12.30 h: Workshop 2012 – Status und nächste Schritte (Andrea Kulas)


 * 12.30 – 13.00 h: Weiterer Zeitplan des Projekts (Andrea Kulas)

Dienstag, 18.10.2011, 13:00-19:15
[Protokoll: Andrea Kulas bis 15:30]

Statusbericht (Andrea Kulas )

 * 3. allgemeines Projektreffen nach 9 Monaten Laufzeit
 * Erreichte Ergebnisse (Auswahl):
 * Funktionstüchtige und sehr aktive Arbeitsgruppen
 * Etablierte Kommunikationsstrukturen: Protokollierte Telefonkonferenzen (Projektleiter, Projektmitarbeiter und AGs), Diskussion über Mailing-Liste (Hinweis: Derjenige der eine Diskussion beginnt, sollte das Ergebnis dann festhalten (z.B. auf Colab-Seite) bzw. die Diskussion auch zu einem Ergebnis führen), Colab-Seiten etc.
 * Erhebung der Anforderungen (siehe Objektbeschreibungen und Colab-Seite Anforderungen): Die Priorisierungsliste (welche auf dem letzten Treffen erstellt wurde) stellt eine Zusammenfassung dar. Die Kategorie "Must 5" enthält laut Entwicklern schon genügend Punkte und sollte rein von der Anzahl her nicht erweitert werden (Austausch ist natürlich möglich). Alle anderen aufgeführten Anforderungen können von den Entwicklern je nach Zeit etc. noch erfüllt werden. Siehe dazu auch das Protokoll von Donnerstag.
 * DLC Datenformat und TEI Minimal-Set
 * Erste "sichtbare" bzw. greifbare Ergebnisse: Funktionaler Prototyp (Ingest, View, Search) + GUI Prototyp (Viewing)
 * Herausforderungen & Ausblick:
 * Wunsch, dass MPDL & Institute noch stärker zusammenfinden (Arbeit an gemeinsamen Ziel)
 * Rolle der Projektkoordination: Unterstützung der Arbeitsgruppen, um eine gute Funktionsfähigkeit zu gewährleisten; Probleme erkennen und zu einer Lösung führen (entsprechende Personen kontaktieren). Ziel: die Ergebnisse der Arbeitsgruppen sollen einen verwertbaren Input für die Entwicklung bietet (e.g. GUI Prototyp kann mit zusätzlicher Dokumentation technische Spezifikationen zu einem gewissen Grad ersetzen). Unklare Spezifikationen stellen für die Entwickler immer eine Schwierigkeit dar. Aktuell konnte z.B. im Rahmen der Editing AG noch kein Ergebnis an die Entwickler vermittelt werden (verschiedene Sichten, wie das Ergebnis aussehen muss, führten hier zu Konflikten). In diesem Fall konnte auch die Projektkoordination keine Lösung herbeiführen. Die angestrebte Lösung besteht nun darin, dass in der Gemeinschaft bzw. in dem vorliegenden Treffen versucht wird, einen guten Weg für die Zusammenarbeit der AG und Entwickler zu finden.

13.10 – 13.30 h: AG Digitalisierungsleitfaden (Lisa Pegelow))
Struktur des Leitfadens


 * Leitfaden als eBook (lineares gezieltes Lesen möglich); PDF als export-Möglichkeit. Colab als Ort für die Erstellung des Leitfadens --Lisapegelow 13:45, 3 November 2011 (CET) ist ingesamt aktuell zu unübersichtlich; das Schreiben des Leitfadens könnte dann auf TitanPad erfolgen
 * aktuell Einfrierphase: Andrea Kulas erstellt in dieser Zeit Überblick über tools von DLC; Februar im Harnack-Haus: konkrete Arbeit am Leitfaden wird wieder aufgenommen, im März 2012 nächste Telko
 * Umfang: leicht lesbares Dokument, das man gerne in die Hand nimmt
 * Anleitung für DLC (viel wird dann auf Colab als input zu finden sein; Entscheidungen im Rahmen von DLC werden im theoretischen Teil sein, Anleitung für die tools sind im praktischen Teil zu finden) + Antworten auf die wirklich spannenen Fragen (-> welche sind dies?)

13.30 - 13:50 h: Bibliographische Metadaten (Sigrid Amedick))
[[Media: Bibliographische_MD_Frankfurt.ppt‎]]


 * Rom ist aktuell nicht in der Arbeitsgruppe vertreten -> wer nimmt aus Rom teil? (siehe Klärung dieser Frage im Block "Vertiefung bisheriger Themen")
 * Formatfragen für die Bibl. MD (MAB bwz. andere Formate) soll an den Instituten geklärt werden (Ziel ist es, der MPDL Daten unmanipuliert zukommen lassen zu können).
 * Schritt 1: Welche Formate können die Institute exportieren? (MAB, MODS, MARC 21...)
 * Schritt 2: Kleinsten gemeinsamen Nenner finden und der MPDL kommunzieren
 * Feldbenennungen (als input für die Viewing Gruppe: Was verbirgt sich hinter den Feldern Bibl. MD?) sollen auf MODS Felder konzentriert werden da MAB in DLC in MODS umgewandelt wird und somit MODS das primäre Format darstellt. Bitte daher in Zukunft die Feldbenennungen gleich auf MODS beziehen! Auch sollten in der Liste der Feldbenennungen die unterschiedlichen Sprachen für die Anzeige gleich mitaufgeführt werden.
 * Kurzanzeige der Bibl. MD soll in vier Wochen auf der nächsten Telko verabschiedet werden
 * Weitere Punkte siehe PPT-Folien.

13.50 - 14:30 h: Viewing (Anette Creutzburg))
[[Media: PräsentationAGViewing.pdf‎]]


 * Vorgehen zur Entwicklung GUI Prototyp hat reibungslos funktioniert, Zusammenarbeit im Team als auch mit Rupert Kiefl lief sehr gut
 * kurze Vorstellung GUI Prototyp
 * Ausblick:
 * Festlegung Wording: Viewing Gruppe arbeitet Vorschlag für sämtliche Labels bzw. Bezeichnungen und auch für Messages wie z.B. "upload war erfolgreich" aus, Bibliotheksleiter bekommen Vorschlag vorgelegt und können kommentieren
 * Erstellung schriftliche Dokumentation für Entwickler
 * Graphik & Gestaltung
 * Umsetzung GUI Prototyp technisch
 * Testen des GUI Prototypen (nutzerfreundlich, gut bedienbar, nicht zu kompliziert etc.) wird in die Session "Vertiefung bisheriger Fragen" übernommen (Hinweis von Rupert Kiefel: ein professionelles User Testing ist zeitaufwendig und im Projektplan nicht vorgesehen)
 * Dynamische Startseite für Institute aktuell durch die MPDL nicht vorgesehen -> siehe auch Diskussion in der Session "Vertiefung bisheriger Themen" bzw. später im Meeting

15.30 – 17.30: Arbeitsgruppen II: Bilanz und offene Fragen (Moderation: Jan Simane)
[Protokoll ab 15:30 Anna Klug]

15.30 – 16.15 h: AG Edit (Ingo Caesar)
[[Media: Editing_Konzept_Frankfurt.ppt‎]]

 Editing-Workshop: 
 * Termin: Mittwoch, 30.11.2011 ab 13 Uhr - Donnerstag, 01.12.2011, 15 Uhr (Rupert Kiefl hat am 26.10.11 die offizielle Einladung verschickt. Die Teilnehmer werden um Zusage über foodle gebeten.)
 * Ort: München, MPDL
 * Teilnehmer:
 * Ingo Caesar
 * Anna Klug
 * Lisa Pegelow
 * Martin Raspe
 * Klaus Werner
 * Wilhelm Frank
 * Markus Haarländer
 * Rupert Kiefl
 * Denise Unfried
 * Lu Yu

 Bezüglich des Web-Editors zu diskutierende Punkte: 


 * 1) Bevor über GUI-Details gesprochen wird, muss als erstes das Basiskonzept diskutiert werden und stehen. --MarkusH 15:52, 8 November 2011 (CET)
 * 2) Die Funktionalität des Rahmenziehens mit der Maus (Es handelt sich hier um eine im Web nicht übliche Desktop-Funktionalität.)
 * 3) Das Visualisierungsmodell: Liste an untereinanderliegenden Kästen mit Thumbnails oder lieber nur untereinanderliegende Thumbnails im Sinne eines auf Miniaturformat reduzierten pdfs?)
 * 4) Die Handhabung: intuitiv und schnell
 * 5) Die Strukturierung großer Bücher (>500S.): Zusätzliche "gehe zu"-Funktion und/oder separate Markierung von Start- und Endpunkten einer Struktureinheit?
 * 6) Die Mehrfachpaginierung
 * 7) u.a.

16.15 – 17.00 h: AG Datenformat (Klaus Werner)
Präsentation

 Vorstellung des Online-Xml-Mind-Editors 
 * Der Xml-Mind-Webeditor bietet eine graphische Nutzeroberfläche.
 * Eine Arbeit mit dem DLC-Minimal-TEI wäre auch über diesen Online-xml-Mind-Editor möglich.
 * Die Methode soll für die Arbeit mit DLC als digitaler Forschungsumgebung geprüft werden. Möglicherweise ist ein Erwerb der Lizenz (für ca. 800 Euro) über die MPG sinnvoll, sofern der Editor für das Projekt genutzt werden soll.
 * Grund für die Beschäftigung und Implementation externer Editoren: Hemmschwellenverringerung für externe wissenschaftliche Bearbeiter

 Thema: Social-OCR-Korrekturen (vgl. erfolgreiche Initiative der National Library) 
 * Das Thema muss gemeinsam mit der virtuellen Forschungsumgebung behandelt werden.

 DLC-TEI-Format:  Der Zugriff auf das DLC-TEI-Format soll künftig über Colab laufen: "DLC-TEI Download" --Andrea 10:59, 10 November 2011 (CET) Dieser Link ist auch über die Colab-Seite der AG Datenformat erreichbar.

 Webeditor: 
 * Fragen der Performance für große Werke und mehrere Bearbeiter sind zu lösen!

'''pdf-Export (Klaus Werner leistete Pionierarbeit):
 * Zur Pdf-Generierung notwendig:
 * Angabe des Formats der Scans
 * FO Rendering Engine
 * xsl-Scripte (Die offiziellen xsl-Scripte des TEI-Konsortiums wurden aufgrund schlechter Erfahrungen nicht verwendet.)
 * Aufbau der pdfs (mit Strukturbaum):
 * S.: Bibl. MD
 * S.: Kodikolog. MD
 * 1) Scans
 * Der Einbau des pdf-Exports für DLC wird von der MPDL geleistet!

17.00 – 17.15 h: Export (Ingo Caesar)
[[Media: Präsentation_Export_IngoCaesar.ppt‎‎]]


 *  Wie offen ist unsere DLC-Anwendung? 

 Unter anderem notwendige Schnittstellen: 


 * OAI: Fachspezifische Suchmöglichkeiten müssen gewährleistet sein!
 * side map: Vgl.: google hat OAI als Schnittstelle abgeschafft und verwendet jetzt side map.

''' Eine Priorisierung der Exporte durch die Institute steht noch aus! (-> MPDL-Statement) ''' --Andrea 11:02, 21 November 2011 (CET) Dieser Punkt ist aktuell nicht zeitkritisch da noch an der internen Struktur gearbeitet wird und Fragen in diesem Zusammenhang zuerst geklärt werden.
 * Es besteht der Wunsch nach Exportmöglichkeiten in alle gängigen Literaturverwaltungsprogramme (ZOTERO, citavi, endnote, u.a.)

17.15 – 17.30 h: Ingest (Ingo Caesar)
[[Media: Präsentation_Ingest_IngoCaesar.ppt‎]]


 * Die Prüfroutinen für die Berliner pbs sind zu spezifizieren!
 * Der Batch-Ingest soll möglichst automatisiert verlaufen!
 * Angedacht ist derzeit ein Batch-Ingest auf FTP-Basis mit Ordnerstrukturen -> siehe Session "Vertiefung bisheriger Themen"

Mittwoch 09:00-18:00
[Protokoll: Ingo Caesar bis 13:00, ab 13:00 Kristina Koller]

Vortrag von Dr. Markus Brantl (BSB)
[[Media: 2011-10-19_Brantl_Digitization_Lifecycle.pdf]]

Das VD 16 hat noch keine Volltexte. Die BSB wartet noch die Ergebnisse aus IMPACT ab. Die BSB arbeitet besonders mit Antiqua Texten mit OCR, Fraktur ist schwerer zu erkennen. Impact Folien

Lu Yu: Vorstellung des technischen Prototyps
Der technische Prototyp ist noch nicht online erreichbar; aktuell ist noch kein Server bzw. keine IP Adresse bereit gestellt worden

Ingest: Manuell editierbare Felder leiten sich aus dem großen Set ab (s. Excel-Tabelle). To Do: Die Pflichtfelder für die manuelle Eingabe definieren (AG Bibliographische Metadaten). --Andrea 11:08, 21 November 2011 (CET) Wichtig in diesem Zusammenhang ist, dass die Anzeige der bibliographischen Daten auf MODS basiert! Wichtiger Hinweis: alles, das nicht in MODS aufgeführt ist, wird nicht abgebildet.

Markus Haarländer: Knackpunkte
[[Media:DLC_OffeneFragen&Schwierigkeiten.ppt‎]]

Standards der TEI-Erkennung, Welche Auszeichnungskonvention wird zugrunde gelegt?

1. „TEI-Volltexte“ müssen einheitlich ausgezeichnet werden. Die Konvention sollte nach dem römischen TEI-Standard erfolgen. Hierzu benötigt wird eine Erfassungsanleitung (genaue Beschreibung, inwieweit sich das römische Format von den TEI-best practice Vorgaben unterscheidet) auch im Hinblick darauf, dass Dienstleister mit dieser Anleitung arbeiten sollen. Rom macht sich darüber Gedanken, was für oder auch gegen das ROM-TEI-Markup als einem neuen Quasi-Standard spricht. Zeitpunkt der Lieferung der Ergebnisse: Ende Oktober.

2. Batch-Ingest: Falls erforderlich, d.h. wenn die Exportmöglichkeiten der Instituts-OPACs divers sind, soll DLC mit verschiedenen bibl. Formaten umgehen können. Frankfurt wünscht sich für das MAB-datenmanagement ein Skript, welches eine „große MAB-Datei“, in der alle Datensätze einer Sammlung stehen, ausliest und automatisch den Image-Ordnern zuordnet. Rom, Florenz und Berlin sollen der MPDL ihre Export-Dateien für eine Analyse zukommen lassen, auch um jeweils die Zuordnungen zwischen den bibl. Einheiten zu identifizieren. Der Batch Ingest sollte möglichst allen Anforderungen gerecht werden. Optional lassen sich dann spezielle Features, wie etwa das aus Frankfurt anbieten.

3. Editing – Figure Element: Wie soll das Figure Element im Online-Editing sinnvoll abgebildet werden. Die Editing AG macht zu diesem Thema einen Vorschlag.

4. Digilib liefert teilsweise keine Bilder zurück. Hier muss noch an der Konfiguration gearbeitet werden. Da zuverlässige Rückliefern von Bildern funktioniert bei Jetty (Rom) einwandfrei. Der DLC Tomcat muss daher noch angepasst werden.

Demo-Anwendung Benutzeroberfläche
Feedback:
 * Eine Suche über bibl. MD und Volltexte wird ergänzt (aktuell muss das Suchergebnis für diesen Fall doppelt eingegeben werden) (Viewing AG)
 * Dynamische Facettierung (Facetten ergeben sich aus den Treffern): auf Grund langsamer Performance kann das bei großen Datenmengen nicht angeboten werden
 * Statische Facettierung (Facetten sind von vorneherein fest definiert): Machbarkeit muss geprüft werden (MPDL). Die statische Facettierung ist zum aktuellen Zeitpunkt noch von niedriger Priorität. Zuerst müssen grundlegende Suchfunktionaltitäten implementiert sein. Sobald relevant, können die Entwickler die Institute über die begrenzte Anzahl an möglichen Facetten informieren. Mögliche Facetten z.B. Mehrbandwerk ja oder nein?, Volltext ja oder nein? Eine Gruppierung nach Autoren ist keine statische Facette (sondern funktioniert dynamisch und ist somit nicht möglich) Eine genauere Information erfolgt noch durch die MPDL.
 * Suche: Bei historischem Material ist es wichtig, dass unterschiedliche Schreibweisen/Formen eines Namens mit einer Suchanfrage gefunden werden (Einbindung von Normdaten in CoNE, die dann wiederum mit der Suche von DLC verknüpft werden).

Wie geht es weiter mit dem GUI Viewing Prototyp?
 * 1) Das Feedback von den Entwicklern, wo eine Spezifikation fehlt und was technisch nicht machbar ist, wird auf CoLab gesammelt (Herr Haarländer). Diese Seite wird als zeitnahe Diskussionsbasis für weitere Fragen zwischen der Entwicklung und der Viewing AG verwendet.
 * 2) Das Feedback von der gesamte Projektgruppe wird eingesammelt (Viewing AG).
 * 3) Die Viewing AG erstellt die gewünschten fehlenden Spezifikationen.
 * 4) Basierend auf den Spezifikationen wird die definitive technische Machbarkeit der einzelnen GUI Elemente überprüft (Entwickler).
 * 5) Es werden verschiedene Konzepte für die grafischen Elemente des GUI Prototypen erarbeitet (Frau Unfried), die per Mail zur Abstimmung verschickt werden (Viewing AG).

Vertiefung bisheriger Themen
Dokumentation der Session [[Media:ThemenoffenerSlot.ppt‎]]

Viewing
Soll die Viewing Umgebung mit Wissenschaftlern getestet werden? Wenn ja, wann? Basierend auf dem GUI Prototypen oder dem technischen Prototypen?
 * Erst wenn ein erster Designvorschlag incl. Daten zur Verfügung steht, soll eine informelle Evaluierung an den einzelnen Instituten stattfinden.
 * Professionelle Usability Tests zur Evaluierung von DLC durch die GUI Abteilung der MPDL werden gewünscht. Dieser Bedarf wird festgehalten. Eine Durchführung solcher Tests ist aktuell aufgrund fehlender Kapazitäten nicht machbar.

Editing
Weiteres Vorgehen:
 * Ein Meeting mit dem Schwerpunkt GUI wird benötigt (noch dieses Jahr), bei dem auch die Entwickler präsent sind, um die technische Machbarkeit gleich zu klären (Herr Kiefl lädt nach München ein).
 * Umfang, Inhalt und Dauer des Meetings wird von der Gruppe separat geklärt (im Rahmen des Rom Meetings).
 * Die Vorbereitung des Meetings erfolgt in einer Telco.

Ingest
Weiteres Vorgehen:
 * 1) Jedes Institut klärt folgendes (koordiniert durch Frankfurt):
 * 2) * welche Ausgabeformate ihre Systeme bieten
 * 3) * wie die Daten und Verzeichnisse für den Batch Ingest aussehen
 * 4) * welche Art von Identifikator es zwischen den zusammengehörigen Volltexten, Scans und MAB Dateien gibt
 * 5) Basierend auf diesen Informationen gibt die MPDL Feedback, was für ein Batch Ingest in DLC machbar wäre. (Am einfachsten wäre eine eindeutige Ordnerstruktur pro Werk. Für Institute die eine große MAB Datei für mehrere Werke besitzen könnten außerhalb von DLC individuelle Skripte zur Umwandlung erstellt werden).
 * Die Frage, ob noch ein GUI für den Ingest erarbeitet werden sollte, wurde nicht diskutiert.
 * Die Minimalanforderungen, was für die Erstellung eines Werks in DLC vorhanden sein muss (z.B. Digitalisate, MAB, TEI) sind noch nicht definiert. --Andrea 11:20, 10 November 2011 (CET) Sind es Digitalisate + MAB-Daten (minimale Eingabe Titel etc.?) -> Bitte noch genau spezifizieren (Aufgabe für AG Bibliographische Daten?).

Weitere große, noch offene Themen

 * AA (Authentication & Authorization) --> AG (siehe unten)
 * Wissenschaftliche Szenarien
 * Externe Entitäten (Normdaten) --> AG bibl. Metadaten (siehe unten)

Arbeitsgruppen

 * AG bibl. Metadaten:
 * Es fehlt ein Vertreter aus Rom --> Sabine Winter, Kontakt wird durch Herrn Werner hergestellt.
 * Von Florenz aus wird ein Experte aus dem bibliografischen Bereich gewünscht --> Herr Simane tritt der Gruppe bei.
 * Koordinatorin + „Kümmererin“ ist Frau Amedick.
 * Die Bibliotheksleiter werden stärker mit in die Arbeit der Gruppe eingebunden.
 * Das Thema Entitäten wird auch von dieser Gruppe behandelt (mit Einbindung der MPDL vertreten durch Herrn Dreyer).
 * Nächste Aktion: Die aktuellen Vorschläge und eine ToDo Liste werden an die Gruppe verschickt (Frau Amedick).
 * Ein Treffen in Florenz wird organisiert (Herr Simane).
 * Die AGs Datenformat, Viewing und Editing werden wie gewohnt fortgeführt.
 * Die AG Digitalisierungsleitfaden nimmt nach einer vorübergehenden Pause ihre Arbeit wieder auf.
 * Die AG Anforderungen ist nicht mehr aktiv, sie wird wahrscheinlich später in die AG wissenschaftliche Szenarien überführt.

Authentication & Authorization

 * Eine AG wird benötigt, die beim nächsten Treffen im Februar gegründet wird (die MPDL sollte in dieser Gruppe vertreten sein).

Startseiten der Institute
Wie individualisiert kann/darf die Startseite jedes einzelnen Instituts sein?
 * Innerhalb von DLC müssen die Auftritte der Institute vom Design her einheitlich aussehen (Wunsch der Projektgruppe).
 * Statische (nicht editierbare) Institutsauftritte können von der MPDL geliefert werden.
 * Anforderung: Die Institute würden gerne ihre eigene Einstiegsseite selbst pflegen --> das ist technisch sehr aufwendig (entspricht einer CMS Funktionalität).
 * Evtl. wäre ein Wordpress Plugin (ähnlich wie in PubMan) auch für DLC interessant --> das müsste von der MPDL geprüft werden.
 * Weiteres Vorgehen:
 * Im Rahmen des Entwicklerfeedbacks an die Viewing Gruppe zu dem GUI Prototypen wird auch Feedback zu den gewünschten Startseiten gegeben (was genau ist machbar und kann direkt von den Instituten editiert werden).-> Entwickler informieren Institute über veränderbare Felder -> Besprechung dann in der nächsten Telko Viewing AG
 * Wenn die Machbarkeit geklärt ist, müssen die Institute gemeinsam abstimmen, ob ihnen das technisch Mögliche ausreicht (Viewing AG).

Weiterentwicklung Digilib

 * Alle Weiterentwicklungen, die im Rahmen von DLC erfolgen, sollten an die Digilib Gruppe zurück fließen.
 * Es gibt Wünsche der Viewing AG an Digilib --> diese werden auf einer CoLab Seite gesammelt (Frau Creutzburg).

Vorstellung Kodikologisches Schema

 * Vorschläge:
 * Camel Case anstatt Unterstriche für mehrwörtige Begriffe verwenden.
 * Keine Abkürzungen verwenden.
 * Eine Revision des Schemas durch Rom ist geplant.
 * Anmerkungen zum Schema sollten in einer Telco besprochen werden.
 * Noch offene Punkte:
 * Wie wird das in DLC angezeigt? --Andrea 11:22, 10 November 2011 (CET) Es müssen die Spezifikationen vorliegen, wie die kodikologischen Daten angezeigt werden sollen
 * Sollen die kodikologischen Daten in DLC bearbeitbar sein?
 * Um das Schema in DLC verwenden zu können, wird noch ein Konverter benötigt.--Andrea 11:22, 10 November 2011 (CET) Ein Konverter ist nicht nötig, es muss einfach das Schema bekannt sein.

Donnerstag 9.00 – 13.00 h
[Protokoll: Lisa Pegelow]

Uebersicht Entwicklungs-/Nutzungsstand Annotationen / Layers

 * Präsentation Annotationssysteme

Ergebnisse der Dokumentenanalyse
--> s. dazu auch Diskussionspunkt [http://colab.mpdl.mpg.de/mediawiki/Digitization_Lifecycle_Meeting_2011-10-18/19/20#Road_Map_wissenschaftliche_Anforderungen Road Map wiss. Anforderungen]
 * offene Diskussion über die Tabelle Anforderungen
 * es stellt sich ein grundsätzliches Problem mit der Tabelle dar --> wie ist sie zu verstehen, zu lesen, zu gruppieren --> zu abstrakt, zu unstrukturiert
 * Prämisse: was soll wissenschaftlich alles mit den Digitalisaten/hochgeladenen Texten gemacht werden (können); wo soll das gemacht werden (können) --> Einbindung in den GUI Prototypen der AG Viewing wichtig; bereits jetzt muss beim GUI mitbedacht werden, wo die wiss. Anforderungen untergebracht werden können/sollen
 * Ergebnis:
 * Gruppierung der Anforderungen in:
 * 1. Ebene: Umgang mit Text
 * 2. Ebene: Text annotieren/kommentieren (über das hinausgehend, was dasteht)
 * 3. Ebene: Text/Bilder
 * Tabelle soll als Vorlage f. die Entwickler dienen hinsichtlich Spezifikationen/Grundtyp(en) von Funktionalitäten
 * in der Tabelle sind bspw. folgende Punkte noch nicht enthalten: OCR-Korrektur, Abkürzungsauflösung
 * allgemein stellt sich die Frage, welche Felder müssen editierbar sein

eHumanities Projekte: Stand und Perspektiven

 * Einblick in die aktuelle Antragslandschaft anhand von Beispielen

Road Map wissenschaftliche Anforderungen

 * [[Media:RoadMap_DLC.ppt]]
 * Grundsätzlich lässt sich hinsichtlich wiss. Anforderungen zusammenfassen:
 * 1. Inhalte: was soll wissenschaftlich gemacht werden mit wissenschaftlichen Texten? Sicht der WissenschaftlerInnen muss berücksichtigt werden
 * 2. Formate: wo sollen wissenschaftliche Tätigkeiten dokumentiert werden?
 * 3. Workflow: wer macht was wann?
 * 4. Werkzeuge: welche werden benötigt?


 * es wird eine offene Lösung benötigt, die flexibel auf Ergänzungen reagieren kann --> Stand-Alone-Lösung wichtig
 * Schnittstellen notwendig (auch Anbindung an moblie Endgeräte, Hinweis auf Web of Science)
 * Erstellen einer Schnittstellen-Definition und deren Spezifikation, dann Entwicklung der Layer-Anwendung (durch Martin Raspe, Klaus Werner, in enger Zusammenarbeit mit der MPDL). --Andrea 11:19, 21 November 2011 (CET) Martin Raspe wird den Entwicklern einen ersten Vorschlag zuschicken.
 * Anforderungs-Tabelle: Martin Raspe arbeitet hinsichtlich des Workflows an der Tabelle
 * alle Institute erarbeiten eine Workflow-Beschreibung f. das wiss. Arbeiten (Deadline: Ende Nov. 2011)
 * -Prolematik: Martin Raspe entwirft dazu ein Dokument ("Besinnungsaufsatz")
 * Rechtemanagement
 * Layer


 * Feedback der MPDL: November 2012 müssen die Entwickler das Produkt stabilisiert haben, dann erfolgt Migration --> daraus folgt, dass noch 9-12 Monate Entwicklungszeit zur Verfügung stehen


 * Treffen der BibliotheksleiterInnen + Malte Dreyer + Martin Raspe + Anna Klug im Januar 2012 in Florenz (Thema: AG wiss. Anforderungen)

Workshop 2012 – Status und nächste Schritte

 * [[Media:Workshop2012_DLC.ppt]]
 * Rainer Simon ist von Ingo Caesar angefragt worden --> Zusage
 * Ursula Flitner fragt beim CIS/München (http://www.cis.uni-muenchen.de/) wegen einer möglichen aktiven Teilnahme am Workshop nach. Thema: Volltext und Einbindung von Wörterbüchern zur besseren Texterkenung
 * Andrea Kulas lädt das MPI Wissensgeschichte (namentlich Jürgen Renn) ein
 * Antrag bei der Schloesmannstiftung wird durch Andrea Kulas gestellt
 * Die BibliotheksleiterInnen + Malte Dreyer treffen sich am 3./4.11.2011 auf der Herbsttagung der BibliothekarInnen der MPG (Geistes-, Sozial- und Humanwissenschaftliche Sektion) in Freiburg, um sich zum Thema Workshop zu beraten. --> Deadline bzgl. Entscheidung, ob Workshop durchgeführt, noch mehr verkleinert oder abgesagt (obwohl das nicht wirklich eine Option ist) wird: 10.11.2011

Weiterer Zeitplan des Projekts

 * MPDL definiert hinsichtlich der Machbarkeit die Prioritätenliste genauer
 * akuteller Zeitplan: [[Media:Arbeitsplan_Digitization_Lifecycle.xls‎]]