Digitization Lifecycle Meeting 2012-02-24

Digitization Lifecycle,MPDL

Allgemeine Angaben
Datum: 24.02.2012, Freitag, 9 Uhr bis 17:30 Uhr Ort: MPI für Bildungsforschung, Berlin

Teilnehmer
Bitte melden Sie sich an, indem Sie Ihren Namen hier eintragen.
 * Andrea Kulas (MPDL)
 * Anette Creutzburg (KHI)
 * Martin Raspe (Hertziana)
 * Lisa Pegelow (MPIB)
 * Sigrid Amedick (MPIeR)
 * Ingo Caesar (MPIeR)
 * Malte Dreyer (MPDL)
 * Markus Haarländer (MPDL)
 * Lu Yu (MPDL)
 * Ursula Flitner (MPIB)
 * Anna Klug (KHI)
 * Andreas Wenzel (MPIB)

Themenvorschläge für das Projekttreffen

 * Nachbesprechung des DLC-Workshops "Mapping the Landscape of E-Research" (22.-23.02.12 im Harnackhaus in Berlin)
 * Besprechung des technischen Prototypen (Anmerkung Telko Projektmitarbeiter 26.01.12: Wichtig ist, dass jedes Institut den technischen Prototypen anhand eigener Dateien bereits im Vorfeld in Augenschein nehmen kann, um Problempunkte zu identifizieren.)
 * Thema "Rechtemanagement" (?)
 * ausführlicher Statusbericht (1 Jahr DLC)
 * Wiederaufnahme AG Digitalisierungsleitfaden, Neugründung der AG Erweiterung Wissenschaftliche Funktionen könnten noch Raum einnehmen, sollten jedoch nur sehr kurz behandelt werden

Agenda
Freitag, 24.02.2011, 09.15 – 15.45


 * 09.00 – 10:30: Nachbesprechung DLC-Workshops "Mapping the Landscape of E-Research" (Moderation: Ursula Flitner)
 * Was können wir für DLC vewerten?
 * Was folgert sich für das weitere Programm in DLC daraus?
 * 10:30 - 10:50: Pause
 * 10:50 - 12:50: Technischer Prototyp (Moderation: Klaus Werner)
 * Kurzvorstellung aktueller Stand Prototyp (MPDL)
 * Diskussion über die Erfahrung der Institute mit dem Prototypen (Achtung!: noch keine Testumgebung)
 * 12:50 - 13:50 Mittagspause
 * 13:50 - 15:50 DLC Reflexion (Moderation: Sigrid Amedick)
 * Statusbericht + Rückblick (Andrea Kulas) + Kurzpräsentationen (5 Minuten) der Insitute
 * Diskussion über den erreichten Stand + Ausblick
 * 15:50 - 16:30 Wissenschaftliche Funktionen - weiteres Vorgehen + Abschluß --> verschoben auf Mai-Treffen

Protokoll
Protokollantin: Lisa Pegelow

9.15-10.30 	Nachbesprechung DLC-Workshop (Moderation: Ursula Flitner)

Nachnutzbarkeit als Ideal – Annotationen – digilib – Organisatorisches

Der Workshop hat u.a. nochmals verdeutlicht, wie komplex TEI als Format ist, und wie begrenzt interoperabel es darum ist. In der Nachbesprechung diskutiert wurde eine mögliche Übernahme des DTA-Formats für DLC. Diese Option soll durch die AG Datenformate gründlicher geprüft werden.

Die MPDL setzt auf Nachhaltigkeit bei der Entwicklung von DLC. Ziel von DLC sollte darum auch eine einfache Nachnutzbarkeit des Produktes sein. Schön wäre, DLC seinerseits könnte über Schnittstellen auch Vorhandenes integrieren. Wie im Grunde alle während des Workshops vorgestellten Projekte erkennen ließen, ist eine Kompatibilität jedoch nicht einfach herzustellen. Die Projekte bearbeiten je ein spezielles Themenfeld – und ihre Spezifizität hat eine Berechtigung. Wollte man Anwendungen ausschließlich generisch programmieren, schränke man sich auf Kosten der Primäranwendung, für die programmiert wird, zu sehr ein.

Wenn also die Übernahme vollständiger Tools wenig realistisch ist, kann und soll dennoch Ausschau gehalten werden nach brauchbaren Entwicklungen, die ggf. in einzelnen Aspekten nachgenutzt werden können. Und wenn gar nicht im technischen Sinn, dann jedenfalls als Ideengeber. Die ewig neue Erfindung des Rads soll vermieden werden.

Namentlich eine Integration von linguistischen Tools wäre wünschenswert (z. B. durch Kooperationen mit dem DTA und CIS hinsichtlich der Nutzung von linguistischen Suchmaschinen und Wörterbüchern). Wenn die Einbindung solcher Tools in DLC jetzt auch nicht vorrangig betrieben werden kann, werden bilaterale Kooperationen begrüßt, die dann ggf. später ausgeweitet werden können.

Als möglicher Kandidat für Nachnutzung in DLC wurde auch das Annotationstool YUMA angesprochen, das während des Workshops gezeigt worden war. Dagegen eingewendet wurde jedoch, dass YUMA Google Code benutzt, der nicht modifizierbar ist. (Ist das tatsächlich so, nicht modifizierbar? --Caesar 15:40, 7 March 2012 (CET))

Die Einbindung von Annotationstools in digilib ist lt. Herrn Raspe vorgesehen. Ein eigener Annotationsserver soll aufgesetzt werden, u. a. Angaben zum Annotierenden sollen erfasst und sogar die Möglichkeit geschaffen werden, Annotationen zu kommentieren. Kontrovers diskutiert wurde die Einsatzfähigkeit von digilib in DLC: die derzeitigen Performanz-Probleme des Programms(manchmal erscheint überhaupt kein Bild) wurden unterschiedlich als angesichts seiner übrigen Vorteile zumutbar und als zu gravierend eingeschätzt. Dauerproblem sind mangelnde Personalressourcen zur kontinuierlichen Weiterentwicklung von digilib. Jüngst haben Herr Raspe und Herr Castis erneut eine Woche investieren können: Respekt und Dank hierfür ist ihnen sicher. Es handelt sich hierbei aber mehr oder minder um ein „Privatvergnügen“ der engagierten Entwickler, in deren Arbeitsportfolios keine Zeiten hierfür ausgewiesen sind.

Im Laufe des Workshops waren ganz unterschiedliche Varianten von Annotationstools zu sehen. Einigkeit bestand darin, dass im DLC-Kontext noch Definitionsarbeit zu leisten ist: was verstehen wir unter Annotation und mit welchen Funktionen wollen wir ein solches Instrument ausstatten? Vielleicht können uns die Kriterien der Open Annotation Collaboration als Vorlage dienen. Vereinbart wurde ein Annotationsschwerpunkt beim nächsten DLC-Treffen in Frankfurt.

Die Organisation des Workshops galt als gelungen. Bedauert wurde, dass die ModeratorInnen, deren Einführungen in die einzelnen Themen recht gehaltvoll waren, nicht im Programm aufgeführt waren. Als unglücklich wurde vorrübergehend auch empfunden, dass das eigene Projekt zu wenig konkret vorgestellt wurde, während andere Projekte ausgeleuchtet wurden. Dies schien jedoch gerechtfertigt, da unser Projekt – im Gegensatz zu den vorgestellten – als noch in den Kinderschuhen steckend bezeichnet werden kann.

10.55.-11.40 	Feature-Liste (Andrea Kulas)

allgemein begrüßt wurde die von Frau Kulas vorgestellte, neue Feature-Liste in CoLab, die folgende Vorteile vereint:
 * To-Do-Liste für Entwickler/in --Andrea 12:54, 1 March 2012 (CET) To-Do-Liste ist hier nicht der korrekte Ausdruck. Es ist eine Feature-Liste und Preisliste von DLC. Daraus ergeben sich dann die Aufgaben der Entwickler. Sobald die Angaben zum Preis (d.h. Entwicklerzeit) vorhanden sind, können wir alle im Projekt erst sehen, was möglicher Weise bis 31.1.2013 nicht mehr umgesetzt werden kann. Daher kann die Liste nicht 1:1 in eine To-Do-Liste umgestaltet werden.
 * Feature-Überblick und Anzeige des Entwicklungsstandes für alle DLC-ler --Andrea 12:54, 1 March 2012 (CET) ja, aber erst sobald das Ampelsystem in der Liste integriert ist. Idealer Weise können die Institute dann später den Entwicklungsstand über JIRA verfolgen. Aktuell haben wir nur diese Excel-Liste.
 * Orientierungshilfe auch für den Digitalisierungsleitfaden

Die Feature-Liste enthält namentlich auch eine „Preis“-Spalte, die über den Arbeitsaufwand für das jeweilige Programmierelement Auskunft gibt.

Seitens der Institute gewünscht ist noch die Einbindung einer Ampel, die anzeigt
 * rot = nicht in Entwicklung
 * gelb = derzeit in Entwicklung
 * grün = fertig

Ebenso sollte erkennbar gemacht werden, wann ein Modul/eine Funktion zum Testen durch DLC-Anwender freigegeben ist. Das Ausgangs-Dokument wird auf CoLab gestellt (KW 10). To Do: Feedback der Institute zu Fragen der Entwicklung per Mail grundsätzlich parallel an Andrea Kulas/Wilhelm Frank erbeten. MPDL sammelt zunächst alle Anmerkungen/Fragen, dann gibt es eine große Telko. Alle 2 Wochen verschickt Andrea Kulas über die Liste eine aktualisierte Version; erstmals ab KW 11, mit gefüllter Spalte „Preisliste“. --Andrea 12:59, 1 March 2012 (CET) Das Verschicken alle zwei Wochen würde ich noch etwas unter Vorbehalt sehen. Etwas hängt das auch von der Schnelligkeit der Veränderungen hab. Es wird hier jedenfalls einen regelmäßigen Update-Mechanismus geben (bis, was ich hoffe, alles in JIRA übergeht (-:).

11.45-12.55 	Technischer Prototyp (Lu Yu)

Drei verschiedene Anwender-Rollen sind vorgesehen:
 * System-Administrator: Organisationseinheiten-Administrator (OU) anlegen (MPDL)
 * OU-Administrator: Collections für einzelne Institute anlegen (Institute)
 * User:
 * Depositor: kann eigene Sammlungen erstellen, hochladen und bearbeiten
 * Moderator: kann seine u. Sammlungen anderer bearbeiten und führt eine Qualitätskontrolle durch

In der Diskussion des Prototypen wurden folgende Wünsche der Institute formuliert:


 * 1) Die Portaleinstiegsseite des jeweiligen Instituts soll vom eigenen Institut gepflegt werden können. --Andrea 12:54, 1 March 2012 (CET) Das ist mein Wissenstand (als Widerspruch zu der Aussage hier): Bei einer zentralen Instanz von DLC, die von der MPDL gehostet wird, kann es keine zentralen Institutsseiten geben, welche von den Instituten verändert werden können. Die Seiten für die Kollektionen können von den Instituten manipuliert werden. Wenn DLC auf eigenen Servern der Institute installiert wird, dann können die Institute hier natürlich machen was sie wollen, d.h. die eigenen Institutsseiten erstellen und manipuliereren etc. Bei diesen eigenen Installationen sind die Daten nicht in eSciDoc abgespeichert, somit hat man hier auch nicht den Vorteil der Langzeitarchivierung und gemeinsamen Datenspeicherung. --Caesar 15:50, 7 March 2012 (CET) Meines Wissen wollen die Institute wenigstens die einmal von der MPDL angelegten Institutsangaben später autonom verwalten.
 * 2) Einbindung des Boolschen Operators „UND NICHT“ in die erweiterte Suche
 * 3) Parallele Anzeige von physischer Scann-Nummer und logischer Seitenzahl (logische zuerst)
 * 4) digilib wird (nur, und) nicht automatisch für die Anzeige der Einzelseite verwendet
 * 5) Suche in Volltext bekommt ein eigenes Suchfeld
 * 6) Anzeige der Trefferanzahl fehlte offenbar noch als Anforderung; sollte noch mit aufgenommen werden
 * 7) Thumbnails-Qualität muss noch verbessert werden: eine Einigung auf die Größe der verschiedenen Auflösungen steht noch aus.

An dieser Stelle war ein Dank an die Entwickler/innen fällig und ging etwas unter. Darum hier noch einmal schriftlich: vielen Dank für die gute Arbeit!

14.00-15.45 	DLC Reflexion (Andrea Kulas)

[Präsentation]

Beim Test-Ingest der Dateien aus den Instituten gab es verschiedene Probleme, die von der MPDL noch an Institute gemeldet werden.

Problem MAB-Datei: Frankfurt erarbeitet eine Vorlage, um den Sachverhalt noch einmal zu verdeutlichen und reichert das Florenz-Protokoll mit Beispielen an.

Lt. Malte Dreyer noch in der Diskussion sind drei unterschiedliche Bereiche für Uploads von Bildern, Texten und Metadaten.

In die Feature-Liste muss noch mit aufgenommen werden:
 * MAB-Thematik
 * Wissenschaftliche Anforderungen (Annotationen)
 * Migration von Daten (vornehmlich Daten aus Frankfurt)

Allgemeines - To Do AG bibliografische Metadaten: Wer ist der/die Ansprechpartner/in in Florenz?

AG Datenformat: DTA-Basisformat dem DLC-TEI-Format gegenüberstellen mit dem Ziel, die Möglichkeit einer Übernahme des DTA-Basisformats zu prüfen.

AG Digitalisierungsleitfaden: Ende Februar/Anfang März (vor Telko der AG am 7.3.) schicken AG-Teilnehmer an Koordinatorin der AG ihre bis dahin erarbeiteten Entwürfe

Telkos: Als sehr vorteilhaft gilt, wenn Entwickler/innen jeweils an den Telkos der AGs teilnehmen. Der direkte Rückbezug auf Entwickler-Know-how wird als äußerst Effizienz steigernd geschätzt. Also bitte weiter so!

Betreffzeilen in Mails an die Liste mit Bedacht/aussagekräftig wählen.

CoLab aufräumen: auf Kategorie-Ebene notieren, welche Seiten mitunter veraltet sind. Inhalte, die die Öffentlichkeit sehen kann, weil abgeschlossen/fertig, freizuschalten, wurde auf später verschoben.

Vorlagen als Arbeitsgrundlage, an der sich abgearbeitet werden kann, werden allseits geschätzt und der Vorsatz gefasst, solches Vorgehen weiter zu praktizieren. Gleich gibt es auch einen Anwendungsfall:

To Do: Jedes Institut ist aufgefordert zusammenzufassen, was und wie es annotieren will bzw. unter Annotation versteht. '''Deadline: 15. Mai 2012'''. Hier können die Überlegungen zu Annotationen der einzelnen Institute abgelegt werden.

Andrea Kulas stellt alle Vorträge/Folien des Mapping the Landscape-Workshops zeitnah online und verschickt an alle Referenten eine Dankes-Mail und an alle Teilnehmer des Workshops eine Mail mit dem Link zu den Folien der Veranstaltung.

Themen der nächsten Telko Projektmitarbeiter/innen (08.03.):
 * Thema A+A (Lu Yu erstellt eine Vorlage)
 * Thema Ingest (Lu Yu stellt Fragen vorab auf die Telko-Seite)

Agenda 29./30.(ggf. 31.) Mai 2012 Frankfurt
 * Verlängerung des Projekts – muss bis Sommer 2012 geklärt sein
 * Prototyp (ggf. GUI)
 * Feature-Liste
 * Wissenschaftliche Anforderungen/Funktionen
 * Editing
 * Leitfaden
 * Workshop 2013
 * ggf. Vortrag Christoph Ringlstetter am 30.5. nachmittags (U. Flitner lädt ein, sobald der 31. als weiterer Sitzungstag von Frankfurt bestätigt ist)