JusCMS Contens Meeting 2009-10-21

JusCMS,JusCMS_2,MPDL =Treffen mit Contens zur Angebotsvorbereitung= Zeit: 21.10.2009, 9:00 - 13:00 Uhr (Contens anwensend), 14:00 - 14:45 Uhr (Nachbesprechung)

Ort: MPDL

Teilnehmer: Frau Arndt, Herr Bussmann, Herr Hoppe (Contens), Herr Franke (MPDL), Frau Kortüm, Herr Martens, Frau Müller, Frau Stoyanova

Vorab: Der Ablauf der Sitzung orientiert sich an der zuvor verschickten Anforderungsmail an Contens. Im nachstehenden Ergebnisprotokoll werden Ausschnitte aus der Mail kursiv angeführt, wenn zu diesen Punkten während der Sitzung offene Fragen geklärt oder Festlegungen getroffen wurden. Die Mail steht im Volltext in CoLab zur Vefügung: JusCMS_Requirements_CMS

-

Allgemeines zum Angebot / Projekt:
 * Die Firma Contens wird innerhalb der nächsten 2 Wochen, spätestens aber bis Mitte November ein Angebot erstellen
 * In dem Angebot wird jede Einzelanforderung mit einem Preis versehen, so dass das Projektteam ggf. modular auswählen kann
 * es wird ein fester Ansprechpartner bei Contens für das Projekt gewünscht
 * in dem Angebot soll auch das Hosting eines Testsystems enthalten sein. Das Testsystem soll folgende Bedingungen erfüllen:
 * alle Projektbeteiligten (inkl. MPDL) sollen einen Zugang erhalten und auch Supportanfragen an Contens stellen dürfen
 * es können auch Templates geändert werden


 * Contens garantiert, dass die notwendigen Programmierungen unabhängig von den unterliegenden Dienstsystemen wie dem Cold Fusion Interpreter (z.B. Railo) und der Datenbank sind. Sie werden auch lauffähig sein, wenn sich die Dienstsysteme auf Test- und Produktivsystem unterscheiden

Betriebsprojekt CMS:
 * Ziel ist es, auf Open Source Dienstsysteme zu migrieren und für diese professionellen Support einzukaufen
 * Die Dienstsysteme sollten von Contens supportet werden (auch Raillo- über einen Subkontraktor von Contens). Die Ausnahme bildet PostgreSQL- hierfür muss vermutlich ein Drittanbieter verpflichtet werden.
 * Es existieren von Contens erprobte Tools (z.B. für eine Migration von Oracle-Datenbankinhalten zu PostgreSQL) die den Umstieg von einem Dienstsystem auf ein anderes erleichtern
 * Bei Contens soll bzgl. Schulungen für die neue Version angefragt werden
 * Mitte Januar kann in Heidelberg ein Testsystem aufgesetzt werden

Geplanter Workflow (09:00 – 10:00 Uhr)
''Manche Publikationen haben einen bzw. mehrere Volltexte. Diese werden nicht übertragen, sondern nur die URLs als Teil der Metadaten, die auf den Volltexten in PubMan verweisen. Die Volltexte haben einen von drei Status: „Public“, „Private“ oder „Restricted", wobei den Status „Private“ und „Restricted“ Benutzer/Gruppen zugeordnet werden können.''
 * Aussage MPDL: Volltexte mit Status "Private" sind nur für den angemeldeten Depositor sichtbar. PubMan sieht keinen IP-basierten Zugriff vor. Für den Status "Restricted" können Nutzergruppen und Embargozeiten definiert werden- nicht aber für den Status "Private".
 * Antwort Contens: Umsetzung des Status in der Linkanzeige ist möglich

Die Volltextindizierung der Publikationen jedes Instituts muss in die Suchfunktion der Website jedes Instituts integriert werden.
 * Antwort Contens: Es wäre technisch am einfachsten und stabilsten, einen Webservice im CMS aufzusetzen, der die Suche von PubMan parellel zur Website-Suche durchführt. Das Suchergebnis würde in zwei Abschnitten (z.B. auf zwei Registerkarten) dargestellt werden.
 * Antwort MPDL: die PubMan-Suche kann über einen Web-Service genutzt werden, entsprechend ist der Contens-Vorschlag auch PubMan-seitig gut umzusetzen.
 * Fazit: ein entsprechender Abschnitt wird in das Contens-Angebot aufgenommen. Nichtsdestotrotz soll Contens auch die Kosten für die Alternativen (z.B. Speichern und Indexieren der Volltexte auch Contens-seitig) benennen.

Datenübertragung (PUSH / PULL)
 * Der Datenverkehr kann über http erfolgen und muss keinen besonderen Sicherheitsanforderungen genügen, da die ausgetauschten Daten alle öffentlich zugänglich sind
 * Serverseitig sollte lediglich konfiguriert werden, dass nur ein Datenfluss zwischen den dafür autorisierten Systemen PubMan und Contens stattfindet (Vorschlag Herr Bussmann: hier könnte z.B. mit pre-shared keys gearbeitet werden. Diese Technik wird im CMS-Betriebsprojekt bereits zwischen Redaktions- und Webserver eingesetzt)
 * um ein Match der PubMan-Publikationssätze mit bereits vorhandenen Publikationssätzen im  CMS zu erreichen, muss der eSciDoc-Identifier im CMS-Objekt enthalten sein
 * um eine korrekte Zuordnung der Publikationen zu den CMS-Seiten der Wissenschaftler zu erreichen, muss der eSciDoc-Identifier jeder Person ebenfalls in das entsprechende CMS-Objekt eingetragen werden
 * aus Contens-Sicht ist es technisch kein großer Unterschied, wo (in PubMan oder im CMS) die Datenübertragung angestoßen wird
 * aus MPDL-Sicht ist "PULL" einfacher zu realisieren, da PubMan ausschließlich standardisierte Schnitstellen anbietet und die für den PULL-Mechanismus (REST) bereits implementiert ist
 * es wäre aus MPDL-Sicht möglich, in PubMan einen Button zu implementieren der das CMS "aufruft" und ein PULL-Request für zuvor in PubMan markierte Datensätze auslöst; durch diese Lösung würde technisch eine PULL-Abfrage durchgeführt, die für den Anwender wie ein PUSH aussieht
 * Stellungnahme Contens / MPDL: Die Lösung ist gut umsetzbar.
 * Ergänzender Vorschlag Herr Bussmann: Bei Auslösen des Buttons sollte sich ein Popup-Fenser mit einer Meldung a la "Die Datenübertragung wurde gestartet. In ca. 5 Minuten sehen Sie die aktualisierten Sätze auf Ihrer Publikationsseite" öffnen.
 * Antwort MPDL: Eine solche Popup-Ergänzung ist unproblematisch.
 * Im CMS-Publikationsobjekt sollten Datum und Methode der Übertragung (automatisch oder manuell) gespeichert werden
 * Antwort Contens: Ist technisch möglich.
 * Eine Archivierung aller Änderungen an Publikationsobjekten in Contens ist nicht notwendig, da die Archivierung der Datensatzversionen bereits in escidoc stattfindet. Dennoch ist eine derarige Funktion in der neuen Contens-Version aktivierbar. Jedes Institut kann diese ohne Aufpreis nutzen. Vorteil der Funktion ist es, dass bei Bedarf alle Objekte, die zu einem bestimmten Zeitpunkt übertragen wurden, in einem Durchlauf auf ihre Vorversion zurückgesetzt werden können.

Contens wird auch beauftragt, Templates, Outputtypes und eine Applikation für alle gewünschten Ausgabeformate (Publikationslisten) für jeweils zwei Institute zu erstellen
 * Antwort Contens: eventuell wird es in dem von Contens erstellten Mustertemplate auch nur einen aktiven Seitenbereich für alle neun Kategorien geben- mit entsprechendem Darstellungstemplate

Dateninhalt einer Publikation im XML-Format (10:15 – 11:00 Uhr)

 * Contens nimmt den Wunsch zur Kenntnis, dass möglichst alle Datenfelder der XML-Sätze auch im Publikationenobjekt erhalten bleiben sollten, damit flexible Filterabfragen möglich sind
 * die Exportdateien wurden von Frau Arndt/Frau Stoyanova generiert und an Herrn Hoppe verschickt. Es sind drei Dateien:
 * ein Item mit Verknüpfung zu einem anderen Item (isRevisionOf)
 * Item mit Zitierstil in CDATA und localTags
 * Itemi mit Zitierstil und Verknüpfung (isRevisionOf)
 * Zusätzlich wurden Links zu der REST-Schnittstelle und Dokumentation in Colab geschickt

Webseite / Publikationsseite des Wissenschaftlers (11:00 – 11:45 Uhr)
''Das Feld "Zitierstil" (CDATA) ist in den Beispieldateien derzeit nur in der deutschen Variante vorhanden. Die Anforderung ist die Darstellung in deutscher und englischer Version. Zur Diskussion steht ob CDATA eventuell 2x übergeben wird, z.B. als CDATA lang_id=de und CDATA lang_id=en oder die Sprachabhängige Darstellung der Metadaten in Contens erfolgt.''
 * Aussage Contens:die Generierung eines "mehr..."-Links ist ebenso möglich, wie die Erstellung einer darüber aufzurufenden Extraseite mit Details zur Publikation (insbesondere dem Abstract)
 * Aussage Contens: die abweichende Darstellung von Rezensionen / Übersetzungen unterhalb der Anzeige der eigentlichen Publikation ist technisch möglich
 * Aussage Contens: man kann über eine Applikation dynamische Seiten (z.B. Publikationslisten) erstellen und diese über einen "Scheduled task" regelmäßig aktualisieren lassen - oder über "Aktive Seitenbereiche". Wunsch des Projektteams ist es, "Aktive Seitenbereiche" mit einem konfigurierbaren "Scheduled task" kombinieren zu können. Contens wird prüfen, ob dies möglich ist und im Angebot eine Aussage dazu treffen.
 * Das Projektteam (Frau Arndt) wird Contens eine weitere Beispielseite zur Verfügung stellen, die alle Arten von möglichen Unterordnungen und Links enhält
 * Vorschlag MPDL: dieses Problem kann halb MPDL-seitig / halb Contens-seitig gelöst werden. Die MPDL wird den Zitierstil im XML-Export an den relevanten Stellen mit HTML-tags versehen (Snippet), die auf einen Platzhalter hinweisen. In Contens wird eine zweisprachige Liste mit den Füllwörtern für die Platzhalter hinterlegt, die dann an den markierten Stellen im Zitierstil ergänzt werden.
 * Antwort Contens: der MPDL-Vorschlag ist umsetzbar.
 * Fazit: der Vorschlag von Herrn Franke soll im Contens-Angebot entsprechend Berücksichtigung finden.

Übertragung der Daten und Publizieren
 * Aussage Contens: ein nächtliches automatisches Update alle Publikationsobjekte in Bezug auf die Performance unproblematisch

OPTION 1: Datenaustausch: On-Demand, Publizieren: automatisch OPTION 2: Datenaustausch: On-Demand, Publizieren: manuell OPTION 3: Datenaustausch: 1x täglich, Publizieren: automatisch OPTION 4: Datenaustausch: 1x täglich, Publizieren: manuell


 * Option 3 und 4 werden von Contens als "Scheduled task" im CMS definiert
 * Option 1 und 2 sollen im Pubman-Interface als Button/Link umgesetzt werden- z.B. neben der jetzigen Funktion "Export"

Optionale Anforderungen (12:00 – 12:30 Uhr)
Sollen die PDF-Dateien sowohl in PubMan als auch im CMS/Liveserver vorhanden sein? Es muss gewährleistet sein, dass auch die Volltexte über die Suche des Liveservers (Website) gefunden werden.etc.
 * aus Sicht der aktiven Institute ist dies nicht notwendig- da eine Suche in den Volltexten auch über einen Webservice stattfinden kann (s.o.)

Sonstiges (12:30 – 13:00 Uhr)
Performance „Aktive Seitenbereiche“ bei 10.000 Publikationsobjekten
 * Aussage Contens: unproblematisch- insbesondere, wenn für den Live-Server statische Seiten erzeugt werden

Wie viele Filter können in den „Aktive Seitenbereiche“ gesetzt werden?
 * Aussage Contens: unbegrenzt.

Shibboleth auf CMS (Authentifizierung) / Liveserver (Autorisierung)
 * Aussage Projektgruppe: wird für die eruierten Workflows als nicht dringend notwendig angesehen, soll aber dennoch in das Contens-Angebot aufgenommen werden

Pflichtenheft
 * Einschätzung Contens / Projektgruppe: auf Basis der von Herrn Martens formulierten Anforderungen und des Contens-Angebots kann recht unproblematisch für die Teile des Angebots, die beauftragt werden sollen, eine pflichtenheft-konforme Konkretisierung erfolgen

Ansprechpartner Rückfragen
 * bzgl. Dateilfragen zu REST kann sich Herr Hoppe an Herrn Franke wenden
 * bzgl. Hardware und Sicherheitsaspekten steht Herr Bussmann zur Verfügung
 * für alle anderen Fragen wird sich Herr Hoppe an Herrn Martens / Frau Kortüm wenden


 * am 19.11. von 14-16 Uhr soll in einer Videokonferenz das Contens-Angebot besprochen werden
 * am 26.11. wird eine abschließende Videokonferenz stattfinden
 * Frau Kortüm klärt, ob es formal notwendig ist, Vergleichsangebote einzuholen (z.B. von Contens-Integratoren)
 * von Herrn Martens wird die Entwicklung direkt durch Contens befürwortet, da man hier die Bedingung stellen kann, dass die Funktionalität der Erweiterungen auch in kommenden Versionen gewährleistet wird


 * Mitte Februar wird ein großes JUSCMS-Projekttreffen stattfinden

Nächstes Meeting mit Contens: JusCMS Contens Meeting 2010-04-15