Trip Report: D-Grid Hands on
in progress;-) Event: D-Grid All Hands Meeting [1] Goettingen, 10-12th sept 2007 For presentations, please check website [2] Participants MPDL: Malte, Wolfgang, Ulla
Summary of impressions:
- "D-Grid - Millionengrad oder Erfolgsgeschichte?"
Critical opening statement by BMBF (H. Loewe), they are missing:
- exchange/cooperations between middleware grids and service grids
- sustainable business models, illustrative usage scenarios for benefits
- integration/connex of "Wissensmanagement"-Projekte (e.g. eSciDoc) and D-Grid unclear
- Tony Hey Microsoft Research, Keynote:
good overview on eScience background/motivation Microsoft viewpoint: future research needs in eScience (infrastructure and applications):
- upload/buy storage of data on thwe web
- data processing / compute on demand
- visualisation!
- MASH-UPs
- digital preservation
- new forms/tpyes of review/reputation/influence
- "Live documents" (RSS feeds, blog entries, comments, annotations => publication not static but living)
- tagging for researcher
- lab notebook as blog entry
Daten: Vorstellung Tools DM, Einsatz in GRID II community projekte
DLR Tobias Schlauch Data finder ressourcen: datentypen relationen (rekursiv, teil-ganzes) metadaten als annotationen anhaengen
ausblick: integration mit unicore, dF als DM-client bereitstellung eins md service fuer unicore 6
integration eines provenance service =Y belastbaer track von history aller Prozesse/aggregationen die zu daten gefuehrt haben
iRODS (florian Schinke, I
10:22 11.09.2007STellaris (zuse) => rdf for integrating metadata from different sourcees, RDF and Sparql (rdf triple, query by sparql) federation throuth common namespace re-use of semantic web tools (because of rdf and sparql) http://stellaris.zib.de/
knowledge (lossau) D-grid and wissensschicht sub fokus auf library, GHS grid projekt wissensvernetzung foerderlinie: missing: technologische infrastruktr ziel escience und dgrid projekte: gemeinsame infrastrktur bei technologien wm, nachnutzung dienste und daten, semantische anreicherung daten und dienste, gemeinsamkeiten, unabhängig welche disziupline wissenschicth: überliegend auf grid infrastruktur:finden, nachnutzen, bereitstellen open call for demonstrations community spezifische optimierung interop der wissensschichtdienste (verknuepfen ovn daten und diensten) gmeinsaem strukturelle aufgabne und dienste
jewiels ein demonstrator aus grid projekten zur nutzung
- daten lebenszyklus management (data curation ) bewahren und verwalnte
jens ludwig, sub content - inhalt (vs bits bytes'9 nutzung: community verknuepfung = nutzung fremder daten, nutzung der daten aus grid commnities? lifecyle: erschaffung, versionierung inhaltlich, technisch, bereitstellung(transfer, austausch), befristete/unbefristete aufbewahrung
topics: repositories. gridifizierung fedora, berücksichtigung anforderungen LTA, interoperabilität (driver, nestor), vorkonfig isntallationspakete, nnutzung von srb, irods alsspeichersystem lta: leitung sub(nestor, kopal, shaman).aufgaben: strategien fuer vertrauenswürdige dauerhafte datenpflege im grid, architektur von lta diensten?, grid dienst fuer datenkonvertierung/migration (grid oder solution?), formatvalidierung, formatcharakterisierung PID: leitung tib (dois) topics: grid infrastruktur fuer basale PI dienste, registration/resolving => unabhaengig vom PI system, Idenfitikation von entitäten verschiedenstr Art
fragen: meilensteine fuer umsetzung - wann kann welcher dienst produktiv genutzt werden.
konzepteulle modellierung einer domain? integration von existierenden ontologien?
Anwwndungsprojekt uas c3grid: awi (hiller, fieg) EIN C3 metadatenprofil (discovery and use metadata) (=> heterogene Metadata, heterogene data)=> ISO, in xml
full use metadatae nur fuer lokale zwecke, =< subsset: discovery metadata need for grid-basierte speichersysteme selektion archivierungswürdig: was schnell reprodutiert werden kann, keine langfristigkeit.
- diensteinfrastruktur - verknuepfen und nachnutzern
studer ziel: semantische auszeichnung verwlatung dienste, dienstabläufe, metadata, ontologien gneerische, konfig dienste <> effiziente schlussfolgerungen?
topics: diensteverzeichnis ablaufverwaltung md dienst ontologiendienst
dienste beschreibng: formalismus fuer spec gewunschter eigentschaften ausrcuksstarke beschreibungssprachen fuer dienste (funktionlitäten, qualität?) ein7ausgabetypen der dienste (cf service registry)
abhaengigkeiten von arbeitsabläufen => semantische suche nach abläufen semantische technologien verbessern funktionalitäten der diensteinfrastruktur
anschauungsprojekt wisent hasselbring fallsbsp fuer diensteinfrastruktur infrastuktur zur ablage, beschreibung von ontologien, keine ontologie-entwicklung (tools vorhanden), keine meta-ontologie
- wissenvermittlung - analysiere, aufbereiten
weikum
D-grid: verstaendnis von service level agreements? nutzeranforderungen? managemnet of expectations? user kann nur job posten, aund weiss wwiviele grid partner anbieten, aber kann nicht selektieren, wen er haben will8nicht habne will
wissensmanagemnt projekte (wissensvernetzung)
hyperimage
kooperation hu berlin, lueneburg,m lmu bildervergleich - bildsemantik => unterstuetzung diskurs uber bilddetails? verbindungen zw details, "scharfes hinsehen", relationen => diskursoptionen, ...forschungsfragen als letifragen der spec/func. bilddetails hI editor =kennzeichnung von details, verlinkung mit anderen details, automatische indexe, verweise, konkordanzen,
kollab workflow: vorhandenes bildmaterial, web-editor => xml, gruppierungen/kategorisierungen, metadaten, verlinkung mit anderen bilddetails => flashbasierter reader, web publish, editor: nur lesen, anwender stellen im quellrep ihre bilder im container zusammen. uebertragungen aus text: konkordanz? index: überischten, zusstllung von bildern, bis 10 000 objekte ohne textsuche (visuelle bilder im kopf). konkordanz: bild im zusammenhang, im kontext. querverweis (liegnt beim nutzer, kein katalog) spatial, temporal, semantik, strukturell das eine kommt vom anderen her..?)) Pilots: HyperTaxon, musemum naturkunderHU, Hypersculpture, kunstgeschichteHU, Hypergiotto, kunstgeschichte Hu, Hypermedia kunstgeschichteLMU
ontoverse: 3d molekularstrukturen, dna sequenzen, richten sich an bioinformatik. verschiedene terminologien, verschiedene ontologien, entiwcklung ontologien zur vernetzung von wissen/daten. erstellung biofinformatik ontologie. konzeptualisierung und planung ist schwierigkeit, niht editieren /tools vorhanden). dauerhafte pflege" => gemeinsachtliche bearbeitung durch community. verschieden phasen des ontologieaufbaus unterstützen, Forum fuer wisse publikationen, peer review der eintraege...zunaehcst wiki, scirttweise formalisierung durch editor. fachexperten mit vereinfachter nutzeroberfläche, ontologie-entwickler (setzen beitrage der fachexperten in formale ontologien um), PA. requ spec document 0 welches gebiet, was soll erreich twerden wiki - pro.onotologische wissensdarstel formaler editor kollaborative ontologie-erstellung, unterstütung der versch phasen der ontologieerstellung,
stemnet
life sciences, publikationen, patentberichte, bm DB, => fehlende semantische interoperabilitaet, struktur daten, uns trukt freitext (artikle), ..stemnet: link zw unstruk freitaxt und struk daten, methoden fu sem interop: uima text mining pipeline, vorberietung, mophosyntak analyise, text entitäten automatisch erkennen und klassifizen (proteinfunkt, genom variants, ..9 normalisierung der entitäten ='> strukt ressourcen (DB und ontologien) benutzerschnittstelle: benutzerstudien, nicht-konventionelle suchmuster, visualisierung textinhaltsbasierter semantischer metadaten (not only au, affil, pubyear, sondern textinhalt darstellen!)
sem interop: abgleich mit datenbanken, ablgeich mit bm ontologien (OBO cell ontology..obo standard ontologien life sciences), mapping, normalisierung GUI: user anfrage im semantischen kontext, naming variants aufgeloest, darstellung texthinhalte (suchanfrage) => not discipline-based
wikinger Fraunhofer, duisburg, essen, komm zeitschichte
weiterenticklung algorithmen eigennamenerkennung (perosns, org, produkte, orte) semiautomati meht erstellung semant netzer relationserkennung und relationssemantik!
WALU Editor textmarkierung visual, clikc, automatische klassifierunhe wired gui, relationen erstellen der fachexperten
piloprojekt: bio-bibliografi handbuch kath deutschland ds 19. 20 jhd schreibrechte auf anfrage (community)
Mickel: Dgrid infrastruktur - next steps status quo dgi infrastruktur im antragsverfahren: sondermaßnahmen 2007, diverse antraege evtl 100oo prozessoren danach strukturierung der zentrren: comunity zentren (ress anboieter, fuer eine oder wenige communities, verlgeich anforderungen bzgl middleware componenten, etwa 25), allgemeine zentren (fuer mehrere od alle communities, ueberlastungsausgleich) sonderinvestitionen nur in schicht ressourcen layer future topics: accounting, monituoring, vo/nutzerdienste, training, support, aai/VO,metadaten, rechtliche fragen, resss management, backup dienste, firewall, frühwarnung, data managemnet, metadaten, nachahltigkeit, koordination...
grid vom forschungsprojekt zum wirtscahftsfaktor: nach hey, faktor 10 noetig
planung dgi II=> priorisierung durch communities (aus Dgrid 1 )=> results: high: nachhaltigkeit, support, aai/VO, (wenigsten bedarf: frühwarnung, back-up dienste) nachhaltigkeit!, koordination! rechtliche fragen/betriebswirtschaftliche Fragen!
DGI 2 = Kern Dgrid = Dgrid infrastruktur ziel dgi 2_: langfristiger übergang zu nachhaltiem produktionssystem, muss nahc förderung allein betrieben werden koenne
nachhaltigkeit im dgrid (schwiegelshohn) erfolg - entscheidend durch community grids, nicht nur durch dgi community, marktanalyse (!) community welche nutzeranforderungen, welche ressourcenanbieter, welche sLA verlangen grid nutzer? ressourcen anbiter seite stark, dienste nutzer seite muss entwickelt werden, im cmmunity grid: bestimmung des abieters fur best job, best nutzer, ermittlung bester anbieter, ablaufkontrolle job, unterstüztung felehersuche..gridinfrastruktur als boerse, koordiniert angebot nachfrage,
=> nutzungsversprecehen innerhalbeiner community/vo (gegenseitiges SLA fur dienstenutzer fuer ressourcenabnbieter) wertschoepfungsarchitekutr spezifisch pro community, evtl overlap mit anderen communities. kerninfrastrukutr, inklc modifikation in dgi II.