Difference between revisions of "Trip Report: D-Grid Hands on"

From MPDLMediaWiki
Jump to navigation Jump to search
(New page: in progress;-) Event: D-Grid All Hands Meeting [http://dgi.d-grid.de/index.php?id=369&L=1] Goettingen, 10-12th sept 2007 For presentations, please check website [http://dgi.d-grid.de/index...)
 
 
(11 intermediate revisions by one other user not shown)
Line 1: Line 1:
in progress;-)
Event: [http://dgi.d-grid.de/index.php?id=369&L=1 D-Grid All Hands Meeting]
Event: D-Grid All Hands Meeting [http://dgi.d-grid.de/index.php?id=369&L=1]
 
Goettingen, 10-12th sept 2007
Goettingen, 10-12th sept 2007
For presentations, please check website [http://dgi.d-grid.de/index.php?id=agenda&L=1]
 
Participants MPDL: Malte, Wolfgang, Ulla
Participants MPDL: Malte, Wolfgang, Ulla


Summary of impressions:
For presentations, please check [http://dgi.d-grid.de/index.php?id=agenda&L=1 Agenda]...should be updated in next weeks
* "D-Grid - Millionengrad oder Erfolgsgeschichte?"
Critical opening statement by BMBF (H. Loewe), they are missing:  
** exchange/cooperations between middleware grids and service grids
** sustainable business models, illustrative usage scenarios for benefits
** integration/connex of "Wissensmanagement"-Projekte (e.g. eSciDoc) and D-Grid unclear
 
*Tony Hey Microsoft Research, Keynote:
good overview on eScience background/motivation
Microsoft viewpoint: future research needs in eScience (infrastructure and applications):
** upload/buy storage of data on thwe web
** data processing / compute on demand
** visualisation!
** MASH-UPs
** digital preservation
** new forms/tpyes of review/reputation/influence
** "Live documents" (RSS feeds, blog entries, comments, annotations => publication not static but living)
**tagging for researcher
**lab notebook as blog entry
 
 


For another point of view on D-Grid, and overview on community grids and projects, see two hardcopies of "Die D-Grid initiative" (1x english, 1x german) => available ab sofort in MPDL library/social room A-strasse, section "Neuerwerbungen".
Also online under [http://www.univerlag.uni-goettingen.de/content/list.php?notback=1&details=isbn-978-3-938616-99-4 english version] and [http://www.univerlag.uni-goettingen.de/content/list.php?notback=1&details=isbn-978-3-940344-01-4 german version]






=== Summary of impressions ===
==== "D-Grid - Millionengrad oder Erfolgsgeschichte? ====
Critical opening statement by BMBF (H. Loewe), which states deficiencies in:
* exchange/cooperations between middleware grids and service grids
* sustainable business models, illustrative usage scenarios for benefits
* integration/connex of "Wissensmanagement"-Projekte (e.g. eSciDoc) and D-Grid unclear


==== Keynote Tony Hey, Microsoft Research ====


useful overview on eScience background/motivation


Microsoft's research areas in eScience:
* upload/buy storage of data on thwe web
* data processing / compute on demand
* visualisation!
* MASH-UPs
* digital preservation
* new forms/tpyes of review/reputation/influence
* "Live documents" (RSS feeds, blog entries, comments, annotations => publication not static but living)
* tagging for researcher
* lab notebook as blog entry


==== Workshop on "Data" ====


Daten:
several presentations on data management tools/engines/languages.
Vorstellung Tools DM, Einsatz in GRID II community projekte
 
DLR Tobias Schlauch
Data finder
ressourcen:
datentypen
relationen (rekursiv, teil-ganzes)
metadaten als annotationen anhaengen
 
ausblick: integration mit unicore, dF als DM-client
bereitstellung eins md service fuer unicore 6
 
integration eines provenance service =Y belastbaer track von history aller Prozesse/aggregationen die zu daten gefuehrt haben
 
iRODS (florian Schinke, I
 
10:22 11.09.2007STellaris (zuse) => rdf for integrating metadata from different sourcees, RDF and Sparql (rdf triple, query by sparql)
federation throuth common namespace
re-use of semantic web tools (because of rdf and sparql)
http://stellaris.zib.de/
 
knowledge (lossau)
D-grid and wissensschicht
sub fokus auf library, GHS grid projekt
wissensvernetzung foerderlinie: missing: technologische infrastruktr
ziel escience und dgrid projekte: gemeinsame infrastrktur bei technologien wm, nachnutzung dienste und daten, semantische anreicherung daten und dienste,
gemeinsamkeiten, unabhängig welche disziupline
wissenschicth: überliegend auf grid infrastruktur:finden, nachnutzen, bereitstellen
open call for demonstrations  community spezifische optimierung
interop der wissensschichtdienste (verknuepfen ovn daten und diensten)
gmeinsaem strukturelle aufgabne und dienste
 
jewiels ein demonstrator aus grid projekten zur nutzung
 
**daten lebenszyklus management (data curation ) bewahren und verwalnte
 
jens ludwig, sub
content - inhalt (vs bits bytes'9
nutzung: community verknuepfung = nutzung fremder daten, nutzung der daten aus grid commnities?
lifecyle: erschaffung, versionierung inhaltlich, technisch, bereitstellung(transfer, austausch), befristete/unbefristete aufbewahrung
 
topics:
repositories. gridifizierung fedora, berücksichtigung anforderungen LTA, interoperabilität (driver, nestor), vorkonfig isntallationspakete, nnutzung von srb, irods alsspeichersystem
lta: leitung sub(nestor, kopal, shaman).aufgaben: strategien fuer vertrauenswürdige dauerhafte datenpflege im grid, architektur von lta diensten?, grid dienst fuer datenkonvertierung/migration (grid oder solution?), formatvalidierung, formatcharakterisierung
PID: leitung tib (dois) topics: grid infrastruktur fuer basale PI dienste, registration/resolving => unabhaengig vom PI system, Idenfitikation von entitäten verschiedenstr Art
 
fragen: meilensteine fuer umsetzung - wann kann welcher dienst produktiv genutzt werden.
 
konzepteulle modellierung einer domain? integration von existierenden ontologien?
 
Anwwndungsprojekt uas c3grid: awi (hiller, fieg)
EIN C3 metadatenprofil (discovery and use metadata) (=> heterogene Metadata, heterogene data)=> ISO, in xml
 
full use metadatae nur fuer lokale zwecke, =< subsset: discovery metadata
need for grid-basierte speichersysteme
selektion archivierungswürdig: was schnell reprodutiert werden kann, keine langfristigkeit.
 
 
**diensteinfrastruktur - verknuepfen und nachnutzern
 
studer
ziel: semantische auszeichnung verwlatung dienste, dienstabläufe, metadata, ontologien
gneerische, konfig dienste <> effiziente schlussfolgerungen?
 
topics:
diensteverzeichnis
ablaufverwaltung
md dienst
ontologiendienst
 
dienste beschreibng: formalismus fuer spec gewunschter eigentschaften
ausrcuksstarke beschreibungssprachen fuer dienste (funktionlitäten, qualität?)
ein7ausgabetypen der dienste (cf service registry)
 
abhaengigkeiten von arbeitsabläufen => semantische suche nach abläufen
semantische technologien verbessern funktionalitäten der diensteinfrastruktur
 
anschauungsprojekt wisent hasselbring fallsbsp fuer diensteinfrastruktur
infrastuktur zur ablage, beschreibung von ontologien, keine ontologie-entwicklung (tools vorhanden), keine meta-ontologie
**wissenvermittlung - analysiere, aufbereiten
weikum
 
D-grid: verstaendnis von service level agreements? nutzeranforderungen? managemnet of expectations?
user kann nur job posten, aund weiss wwiviele grid partner anbieten, aber kann nicht selektieren, wen er haben will8nicht habne will
 
wissensmanagemnt projekte (wissensvernetzung)
hyperimage
 
kooperation hu berlin, lueneburg,m lmu
bildervergleich - bildsemantik => unterstuetzung diskurs uber bilddetails? verbindungen zw details, "scharfes hinsehen", relationen => diskursoptionen, ...forschungsfragen als letifragen der spec/func.
bilddetails hI editor =kennzeichnung von details, verlinkung mit anderen details, automatische indexe, verweise, konkordanzen,
 
kollab workflow: vorhandenes bildmaterial, web-editor => xml, gruppierungen/kategorisierungen, metadaten, verlinkung mit anderen bilddetails => flashbasierter reader, web publish, editor: nur lesen, anwender stellen im quellrep ihre bilder im container zusammen.
uebertragungen aus text: konkordanz? index: überischten, zusstllung von bildern, bis 10 000 objekte ohne textsuche (visuelle bilder im kopf). konkordanz: bild im zusammenhang, im kontext. querverweis (liegnt beim nutzer, kein katalog) spatial, temporal, semantik, strukturell  das eine kommt vom anderen her..?))
Pilots: HyperTaxon, musemum naturkunderHU, Hypersculpture, kunstgeschichteHU, Hypergiotto, kunstgeschichte Hu, Hypermedia kunstgeschichteLMU
 
ontoverse: 3d molekularstrukturen, dna sequenzen, richten sich an bioinformatik. verschiedene terminologien, verschiedene ontologien, entiwcklung ontologien zur vernetzung von wissen/daten. erstellung biofinformatik ontologie. konzeptualisierung und planung ist schwierigkeit, niht editieren /tools vorhanden). dauerhafte pflege" => gemeinsachtliche bearbeitung durch community. verschieden phasen des ontologieaufbaus unterstützen, Forum fuer wisse publikationen, peer review der eintraege...zunaehcst wiki, scirttweise formalisierung durch editor. fachexperten mit vereinfachter nutzeroberfläche, ontologie-entwickler (setzen beitrage der fachexperten in formale ontologien um), PA.
requ spec document 0 welches gebiet, was soll erreich twerden
wiki - pro.onotologische wissensdarstel
formaler editor
kollaborative ontologie-erstellung, unterstütung der versch phasen der ontologieerstellung,
 
stemnet
 
life sciences, publikationen, patentberichte, bm DB, => fehlende semantische interoperabilitaet,
struktur daten, uns trukt freitext (artikle), ..stemnet: link zw unstruk freitaxt und struk daten,
methoden fu sem interop:
uima text mining pipeline, vorberietung, mophosyntak analyise, text entitäten automatisch erkennen und klassifizen (proteinfunkt, genom variants, ..9 normalisierung der entitäten ='> strukt ressourcen (DB und ontologien)
benutzerschnittstelle: benutzerstudien, nicht-konventionelle suchmuster, visualisierung textinhaltsbasierter semantischer metadaten (not only au, affil, pubyear, sondern textinhalt darstellen!)
 
sem interop: abgleich mit datenbanken, ablgeich mit bm ontologien (OBO cell ontology..obo standard ontologien life sciences), mapping, normalisierung
GUI: user anfrage im semantischen kontext, naming variants aufgeloest, darstellung texthinhalte (suchanfrage) => not discipline-based
 
wikinger
Fraunhofer, duisburg, essen, komm zeitschichte


weiterenticklung algorithmen eigennamenerkennung (perosns, org, produkte, orte)
I was hoping for discussions on content/data types and structures, but that was not in the focus.
semiautomati meht erstellung semant netzer relationserkennung und relationssemantik!


WALU Editor textmarkierung visual, clikc, automatische klassifierunhe
==== Workshop on "Knowledge" ====
wired gui, relationen erstellen der fachexperten


piloprojekt: bio-bibliografi handbuch kath deutschland ds 19. 20 jhd
several presentations on projects which are connecting the d-grid infrastructure and the on-top "Wissensschicht"/knowledge layer projects.
schreibrechte auf anfrage (community)
* same needs between eScience and d-grid projects:


Mickel: Dgrid infrastruktur - next steps
shared infrastructure, re-use of data and services, semantic enrichment of data and services.
status quo dgi infrastruktur
* focus knowledge layer: re-use, enrichment, provision of data
im antragsverfahren: sondermaßnahmen 2007, diverse antraege
* call for demonstration projects and community-driven improvements
evtl 100oo prozessoren danach
* topics presented:
strukturierung der zentrren: comunity zentren (ress anboieter, fuer eine oder wenige communities, verlgeich anforderungen bzgl middleware componenten, etwa 25), allgemeine zentren (fuer mehrere od alle communities, ueberlastungsausgleich)
** daten lebenszyklus management (data curation )
sonderinvestitionen nur in schicht ressourcen layer
** service infrastructure: link services, semantic description of services, register services, make them re-usable
future topics: accounting, monituoring, vo/nutzerdienste, training, support, aai/VO,metadaten, rechtliche fragen, resss management, backup dienste, firewall, frühwarnung, data managemnet, metadaten, nachahltigkeit, koordination...
** Wissensvermittlung/transfer of knowledge (Weikum, MPI-INF and Matthias from FIZ K.)


grid vom forschungsprojekt zum wirtscahftsfaktor: nach hey, faktor 10 noetig
==== Presentation of projects "Wissensmanagement/Wissensvernetzung" ====


planung dgi II=> priorisierung durch communities (aus Dgrid 1 )=> results: high: nachhaltigkeit, support, aai/VO, (wenigsten bedarf: frühwarnung, back-up dienste)
was the most interesting afternoon for me...
nachhaltigkeit!, koordination! rechtliche fragen/betriebswirtschaftliche Fragen!


DGI 2 = Kern Dgrid = Dgrid infrastruktur
* hyperImage: Cmopare images and semantic of images => supports discourse on specific image details. HyperImage Editor allows marking details in the image, link to other details, automatic indexes, links (no semantic enrichment on type of relation), concordances (images in their context).
ziel dgi 2_: langfristiger übergang zu nachhaltiem produktionssystem, muss nahc förderung allein betrieben werden koenne
* ontoverse: tool to conceptualize, cooperatively develop ontologies, support of different phases of ontology development, incl kind of quality assurance. currently domain of bio-informatics
* stemnet: create relations between unstructured freetext (= article) and structured data, using technologies for semantic interoperability. morphosyntactic analysis of text data => recognize text entities and classify them, normalize text entities based on structured ressources like databases and ontologies, support non-conventional search patterns, support visualisation of semantical metadata.
* wikinger: algorithms for recognition of named entities (persons, organisation, products, locations). semi-automatic generation of semantical relations between entities


nachhaltigkeit im dgrid (schwiegelshohn)
==== High prios for future D-Grid activities ====
erfolg - entscheidend durch community grids, nicht nur durch dgi
sustainability, support, AAI/VO, legal issues, develop/improve their business models to prove sustainability (Nachhaltigkeit) and user-centered service level definitions
community, marktanalyse (!) community welche nutzeranforderungen, welche ressourcenanbieter, welche sLA verlangen grid nutzer? ressourcen anbiter seite stark, dienste nutzer seite muss entwickelt werden,
im cmmunity grid: bestimmung des abieters fur best job, best nutzer, ermittlung bester anbieter, ablaufkontrolle job, unterstüztung felehersuche..gridinfrastruktur als boerse, koordiniert angebot nachfrage,


=> nutzungsversprecehen innerhalbeiner community/vo (gegenseitiges SLA fur dienstenutzer fuer ressourcenabnbieter)
wertschoepfungsarchitekutr spezifisch pro community, evtl overlap mit anderen communities. kerninfrastrukutr, inklc modifikation in dgi II.




[[Category:Trip report]]
[[Category:Trip report|D-Grid Hands on]]

Latest revision as of 11:40, 23 April 2008

Event: D-Grid All Hands Meeting

Goettingen, 10-12th sept 2007

Participants MPDL: Malte, Wolfgang, Ulla

For presentations, please check Agenda...should be updated in next weeks

For another point of view on D-Grid, and overview on community grids and projects, see two hardcopies of "Die D-Grid initiative" (1x english, 1x german) => available ab sofort in MPDL library/social room A-strasse, section "Neuerwerbungen".

Also online under english version and german version


Summary of impressions[edit]

"D-Grid - Millionengrad oder Erfolgsgeschichte?[edit]

Critical opening statement by BMBF (H. Loewe), which states deficiencies in:

  • exchange/cooperations between middleware grids and service grids
  • sustainable business models, illustrative usage scenarios for benefits
  • integration/connex of "Wissensmanagement"-Projekte (e.g. eSciDoc) and D-Grid unclear

Keynote Tony Hey, Microsoft Research[edit]

useful overview on eScience background/motivation

Microsoft's research areas in eScience:

  • upload/buy storage of data on thwe web
  • data processing / compute on demand
  • visualisation!
  • MASH-UPs
  • digital preservation
  • new forms/tpyes of review/reputation/influence
  • "Live documents" (RSS feeds, blog entries, comments, annotations => publication not static but living)
  • tagging for researcher
  • lab notebook as blog entry

Workshop on "Data"[edit]

several presentations on data management tools/engines/languages.

I was hoping for discussions on content/data types and structures, but that was not in the focus.

Workshop on "Knowledge"[edit]

several presentations on projects which are connecting the d-grid infrastructure and the on-top "Wissensschicht"/knowledge layer projects.

  • same needs between eScience and d-grid projects:

shared infrastructure, re-use of data and services, semantic enrichment of data and services.

  • focus knowledge layer: re-use, enrichment, provision of data
  • call for demonstration projects and community-driven improvements
  • topics presented:
    • daten lebenszyklus management (data curation )
    • service infrastructure: link services, semantic description of services, register services, make them re-usable
    • Wissensvermittlung/transfer of knowledge (Weikum, MPI-INF and Matthias from FIZ K.)

Presentation of projects "Wissensmanagement/Wissensvernetzung"[edit]

was the most interesting afternoon for me...

  • hyperImage: Cmopare images and semantic of images => supports discourse on specific image details. HyperImage Editor allows marking details in the image, link to other details, automatic indexes, links (no semantic enrichment on type of relation), concordances (images in their context).
  • ontoverse: tool to conceptualize, cooperatively develop ontologies, support of different phases of ontology development, incl kind of quality assurance. currently domain of bio-informatics
  • stemnet: create relations between unstructured freetext (= article) and structured data, using technologies for semantic interoperability. morphosyntactic analysis of text data => recognize text entities and classify them, normalize text entities based on structured ressources like databases and ontologies, support non-conventional search patterns, support visualisation of semantical metadata.
  • wikinger: algorithms for recognition of named entities (persons, organisation, products, locations). semi-automatic generation of semantical relations between entities

High prios for future D-Grid activities[edit]

sustainability, support, AAI/VO, legal issues, develop/improve their business models to prove sustainability (Nachhaltigkeit) and user-centered service level definitions