Difference between revisions of "Trip Report: D-Grid Hands on"

From MPDLMediaWiki
Jump to navigation Jump to search
(New page: in progress;-) Event: D-Grid All Hands Meeting [http://dgi.d-grid.de/index.php?id=369&L=1] Goettingen, 10-12th sept 2007 For presentations, please check website [http://dgi.d-grid.de/index...)
 
Line 1: Line 1:
in progress;-)
Event: [http://dgi.d-grid.de/index.php?id=369&L=1 D-Grid All Hands Meeting]
Event: D-Grid All Hands Meeting [http://dgi.d-grid.de/index.php?id=369&L=1]
 
Goettingen, 10-12th sept 2007
Goettingen, 10-12th sept 2007
For presentations, please check website [http://dgi.d-grid.de/index.php?id=agenda&L=1]
 
For presentations, please check [http://dgi.d-grid.de/index.php?id=agenda&L=1 Agenda]...should be updated in next weeks
 
 
Participants MPDL: Malte, Wolfgang, Ulla
Participants MPDL: Malte, Wolfgang, Ulla


Summary of impressions:
Summary of impressions:
* "D-Grid - Millionengrad oder Erfolgsgeschichte?"
* "D-Grid - Millionengrad oder Erfolgsgeschichte?"
Critical opening statement by BMBF (H. Loewe), they are missing:  
Critical opening statement by BMBF (H. Loewe), which states deficiencies in:  
** exchange/cooperations between middleware grids and service grids
** exchange/cooperations between middleware grids and service grids
** sustainable business models, illustrative usage scenarios for benefits
** sustainable business models, illustrative usage scenarios for benefits
** integration/connex of "Wissensmanagement"-Projekte (e.g. eSciDoc) and D-Grid unclear
** integration/connex of "Wissensmanagement"-Projekte (e.g. eSciDoc) and D-Grid unclear


*Tony Hey Microsoft Research, Keynote:  
*Tony Hey Microsoft Research, Keynote:
good overview on eScience background/motivation
useful overview on eScience background/motivation
Microsoft viewpoint: future research needs in eScience (infrastructure and applications):
 
Microsoft viewpoint => future research needs in eScience (infrastructure and applications):
** upload/buy storage of data on thwe web
** upload/buy storage of data on thwe web
** data processing / compute on demand
** data processing / compute on demand
Line 22: Line 26:
** new forms/tpyes of review/reputation/influence
** new forms/tpyes of review/reputation/influence
** "Live documents" (RSS feeds, blog entries, comments, annotations => publication not static but living)
** "Live documents" (RSS feeds, blog entries, comments, annotations => publication not static but living)
**tagging for researcher
** tagging for researcher
**lab notebook as blog entry
** lab notebook as blog entry
 
 
 
 
 
 
 
 
 
 
 
Daten:
Vorstellung Tools DM, Einsatz in GRID II community projekte
 
DLR Tobias Schlauch
Data finder
ressourcen:
datentypen
relationen (rekursiv, teil-ganzes)
metadaten als annotationen anhaengen
 
ausblick: integration mit unicore, dF als DM-client
bereitstellung eins md service fuer unicore 6
 
integration eines provenance service =Y belastbaer track von history aller Prozesse/aggregationen die zu daten gefuehrt haben
 
iRODS (florian Schinke, I
 
10:22 11.09.2007STellaris (zuse) => rdf for integrating metadata from different sourcees, RDF and Sparql (rdf triple, query by sparql)
federation throuth common namespace
re-use of semantic web tools (because of rdf and sparql)
http://stellaris.zib.de/
 
knowledge (lossau)
D-grid and wissensschicht
sub fokus auf library, GHS grid projekt
wissensvernetzung foerderlinie: missing: technologische infrastruktr
ziel escience und dgrid projekte: gemeinsame infrastrktur bei technologien wm, nachnutzung dienste und daten, semantische anreicherung daten und dienste,
gemeinsamkeiten, unabhängig welche disziupline
wissenschicth: überliegend auf grid infrastruktur:finden, nachnutzen, bereitstellen
open call for demonstrations  community spezifische optimierung
interop der wissensschichtdienste (verknuepfen ovn daten und diensten)
gmeinsaem strukturelle aufgabne und dienste
 
jewiels ein demonstrator aus grid projekten zur nutzung
 
**daten lebenszyklus management (data curation ) bewahren und verwalnte
 
jens ludwig, sub
content - inhalt (vs bits bytes'9
nutzung: community verknuepfung = nutzung fremder daten, nutzung der daten aus grid commnities?
lifecyle: erschaffung, versionierung inhaltlich, technisch, bereitstellung(transfer, austausch), befristete/unbefristete aufbewahrung
 
topics:
repositories. gridifizierung fedora, berücksichtigung anforderungen LTA, interoperabilität (driver, nestor), vorkonfig isntallationspakete, nnutzung von srb, irods alsspeichersystem
lta: leitung sub(nestor, kopal, shaman).aufgaben: strategien fuer vertrauenswürdige dauerhafte datenpflege im grid, architektur von lta diensten?, grid dienst fuer datenkonvertierung/migration (grid oder solution?), formatvalidierung, formatcharakterisierung
PID: leitung tib (dois) topics: grid infrastruktur fuer basale PI dienste, registration/resolving => unabhaengig vom PI system, Idenfitikation von entitäten verschiedenstr Art
 
fragen: meilensteine fuer umsetzung - wann kann welcher dienst produktiv genutzt werden.
 
konzepteulle modellierung einer domain? integration von existierenden ontologien?
 
Anwwndungsprojekt uas c3grid: awi (hiller, fieg)
EIN C3 metadatenprofil (discovery and use metadata) (=> heterogene Metadata, heterogene data)=> ISO, in xml
 
full use metadatae nur fuer lokale zwecke, =< subsset: discovery metadata
need for grid-basierte speichersysteme
selektion archivierungswürdig: was schnell reprodutiert werden kann, keine langfristigkeit.
 
 
**diensteinfrastruktur - verknuepfen und nachnutzern
 
studer
ziel: semantische auszeichnung verwlatung dienste, dienstabläufe, metadata, ontologien
gneerische, konfig dienste <> effiziente schlussfolgerungen?
 
topics:
diensteverzeichnis
ablaufverwaltung
md dienst
ontologiendienst
 
dienste beschreibng: formalismus fuer spec gewunschter eigentschaften
ausrcuksstarke beschreibungssprachen fuer dienste (funktionlitäten, qualität?)
ein7ausgabetypen der dienste (cf service registry)
 
abhaengigkeiten von arbeitsabläufen => semantische suche nach abläufen
semantische technologien verbessern funktionalitäten der diensteinfrastruktur
 
anschauungsprojekt wisent hasselbring fallsbsp fuer diensteinfrastruktur
infrastuktur zur ablage, beschreibung von ontologien, keine ontologie-entwicklung (tools vorhanden), keine meta-ontologie
**wissenvermittlung - analysiere, aufbereiten
weikum
 
D-grid: verstaendnis von service level agreements? nutzeranforderungen? managemnet of expectations?
user kann nur job posten, aund weiss wwiviele grid partner anbieten, aber kann nicht selektieren, wen er haben will8nicht habne will
 
wissensmanagemnt projekte (wissensvernetzung)
hyperimage
 
kooperation hu berlin, lueneburg,m lmu
bildervergleich - bildsemantik => unterstuetzung diskurs uber bilddetails? verbindungen zw details, "scharfes hinsehen", relationen => diskursoptionen, ...forschungsfragen als letifragen der spec/func.
bilddetails hI editor =kennzeichnung von details, verlinkung mit anderen details, automatische indexe, verweise, konkordanzen,
 
kollab workflow: vorhandenes bildmaterial, web-editor => xml, gruppierungen/kategorisierungen, metadaten, verlinkung mit anderen bilddetails => flashbasierter reader, web publish, editor: nur lesen, anwender stellen im quellrep ihre bilder im container zusammen.
uebertragungen aus text: konkordanz? index: überischten, zusstllung von bildern, bis 10 000 objekte ohne textsuche (visuelle bilder im kopf). konkordanz: bild im zusammenhang, im kontext. querverweis (liegnt beim nutzer, kein katalog) spatial, temporal, semantik, strukturell  das eine kommt vom anderen her..?))
Pilots: HyperTaxon, musemum naturkunderHU, Hypersculpture, kunstgeschichteHU, Hypergiotto, kunstgeschichte Hu, Hypermedia kunstgeschichteLMU
 
ontoverse: 3d molekularstrukturen, dna sequenzen, richten sich an bioinformatik. verschiedene terminologien, verschiedene ontologien, entiwcklung ontologien zur vernetzung von wissen/daten. erstellung biofinformatik ontologie. konzeptualisierung und planung ist schwierigkeit, niht editieren /tools vorhanden). dauerhafte pflege" => gemeinsachtliche bearbeitung durch community. verschieden phasen des ontologieaufbaus unterstützen, Forum fuer wisse publikationen, peer review der eintraege...zunaehcst wiki, scirttweise formalisierung durch editor. fachexperten mit vereinfachter nutzeroberfläche, ontologie-entwickler (setzen beitrage der fachexperten in formale ontologien um), PA.
requ spec document 0 welches gebiet, was soll erreich twerden
wiki - pro.onotologische wissensdarstel
formaler editor
kollaborative ontologie-erstellung, unterstütung der versch phasen der ontologieerstellung,
 
stemnet
 
life sciences, publikationen, patentberichte, bm DB, => fehlende semantische interoperabilitaet,
struktur daten, uns trukt freitext (artikle), ..stemnet: link zw unstruk freitaxt und struk daten,
methoden fu sem interop:
uima text mining pipeline, vorberietung, mophosyntak analyise, text entitäten automatisch erkennen und klassifizen (proteinfunkt, genom variants, ..9 normalisierung der entitäten ='> strukt ressourcen (DB und ontologien)
benutzerschnittstelle: benutzerstudien, nicht-konventionelle suchmuster, visualisierung textinhaltsbasierter semantischer metadaten (not only au, affil, pubyear, sondern textinhalt darstellen!)


sem interop: abgleich mit datenbanken, ablgeich mit bm ontologien (OBO cell ontology..obo standard ontologien life sciences), mapping, normalisierung
* Workshop on "Data"
GUI: user anfrage im semantischen kontext, naming variants aufgeloest, darstellung texthinhalte (suchanfrage) => not discipline-based


wikinger
several presentations on data management tools/engines/languages.
Fraunhofer, duisburg, essen, komm zeitschichte


weiterenticklung algorithmen eigennamenerkennung (perosns, org, produkte, orte)
I was hoping for discussions on content/data types and structures, but that was not in the focus.
semiautomati meht erstellung semant netzer relationserkennung und relationssemantik!


WALU Editor textmarkierung visual, clikc, automatische klassifierunhe
* Workshop on "Knowledge"
wired gui, relationen erstellen der fachexperten


piloprojekt: bio-bibliografi handbuch kath deutschland ds 19. 20 jhd
several presentations on projects which are connecting the d-grid infrastructure and the on-top "Wissensschicht"/knowledge layer projects.
schreibrechte auf anfrage (community)


Mickel: Dgrid infrastruktur - next steps
** same needs between eScience and d-grid projects:  
status quo dgi infrastruktur
im antragsverfahren: sondermaßnahmen 2007, diverse antraege
evtl 100oo prozessoren danach
strukturierung der zentrren: comunity zentren (ress anboieter, fuer eine oder wenige communities, verlgeich anforderungen bzgl middleware componenten, etwa 25), allgemeine zentren (fuer mehrere od alle communities, ueberlastungsausgleich)
sonderinvestitionen nur in schicht ressourcen layer
future topics: accounting, monituoring, vo/nutzerdienste, training, support, aai/VO,metadaten, rechtliche fragen, resss management, backup dienste, firewall, frühwarnung, data managemnet, metadaten, nachahltigkeit, koordination...


grid vom forschungsprojekt zum wirtscahftsfaktor: nach hey, faktor 10 noetig
shared infrastructure, re-use of data and services, semantic enrichment of data and services.
** focus knowledge layer: re-use, enrichment, provision of data
** call for demonstration projects and community-driven improvements
** topics presented:
*** daten lebenszyklus management (data curation )
*** service infrastructure: link services, semantic description of services, register services, make them re-usable
*** Wissensvermittlung/transfer of knowledge


planung dgi II=> priorisierung durch communities (aus Dgrid 1 )=> results: high: nachhaltigkeit, support, aai/VO, (wenigsten bedarf: frühwarnung, back-up dienste)
* Presentation of projects "Wissensmanagement/Wissensvernetzung"
nachhaltigkeit!, koordination! rechtliche fragen/betriebswirtschaftliche Fragen!
was the most interesting afternoon for me...


DGI 2 = Kern Dgrid = Dgrid infrastruktur
** hyperImage: Cmopare images and semantic of images => supports discourse on specific image details. HyperImage Editor allows marking details in the image, link to other details, automatic indexes, links (no semantic enrichment on type of relation), concordances (images in their context).
ziel dgi 2_: langfristiger übergang zu nachhaltiem produktionssystem, muss nahc förderung allein betrieben werden koenne
** ontoverse: tool to conceptualize, cooperatively develop ontologies, support of different phases of ontology development, incl kind of quality assurance. currently domain of bio-informatics
** stemnet: create relations between unstructured freetext (= article) and structured data, using technologies for semantic interoperability. morphosyntactic analysis of text data => recognize text entities and classify them, normalize text entities based on structured ressources like databases and ontologies, support non-conventional search patterns, support visualisation of semantical metadata.
** wikinger: algorithms for recognition of named entities (persons, organisation, products, locations). semi-automatic generation of semantical relations between entities


nachhaltigkeit im dgrid (schwiegelshohn)
* High prios for future D-Grid activities:
erfolg - entscheidend durch community grids, nicht nur durch dgi
sustainability, support, AAI/VO, legal issues, develop/improve their business models to prove sustainability (Nachhaltigkeit) and user-centered service level definitions
community, marktanalyse (!) community welche nutzeranforderungen, welche ressourcenanbieter, welche sLA verlangen grid nutzer? ressourcen anbiter seite stark, dienste nutzer seite muss entwickelt werden,
im cmmunity grid: bestimmung des abieters fur best job, best nutzer, ermittlung bester anbieter, ablaufkontrolle job, unterstüztung felehersuche..gridinfrastruktur als boerse, koordiniert angebot nachfrage,


=> nutzungsversprecehen innerhalbeiner community/vo (gegenseitiges SLA fur dienstenutzer fuer ressourcenabnbieter)
wertschoepfungsarchitekutr spezifisch pro community, evtl overlap mit anderen communities. kerninfrastrukutr, inklc modifikation in dgi II.




[[Category:Trip report]]
[[Category:Trip report]]

Revision as of 17:17, 14 September 2007

Event: D-Grid All Hands Meeting

Goettingen, 10-12th sept 2007

For presentations, please check Agenda...should be updated in next weeks


Participants MPDL: Malte, Wolfgang, Ulla

Summary of impressions:

  • "D-Grid - Millionengrad oder Erfolgsgeschichte?"

Critical opening statement by BMBF (H. Loewe), which states deficiencies in:

    • exchange/cooperations between middleware grids and service grids
    • sustainable business models, illustrative usage scenarios for benefits
    • integration/connex of "Wissensmanagement"-Projekte (e.g. eSciDoc) and D-Grid unclear
  • Tony Hey Microsoft Research, Keynote:

useful overview on eScience background/motivation

Microsoft viewpoint => future research needs in eScience (infrastructure and applications):

    • upload/buy storage of data on thwe web
    • data processing / compute on demand
    • visualisation!
    • MASH-UPs
    • digital preservation
    • new forms/tpyes of review/reputation/influence
    • "Live documents" (RSS feeds, blog entries, comments, annotations => publication not static but living)
    • tagging for researcher
    • lab notebook as blog entry
  • Workshop on "Data"

several presentations on data management tools/engines/languages.

I was hoping for discussions on content/data types and structures, but that was not in the focus.

  • Workshop on "Knowledge"

several presentations on projects which are connecting the d-grid infrastructure and the on-top "Wissensschicht"/knowledge layer projects.

    • same needs between eScience and d-grid projects:

shared infrastructure, re-use of data and services, semantic enrichment of data and services.

    • focus knowledge layer: re-use, enrichment, provision of data
    • call for demonstration projects and community-driven improvements
    • topics presented:
      • daten lebenszyklus management (data curation )
      • service infrastructure: link services, semantic description of services, register services, make them re-usable
      • Wissensvermittlung/transfer of knowledge
  • Presentation of projects "Wissensmanagement/Wissensvernetzung"

was the most interesting afternoon for me...

    • hyperImage: Cmopare images and semantic of images => supports discourse on specific image details. HyperImage Editor allows marking details in the image, link to other details, automatic indexes, links (no semantic enrichment on type of relation), concordances (images in their context).
    • ontoverse: tool to conceptualize, cooperatively develop ontologies, support of different phases of ontology development, incl kind of quality assurance. currently domain of bio-informatics
    • stemnet: create relations between unstructured freetext (= article) and structured data, using technologies for semantic interoperability. morphosyntactic analysis of text data => recognize text entities and classify them, normalize text entities based on structured ressources like databases and ontologies, support non-conventional search patterns, support visualisation of semantical metadata.
    • wikinger: algorithms for recognition of named entities (persons, organisation, products, locations). semi-automatic generation of semantical relations between entities
  • High prios for future D-Grid activities:

sustainability, support, AAI/VO, legal issues, develop/improve their business models to prove sustainability (Nachhaltigkeit) and user-centered service level definitions