Linked Data Cubes - Integration und Analyse Verteilter Statistischer Datensätze durch Linked Data

01.01.2013 -

Abgeschlossen
KIT & SAP SE

Name des Teilnehmers: Benedikt Kämpgen

Beschreibung des IT-Forschungsprojekts: In vielen Szenarien gilt es über Intranet und Internet verteilte, statistische Daten als Entscheidungsunterstützung zu verknüpfen. So ergänzen z.B. Naturwissenschaftler im Integrierten Wasserressourcenmanagement Sensordaten verschiedener Klimastationen mit Hintergrundinformationen aus einem Wiki; Finanzanalysten kombinieren Jahres- und Quartalsberichte mit Statistiken aus News-Seiten, um eine 360-Grad-Sicht auf Firmen zu erhalten; und Chirurgen sollten prä-, intra- und postoperative Statistiken bzgl. medizinischer Standards, z.B. ICD-10, auswerten, anstatt sich auf ihre Erfahrung und Intuition zu verlassen.

Von separaten Systemen und Institutionen generierte und verwaltete Daten sind häufig heterogen und besitzen einen unbekannten Inhalt sowie unklare Semantik, die sich zudem je nach aktuellen Anforderungen dynamisch ändern können. Deshalb schöpfen bei der Integration und Analyse verteilter Daten weder simple Ansätze mittels Tabellenkalkulationsprogrammen wie Excel, noch aufwändig erstellte, aber starre Extraktion-Transformation-Laden-Prozesse (ETL) zum Populieren von Data Warehouses das Potenzial voll aus.

Ziel des Projekts „LD-Cubes“ ist ein prototypisches Assistenzsystem, mit dem Entscheidungsträger verteilte Statistikdaten in einer Wissensbasis effizient integrieren und situationsadaptiert sowie kollaborativ auswerten können. Ergebnisse sollen auf Basis von Web-Standards erreicht und auf ihre Flexibilität, Skalierbarkeit und Effizienz in Fallstudien evaluiert werden. Passend zum Zukunftsprojekt der Bundesregierung, das Wissen der Welt digital zugänglich und erfahrbar zu machen, sind die Projektergebnisse generell relevant für Domänen, in denen viele quantitative Datensätze aus verteilten operativen Prozessen generiert werden. Cloud-Computing-Plattformen, wie sie aktuell durch die Bundesregierung gefördert werden, und Sensornetzwerke, wie sie durch neue Informations- und Kommunikationstechnologien möglich werden, versprechen in Zukunft eine wachsende Anzahl an verteilt generierten Daten, z.B. im Gesundheitssektor oder in Öffentlichen Bereichen.

Software Campus-Partner: KIT, SAP AG

Umsetzungszeitraum: 01.01.2013 - 31.12.2014