Semi-automatische Erkennung und Wissensbasis-Integration von Neuigkeiten aus Textdokumenten

01.04.2014 -

Abgeschlossen
KIT & SAP SE

Name des Teilnehmers: Michael Färber

Beschreibung des IT-Forschungsprojektes: Unternehmen stehen zunehmend vor der Herausforderung, die stetig steigende Anzahl an Webdokumenten zu sichten, auszuwerten und schließlich hinsichtlich ihrer Relevanz und Neuartigkeit zu beurteilen. Beispielsweise müssen große Hersteller von Mobiltelefonen aktuelle Trends in der Technologiedomäne entdecken bzw. diese überwachen. Großkonzerne, aber auch mittelständische Unternehmen und Großaktionäre sind auf ein Monitoring der Märkte bzw. auf eine selektive Berichterstattung angewiesen. Die bisher eingesetzten Systeme und Workflows, Neuigkeiten, beispielsweise neue Technologie-Einsatzmöglichkeiten oder Marktveränderungen jeglicher Art, in frisch publizierten Webdokumenten und Nachrichtentexten automatisch zu detektieren und in einem zweiten, oft semi-automatisch vollzogenen Schritt zu bewerten, sind oftmals sehr ineffizient.

Das Projekt SUITE widmet sich daher einem neuen Ansatz zur semantischen Suche nach Neuigkeiten in Textdokumenten. Ziel des Projektes ist die automatische Erkennung von neuen Entitäten sowie von neuen Beziehungen bekannter Entitäten in Textdokumenten. Damit wird es möglich, unmittelbar auf Veränderungen im wettbewerblichen Gefüge und auf Technologie-Neuheiten aufmerksam zu werden und rechtzeitig und adäquat darauf reagieren zu können. Im Rahmen des Projekts kommen Use case-spezifsche Wissensbasen zum Einsatz, die die zentrale Rolle der Wissensspeicherung einnehmen. Der Wissensstand der jeweilig eingesetzten Wissensbasis spiegelt den momentanen Wissensstand des Benutzers bzw. der Mitarbeiter in einem Unternehmen wider. Auch andere Ereignisse, wie sie typischerweise in Nachrichtentexten von Nachrichtenagenturen erstmals beschrieben werden, können so modelliert werden. Aufgrund der möglicherweise fachspezifischen Domänen werden spezifische Ontologien gebildet, die auf die Bedürfnisse der Endbenutzer zugeschnitten sind. Die Ergebnisse des Projekts sollen auf Basis von Web-Standards erreicht und auf ihre Flexibilität, Skalierbarkeit und Effizienz in Fallstudien evaluiert werden.

Software Campus-Partner: KITSAP SE

Umsetzungszeitraum: 01.04.2014 - 31.03.2016