Projekt COMET

Projekt auf einen Blick

Im Rahmen des von Innosuisse (Kommission für Technologie und Innovation KTI) geförderten COMET-Projekts werden Verfahren und Technologien zur Kombination und Analyse von heterogenen, multimodalen Marktdaten entwickelt. Automatisierte Datenkonsolidierungs- und -klassifizierungsverfahren sowie Komponenten zur Valenzanalyse ermöglichen die Extraktion von Information, um die Entscheidungsträger aktiv bei der Optimierung ihrer Marken- und Marketingstrategien zu unterstützen.

Projekt
COMET: Cross-media extraction of unified high-quality marketing data
Lead
Schweizerisches Institut für Informationswissenschaft (SII) Mehr über Schweizerisches Institut für Informationswissenschaft (SII)
Projektleitung
Weichselbraun Albert Mehr über Weichselbraun Albert
Team
Süsstrunk Norman Mehr über Süsstrunk Norman Kuntschik Philipp Mehr über Kuntschik Philipp
Forschungsfelder
Data Analytics Mehr über Data Analytics
Auftrag/Finanzierung
Media Focus Schweiz GmbH, Innosuisse (Kommission für Technologie und Innovation KTI)
Dauer
September 2013 – Mai 2015

Ausgangslage

In vielen Medienkanälen, wie zum Beispiel Print- und Onlinemedien, Blogs und Social Media sind marktrelevante Daten zu finden, welche die öffentliche Wahrnehmung von Produkten, deren Stärken und Schwächen sowie den Erfolg von Public Relations und Marketingstrategien widerspiegeln. Eine manuelle Auswertung dieser Datensätze ist aufgrund der steigenden Anzahl von möglichen Inhaltsquellen oft nicht möglich, sodass in der Praxis auf Business- und Web-Intelligence-Technologien zurückgegriffen wird, welche automatisch entscheidungsrelevante Information aus diesen Quellen extrahieren.

Projektziel

Das COMET-Projekt entwickelt Technologien zur Ermittlung, Konsolidierung, Kombination und Klassifikation von heterogenen, multimodalen Daten aus verschiedenster Quellen, um handlungsrelevante Inhalte automatisch zu erkennen und zu extrahieren und sie dadurch nutzbar zu machen.

Zwischenstand

2. Juni 2014 – Die COMET-Forschungsarbeit «Linked Enterprise Data for Fine Grained Named Entity Linking and Web Intelligence» («Verknüpfte Unternehmensdaten für optimiertes Entity Linking und Web Intelligence») wird an der 4th International Conference on Web Intelligence, Mining and Semantics (4. Internationale Konferenz zu Web Intelligence, Mining und Semantik; WIMS 2014) in Thessaloniki, Griechenland, vorgestellt.
28. Mai 2014 – Das Projektteam reicht den zweiten Projektbericht bei Innosuisse (Kommission für Technologie und Innovation KTI) ein.
26. April 2014 – Der Artikel «Enriching Semantic Knowledge Bases for Opinion Mining in Big Data Applications» («Anreicherung von semantischen Wissensgrundlagen zum Opinion Mining in Big-Data-Anwendungen») wird zur Veröffentlichung im Knowledge-Based System angenommen.
27. März 2014 – COMET-Planungstreffen in Zürich.
8. Januar 2014 – Das Projektteam hat wöchentliche Treffen geplant, um die Entwicklung des COMET XML-Austauschformats und seiner Web-API zu koordinieren.
30. November 2013 – Das Projektteam reicht den ersten Projektbericht bei Innosuisse (Kommission für Technologie und Innovation KTI) ein.
2. September 2013 – COMET-Auftakttreffen in Zürich.
1. September 2013 – Offizieller Projektstart.

Umsetzung

So unterstützen die entwickelten Technologien die Domänen-Expertinnen und -Experten beim Hinzufügen von relevanten Artikeln, indem sie ihnen die Ergebnisse einer automatischen Inhaltsanalyse des Artikels zur Verfügung stellen. Diese enthält unter anderem (i) das Sentiment (positive versus negative Wahrnehmung) von Produkten, Personen oder Unternehmen im Artikel, (ii) die automatische Klassifikation des Artikels in bekannte Produktsegmente sowie (iii) automatisch generierte Metadaten. Des Weiteren werden ähnliche Artikel automatisch erkannt und – sofern bereits vorhanden – mit Annotationen versehen.

Durch diese Vorgehensweise konnten die Effizienz und Effektivität von Auswertungsprozessen und die Datenqualität der Ergebnisse erheblich gesteigert werden. Die annotierten, entscheidungsrelevanten Dokumente werden automatisch aggregiert und stehen Entscheidungsträgerinnen bzw. Entscheidungsträgern in Form von Statistiken und dem klassischen Pressespiegel zur Verfügung. Sie unterstützen die Verantwortlichen somit bei der Optimierung ihrer Public Relations, Marketing- und Markenstrategie.

Obwohl ein Grossteil der relevanten Dokumente elektronisch vorliegt, nutzt COMET eine medienübergreifende Infrastruktur. Diese erfasst sowohl elektronische Dokumente als auch klassische Printmedien. Printmedien werden gescannt und anschliessend mittels OCR (optical character recognition) in Textdokumente übersetzt. In diesem Prozessschritt kommt es häufig zu Erkennungsfehlern, die eine grosse Herausforderung für das Projekt darstellen. Ähnliche Probleme werden auch durch Schreibfehler, nicht standardisierte Schreibformen und Abkürzungen sowie Navigations- und Werbeelemente auf Webseiten hervorgerufen.

Resultate

Ein Kernelement des COMET-Projekts ist daher die Entwicklung von Algorithmen, durch welche die negativen Auswirkungen dieses Rauschens minimiert werden. Das bereinigte Dokument wird anschliessend nach Zielobjekten (Personen, Organisationen, Produkten etc.) durchsucht und das auf sie bezogene Sentiment sowie das Sentiment des Dokuments an sich werden bestimmt. Ausserdem wird eine Klassifizierung des Artikels anhand der vorliegenden Textbausteine und Objekte vorgenommen. Durch die Automatisierung dieser Arbeitsschritte konnten die Produktivität und die Ergebnisqualität des Geschäftsprozesses erheblich gesteigert werden.

Team

Dozent

Prof. Dr. habil. Albert Weichselbraun

Telefon: +41 81 286 37 27

E-Mail

Wissenschaftlicher Projektleiter

Norman Süsstrunk

Telefon: +41 81 286 36 74

E-Mail

Lehrbeauftragter

Philipp Kuntschik

E-Mail

Neben den angeführten aktuellen Mitarbeitenden der FH Graubünden waren folgende ehemalige Projektmitarbeitende und externe Personen am Projekt beteiligt:

Alistair Buxton
Philipp Kuntschik
Seraina Lutz
Peter Metzner
Fabian Odoni
Kevin Schnell
Daniel Streif

Weiterführende Information

Research Blog

Unser Research Blog blog.semanticlab.net fasst Artikel, Methoden und Applikationen zusammen, welche für das Projekt COMET relevant sind.

Publikationen

Weichselbraun, Albert; Streiff, Daniel; Scharl, Arno (2014): Linked Entreprise Data for Fine Grained Named Entity Linking and Web Intelligence. ACM New York.

Data Analytics

Wir entwickeln Methoden, um strukturierte und unstrukturierte Daten zu analysieren und daraus fundierte Erkenntnisse zu gewinnen.

Jetzt entdecken

Beteiligte

Das COMET-Projekt wird von Innosuisse (Kommission für Technologie und Innovation KTI) des Eidgenössischen Departements für Wirtschaft, Bildung und Forschung gefördert. Zu den Projektpartnern gehören die Hochschule für Technik und Wirtschaft Chur (Schweizerisches Institut für Informationswissenschaft) und Media Focus – ein Marktforschungsunternehmen, das unabhängige Marketing-Leistungskennzahlen erhebt.

Schweizerisches Institut für Informationswissenschaft (SII)

Wir entwickeln Lösungen rund um Daten, Wissen und Information – von Data Analytics über Digital Business bis zur Organisation und langfristigen Nutzung von Informationen.

Jetzt entdecken

COMET

Projekt

Lead

Projektleitung

Team

Forschungsfelder

Auftrag/Finanzierung

Dauer

Research Blog

Publikationen

Data Analytics

Beteiligte

Schweizerisches Institut für Informationswissenschaft (SII)