Projekt auf einen Blick
Im Rahmen des von Innosuisse (Kommission für Technologie und Innovation KTI) geförderten COMET-Projekts werden Verfahren und Technologien zur Kombination und Analyse von heterogenen, multimodalen Marktdaten entwickelt. Automatisierte Datenkonsolidierungs- und -klassifizierungsverfahren sowie Komponenten zur Valenzanalyse ermöglichen die Extraktion von Information, um die Entscheidungsträger aktiv bei der Optimierung ihrer Marken- und Marketingstrategien zu unterstützen.
Projekt
COMET: Cross-media extraction of unified high-quality marketing dataLead
Schweizerisches Institut für Informationswissenschaft (SII) Mehr über Schweizerisches Institut für Informationswissenschaft (SII)Projektleitung
Weichselbraun Albert Mehr über Weichselbraun AlbertTeam
Kuntschik Philipp Mehr über Kuntschik Philipp Süsstrunk Norman Mehr über Süsstrunk NormanForschungsfelder
Data Analytics Mehr über Data AnalyticsAuftrag/Finanzierung
Media Focus Schweiz GmbH, Innosuisse (Kommission für Technologie und Innovation KTI)Dauer
September 2013 – Mai 2015
Ausgangslage
In vielen Medienkanälen, wie zum Beispiel Print- und Onlinemedien, Blogs und Social Media sind marktrelevante Daten zu finden, welche die öffentliche Wahrnehmung von Produkten, deren Stärken und Schwächen sowie den Erfolg von Public Relations und Marketingstrategien widerspiegeln. Eine manuelle Auswertung dieser Datensätze ist aufgrund der steigenden Anzahl von möglichen Inhaltsquellen oft nicht möglich, sodass in der Praxis auf Business- und Web-Intelligence-Technologien zurückgegriffen wird, welche automatisch entscheidungsrelevante Information aus diesen Quellen extrahieren.
Projektziel
Das COMET-Projekt entwickelt Technologien zur Ermittlung, Konsolidierung, Kombination und Klassifikation von heterogenen, multimodalen Daten aus verschiedenster Quellen, um handlungsrelevante Inhalte automatisch zu erkennen und zu extrahieren und sie dadurch nutzbar zu machen.
Zwischenstand
- 2. Juni 2014 – Die COMET-Forschungsarbeit «Linked Enterprise Data for Fine Grained Named Entity Linking and Web Intelligence» («Verknüpfte Unternehmensdaten für optimiertes Entity Linking und Web Intelligence») wird an der 4th International Conference on Web Intelligence, Mining and Semantics (4. Internationale Konferenz zu Web Intelligence, Mining und Semantik; WIMS 2014) in Thessaloniki, Griechenland, vorgestellt.
- 28. Mai 2014 – Das Projektteam reicht den zweiten Projektbericht bei Innosuisse (Kommission für Technologie und Innovation KTI) ein.
- 26. April 2014 – Der Artikel «Enriching Semantic Knowledge Bases for Opinion Mining in Big Data Applications» («Anreicherung von semantischen Wissensgrundlagen zum Opinion Mining in Big-Data-Anwendungen») wird zur Veröffentlichung im Knowledge-Based System angenommen.
- 27. März 2014 – COMET-Planungstreffen in Zürich.
- 8. Januar 2014 – Das Projektteam hat wöchentliche Treffen geplant, um die Entwicklung des COMET XML-Austauschformats und seiner Web-API zu koordinieren.
- 30. November 2013 – Das Projektteam reicht den ersten Projektbericht bei Innosuisse (Kommission für Technologie und Innovation KTI) ein.
- 2. September 2013 – COMET-Auftakttreffen in Zürich.
- 1. September 2013 – Offizieller Projektstart.
Umsetzung
So unterstützen die entwickelten Technologien die Domänen-Expertinnen und -Experten beim Hinzufügen von relevanten Artikeln, indem sie ihnen die Ergebnisse einer automatischen Inhaltsanalyse des Artikels zur Verfügung stellen. Diese enthält unter anderem (i) das Sentiment (positive versus negative Wahrnehmung) von Produkten, Personen oder Unternehmen im Artikel, (ii) die automatische Klassifikation des Artikels in bekannte Produktsegmente sowie (iii) automatisch generierte Metadaten. Des Weiteren werden ähnliche Artikel automatisch erkannt und – sofern bereits vorhanden – mit Annotationen versehen.
Durch diese Vorgehensweise konnten die Effizienz und Effektivität von Auswertungsprozessen und die Datenqualität der Ergebnisse erheblich gesteigert werden. Die annotierten, entscheidungsrelevanten Dokumente werden automatisch aggregiert und stehen Entscheidungsträgerinnen bzw. Entscheidungsträgern in Form von Statistiken und dem klassischen Pressespiegel zur Verfügung. Sie unterstützen die Verantwortlichen somit bei der Optimierung ihrer Public Relations, Marketing- und Markenstrategie.
Obwohl ein Grossteil der relevanten Dokumente elektronisch vorliegt, nutzt COMET eine medienübergreifende Infrastruktur. Diese erfasst sowohl elektronische Dokumente als auch klassische Printmedien. Printmedien werden gescannt und anschliessend mittels OCR (optical character recognition) in Textdokumente übersetzt. In diesem Prozessschritt kommt es häufig zu Erkennungsfehlern, die eine grosse Herausforderung für das Projekt darstellen. Ähnliche Probleme werden auch durch Schreibfehler, nicht standardisierte Schreibformen und Abkürzungen sowie Navigations- und Werbeelemente auf Webseiten hervorgerufen.
Resultate
Ein Kernelement des COMET-Projekts ist daher die Entwicklung von Algorithmen, durch welche die negativen Auswirkungen dieses Rauschens minimiert werden. Das bereinigte Dokument wird anschliessend nach Zielobjekten (Personen, Organisationen, Produkten etc.) durchsucht und das auf sie bezogene Sentiment sowie das Sentiment des Dokuments an sich werden bestimmt. Ausserdem wird eine Klassifizierung des Artikels anhand der vorliegenden Textbausteine und Objekte vorgenommen. Durch die Automatisierung dieser Arbeitsschritte konnten die Produktivität und die Ergebnisqualität des Geschäftsprozesses erheblich gesteigert werden.
Team
Neben den angeführten aktuellen Mitarbeitenden der FH Graubünden waren folgende ehemalige Projektmitarbeitende und externe Personen am Projekt beteiligt:
- Kevin Schnell
- Alistair Buxton
- Seraina Lutz
- Peter Metzner
- Daniel Streif
- Fabian Odoni
Weiterführende Information
Research Blog
Unser Research Blog blog.semanticlab.net fasst Artikel, Methoden und Applikationen zusammen, welche für das Projekt COMET relevant sind.
Publikationen
- Weichselbraun, Albert; Streiff, Daniel; Scharl, Arno (2014): Linked Entreprise Data for Fine Grained Named Entity Linking and Web Intelligence. ACM New York.
Beteiligte
Das COMET-Projekt wird von Innosuisse (Kommission für Technologie und Innovation KTI) des Eidgenössischen Departements für Wirtschaft, Bildung und Forschung gefördert. Zu den Projektpartnern gehören die Hochschule für Technik und Wirtschaft Chur (Schweizerisches Institut für Informationswissenschaft) und Media Focus – ein Marktforschungsunternehmen, das unabhängige Marketing-Leistungskennzahlen erhebt.