TY - THES AU - Odoni, Fabian T1 - Automatische Inhaltsanalyse durch Stichwortextraktion T4 - Evaluation von Algorithmen zur Extraktion von Stichwörtern im Kontext von Social Collaborative Knowledge Management Systemen DA - 2015 CY - Chur PB - Hochschule für Technik und Wirtschaft HTW Chur A3 - Semar, Wolfgang AB - Hintergrund. Social Collaborative Knowledge Management Systeme (SCKM-System) sind Wissensmanagement-Software-Systeme, die mit sozialen Funktionen ausgestattet sind. In SCKM-Systemen muss das gespeichert Wissen geordnet werden, um dessen Benutzung zu ermöglichen. Diese Ordnung dient auch dazu, den Benutzern mit Inhalten in Kontakt zu bringen, die für ihn relevant sein könnten. Diese Ordnung wird oft mittels Tags (Stichwörtern) erzielt, die der Benutzer für seine Inhalte setzt. Dieses Vorgehen verlangt jedoch, dass die Benutzer diese Tags zu jedem Inhalt korrekt setzen. Ein fehlerhaftes oder nicht vorhandenes Indexieren der Inhalte kann diesem Vorgehen schaden. Ziel. Ziel der Master Thesis ist es, für den Einsatz in einem SCKM-System einen geeigneten Algorithmus zur Extraktion von Stichwörtern zu finden, um die Indexierung der Inhalte zu unterstützen. Zudem soll skizziert werden, wie ein solcher Algorithmus technisch in ein System implementiert werden kann und welche Funktionen in einem SCKM-System damit umgesetzt werden können. Vorgehen. Für die Evaluation wurde zuerst nach Algorithmen zur Extraktion von Stichwörtern recherchiert. Geeignete Kandidaten wurden anhand von definierten Kriterien ausgewählt. Diese Algorithmen wurden in einer eigens programmierten Python-Testumgebung evaluiert. Als Datenquelle für die Evaluation diente ein Testkorpus, der anhand eines Kriterienkatalogs erstellt wurde. Die Ergebnisse wurden anhand von Precision, Recall, F1-Score und der Laufzeit bewertet. Um eine technische Implementation in ein SCKM-System zu skizzieren, wurden die Eigenschaften der Umgebung und der Algorithmen analysiert. Anhand dieser Analyse wurden Vorschläge gemacht, wie eine Implementation aussehen könnte. Die Erarbeitung möglicher Funktionen, die eine Stichwortextraktion bietet, wurde konzeptionell durchgeführt. Ergebnis. Es konnte gezeigt werden, dass genügend Algorithmen vorhanden sind die mit unterschiedlichen Ansätzen versuchen, Stichwörter aus Texten zu extrahieren. Fünf dieser Algorithmen (TextRank, RAKE, Topia Termextract, TF-IDF und Keyword-Detection) wurden evaluiert. Die Evaluation zeigte auf, dass diese Algorithmen mit der entsprechenden Vorverarbeitung des Textes eine bessere Leistung erzielen. Der TF-IDF Algorithmus erreichte die beste Gesamtbewertung. Der RAKE Algorithmus erreichte den zweiten Platz kann jedoch anhand seines höheren Recall-Werts auch als Kandidat für den Einsatz in einem SCKM-System angesehen werden. Die Implementation der Algorithmen konnte an der Software Humhub skizziert sowie Vorschläge zur Verbesserung der Inhaltsdarstellung im Activity-Stream und der Suchfunktion eines SCKM-System aufgezeigt werden. M3 - Masterarbeit Information and Data Management M4 - Citavi ER -