Menu
News
Informationen zu klinischen Studien aus dem Deep Web extrahieren

30. April 2019

Viele qualitativ hochwertige Informationen werden in Datenbanken gespeichert, welche nur über die Portalseiten der entsprechenden Anbieter zugänglich sind. Diese Daten sind, wie viele andere Quellen, für konventionelle Internet-Suchmaschinen «unsichtbar» und werden daher auch als das «Deep Web» bezeichnet. Im «Deep Web» befindet sich ein beachtlicher Teil der im Internet verfügbaren Informationen und besonders viele Datensätze von hohem kommerziellen Potential. Nun hat ein Forschungsteam der Hochschule für Technik und Wirtschaft HTW Chur Methoden für die automatische Extraktion von kommerziell relevanten Informationen aus dem Deep Web mittels künstlicher Intelligenz entwickelt, welche unter anderem Daten von einer Plattform der Weltgesundheitsorganisation WHO beziehen.

Daten im Deep Web können nicht mittels gewöhnlicher Websuche lokalisiert werden. Gemäss aktuellen Schätzungen sind Datenvolumina mit einem beträchtlichen kommerziellen Potential im Deep Web gespeichert. Typische Beispiele für solche Quellen sind elektronische Datenbanken, Bibliotheken und Archive, Online-Kataloge oder auch die für das DISCOVER-Projekt relevante «Clinical Trials Platform» der Weltgesundheitsorganisation (WHO), welche Informationen zu klinischen Studien sammelt.

Deep-Web-Quellen zugänglich machen

Im Rahmen des DISCOVER-Projektes hat ein Forschungsteam des Schweizerischen Instituts für Informationswissenschaften (SII) der HTW Chur Methoden für die automatische Extraktion von Datensätzen aus der WHO Clinical Trials Platform entwickelt. Die Methoden schätzen mittels intelligenter Algorithmen ab, wie relevant eine Information für den Endbenutzer ist. Basierend darauf wird festgelegt, welche Datensätze abgefragt und analysiert werden sollen. Parameter zum erwarteten Studienverlauf und zum aktuellen Status der Studien werden dabei berücksichtigt. Bislang konnten auf diesem Weg Informationen zu über 450’000 klinischen Studien extrahiert werden.

Datensätze durch künstliche Intelligenz verknüpfen und aktualisieren

Die auf diese Art gewonnen Datensätze müssen in einem nächsten Schritt mit bestehenden Firmen- und Wirkstoffprofilen verknüpft werden. Um diesen sehr arbeitsintensiven Prozess zu automatisieren, werden im DISCOVER-Projekt Methoden der künstlichen Intelligenz eingesetzt. Diese beschränken sich jedoch nicht nur auf klinische Studien, sondern durchsuchen auch das konventionelle Web nach Lizenzabkommen von Biotechnologie- und Pharmaunternehmen sowie nach Änderungen bei deren Schlüsselpersonal. Analysten können solche Mutationen dadurch schneller erkennen und in ihre Datenbanken integrieren.

Aktuellere und umfangreichere Informationen für Entscheidungsträger

Das DISCOVER-Projekt ist ein Beispiel dafür, wie durch den Einsatz aktueller Technologien bestehender Service verbessert und der Kundennutzen erhöht werden kann. Die Biotechgate Plattform des Industriepartners Venture Valuation strukturiert Informationen zu Life Science-Unternehmen und macht diese in einem intuitiven Benutzerinterface durchsuchbar. Die in DISCOVER entwickelten Innovationen erlauben nun auch den Zugriff auf klinische Studien sowie eine verbesserte Abfrage von Lizenzabkommen zwischen Unternehmen. Datenpunkte wie Studienphase, Krankheiten, Symptome und getestete Wirkstoffe werden thematisch gruppiert und mit den entsprechenden Firmendatensätzen verknüpft. Entscheidungsträger können sich ein noch umfangreicheres und aktuelleres Bild von Entwicklungen in der Biotechnologie- und Pharmabranche verschaffen und gezielt nach Firmen und Wirkstoffen suchen.

Forschungsergebnisse schnell in die Praxis umsetzen

DISCOVER ist ein von Innosuisse gefördertes Projekt. Ende Januar 2019 konnte das Team der HTW Chur das Projekt nach einer Laufzeit von 26 Monaten abschliessen. Bereits zwei Monate später profitieren die ersten Kunden des Industriepartners Venture Valuation von schnelleren und umfangreicheren Aktualisierungen der Datenbasis. Ausserdem können Kunden im Rahmen eines Tests auf die Produkterweiterung zu klinischen Studien zugreifen.

Das Schweizerische Institut für Informationswissenschaft (SII) entwickelt und erarbeitet Lösungen zu aktuellen und zukünftigen Herausforderungen und Fragestellungen in Bereich der Produktion, Organisation und Distribution von Information und Wissen.

Weitere Details:

 

Das Projekt DISCOVER der FH Graubünden analysiert Deep-Web-Quellen für klinische Studien und verwendet künstliche Intelligenz, um die Datensätze zu extrahieren und mit bestehendem Wissen zu verknüpfen.
DISCOVER analysiert «Deep Web»-Quellen wie die WHO-Plattform für klinische Studien und verwendet künstliche Intelligenz, um die Datensätze zu extrahieren und mit bestehendem Wissen in der Biotechgate-Datenbank zu verknüpfen. Zusätzlich durchsuchen intelligente Agenten das Web nach Änderungen zu bestehenden Datensätzen.

Weitere Auskünfte

Fachhochschule Graubünden

Als agile Hochschule setzt die FH Graubünden auf dynamisches Denken und proaktives Handeln. Mit diesem Mindset gestaltet sie nachhaltig die Zukunft mit. Studium und Forschung sind interdisziplinär und orientieren sich an praktischen Herausforderungen in Wirtschaft und Gesellschaft. Ihre über 2300 Studierenden bildet sie zu hochqualifizierten und verantwortungsvollen Persönlichkeiten aus. Die Hochschule bietet Studien- und Weiterbildungsangebote in Architektur, Bauingenieurwesen, Computational and Data Science, Digital Supply Chain Management, Information Science, Management, Mobile Robotics, Multimedia Production, Photonics sowie Tourismus an. In ihrer Forschung fokussiert sie auf die Themen Angewandte Zukunftstechnologien, Entwicklung im alpinen Raum und Unternehmerisches Handeln, und agiert auch partizipativ in Reallaboren. Die Mitwirkung aller Hochschulangehörigen trägt zur Weiterentwicklung der Fachhochschule und deren Qualität bei.