30. April 2019
Viele qualitativ hochwertige Informationen werden in Datenbanken gespeichert, welche nur über die Portalseiten der entsprechenden Anbieter zugänglich sind. Diese Daten sind, wie viele andere Quellen, für konventionelle Internet-Suchmaschinen «unsichtbar» und werden daher auch als das «Deep Web» bezeichnet. Im «Deep Web» befindet sich ein beachtlicher Teil der im Internet verfügbaren Informationen und besonders viele Datensätze von hohem kommerziellen Potential. Nun hat ein Forschungsteam der Hochschule für Technik und Wirtschaft HTW Chur Methoden für die automatische Extraktion von kommerziell relevanten Informationen aus dem Deep Web mittels künstlicher Intelligenz entwickelt, welche unter anderem Daten von einer Plattform der Weltgesundheitsorganisation WHO beziehen.
Daten im Deep Web können nicht mittels gewöhnlicher Websuche lokalisiert werden. Gemäss aktuellen Schätzungen sind Datenvolumina mit einem beträchtlichen kommerziellen Potential im Deep Web gespeichert. Typische Beispiele für solche Quellen sind elektronische Datenbanken, Bibliotheken und Archive, Online-Kataloge oder auch die für das DISCOVER-Projekt relevante «Clinical Trials Platform» der Weltgesundheitsorganisation (WHO), welche Informationen zu klinischen Studien sammelt.
Deep-Web-Quellen zugänglich machen
Im Rahmen des DISCOVER-Projektes hat ein Forschungsteam des Schweizerischen Instituts für Informationswissenschaften (SII) der HTW Chur Methoden für die automatische Extraktion von Datensätzen aus der WHO Clinical Trials Platform entwickelt. Die Methoden schätzen mittels intelligenter Algorithmen ab, wie relevant eine Information für den Endbenutzer ist. Basierend darauf wird festgelegt, welche Datensätze abgefragt und analysiert werden sollen. Parameter zum erwarteten Studienverlauf und zum aktuellen Status der Studien werden dabei berücksichtigt. Bislang konnten auf diesem Weg Informationen zu über 450’000 klinischen Studien extrahiert werden.
Datensätze durch künstliche Intelligenz verknüpfen und aktualisieren
Die auf diese Art gewonnen Datensätze müssen in einem nächsten Schritt mit bestehenden Firmen- und Wirkstoffprofilen verknüpft werden. Um diesen sehr arbeitsintensiven Prozess zu automatisieren, werden im DISCOVER-Projekt Methoden der künstlichen Intelligenz eingesetzt. Diese beschränken sich jedoch nicht nur auf klinische Studien, sondern durchsuchen auch das konventionelle Web nach Lizenzabkommen von Biotechnologie- und Pharmaunternehmen sowie nach Änderungen bei deren Schlüsselpersonal. Analysten können solche Mutationen dadurch schneller erkennen und in ihre Datenbanken integrieren.
Aktuellere und umfangreichere Informationen für Entscheidungsträger
Das DISCOVER-Projekt ist ein Beispiel dafür, wie durch den Einsatz aktueller Technologien bestehender Service verbessert und der Kundennutzen erhöht werden kann. Die Biotechgate Plattform des Industriepartners Venture Valuation strukturiert Informationen zu Life Science-Unternehmen und macht diese in einem intuitiven Benutzerinterface durchsuchbar. Die in DISCOVER entwickelten Innovationen erlauben nun auch den Zugriff auf klinische Studien sowie eine verbesserte Abfrage von Lizenzabkommen zwischen Unternehmen. Datenpunkte wie Studienphase, Krankheiten, Symptome und getestete Wirkstoffe werden thematisch gruppiert und mit den entsprechenden Firmendatensätzen verknüpft. Entscheidungsträger können sich ein noch umfangreicheres und aktuelleres Bild von Entwicklungen in der Biotechnologie- und Pharmabranche verschaffen und gezielt nach Firmen und Wirkstoffen suchen.
Forschungsergebnisse schnell in die Praxis umsetzen
DISCOVER ist ein von Innosuisse gefördertes Projekt. Ende Januar 2019 konnte das Team der HTW Chur das Projekt nach einer Laufzeit von 26 Monaten abschliessen. Bereits zwei Monate später profitieren die ersten Kunden des Industriepartners Venture Valuation von schnelleren und umfangreicheren Aktualisierungen der Datenbasis. Ausserdem können Kunden im Rahmen eines Tests auf die Produkterweiterung zu klinischen Studien zugreifen.
Das Schweizerische Institut für Informationswissenschaft (SII) entwickelt und erarbeitet Lösungen zu aktuellen und zukünftigen Herausforderungen und Fragestellungen in Bereich der Produktion, Organisation und Distribution von Information und Wissen.
Weitere Details:
- Projekt Discover: htwchur.ch/discover

Dateien
- news-fhgr-discover.jpgDISCOVER analysiert «Deep Web»-Quellen wie die WHO-Plattform für klinische Studien und verwendet künstliche Intelligenz, um die Datensätze zu extrahieren und mit bestehendem Wissen in der Biotechgate-Datenbank zu verknüpfen. Zusätzlich durchsuchen intelligente Agenten das Web nach Änderungen zu bestehenden Datensätzen.
Fachhochschule Graubünden
Als Hochschule setzt die FH Graubünden auf dynamisches Denken und proaktives Handeln. Mit diesem Mindset prägt sie die Zukunft. Die Studienangebote orientieren sich an praktischen Herausforderungen in Wirtschaft und Gesellschaft. Ihre über 2200 Studierenden bildet sie zu verantwortungsvollen Persönlichkeiten aus und weiter. Die Hochschule bietet Angebote in den Bereichen «Architektur und Bauingenieurwesen», «Medien, Technik und IT» sowie «Wirtschaft, Dienstleistung und Informationswissenschaft» an. In ihrer inter- und transdisziplinären Forschung fokussiert sie auf die Themen Angewandte Zukunftstechnologien, Entwicklung im alpinen Raum und Unternehmerisches Handeln. Mit ihren Tätigkeiten trägt die FH Graubünden zum Erfolg und zur Wettbewerbsfähigkeit von Individuen, Institutionen und Regionen bei. Hierfür ist sie in der Region verankert, in der Schweiz von Bedeutung und strahlt international aus.