Menu
News
Korrelationsmuster in Bildungsdatensätzen identifziert

Mit Verfahren aus der Data Science und Machine Learning Muster in Bildungsdatensätzen finden

19. November 2021

Im Rahmen eines Forschungsprojektes zur Bildungsforschung wurden Verfahren aus der Data Science und dem Machine Learning auf ihre Brauchbarkeit hin untersucht, Muster in Bildungsdatensätzen zu finden. Hierbei kamen neben klassischen Dimensionalitätsreduktionsverfahren wie etwa t-SNE auch interaktive Visualisierungen zum Einsatz. Die Ergebnisse der Forschungsarbeit wurden auf dem Symposium for Visual Information Communication and Interaction (VINCI) in Potsdam vorgestellt.

Bildungsdaten setzen sich aus vielen Daten zusammen und bestehen aus Unmengen an Attributen. Um aus solchen einen Wissensgewinn zu generieren, muss man diese Art von Daten erst analytisch vorverarbeiten, damit die wesentlichen Aspekte darin weiterverarbeiten werden können. Diese Weiterverarbeitung besteht darin, für bestimmte Attribute eine Gruppierung und Strukturierung vorzunehmen, so dass man mit visuellen Methoden relativ schnell Muster darin erkennen kann. Diese visuellen Muster wiederum kann man nutzen, um die Daten und Zusammenhänge darin besser zu verstehen und um weitere analytische Verfahren anzustossen oder etwa bestimmte Parameter anzupassen.

Im Rahmen des Projektes hat man in einem ersten Anwendungsfall mit Hilfe einer Dimensionalitätsreduktion zusammenhängende Elemente des Datensatzes sichtbar gemacht. Diese könnten im Bereich Bildung gezielt für die Mustererkennung in grossen Bildungsdatensätzen eingesetzt werden. So könnten mithilfe dieser Methode verschiedene Fragestellungen der Bildung aus vorhandenen Datensätzen von einer anderen Perspektive beleuchtet werden. Beispielsweise die Frage, ob in einem bestimmten Land die Bildung bezüglich eines bestimmten Aspektes verbessert werden könnte.

Im Rahmen des Forschungsprojekts Virtual Education Observatory (VEO) sollen in den nächsten Jahren weitere Anwendungsfälle folgen – dies in enger Zusammenarbeit mit dem Kompetenzzentrum für Datenanalyse, Visualisierung und Simulation. Ziel ist es, relevante Bildungsdatensätze zusammenzuführen, Zusammenhänge mit Methoden der Data Science und des Machine Learning sichtbar zu machen und damit das Potenzial für wissenschaftliche Analysen zu erhöhen.


Weiterführende Information

Ergebnis der tSNE Clusteranalyse

Weitere Auskünfte