In zunehmendem Maße kann menschliches Verhalten durch die Sammlung von Big Data überwacht werden, die Informationen über Verhaltensweisen und Standorte enthalten. Im Kontext der Hochschulbildung sammeln immer mehr Bildungseinrichtungen Daten über ihre StudentInnen, um deren Verhalten und akademische Leistungen zu bewerten oder auch vorherzusagen. Der durch die Pendemie Wechsel zur Online-Ausbildung erhöht die Menge der auf diese Weise gesammelten Daten dramatisch und wirft bereits Bedenken hinsichtlich der Privatsphäre von StudentInnen auf. Bjerre-Nielsen et al. (2021) untersuchten die akademische Leistungen von StudentInnen einer Technischen Universität in Dänemark und fragten sich, ob die Vorhersageleistung für einen bestimmten Datensatz mit weniger in die Privatsphäre eingreifenden, aber aufgabenspezifischeren Daten ebenfalls erreicht werden kann. Sie stützen sich dabei auf Datensätze über eine große Studentenpopulation, die sowohl hochdetaillierte Messungen von Verhalten und Persönlichkeit als auch von Dritten gemeldete Verwaltungsdaten auf individueller Ebene enthielten. Sie fanden dabei heraus, dass Modelle, die mit den umfangreichen Verhaltensdaten geschätzt werden, tatsächlich in der Lage sind, akademische Leistungen außerhalb der Stichprobe genau vorherzusagen. Jene Modelle aber, die nur niedrigdimensionale und weniger in die Privatsphäre eingreifende administrative Daten verwenden, schnitten jedoch besser ab und verbesserten sich auch nicht, als man die in die Privatsphäre eingreifenden Verhaltensdaten hinzufügte.
Literatur
Bjerre-Nielsen, Andreas, Kassarnig, Valentin, Lassen, David Dreyer & Lehmann, Sune (2021). Task-specific information outperforms surveillance-style big data in predictive analytics. Proceedings of the National Academy of Sciences, 118, doi:10.1073/pnas.2020258118.