„Digital souverän“? Akademische Selbstbestimmung: Hochschulen unter Bedingungen der Digitalisierung und der Datenökonomie
„Digital souverän“? Akademische Selbstbestimmung: Hochschulen unter Bedingungen der Digitalisierung und der Datenökonomie
30.06.23„Digitale Souveränität“ wurde im Rahmen einer ZKI-Umfrage unter die Top-Trends 2021 gewählt. Damit braucht Hochschuldatenpolitik nicht nur einen Blick für den Datenschutz, sondern auch für die Datennutzung, sagt Justus Lentsch. Denn mit der Digitalisierung werden sowohl die Nutzer:innendaten als auch die Datenspuren gespeichert. Doch aktuell mangelt es an einheitlichen Regeln.
1. Akademische Selbstbestimmung unter Bedingungen der Digitalisierung
Was bedeutet akademische Selbstbestimmung unter Bedingungen der Digitalisierung und in der Datenökonomie? Wie lässt sich sich auf institutioneller, organisationaler und individueller Ebene umsetzen? Wie können wir die digitale Transformation in Wissenschaft und Hochschulen und die den Wissenschafts-, Lehr- und Studienbetrieben tragenden digitalen und insbesondere Daten Ökosysteme so gestalten, dass akademische Freiheit und Selbstbestimmung angesichts eines Datengestützten und auf Algorithmen basierenden Forschungs- und wissenschaftlichem Kommunikationsprozesses und Studien-, Lehr- und Lernbetrieb umgesetzt werden kann? Welche formalen und infrastrukturellen Voraussetzungen braucht es dazu? Und welchen Ordnungsrahmen, welche Geschäftsmodelle, Anreizsysteme und Organisationsformen?
An die Diskussion über einen Bildungsdatenraum anknüpfend(1), würde ich gern mit Ihnen über die grundsätzlichen und strukturellen Fragen ins Gespräch kommen, um im nächsten Schritt konkrete Handlungsfelder identifizieren und eingrenzen zu können.
Im Zentrum der Debatte steht der Begriff der „Digitalen Souveränität“. Darunter wird Unterschiedliches verstanden: etwa der souveräne (individuelle) Umgang mit digitalen Medien, die Unabhängigkeit und Sicherheit von IT und digitalen Infrastrukturen oder die „Summe der Fähigkeiten und Möglichkeiten von Individuen und Institutionen, ihre „Rolle(n) in der digitalen Welt selbstständig, selbstbestimmt und sicher ausüben zu können“.(2) Insbesondere der letzte Aspekt, die Selbstbestimmtheit unter Bedingungen von Digitalisierung, also Technologien, Algorithmen und die Erhebung und Nutzung von Daten gemeinwohlorientiert und in den alleinigen Dienst für die Wissenschaft zu stellen, ist zentral für die Wissenschaft und für die Hochschulen.
„Digitale Souveränität“ wurde letztes Jahr in der Umfange des Arbeitskreises Strategie und Organisation der „Zentren für Kommunikationsverarbeitung in Forschung und Lehre“ (ZKI e.V.) entsprechend auch erstmals unter den Top-Trends genannt (auf Platz 6), die aus Sicht der Leitungen für den Betrieb von für Hochschulen und Wissenschaftsrichtungen besonders relevant sind.(3) Auch der Wissenschaftsrat hat eine Arbeitsgruppe eingerichtet, die sich mit „digitaler Souveränität“ beschäftigt, denn: „Ein wichtiger Baustein digitaler Souveränität ist eine Wissenschaft, die frei über Algorithmen, Daten, Software, Plattformen und Publikationswege entscheiden und verfügen kann.“ (Wissenschaftsrat, Arbeitsprogramm 2022).
2. Treiber und Herausforderungen in Bezug auf wissenschaftliche Selbstbestimmung und „digitale Souveränität“
Tatsächlich verändert die Digitalisierung und insbesondere die Datenökonomie die Wissenschaft selbst: Der Wissenschafts-, Lehr- und Studienbetrieb findet in zunehmend geschlossenen digitalen Ökosystemen und insbesondere Datenökosystemen statt. Digitale Anwendungen sind nicht mehr wegzudenken und greifen zunehmend in einander. Wissenschaftliche Kommunikation und wissenschaftliches Handel selbst ist digital vermittelt und Algorithmen basiert – dafür steht beispielsweise der spektakuläre wissenschaftliche Durchbruch in der molekularbiologischen Forschung, den Googles Tochterfirma „Deep Mind“ im Dezember 2020 mit ihrem KI-Programm AlphaFold durch die Lösung des sog. „Proteinfaltungsproblem“ erzielt und damit gegen einhundert wissenschaftliche Teams in einem internationalen wissenschaftlichen Wettbewerb gewonnen hat.(4) Wie auch immer man dieses Ereignis werten möchte: KI und maschinelles Lernen wird auch fachwissenschaftliche Erkenntnisprozessen grundlegend verändern – mit den entsprechenden Herausforderungen für Qualitätssicherung etc.
Digitale Ökosysteme sind insbesondere auch Datenräume: Die Interaktionen von Wissenschaftler:innen und Studierenden mit digitalen Anwendungen hinterlassen „Datenspuren“. Die Erhebung, Analyse und Integration dieser Daten mit anderen Datensätzen eröffnet ganz neue und tiefgreifende Möglichkeiten, wissenschaftliches Handeln und Kommunizieren nachzuverfolgen (also bspw. wer was liest, wie lange auf einem Text verweilt, wie etwas bewertet wird etc.), zu analysieren und eben auch zu steuern. Und es eröffnet neue Geschäftsmodelle durch die Sekundärverwertung dieser Daten für ganz andere Zwecke, die eben nicht an den Bildungsgewinnen und Zielen der Wissenschaft orientiert sind. Das krempelt die politische Ökonomie des Hochschulsektors um. Und es stellt neue Herausforderungen an die Integrität von Wissenschaft. Daher sollen wir nicht die Frage nach der „digitalen Souveränität“ in den Mittelpunkt stellen, sondern vielmehr die Selbstbestimmung und Selbststeuerung der Wissenschaft. Vorweg: Wissenschaftliche Selbstbestimmung wird zukünftig wesentlich eine Frage der Datengovernance sein. Daher brauchen wir eine aktive Hochschuldatenpolitik.
Ein zentraler Player und Treiber sind die großen Wissenschaftsverlage: „Suchen, lesen, publizieren, zitieren, vernetzen – all das geht bequem mit den digitalen Werkzeugen der Wissenschaftsverlage.“(5) Die Wissenschaft sei damit in eine wachsende Abhängigkeit von Großverlagen geraten, so die Vorsitzende des Rats für Informationsinfrastrukturen, Petra Gehring. In „vernetzten Workbenches [übergreifen diese digitalen Ökosysteme] alle Stufen des Forschungsprozesses […]“, so dass die einzelnen Forschenden dieses Ökosystem gar nicht mehr verlassen müssen.(6)
Wenn man die Entwicklung in den USA betrachtet, zeichnet sich ab, dass Anwendung, die auf der Analyse von Sekundärdaten basieren, die bei der Interaktion von Studierenden mit digitalen Lehrangeboten anfallen (siehe „learning analytics“) zunehmend den Lehr- und Studienbetrieb prägen werden: „The Next Normal: Algorithms will take over college, from admissions to advising“ (Shea Swauger in „The Washington Post“ vom 12. November 2021).(7) Zunehmend wird Lehre auf digitalen Lernplattformen mit Anwendungen stattfinden, die auf der Analyse von „Big Data“ (s. u., nutzergenerierte Sekundärdaten) und Algorithmen (s. „learning analytics“) basieren. Das hat gravierende Weiterungen insbesondere hinsichlich Qualitätssicherung und Akkreditierung. So wird bspw. in der ersten Version der EdTech-Charta, die der Stiftverband mit Stakeholdern erarbeitet hat, „eine Neuorientierung bei der Evaluation und Akkreditierung von Studienangeboten, die Lernergebnisse noch stärker in den Mittelpunkt stellt und technologiegestütztes Lernen anerkennt“ gefordert.(8)
Mit der rasanten Entwicklung hat die Wissenschaft und hat die öffentliche Hand allerdings nicht Schritt gehalten und kaum eigene Dienste oder digitale Forschungs- und Lernumgebungen entwickelt, wie die Vorsitzende des Rats für Informationsinfrastrukturen, Petra Gehring, schreibt. Vielmehr hat sie in großem Umfang auf die Angebote privatwirtschaftlich agierender Akteure zurückgegriffen; unter dem suggestiven Titel „Offenheit“ sei dies auch wissenschaftspolitisch massiv gefördert worden.(9) Beispielsweise setzt sich der Stifterverband dafür ein, die Kollaboration von Hochschulen mit externen Dritten, insbesondere sog. EdTechs, im Bereich der Lehre und Studierendenservices zu fördern; mit Stakeholdern hat er die bereits erwähnte „EdTech Charter“ erarbeitet, die darauf zielt, das Engagement und den Markteintritt von EdTechs, technologieorientierte Unternehmen und Start-ups zusammenfassen, die Lösungen, Services und Produkte im Bereich der Lern- und Bildungsanwendungen anbieten, in Hochschulen zu erleichtern.(10) Durch die entstehende Technologieabhängigkeit kann es zu „vendor lock-in“ Effekten kommen, die den Wechsel auf einen anderen Anbieter verhindern.
Bei der Nutzung dieser Dienste hinterlassen die Nutzer:innen „Datenspuren“, die durch unterschiedliche Tracking-Technologien erhoben werden (vielfach unbemerkt). Zudem versuchen die Verlage, „die Zugangsauthentifizierung unter ihre Kontrolle zu bringen, um den personalisierten Zugriff auf alle Nutzenden sicherzustellen“(11). Die von den Nutzer:innen selbst generierten Daten werden zum einen zur Verbesserung der Services genutzt, zum anderen aber können Sie verkauft und analysiert werden und sind dann selbst der „Rohstoff“ für neuer Geschäfte und Services. Diese Daten sind „Gold wert“, da die Datenprofile viel genauer und umfassender als ein Zeugnis oder ECTS-Punkte Aufschluss darüber geben, „was wir wissen (Expertise), wie gut und wie schnell wir lernen (Talent), wie wir Situationen lösen (Kompetenz), wie oft wir etwas versuchen (Frustrationstoleranz) oder ob wir auch einmal ungewöhnliche Lösungswege wagen (Kreativität)“.12 Diese Anwendungen, die nur durch die Nutzung dieser Daten aus Lehr- und Lernprozessen möglich sind, haben ein großes Potential.13 „Doch sie machen uns zugleich noch abhängiger von großen Datenfirmen.“(14)
Der Ausschuss für Wissenschaftliche Bibliotheken und Informationssysteme der DFG weist in seiner Stellungnahme zum „Daten-Tracking in der Wissenschaft“ vom 28. Oktober 2021 darauf hin, dass die Wissenschaftsverlage sich von „Content Providern“ zu einem „Data Analytics Business“ und Unternehmen für Informationsanalysen entwickeln. „Die Aggregation und die Weiterverwendung bzw. der Weiterverkauf von Nutzerspuren werden relevante Aspekte der Verlagstätigkeit.“ (DFG 2021, S. 3).(15)
Die Nutzer:innen wissen dabei vielfach nicht, dass Daten erhoben werden, wer diese Daten erhebt, wohin sie gehen und was mit Ihnen geschieht. Denn Daten haben keinen GPS-Tracker, mit dem sich ihr Weg nachverfolgen ließe. Die Vermarktung von diesen Sekundärdaten und das Angebot von Services, die auf der Analyse der Datenspuren der Wissenschaftler:innen beruhen (das sind dabei nicht nur wissenschaftliche oder Akademische Angebote, sondern können auch Angebote für ganze andere Zielgruppen und Märkte sein, wie bspw. „Risk Solutions“ oder „Applicant Tracking“), ist ein neues Geschäftsfeld mit hohen Margen, insbesondere für die Verlage. Die Verlage begründen das von den Nutzer:innen vielfach unbemerkte und von den Verlagen orftmals nicht als solches gekennzeichnete Tracking dabei unter anderen damit, dass nur so lizensierte Inhalte geschützt werden können. In der Folge werden die Verlage in dem neuen System von DEAL mehrfach vergütet, einmal durch die Article Processing Charges der Autor:innen und zum anderen durch die Daten der Leser:innen.(16)
In der Debatte um die digitale Transformation der Hochschulen stehen dabei bislang die technologischen und infrastrukturellen Aspekte im Vordergrund und weniger die Geschäftsmodelle oder Fragen einer Hochschuldatenpolitik. Petra Gehring schreibt dazu: „Den globalisierten Kampf um gewinnträchtige Märkte, den diese neuen Formen der Wertschöpfung bieten, erkannte man nicht. So sind jetzt die virtuellen Nutzerumgebungen, die man teils öffentlich mitfinanziert hat, zur Lebendfalle für Forschende geworden.“(17) Diese virtuellen Nutzerumgebungen werden dabei den ganzen „research life cycle“ ebenso wie den „student life cycle“ und die Verwaltungsprozesse integrieren. Diese Entwicklung verändert gerade die politische Ökonomie des Hochschulsektors grundlegend. Wie können wir die digitalen (Daten-)Ökosysteme so gestalten und welche Governance und welchen Ordnungsrahmen braucht es, dass die akademische Selbstbestimmung nicht gefährdet wird?
Da nur wenige Anbieter den Markt dominieren, „greifen wettbewerbliche Mechanismen immer weniger, so dass diese Anbieter zunehmend die Art und Weise prägen, wie in der Wissenschaft digitale Werkzeuge genutzt und Daten verarbeitet werden.“ (WR, Arbeitsprogramm 2022). Dies wirkt sich auch auf die Institution Wissenschaft aus, wenn über Datenauswertungen eine „Steuerung der Forschung und Wissenschaft im Sinne der Interessen privater Unternehmen möglich ist“.(18) Digitale Souveränität bedeutet dabei nicht, nur auf eigene Lösungen zu setzen. Wissenschaft ist zunehmend auf die Zusammenarbeit mit „Drittanbietern“ angewiesen (bspw. EdTechs). Welche Regeln bzw. welchen Ordnungsrahmen, welche Anreize und welche Reduktion von Abhängigkeiten sind notwendig, um die Zusammenarbeit so zu gestalten, dass die Selbstbestimmtheit der Wissenschaft nicht gefährdet wird?
3. Ebenen der akademischen Selbstbestimmtheit unter Bedingungen der Digitalisierung
Die Aspekte der „Digitale Souveränität“ betreffen die akademische Selbstbestimmtheit auf der institutionellen, der organisationalen und der individuellen Ebene.
Institutionelle Ebene
Es dürfte deutlich geworden sein, dass ein Daten- und Algorithmen-basierter Wissenschaftsbetrieb und die neuen Geschäftsmodelle – insbesondere die Transformation der Verlage von „content providern“ zu einem „data analytics business“, zu Unternehmen für Informationsanalysen, massive Auswirkung auf der institutionellen Ebene haben werden, wenn die Dienste auf Wertschöpfung durch Zweitverwertung von Sekundärdaten statt auf die Maximierung von Bildungsgewinnen optimiert wird. Das wird die wissenschaftliche Kommunikation und das wissenschaftliche Publikationswesen ebenso verändern wie das wissenschaftliche Arbeiten selbst. Schließlich wird es auch Auswirkung auf das wissenschaftliche Reputationssystem haben (s. bspw. im Bereich Evaluationen oder Einsatz von „people analytics“), das Tracking und das Geschäft mit Daten durch die Wissenschaftsverlage stellt die Integrität des wissenschaftlichen Austauschs in Frage. Wie kann sichergestellt sein, dass die Regeln der Wissenschaft grundlegend sind?
Individuelle Ebene
Auf der individuellen Ebene wird einmal die digitale Mündigkeit von Wissenschaftler:innen und Studierenden zu fördern sein. Das bedeutet zum einen so etwas wie „digital literacy“, d. h. digitale Medien kompetent, sicher und vielfältig nutzen können, oder „data literacy“, den souveränen und kompetenten Umgang mit Daten und Datenanalysen. Darüber hinaus bedeutet es aber auch, die Sicherheit von digitalen Diensten bewerten zu können. Dies setzt eine Kenntnis der Funktionsweise von digitalen Anwendungen voraus. Insbesondere muss die eingesetzte Software Transparenzanforderungen genügen (bspw. Open Source). Das betrifft insbesondere auch die Datenverarbeitung. Denn nur dann, wenn man weiß, wo die Datenverarbeitung stattfindet und wer möglicherweise zu welchem Zweck den Zugriff auf die personenbezogenen Daten hat, kann das Risiko für die Freiheit und die Rechte Betroffener abgeschätzt werden. Weiterhin sollte eine gewisse Unabhängigkeit und Wahlfreiheit in der Auswahl der IT und Services mit Blick auf die Freiheit von Forschung und Lehre gegeben sein.
Vor allem aber bedeutet Selbstbestimmtheit auf der individuellen Ebene informationale Selbstbestimmung und „Datensouveränität“, d. h., dass die Nutzer:innen grundsätzlich Kontrolle über ihre eigenen persönliche Daten und die Datenspuren behalten sollten, die sie bei der Nutzung von digitalen Angeboten hinterlassen. Sie sollten selbstbestimmt über die Verwendung ihrer Daten entscheiden und die Datenflüsse und Datenintegration kontrollieren können. Was bedeutet individuelle Wissenschaftsfreiheit unter diesen Bedingungen – insbesondere wenn wissenschaftliches Handeln in einem geschlossenen Datenökosystem stattfindet – und wie kann sie gesichert werden?
Organisationale Ebene und strategische Autonomie
Auf der organisationalen Ebene sind dies u. a. Fragen der Abhängigkeit von kritischer Informationsinfrastruktur, Abhängigkeit und Vermeidung von „vendor lock-ins“ und entsprechend (Anbieter-)Unabhängigkeit in der IT Auswahl und insbesondere auch die verstärkte Förderung von Open Source und Eigenentwicklungen. Das umfasst die Geschäftsprozesse und Verwaltungs-IT, Campusmanagementsysteme, Lehr-, Prüf- und Lernmanagementsysteme und Lernplattformen, E-Government und insbesondere auch Bibliothekssysteme. Viele dieser Services und der damit verbundenen Herausforderungen wird eine einzelne Einrichtung nicht allein bewältigen können. Daher bedarf es eines kooperativen Vorgehens und entsprechender Kooperationsformen (wie Genossenschaften, Vereine oder Zweckverbände).(19)
Ein zentraler Punkt ist die „Datensouveränität“
Digitale Souveränität wird wesentlich Datensouveränität bedeuten. Digitale Souveränität bedeutet, über die eigenen „Datenspuren“ selbst bestimmen zu können, d. h. über die Erhebung, die Speicherung, Weitergabe und Nutzung der Daten, die die Nutzerinnen und Nutzer im Lern-, Lehr- und Studienkontext selbst erzeugen (bspw. bei der Verwendung von Lernsoftware oder bei der Benutzung digitaler Angebote der Bibliothek).
Die Sekundärdaten, die die Wissenschaftler:innen und Studierenden in der Interaktion mit digitalen Anwendungen erzeugen, sollten transparent, im Sinne des Gemeinwohls und im Interesse der Studierenden und der Lehrenden verfügbar gemacht und geteilt werden können. Dafür braucht es neue Geschäftsmodelle, Organisationsformen und Datentreuhandmodelle. Und eine Hochschuldatenpolitik, die nicht nur den Datenschutz, sondern auch die Datennutzung in den Blick nimmt.(20) Die Funktion von Hochschulen als Organisationen wird sich sehr verändern. Wie lässt sich sicherstellen, dass Organisationsentscheidungen wissenschaftsadäquat und von den Mitglieder bestimmt sind? Und wir werden Organisationsformen brauchen, die stärker der Gemeinschaft eine Form geben – beispielsweise Genossenschaften, die eine Datentreuhänderfunktion übernehmen oder wie die HIS eG Services entwickeln.
4. Diskussion
- Geht die Gleichung auf: Digitale Souveränität = Datensouveränität?
- Welche spezifischen Aspekte sehen Sie für die akademische Selbstbestimmung und Selbststeuerung an Hochschulen und Forschungseinrichtungen als konstitutiv an?
- Welche Aspekte sind zu adressieren, um die akademisches Selbstbestimmtheit unter Bedingungen von Digitalisierung und in digitalen Datenökosystemen umzusetzen?
Verweise
1 Siehe auch Lentsch, Justus. „Unsere Bildungsdaten gehören uns!“ (URL zum Artikel).
2 Antwort der Bundesregierung auf eine kleine Anfrage zur „Digitalen Souveränität“ (Drs. 19/24896, S. 2), (Link zum Dokument).
3 Im ZKI e.V. haben sich 250 IT-Servie-Einrichtungen deutscher Hochschulen und Forschungseinrichtungen zusammengeschlossen (Website).
4 „It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures“, in: Nature 588, 203- 204 (2020) (doi: https://doi.org/10.1038/d41586-020-03348-4). Sollte der spektakuläre Sieg der Schachmaschine Deep Blue von IBM über den Großmeister Kasparow im Jahr 1997, noch zeigen, dass sich mit „brute force“ maschineller Rechen-Power menschliche Intelligenz schlagen lässt, so geht der Anspruch von KI noch weiter, nämlich wissenschaftliche Kreativität schlagen zu können. Genau das hat Googles Tochterfirma „Deep Mind“ im Dezember 2020 mit der Lösung des „Proteinfaltungsproblems“ demonstriert.
5 Ebd.
6 Siems, Renke. Das Lesen der Anderen Die Auswirkungen von User Tracking auf Bibliotheken, in: o | bib – das offene Bibliotheksjournal Bd. 9 Nr. 1 (2022) (URL zum Artikel).
Zusammen mit der Stellungnahme zum Datentracking des gibt Siems einen guten Überblick über die Praktiken, Techologien und das Ausmaß des Datentracking im Bibliotheksbereich und durch Wissenschaftsverlage und die „undurchsichtigen Datengeschäfte“ der Wissenschaftsverlage und deren Folgen auf die Wissenschaft.
7 Einen Überblick über den Einsatz von Learning Analytics an US amerikanischen Universitäten gibt bspw. Kyle et al. A Comprehensive Primer to Library Learning Analytics Practices, Initiatives, and Privacy Issues, in: College & Research Libraries 81/3 (2020) (https://crl.acrl.org/index.php/crl/article/view/24374/32187); „The next Normal: Algorithms will take over college, from admissions to advising“, Washington Post, 12.11.2021, (URL zum Artikel).
8 Arbeitspapier: EdTech-Charta, Stifterverband (Version: 02.11.2021), (URL zum Dokument, zuletzt besucht am 18.04.2022).
9 Gehring, Petra. Wissenschaftlertracking – „Das Schicksal von Open Science steht auf dem Spiel“, in: Forschung & Lehre 8 (2021) (URL zum Artikel).
10 https://www.stifterverband.org/edtech-charta
11 Siems 2022.
12 Lentsch, Justus. „Unsere Bildungsdaten gehören uns!“, Gastbeitrag auf dem Blog von Jan Martin Wiarda vom 16.02.2021 (URL zum Artikel).
13 Wegweisend für die Nutzung dieser Daten an Universitäten steht das „DataLab“ der Carnegie Mellon University, Pittsburgh (USA). Es beschreibt sich selbst als weltweit größte „bank of educational technology data — detailed data about how people learn and how effective learning software can be designed and deployed“ (https://www.cmu.edu/datalab/about-datalab/index.html).
14 Hafen, Ernst. „Meine Bildungsdaten gehören mir!“, Gastkommentar in der NZZ vom 07.07.2015.
15 https://www.dfg.de/download/pdf/foerderung/programme/lis/datentracking_papier_de.pdf.
16 Dazu Siems 2022.
17 Gehring, Petra. Wissenschaftlertracking – „Das Schicksal von Open Science steht auf dem Spiel“, in: Forschung & Lehre 8 (2021) (URL zum Artikel).
18 Benedikt, Kristin und Rolf Schwartmann. Datentracking: Wie große Verlage in Zukunft die Wissenschaft steuern, in: FAZ vom 04.08.2021 (URL zum Artikel).
19 Sie dazu bspw. die Stellungnahme der DINI-AG/ZKI-Kommission »E-Framework« „Nachhaltige Kooperationsstrukturen zur Unterstützung der Digitalisierung an Hochschulen“ (2020), (Link zur Stellungnahme).
20 Lentsch, Justus. „Unsere Bildungsdaten gehören uns!“ (Link zum Artikel).