Hochschullehre unter dem Einfluss des KI-gestützten Schreibens
Hochschullehre unter dem Einfluss des KI-gestützten Schreibens
14.07.22Plagiat oder technologischer Fortschritt? Wie soll die Hochschullehre mit Texten umgehen, die von einer künstlichen Intelligenz verfasst wurden? Doris Weßels und Ole Gottschalk fassen die Ergebnisse einer Studie, in der mehr als 100 Hochschullehrende aus Deutschland zu KI-gestützter Textgenerierung befragt wurden, für den Blog zusammen. Eines der wichtigsten Ergebnisse war, dass Hochschulen sich mit dem disruptiven Potenzial dieser KI-Werkzeuge zukünftig deutlich intensiver auseinandersetzen müssen. Zu den notwendigen Veränderungen gehört nach Meinung der Autor:innen auch eine Kennzeichnungspflicht beim Einsatz besonders leistungsstarker KI-Textgeneratoren.
Künstliche Intelligenz (KI) hat im Rahmen der Digitalisierung Einzug in unseren Lebensalltag gehalten und ist daraus nicht mehr wegzudenken. Bereits heute wird beispielweise bei der Entsperrung des Smartphones über Face-ID-Funktionen, bei der Krebserkennung in der Medizin oder auch beim Übersetzen von Texten auf KI-Technologien zurückgegriffen. Im Journalismus hat sich der Begriff des Robo-Journalismus etabliert und auch im Bereich des Marketings kann eine Fülle leistungsstarker KI-Tools genutzt werden, siehe auch diese Übersichten und Vergleiche von KI-Schreibwerkzeugen: victorytale.com/best-ai-copywriting-tools und search-one.de/automatisierte-textgenerierung.
Die Leistungsstärke und Einsatzvielfalt dieser Werkzeuge macht sie auch attraktiv für den Einsatz an Hochschulen. Naheliegende Anwendungen im Hochschulkontext sind:
- die automatische Paraphrasierung eines vorliegenden Textes
- das Generieren einer Zusammenfassung eines Kapitels
- und das Fortführen bestehender Texte.
Im Rahmen einer in der ersten Jahreshälfte 2022 erstellten Masterthesis von Ole Gottschalk unter Leitung von Prof. Dr. Doris Weßels an der Fachhochschule Kiel wurde das Einsatzpotenzial der Werkzeuge in Verbindung mit den Implikationen für das „System Hochschule“ näher untersucht.
1. Definition des KI-gestützten Schreibens
Beim KI-gestützten Schreiben sind die beiden Varianten KI-gestützte Textbearbeitung und KI-gestützte Textgenerierung aus dem Bereich des Natural Language Processing (NLP) zu unterscheiden:
Bei der KI-gestützten Textbearbeitung wird lediglich ein bestehender Text paraphrasiert, ohne die inhaltlichen Aussagen grundlegend zu verändern. Der auf diese Weise modifizierte Text bleibt nach dem derzeitigen Rechtsverständnis dabei Eigentum des ursprünglichen Verfassers, auch wenn er paraphrasiert wird, denn es ist keine primäre Eigenleistung des Bearbeiters erkennbar. Die urheberrechtliche Herausforderung im Umgang mit diesen Texten besteht darin, dass selbst hoch spezialisierte Software zur Plagiatserkennung diese KI-modifizierten Texte nach dem Rewriting in der Regel nicht als Plagiat erkennt. Der Einsatz dieser Werkzeuge zur bewussten Verschleierung von Plagiaten und das Erkennen dieses Vorgangs stellen daher für die Sicherstellung der akademischen Integrität und der „guten wissenschaftlichen Praxis“ eine große Herausforderung dar (Wahle et al., 2022; Wilder et al., 2022).
Bei der KI-gestützten Textgenerierung wird nach der Eingabe einiger Stichworte oder einer kurzen Textsequenz, die als Eingabeaufforderung interpretiert werden, ein neuer Text generiert, der als Unikat bewertet werden darf. Charakteristisch für diesen Prozess ist der stochastische Prozess des „Wörterwürfelns“, wie er bei dem derzeit führenden KI-Sprachmodell GPT-3 zu beobachten ist (siehe https://openai.com/api/). Bei jedem Aufruf mit der gleichen Textsequenz als Input entsteht ein anderes Ergebnis in der Textfortführung. Es handelt sich daher um einen nichtdeterminierten Algorithmus, da das Ergebnis von zufälligen Ereignissen abhängt. Dieser Mechanismus erschwert die Frage, ob es sich bei dieser Art von Texten um Plagiate handelt und worin die Eigenleistung einer Person liegt.
Aufbauend auf diesen Erkenntnissen wird in diesem Beitrag die folgende Definition des KI-gestützten Schreibens vorgeschlagen:
KI-gestütztes Schreiben beschreibt einen Schreibprozess, der durch eine KI-basierte Software in unterschiedlichen Phasen des Schreibprozesses und mit unterschiedlicher Intensität und Funktionalität unterstützt wird. Er gliedert sich in die beiden Teilbereiche KI-gestützte Textbearbeitung und KI-gestützte Textgenerierung. Die primären Zielsetzungen des KI-gestützten Schreibens sind die effizientere Bearbeitung vorhandener Texte oder das automatisierte Generieren neuer Textsequenzen.
2. Das Fundament der Hochschullehre
Literatur, Forschungsberichte, Hausarbeiten, Mitschriften: Eine Hochschullehre ohne das Arbeiten mit Texten aller Art ist undenkbar. Beispielhaft für Schreibzentren an deutschen Hochschulen sei die geisteswissenschaftliche Schreibwerkstatt der Freien Universität Berlin genannt. Sie betont, dass Schreiben aufgrund der Bedeutung für die „rhetorisch-argumentative Textarbeit“ als Kernkompetenz der Hochschulbildung wahrgenommen und als eigene Disziplin gelehrt werden muss (Freie Universität Berlin, 2022).
In welcher Verbindung stehen Textdokumente und klassische Prüfungsleistungen bzw. Leistungsnachweise an deutschen Hochschulen? Noch immer besteht für Studierende in vielen Studiengängen und Modulen die Prüfungsleistung darin, eine wissenschaftliche Fragestellung nach dem Schema „Einleitung – Hauptteil – Fazit“ als schriftliche Ausarbeitung zu erstellen. Mit Hilfe von Angaben zu genutzten Quellen, einer eidesstattlichen Versicherung oder auch Eigenständigkeitserklärung sowie dem punktuellen Einsatz von Plagiats-Erkennungssoftware soll sichergestellt werden, dass nicht plagiiert wurde. Dieser Umgang mit textbasierten Leistungen muss jedoch unter Berücksichtigung der großen Angebotsvielfalt niedrigschwelliger und in der Regel frei zugänglicher KI-gestützter Schreibwerkzeuge in Frage gestellt werden (Weßels, 2021). Zu klären gilt dabei nicht nur, wie die Nutzung dieser Tools im Hochschulalltag bewertet wird, sondern auch, wie sie erkannt werden kann. Sind klassische Prüfungsformen überhaupt noch möglich oder muss sich die zukünftige Hochschullehre verändern? Stellt das KI-gestützte Schreiben eine Chance oder eine Gefahr für die Hochschullehre dar?
3. Studienergebnisse zum KI-gestützten Schreiben
Eine im Zeitraum vom 23.03. bis 14.04.2022 anonymisiert durchgeführte Umfrage unter Hochschullehrenden mit 107 Teilnehmenden in Deutschland führte zu dem Ergebnis, dass die Thematik rund um das KI-gestützte Schreiben den Lehrenden zwar nicht grundlegend neu ist, ihnen die Anwendungsmöglichkeiten aber größtenteils unbekannt sind. 85 % der Hochschullehrenden nahmen aus den Bundesländern Schleswig-Holstein und Hamburg teil. Der Median innerhalb der Altersgruppe betrug 40 Jahre.
So gaben nur 3% der Lehrenden an, selbst Tools zur KI-gestützten Textgenerierung zu nutzen. Dennoch sehen viele von ihnen Vorteile bei deren Einsatz wie etwa einen Ausgleich unter Studierenden zum Beispiel in Bezug auf sprachliche Fähigkeiten oder eine Steigerung der Effizienz. Gleichzeitig sind die Lehrenden der Ansicht, dass die Bewertung von Prüfungsleistungen beim Einsatz von Tools des KI-gestützten Schreibens deutlich erschwert wird und die Fähigkeiten der Studierenden beim Verfassen von wissenschaftlichen Texten verloren gehen können.
Problematisch bleibt auch, dass ein Einsatz von KI-gestützten Tools auf Seiten der Studierenden nicht nachgewiesen werden kann. Weder Plagiats-Erkennungssoftware noch die Lehrenden können im Rahmen ihrer Begutachtung und Bewertung schriftlicher Ausarbeitungen feststellen, ob ein Text von einer KI oder von einer Person geschrieben wurde. Diese Ansicht teilten auch die Lehrenden innerhalb der Studie, denn lediglich 1% von ihnen beantworteten die Frage „Sind Sie der Meinung, dass Sie Texte von einer KI und Studierenden unterscheiden könnten?“ mit der Antwortmöglichkeit „trifft voll und ganz zu“. Diese Problematik erfordert eine proaktive Anpassung der Hochschullehre mit Blick auf moderne KI-Technologien des Natural Language Processing (NLP).
Die Lehrenden wurden auch dazu befragt, was für sie der Unterschied zwischen einem Plagiat und einem von einer KI generierten Text sei. Grundsätzlich lassen sich ihre Antworten in zwei Bereiche aufteilen, siehe die ausgewählten Zitate in Tabelle 1:
So sind viele Teilnehmende der Meinung, dass jeder von einer KI verfasste Text ein Plagiat darstelle. Dies beruht auf der vorherrschenden Meinung, dass die KI lediglich bestehende Texte übernehme und diese abändere. So nutze die KI laut Befragten „schon vorhandene Daten, also Wissen von Menschen“ und formuliert diese um. Das bedeute, dass inhaltlich kein neuer Text entstehe.
Ein anderer Teil der Lehrenden bewertet Texte von KIs nicht grundsätzlich als Plagiat, sofern ein Einsatz von Tools des KI-gestützten Schreibens kenntlich gemacht wird. Die Lehrenden sind der Meinung, dass eine Eigenleistung initial erfolgen muss, bevor eine KI diese fortführen kann. Ein elementarer Unterschied zwischen einem Plagiat und einem Text von einer KI liegt ihrer Einschätzung nach in der Angabe der Herkunft der Informationen. Diese fehlten bei einem Plagiat, sodass in der Folge das geistige Eigentum anderer als eigene Leistung angegeben werde. Texte von einer KI könnten jedoch „eine eigene wissenschaftliche Aussage des dahinterstehenden Autors haben“. Es ist somit von elementarer Bedeutung, den Einsatz von Tools des KI-gestützten Schreibens zu dokumentieren, sodass ein transparenter Umgang damit gewährleistet werden kann.
4. Gestaltung der zukünftigen Hochschullehre
Die Lehrenden wurden im Rahmen der Studie auch befragt, wie sich die zukünftige Hochschullehre unter dem Einfluss des KI-gestützten Schreibens verändern sollte. Lediglich ein kleiner Teil der Teilnehmenden sieht grundsätzlich keinen Änderungsbedarf in der Hochschullehre oder befürwortet sogar ein generelleres Verbot des Einsatzes von KI im Schreibprozess. Zeitgleich wird jedoch auch die Schwierigkeit der Durchsetzung eines solchen Verbots thematisiert.
Dem gegenüber steht der Großteil der befragten Lehrenden, der einen Bedarf der Einbindung des KI-gestützten Schreibens an Hochschulen sieht.
Dabei sehen diese Lehrenden auch einen Wechsel in der Hochschullehre. Während der eigentliche Schreibprozess ihrer Ansicht nach in den Hintergrund rückt, zeichnet sich die zukünftige Hochschullehre insbesondere durch das Verstehen und Lösen von praxisorientierten Problemen aus. Dieses Untersuchungsergebnis stützt die Empfehlung von Salden und Weßels aus dem Jahr 2021 (Salden & Weßels). Sie vertreten die Meinung, dass zukünftig die Kompetenz dominiere, einen KI-modifizierten oder auch KI-generierten Text inhaltlich zu durchdringen, ihn zu bewerten, zu korrigieren oder anzupassen und die Verantwortung für den gesamten Prozess der Textentstehung zu übernehmen.
Nach Meinung der Befragten erfordert der Einsatz von Tools des KI-gestützten Schreibens eindeutige(re) Regelungen. So müsse definiert sein, in welchem Rahmen der Einsatz solcher Tools rechtmäßig sei und wann eine Einstufung als Plagiat vorliege. Das breite Meinungsspektrum zum Anpassungsbedarf der Hochschulen wird in Tabelle 2 exemplarisch dargestellt.
Bei einer Einbindung von Tools des KI-gestützten Schreibens in die Hochschullehre bedarf es einer Sensibilisierung der Lehrenden sowie der Studierenden. Als ein erster möglicher Schritt wurde der Vorschlag geäußert, an den jeweiligen Hochschulen Gruppen von Expert:innen zu bilden, die Vorschläge zur Einbindung in die Hochschullehre, Prüfungsordnung und den Schreibprozess machen. Insbesondere die Einbindung in die Hochschullehre in Form der Einbeziehung in Lehrpläne, das generelle Lehren des Umgangs mit den Tools sowie das Sensibilisieren der Studierenden für Vor- und Nachteile nehmen hierbei eine Schlüsselrolle ein.
5. Neue Formen der Autor:innenschaft und Kennzeichnungspflichten für KI-gestützte Textproduktion
Die Untersuchungsergebnisse deuten darauf hin, dass neue Regeln erforderlich sind, um die Verantwortung der:s menschlichen Autorin:s beim Einsatz KI-gestützter Schreibwerkzeuge zu klären.
Der Philosoph und Literaturwissenschaftler Hannes Bajohr (Bajohr, 2022, S. 198) unterscheidet vier Arten der Autorschaft, bei denen er die ersten beiden Typen der primären und sekundären Autorschaft beim Einsatz klassischer Algorithmen („sequenzielles Paradigma“) für das IT-gestützte Schreiben verortet. Im Unterschied dazu sind bei der tertiären und quartären Autorschaft die unterstützenden Systeme für den Anwender eine „Black Box“, da sich beim eingesetzten Deep Learning in den Künstlichen Neuronalen Netzen (KNN) tiefe und verborgene Netzstrukturen („Hidden Layer“) bilden. Die mit diesen Systemen generierten Texte sind für Anwender:innen nicht erklärbar und überprüfbar, jedoch häufig von überraschend guter Qualität. Diese Form mit den beiden Ausprägungen der tertiären und quartären Autorschaft ordnet er dem “konnektionistischen Paradigma“ zu:
- primäre Autorschaft, ohne IT-Unterstützung in Form algorithmischer Systeme
- sekundäre Autorschaft, mit IT-Unterstützung in Form algorithmischer Systeme
- tertiäre Autorschaft, mit Unterstützung von KI-Systemen, wobei der Autor das Künstliche Neuronale Netz (KNN) eigenständig trainiert
- quartäre Autorschaft, bei der der Mensch auf vortrainierte KI-Systeme zugreifen kann und „nur“ noch seine Aufforderung als „Prompt“ eingibt.
Die aus Anwendersicht relevante quartäre Autorschaft, die beim Zugriff auf große generative Sprachmodelle („Large Language Models“ (LLM)) wie z.B. GPT-3 durch sehr einfache und kompakt formulierte normalsprachliche Befehlseingaben („Prompts“) erfolgt, spiegelt die neue Rolle des menschlichen Autors als „Machine Leader“ sehr gut wider.
Ein Beispiel ist in Abbildung 1 dargestellt. Der „Prompt“ lautete: „Erstelle einen deutschsprachigen und wissenschaftlich formulierten Beitrag zum Thema Hochschulbildung in Deutschland im Zeitalter von KI unter Berücksichtigung knapper Haushaltsmittel“.
Dargestellt sind in dem Screenshot nur die ersten Textfortführungen, die mithilfe des Buttons „Submit“ (unten links zu sehen) schrittweise in wenigen Sekunden generiert wurden.
Das vorgestellte Beispiel zeigt, dass eine Kennzeichnungspflicht beim Einsatz besonders leistungsstarker KI-Textgeneratoren (hier dem KI-Sprachmodell GPT-3 der Organisation OpenAI) dringend erforderlich ist.
Dieser Beitrag soll dazu dienen, den Diskussionsprozess in Hochschulen durch den nachfolgend dargestellten Entwurf in Abbildung 2 zu forcieren. Dieser Entwurf ist als Ergänzung zu den bereits verwendeten Eigenständigkeitserklärungen an deutschen Hochschulen zu verstehen. Er berücksichtigt die neuen Formen der Autorschaft im KI-Zeitalter und soll zugleich der Kennzeichnung leistungsstarker KI-Schreibwerkzeuge bei der Erstellung einer schriftlichen Studienarbeit (Hausarbeit/Bachelorthesis/Masterthesis) als Individualleistung dienen.
Den Autor:innen dieses Beitrags ist bewusst, dass trotz dieser neuen Form der Eigenständigkeitserklärung die im weiteren Verlauf des Prozesses auftretenden Fragen zur Bewertung von Arbeiten, die mit oder ohne KI-Unterstützung entstanden sind, sehr komplex sind und eine deutlich größere Herausforderung darstellen als die Anpassung der derzeit üblichen Eigenständigkeitserklärung an das KI-Zeitalter.
Mit Blick auf die Dynamik des technologischen Fortschritts der KI-Technologien wird eine Beschäftigung mit der Thematik rund um das KI-gestützte Schreiben im Hochschulkontext immer dringlicher (Pollmeyer et al., 2020; Weßels, 2021). Notwendig sind (endlich) konkrete Anpassungsmaßnahmen, wie sie im obigen Vorschlag vorgestellt werden, und der Mut zum Experiment – trotz der vielen Herausforderungen, die das Lehren und Lernen von Schreiben mit KI an deutschen Hochschulen mit sich bringen.
Literaturverzeichnis
Bajohr, H. (2022). Schreibenlassen: Texte zur Literatur im Digitalen (Erste Auflage). August Verlag.
Freie Universität Berlin (Hrsg.). (2022). Kernkompetenz Wissenschaftliches Schreiben. BerlinFacFachbereich Philosophie und Geisteswissenschaften. https://www.geisteswissenschaften.fu-berlin.de/studium/schreibwerkstatt/wissenschaftliches-schreiben/index.html
Pollmeyer, I., Weßels, D. & Wiebusch, A. (2020). Fakten, Fakes und Fiktion: Die wahre Herausforderung nach Corona. Die Neue Hochschule (DNH)(04), 14–17.
Salden, P. & Weßels, D. Künstlich intelligentes Schreiben. DUZ – Magazin – Wissenschaft & Management, 11/2021, 45–48. https://www.duz.de/ausgabe/!/id/562
Wahle, J. P., Ruas, T., Foltýnek, T., Meuschke, N. & Gipp, B. (2022). Identifying Machine-Paraphrased Plagiarism, 13192(1), 393–413. https://doi.org/10.1007/978-3-030-96957-8_34
Weßels, D. (2021). Verführerische Werkzeuge – Plagiate und KI-gestützte Textproduktion an Hochschulen? Forschung&Lehre, 12/2021, 1018 f. https://www.forschung-und-lehre.de/zeitfragen/ki-gestuetzte-textproduktion-an-hochschulen-4292
Wilder, N., Weßels, D., Gröpler, J., Klein, A. & Mundorf, M. (2022). Forschungsintegrität und Künstliche Intelligenz mit Fokus auf den wissenschaftlichen Schreibprozess: Traditionelle Werte auf dem Prüfstand für eine neue Ära. In K. Miller, M. Valeva & J. Prieß-Buchheit (Hrsg.), Verlässliche Wissenschaft: Bedingungen, Analysen, Reflexionen (1. Aufl., S. 203–223). wbg Academic in Wissenschaftliche Buchgesellschaft (wbg). https://files.wbg-wissenverbindet.de/Files/Article/ARTK_ZOA_1025976_0001.pdf