KI als Prüfstein universitärer Lehre
KI als Prüfstein universitärer Lehre
24.07.24Inhaltsverzeichnis
Mit Hilfe von textbasierter künstlicher Intelligenz (KI) können sprachlich hochwertige Texte schnell und effizient generiert werden. Seit der Veröffentlichung von ChatGPT Ende 2022 wird vor diesem Hintergrund (wieder) besonders intensiv über die Strukturen von Lehre und Prüfungen an den Universitäten diskutiert (Weimann-Sandig, 2023) sowie Leitlinien für gute wissenschaftliche Arbeit optimiert (Gimpel et al., 2023; Mohr et al., 2023). Der folgende Beitrag „KI als Prüfstein universitärer Lehre“ von Prof. Dr. Boris Zizek und Bettina Gautel erläutert den aktuellen Stand der Diskussion und gibt Anregungen, wie KI in Prüfungen sinnvoll eingesetzt werden kann.
1. Einleitung
Unser Ziel, basierend auf unserem Selbstverständnis als Bildungs- und Erziehungswissenschaftler:innen sowie Ausbilder:innen zukünftiger Lehrkräfte und Bildungswissenschaftler:innen, besteht darin, die Studierenden nicht nur im Hinblick auf eine reflektierte Handlungsfähigkeit (Dannemann et al., 2019; Labede et al., 2023) zu sensibilisieren und zu schulen, sondern auch ihre Handlungsbereitschaft durch die Vermittlung demokratischer Werte, einer verantwortungsbewussten und innovationsbereiten Haltung sowie eines professionalisierten Habitus (Zizek, 2021) zu fördern.
In den folgenden Ausführungen haben wir versucht, ausgehend von diesem Selbstverständnis verallgemeinerbare Prinzipien zum Umgang mit KI-Tools in Lehre und Prüfungen zu formulieren. Dabei ist sicherlich davon auszugehen, dass es fachkulturelle Unterschiede gibt, die wir mit unseren Überlegungen aktuell noch nicht abbilden. Gleichwohl ist es unser Ziel, einen Dialog über fach- und universitätsübergreifende Prinzipien zum Umgang mit KI-Tools in Lehre und Prüfungen sowie zukünftig auch im Bereich der Forschung auszulösen, da die beständige (Weiter-)Entwicklung von KI-Tools uns nicht nur in einem Fach, sondern die Universität als Bildungs- und Forschungsinstitution in der Gesamtheit herausfordert.
2. Vertieftes Verständnis
Ein vertieftes Verständnis von Bildungs- und Sozialisationsprozessen sowie effektiver Lehr-Lern-Settings, um Reflexion als Prozess des strukturierten Analysierens (von Aufschnaiter et al., 2019) zu ermöglichen, lässt sich als übergeordnetes Ziel der Bildungs- und Erziehungswissenschaft am Standort Hannover formulieren. Gleichzeitig gilt es, Kriterien guter wissenschaftlicher Praxis im Zusammenhang mit der Erfahrung von Forschungsprozessen innerhalb verschiedener Forschungstraditionen zu vermitteln. Konkretisiert werden kann dieses vertiefte Verständnis zum Beispiel anhand von Blooms Lernzieltaxonomie (Anderson & Krathwohl, 2001):
2.1 Breites Feldwissen
Parallel und ergänzend zum vertieften Verständnis sehen wir das breite Feldwissen, das zum Beispiel in Vorlesungen oder Einführungs- und Handbüchern vermittelt wird. Während das vertiefte Verständnis sich nicht gleichzeitig in mehreren theoretischen oder methodischen Paradigmen (Kuhn 1996) erarbeiten lässt, verschaffen die genannten Lehr- und Publikationsformate ein Wissen über benachbarte und kontrastierende Zugänge zu denselben Themen und auf diese Weise eine produktive Distanz zum eigenen Paradigma. Produktiv ist die Distanz, insofern den Studierenden deutlich wird, dass das Paradigma, in dem sie sich gerade mit Interesse bewegen, nicht der einzige und nicht der alles erklärende, sondern bestenfalls besonders aufschlussreiche Zugang ist.
2.2 Wissenschaftliches Arbeiten
Ausgehend von diesem Verständnis von Bildungsprozessen folgt die Frage, welches Ziel bzw. welche Funktion die (wissenschaftlichen) Schreibaufgaben, welche durch KI-Tools so bedroht scheinen (Weimann-Sander, 2023), eigentlich erfüllen sollen. Angelehnt an die Überlegungen von Hanke (2023) stellen wir hier die Unterstützung des Lernens sowie die Überprüfung von Wissen und Können als zentrale Ziele heraus. Das wissenschaftliche Schreiben stellt darüber hinaus eine strukturierte Grundform einer exemplarischen eigenständigen, komplexen und differenzierten Auseinandersetzung mit einem bestimmten Thema oder einem spezifischen Fokus dar, die erlernt und erfahren werden soll.
Die beständige (Weiter)Entwicklung der KI-Tools zwingt uns vor diesem Hintergrund, die Kriterien zur Erreichung (Prüfungsformate) aber auch Vermittlung (Lehrformate) dieser Ziele neu zu überdenken. In Anlehnung an Gardners und Davis` Unterscheidung „app-enabling“ und „app- dependent“ (2014), sollten alle Nutzungsformen dahingehend geprüft werden, ob sie den Bildungsprozess der Studierenden fördern (KI unterstützte Explorer) oder sie zu passiven, die oben genannte Auseinandersetzung vermeidenden Usern (KI gestützte Minimalisten) machen. Um das Risiko „Lernen vermeiden“ zu verhindern bzw. einzuschränken, bedarf es:
- Einer klaren und fundierten Aufklärung der Studierenden über die genannten, bildungsrelevanten Zusammenhänge und
- Klarer Leitlinien für Studierende und Lehrende, wann und in welcher Form KI-Tools verwendet werden (sollten und dürfen), um Lern- und Bildungsprozesse zu unterstützen und nicht zu vermeiden. Zum anderen besteht eine (neue) Aufgabe in Bezug auf wissenschaftliches Arbeiten darin, den Studierenden KI-bezogene Kompetenzen (Stichwort: KI-Literacy (vgl. Long & Magerko 2020; Laupichler et al. 2022)) zu vermitteln. Im Folgenden soll erläutert werden, was dieses Verständnis für die Prüfungs- und Lehrformate unter Einbezug von KI-Tools bedeuten kann.
3. Lehrformate
Wenngleich seit der Veröffentlichung von ChatGPT (2022) beeindruckt bis ablehnend über KI-Tools in der (Hochschul-)Lehre diskutiert wird, bleiben sie vor allem ein (neues) Werkzeug, welches das Lernen sowie wissenschaftliches Arbeiten unterstützen kann. Zugleich verweisen Expert:innen darauf, dass eine Verweigerung der Auseinandersetzung mit diesen Tools nicht zu empfehlen ist, da diese bereits zeitnah in Suchmaschinen und Textverarbeitungsprogrammen integriert werden (Salden, Lordick & Wiethoff, 2023; www.einfachlehren.de, Hochschuldidaktische Arbeitsstelle, TU Darmstadt). Anstatt eines Verbots bedarf es also klarer und vor allem begründeter Empfehlungen und Regeln für den Umgang mit KI-Tools, die beständig aktualisiert werden. Schlussfolgernd gilt, wenn KI-Tools in Prüfungen erlaubt sind, dann muss vorher in der Lehre eine Auseinandersetzung mit diesen Tools erfolgen und / oder Hilfestellungen für Studierende formuliert werden (z. B. Wie formuliere ich Prompts?, Wie zitiere ich ChatGPT? etc.). Denn die Qualität der von einer KI wie ChatGPT generierten Texte hängt maßgeblich von der formulierten Arbeitsanweisung (engl. Prompt) ab (Gimpel et al., 2023; Spannagel, 2023). Mit diesem Prozess rückt nach Salden, Lordick & Wiethoff (2023) vor allem die Kompetenz der Nutzer:innen in den Vordergrund und deren Vermögen, konkrete Prompts für die Formulierung bzw. Verbesserung ihrer wissenschaftlichen Arbeit zu formulieren. Schlussfolgernd wird „prompt engineering“ als eine Schlüsselkompetenz im Umgang mit KI-Tools formuliert (Salden, Lordick & Wiethoff, 2023), welche es in der Hochschullehre als neue Facette des wissenschaftlichen Arbeitens zu schulen gilt (Hanke, 2023).
Bereits diese knappe Darstellung der Bedingungen zum erfolgreichen Einsatz von KI-Tools in der Hochschullehre skizziert die Aufgabe der Lehrenden (und Hochschulen), KI-Literacy in Bezug auf wissenschaftliche Arbeits- und Schreibprozesse zu schulen. Gleichzeitig setzt dies ausreichend „Wissen über die Funktionsweise von KI-Schreibtools und damit verbundenen Limitationen und Fehlerquellen, Strategien zu effizienten Promptings, Strategien zur Überprüfung von Quellen und der Richtigkeit der generierten Informationen, Strategien zur Überarbeitung KI-generierter Texte sowie zum wiederholten Analysieren und kritischen Reflektieren KI-generierter Textpassagen anhand von Qualitätskriterien für die jeweilige Textsorte“ (Brommer et al., 2023, S. 5) voraus.
Als Lehrende obliegt uns somit die Aufgabe, unsere eigene Kompetenzentwicklung im Umgang mit KI-Tools bzgl. wissenschaftlicher Arbeits- und Schreibprozesse zu verantworten. In Anlehnung an Brommer et al. (2023) möchten auch wir betonen, dass die Aneignung dieser beschriebenen Expertise auch im Aushandlungsprozess mit den Studierenden ̶ im Sinne der Ko-Konstruktion von Wissen ̶ geschehen kann, um voneinander und miteinander zu lernen.
4. Prüfungsformate
KI-generierte Texte sind mit der üblichen Plagiatssoftware nicht zu erkennen. Aus diesem Grund besteht die in Bildungsinstitutionen übergreifende Sorge, dass Studierende (zukünftig) vermehrt in Prüfungen „schummeln“; Haus- und Abschlussarbeiten, Berichte, Essays, (Open-Book-)Klausuren scheinen von diesem Verdacht besonders betroffen.
Ausgehend von unserem Ziel, ein vertieftes Verständnis von Bildungs- und Sozialisationsprozessen sowie effektiver Lehr-Lern-Settings zu erreichen, lassen sich die von uns gestellten Aufgaben in drei Bereiche einteilen.
4.1 Paper- Pencil-Klausuren (breites Feldwissen prüfend)
Zum einen werden Aufgaben der Lernzielstufen „Erinnern“ und „Verstehen“ gestellt, um Faktenwissen bzgl. eines (breites) Feldwissens zu prüfen, welches als begleitende Horizonterweiterung (produktive Distanz) bei der Entwicklung eines vertieften Verständnisses fungieren soll. Dieses Wissen gilt es weiterhin klassisch durch überwachte Paper-Pencil-Klausuren zu prüfen, um sicherzustellen, dass die Studierenden gewünschte kognitive Prozesse zeigen. Gleichwohl gilt es diese Szenarien dann auch in der Lehrveranstaltung ohne KI-Tools zu üben (Spannagel, 2023).
Zum anderen soll das vertiefte Verständnis (unter Berücksichtigung von Kriterien guten wissenschaftlichen Arbeitens) gerahmt durch die Lernzielstufen „Anwenden“, „Analysieren“, „Bewerten“ und „Entwickeln“ geprüft werden. Dies kann unserer Meinung nach auf zwei Wegen erfolgen:
4.2 Praktische Prüfungsformen (z. B. Mündliche Prüfung)
In ihrer Übersicht zu „Lernen und Prüfen in einer Welt mit ChatGPT mit Hilfe der Lernzieltaxonomie“ verdeutlicht Hanke (2023), dass die Notwendigkeit schriftliche Prüfungsformate, die ohne Aufsicht erfolgen, durch mündliche Prüfungen oder praktische Aufgaben zu ergänzen, steigt. Mündliche Prüfungen bieten den Rahmen in Präsenz Verstehensprozesse (z. B. von einzelnen Primärtexten) im Dialog sichtbar zu machen. Je nach Anforderungsniveau und Aufgabenstellung ist auch die Kombination aus einem Schriftprodukt und einer mündlichen Prüfung denkbar (Mohr et al., 2023; Spannagel, 2023).
4.3 Haus- und Abschlussarbeiten
Haus- und Abschlussarbeiten werden als besonders von ChatGPT bedrohte Prüfungsform eingeordnet (z. B. Weimann-Sandig, 2023). Dennoch ist die oben bereits erwähnte Besonderheit dieses Prüfungsformats, nämlich dass die Studierenden sich ausschließlich in wissenschaftlichen Arbeiten ganzheitlich mit einem bestimmten Thema oder einem spezifischen Fokus eigenständig und differenziert auseinandersetzen, in dieser Diskussion herauszustellen. Ausgehend davon sprechen wir uns dafür aus, weiterhin an der Prüfungsform der Hausarbeit festzuhalten, es jedoch (auch bei der Benotung) einer stärkeren Betonung von Reflexionsprozessen und/oder der Auseinandersetzung mit KI-Tools für das Erstellen einer wissenschaftlichen Arbeit auf der Metaebene, z. B. in Form eines Prozessprotokolls, bedarf. Zusätzlich betont Weimann-Sandig (2023), KI-Tools wie ChatGPT auch als Tool zu verstehen, kritisches Denken in Bezug auf die Prozesse wissenschaftlichen Schreibens, z. B. der Formulierung einer dezidierten Fragestellung anzuregen. Wird ChatGPT als „Sparring-Partner:in“ verstanden, können die von ChatGPT vorgeschlagenen Antworten und Lösungen als Ausgangspunkt genutzt werden, um diese Informationen kritisch zu analysieren und zu bewerten und Schlussfolgerungen für die eigenen (Haus-)Arbeit abzuleiten.
Grundsätzlich lohnt sich also die Reflexion jeder:jedes individuellen Lehrenden, inwiefern sich in bisherigen Prüfungsformaten Lernprozess und Prüfungsprodukt vermischen und ob lernprozessbegleitende Lern- und Prüfungsaufgaben (Stichwort: formative Lern- und Prüfungsaufgaben (Salden, Lordick & Wiethoff, 2023)) eher den formulierten Lernzielen entsprechen.
Abschließend bleibt hervorzuheben, dass unabhängig davon, welches Prüfungsformat die Lehrenden innerhalb des spezifischen Lehrveranstaltungskontexts wählen, es frühzeitig transparent zu machen gilt, ob und wenn ja, welche (KI-basierten) Hilfsmittel für die Prüfung verwendet werden dürfen und welche Bewertungskriterien gelten.
5. Fazit und Schlussfolgerungen für Lehr- und Prüfungsformate am IEW
Aus den bisher dargestellten Schlussfolgerungen für Lehr- und Prüfungsformate lassen sich folgende Vorteile und Risiken der KI-Tools in der Hochschullehre und Prüfungen noch einmal zusammenfassend darstellen: Als klare Chance von ChatGPT und ähnlichen KI-Tools wird herausgestellt, dass es uns einen Anlass bietet, die bisherige Prüfungspraxis an den Hochschulen zu hinterfragen und das Ziel von (wissenschaftlichen) Schreibaufgaben zu reflektieren (Weinmann-Sandig, 2023). Ausgehend von dieser Reflexion können nicht nur neue Prüfungsformate, sondern auch differenzierte Aufgaben für die Studierenden sowie klarer herausgearbeitete Qualitätskriterien für gute wissenschaftliche Praxis entstehen. Darüber hinaus bietet ein reflektierter (und sicherlich zunächst auch angeleiteter) Umgang mit ChatGPT die Möglichkeit zur Entwicklung von Digital bzw. KI Literacy (Mohr et al., 2023).
Als ein aktuelles Risiko ist sicherlich die Sammlung von Nutzungsdaten zu betrachten (siehe dazu: Mohr et al., 2023). Darüber hinaus gilt es, die Studierenden dafür zu sensibilisieren, dass die Informationen, die ChatGPT generiert, nicht korrekt sein müssen. Ganz im Gegenteil, „die ausgegebenen Antworten sind kein Faktenwissen, entsprechend nicht zwingend fehlerfrei sowie möglicherweise einseitig verzerrt“ (Mohr et al., 2023, S. 6). Zusätzlich besteht eine Bias-Gefahr; „sowohl die Auswahl des Datenkorpus als auch die für die Datengrundlage genutzte Sprache (Englisch) können zu einem Bias bei den Antworten führen“ (Mohr et al., 2023, S. 6). Insbesondere im wissenschaftlichen Kontext (aber selbstverständlich auch darüber hinaus) gilt es die von ChatGPT generierten Antworten und Textpassagen in Bezug auf Fehlinformationen und frei generierte Zitate oder Quellen (Mohr et al., 2023) und aktuelle wissenschaftliche Quellen zu prüfen, da diese in der Regel nicht berücksichtigt werden (können).
Abschließend ist festzuhalten, dass wir – die Autor:innen – die Entwicklung und Verbreitung von ChatGPT und weiterer KI-Tools als Chance sehen und nutzen möchten, um unsere Kriterien für gute wissenschaftliche Praxis zu reflektieren sowie unsere Lehr- und Prüfungskultur hinsichtlich unseres Ziels das vertiefte Verständnis von Lehr-Lern- und Sozialisationsprozessen der Studierenden zu fördern und (neu) zu evaluieren. Gleichzeitig gilt es dabei, die Risiken dieser Tools im Rahmen der Förderung der KI Literacy kritisch mit den Studierenden zu diskutieren.
Autor:innen
Prof. Dr. Boris Zizek
Boris Zizek studierte Literatur- und Sozialwissenschaften bei Ulrich Oevermann an der Goethe-Universität Frankfurt und Erziehungswissenschaften an der Gutenberg-Universität Mainz bei Detlef Garz, wo er 2012 promoviert und 2015 habilitiert wurde. Von 2014 bis 2016 forschte er als Postdoctoral Fellow bei Robert L. Selman an der Harvard Graduate School of Education zu digitalen Sozialisationsräumen. Zizek hatte eine Professur an der Universität Hamburg und Hannover inne, auf die er 2017 berufen wurde und wo er seither Sozialisationsprozesse mit qualitativen Methoden rekonstruiert und an international vergleichender qualitativer Adoleszenzforschung arbeitet. Sein Interesse gilt auch dem Aufwachsen in Konfliktkontexten, mit Migrationshintergrund, in der Spätmoderne und in digitalen Erfahrungsräumen.
Bettina Gautel
Bettina Gautel studierte die Fächer Deutsch, Philosophie und Englisch für das Lehramt an Gymnasien an der Leibniz Universität Hannover. Seit 2020 ist Bettina Gautel Doktorandin an Institut für Erziehungswissenschaft unter Prof. Dr. Katharina Müller. Ihre Forschungs- und Arbeitsschwerpunkte liegen im Bereich Mentoring und Peer Coaching in Praxisphasen sowie der Erforschung professionsspezifischer Kompetenzen in simulationsbasierten Lernumgebungen.
Kontakt:
https://www.iew.uni-hannover.de/de/bgautel
https://www.linkedin.com/in/bettina-gautel-988b892b5/
- Anderson, L. W. & Krathwohl, D. R. (2001): A Taxonomy for Learning, Teaching, and Assessing. A Revision of Bloom’s Taxonomy of Educational Objectives. Addison-Wesley
- Brommer, S., Berendes, J., Bohle-Jurok, U., Buck, I., Girgensohn, K., Grieshammer, E., Gröner, C., Gürtl, F., Hollosi-Boiger, C., Klamm, C., Knorr, D., Limburg, A., Mundorf, M., Stahlberg, N., Unterpertinger, E. (2023). Wissenschaftliches Schreiben im Zeitalter von KI gemeinsam verantworten. Diskussionspapier Nr. 27. Hochschulforum Digitalisierung. https://hochschulforumdigitalisierung.de/wp-content/uploads/2023/11/HFD_DP_27_Schreiben_KI.pdf
- Dannemann, S., Gillen, J., Krüger, A., Oldenburg, M., von Roux, Y. & Sterzik, L. (2019). Zur Entwicklung des Leitbilds der Reflektierten Handlungsfähigkeit – Herausforderungen und Chancen für die erste Phase der Lehrer*innenbildung. In: S. Dannemann, J. Gillen, A. Krüger & Y. Von Roux (Hrsg.). Reflektierte Handlungsfähigkeit in der Lehrer*innenbildung. Leitbild, Konzepte und Projekte, (S. 15-36). Logos Verlag Berlin.
- Gimpel, H., Hall, K., Decker, S., Eymann, T., Lämmermann, L., Mädche, A., Röglinger, M., Ruiner, C., Schoch, M., Schoop, M., Urbach, N. & Vandirk, S. (2023). Unlocking the power of generative AI models and systems such as GPT-4 and ChatGPT for higher education. https://digital.uni-hohenheim.de/fileadmin/einrichtungen/digital/Generative_AI_and_ChatGPT_in_Higher_Education.pdf
- Hanke, U. (2023, 8. Februar). Lernen und Prüfen in einer Welt mit ChatGPT mit Hilfe der Lernzieltaxonomie. [Video]. YouTube. https://www.youtube.com/watch?v=re5j1I6jHTE
- Gardner, H., & Davis, K. (2014). The App Generation. Yale University Press.
- T. S. (1996). Die Struktur wissenschaftlicher Revolutionen. Frankfurt am Main: Suhrkamp.
- Labede, J., Müller, K. & Schanze, S. (2023). Forschungsbasiert. Reflektiert. Handlungsfähig. Entwicklungslinien der Lehrer:innenbildung an der Leibniz Universität Hannover im Rahmen des durch die Qualitätsoffensive Lehrerbildung geförderten Leibniz-Prinzips. In: J. Gillen, J. Labede, B. Lindmeier, K. Müller, A. Nehring, S. Schanze (Hrsg.) , (S. 13-26). Academia.
- Laupichler, M. C., Aster, A., Schirch, J., & Raupach, T. (2022). Artificial intelligence literacy in higher and adult education. A scoping literature review. Computers and Education: Artificial Intelligence (3), 15. https://doi.org/https://doi.org/10.1016/j.caeai.2022.100101
- Long, D., & Magerko, B. (2020). What is AI Literacy? Competencies and Design Considerations. In R. Bernhaupt & F. F. Mueller (Eds.), CHI ’20: Proceedings of the 2020 CHI Conference on Human Factors in Computing Systems, Honolulu HI USA, April 25–30, 2020 (S. 1–16). Association for Computing Machinery. https://doi.org/https://doi.org/10.1145/3313831.3376727
- Mohr, G., Reinmann, G., Blüthmann, N., Lübcke, E. & Kreinsen, M. (2023). Übersicht zu ChatGPT im Kontext Hochschullehre. Hamburger Zentrum für Universitäres Lehren und Lernen (HUL).
- Salden, P., Lordick, N. & Wiethoff, M. (2023). KI-basierte Schreibwerkzeuge in der Hochschule. Eine Einführung. https://hss-opus.ub.ruhr-uni-bochum.de/opus4/frontdoor/index/index/docId/9734
- Spannagel, C. (2023). ChatGPT und die Zukunft des Lernens: Evolution statt Revolution. https://hochschulforumdigitalisierung.de/de/blog/chatgpt-und-die-zukunft-des-lernens-evolution-statt-revolution
- Technische Universität Darmstadt. (2023, 21. November). Künstliche Intelligenz in der Hochschullehre am Beispiel von ChatGPT. einfachlehren.de, Hochschuldidaktische Arbeitsstelle, TU Darmstadt
- Weinmann-Sandig, N. (2023). ChatGPT – Eine Chance zur Wiederbelebung des kritischen Denkens in der Hochschullehre. https://hochschulforumdigitalisierung.de/de/blog/praxistest-chatgpt-weimann-sandig
- Von Aufschnaiter, C., Fraij, A. & Kost, D. (2019). Reflexion und Reflexivität in der Lehrerbildung. Herausforderung Lehrer*innenbildung – Zeitschrift zur Konzeption, Gestaltung und Diskussion, 2(1), 144-159. https://doi.org/10.4119/hlz-2439
- Zizek, B. (2021). Process, stages and methodical stimulation of the development of a professional attitude – A reconstructive approach to teacher ethos. In The International Handbook of Teacher Ethos: Strengthening Teachers, Supporting Learners (S. 297-323). Springer International Publishing. AG. https://doi.org/10.1007/978-3-030-73644-6_18