KI-Primat vs. KI-Gnadentum – ein Promptversuch in der Praxis

KI-Primat vs. KI-Gnadentum – ein Promptversuch in der Praxis

28.10.25

Foto von den Buchrücken alter Bücher. Darunter der Text: KI-Primat vs. KI-Gnadentum. Ein Promptversuch in der Praxis. Ein Blogartikel von Bastian Aljoscha Turowski.

In diesem Blogbeitrag beschreibt Bastian Aljoscha Turowski, wie er generative KI in einem geschichtswissenschaftlichen Seminar an der Universität Münster eingesetzt hat. Dazu hat er ChatGPT auf Basis historischer Quellen argumentieren lassen und seinen Studierenden den Auftrag gegeben, die Aussagen kritisch zu untersuchen. Wie genau er dabei vorgegangen ist, wie es funktioniert hat und ob er der Meinung ist, dass generative KI einen Platz in einem universitären Seminar hat, beschreibt er in diesem Artikel.

Der Beitrag untersucht die Integration generativer KI in eine universitäre Seminarsitzung zum Investiturstreit. Aufbauend auf Tilman Struves Analyse zur politischen Theorie der Salierzeit wurde auf die Methode KI-generierter „Personae“ zurückgegriffen, um zeitgenössische Argumentationsmuster nachzubilden. Ziel war es, die Lernenden zur kritischen Reflexion dieser Argumentationsweisen anzuregen und eine Überwindung der im Seminar zuvor beobachteten „heiligen Scheu“ vor den Quellen zu erwirken. Die Durchführung des Unterrichtsversuchs zeigt, dass die Studierenden quellenkritisch und differenziert mit den KI-Texten arbeiten und zentrale Aspekte der im Seminar besprochenen Themen herausarbeiten können. Der Beitrag belegt die Tendenz der Forschung zum KI-Einsatz an Universitäten, dass KI bei gezieltem und richtigem Einsatz in Verbindung mit den richtigen Themen und Texten ein produktives Mittel und Werkzeug zur Förderung, insbesondere zum Abbau von Hemmungen gegenüber der Quellenkritik, sein kann.

Thema des Proseminars und angezielte Sitzung

Im Sommersemester 2025 habe ich ein Proseminar mit dem Titel „Auctoritas in sacro imperio oder Chefsache: Zwischen Kirchenreform und Investiturstreit“ abgehalten. Das Seminar widmete sich den Ereignissen sowie den zentralen Forschungsdiskursen des sogenannten „Investiturstreits“ (seit Rudolf Schieffers Habilitationsschrift „Die Entstehung des Investiturverbots für den deutschen König“ wird der Begriff „Investiturstreit“ entweder in Anführungszeichen gesetzt oder schon insgesamt gar nicht mehr für die Konflikte dieser Zeit verwendet, weil er viel zu wenig die gesamten Entwicklungen der Zeit in den Blick nimmt).

Gemeinsam mit den Studierenden habe ich nach einer allgemeinen Einführung zunächst zentrale Kernbegriffe der Kirchenreformbewegung (libertas ecclesiae, Nikolaitismus und Simonie) und des Selbstverständnis des Papstamtes (primus inter pares und plenitudo potestatis) erarbeitet. Darauf aufbauend untersuchten wir das herrschaftliche Selbstverständnis und die Herrschaftspraxis des König- und Kaisertums im 10. und frühen 11. Jahrhundert. Hieran knüpfte sich eine Sitzung zu den monastischen Reformbewegungen des 11. Jahrhunderts am prominentesten Beispiel an: dem Reformkloster Cluny. Dabei konnten der Einfluss, das Selbstverständnis und auch die Ziele der monastischen Reformbewegung verbunden mit einem vertieften Verständnis der zeitgenössischen Reformdiskurse gewonnen werden. Die sechste Sitzung des Seminars behandelte das sakrale Herrschaftsverständnis Heinrichs III. und die sog. „Synode von Sutri“ 1046: Dabei wurden die unterschiedlichen Interessen und Amtsauffassungen von Kaisertum und Papsttum sichtbar, welche zuvor noch als Einheit gedacht wurden (vgl. u. a. Struve, 1991). Heinrich III. setzte kurzerhand drei gleichzeitig amtierende Päpste ab und erhob eigenständig einen neuen Papst auf den Stuhl Petri. An diesem kritischen Wendepunkt des Seminars setzte schließlich gezielt der Einsatz von KI an, um den Studierenden durch aktive Einbindung digitaler Tools eine tiefere und zugleich kritische Reflexion des zeitgenössischen Diskurses zu ermöglichen.

Angaben zur Lerngruppe

Die Lerngruppe des Proseminars besteht aus insgesamt zwölf Studierenden. Besonders auffällig ist, wie unterschiedlich ausgeprägt die Vorkenntnisse zum Seminarthema „Kirchenreform und Investiturstreit” sind. Dies zeigt sich insbesondere darin, dass wir häufig zunächst erheblich viel Zeit investieren müssen, um die grundlegenden Ereigniszusammenhänge zu erarbeiten, bevor sich die Studierenden aktiv in den Forschungsdiskurs einbringen können. Am Anfang des Seminars habe ich eine deutliche Scheu in der Diskussion im Seminar wahrgenommen. Was mir bei diesem Proseminar im Vergleich zu anderen Seminaren besonders aufgefallen ist, ist dass die Studierenden nach dem „Ankommen“ im Seminar sowohl die konkreten Texte als auch abstrakte Seminarinhalte mit bemerkenswertem Interesse und Engagement diskutieren. Das führt in vielen Fällen dazu, dass sie die behandelten Forschungsdiskurse kritisch und differenziert reflektieren.

Andererseits besteht jedoch eine ausgeprägte Hemmung, Quellenpassagen kritisch zu hinterfragen oder gar zu dekonstruieren – allerdings nicht, wie vielfach bereits in der Forschung diagnostiziert, wegen mangelnder Textlektüre (das Problem mangelnder Textlektüre durch die Studierenden behandeln auch Thieme/Weiß, 2020. Dieses Problem war auch schon vor der Corona-Pandemie und dem Einsatz von generativer KI bekannt. Allerdings zeigt sich in dem hier geschilderten Problem bei der untersuchten Gruppe keine Schwäche im Verständnis der Zeit oder im mangelnden Lesen der Texte, sondern eine reale Hemmung vor dem Dekonstruieren der Quellenaussagen.). Diese Hemmung könnte man durchaus als „heilige Scheu“ vor den Quellen beschreiben (religio fontium). An dieser ambivalenten Beobachtung zwischen kritischer Diskussionsfreude und methodischer Zurückhaltung setzt der nachfolgende Beitrag in der Umsetzung von generativer KI in der Hochschullehre an.

Versuchsaufbau

Die Vor- und Nachteile vom Einsatz generativer KI in Forschung und Lehre sind bereits ausführlich erörtert worden und werden es noch immer (vgl. König und Zefferer), weshalb es darum in diesem kurzen Beitrag nicht gehen soll. Im Rahmen der zuvor skizzierten Sitzung, die das sakrale Herrschaftsverständnis Heinrichs III. thematisierte und damit in die beginnenden divergierenden Interessen der beiden Universalgewalten in regnum und sacerdotium hineinführte, habe ich in einem ersten Ansatz mit Studierenden versucht, ChatGPT zu integrieren, indem es die zeitgenössischen Argumentation nachbilden sollte. Textgrundlage war der Aufsatz von Tilman Struve, der die grundlegenden Veränderungen politischen Denkens über König- und Priestertum im 11. Jahrhundert beleuchtet (vgl. Struve, 1991). Vor dem abrupten Auseinanderbrechen der Universalgewalten in die Bereiche regnum und sacerdotium, besaß der König (im Falle Heinrichs III., der Kaiser) eine umfassende weltliche wie auch kirchliche Autorität, die jedoch im Zuge der aufkeimenden Kirchenreformbewegung immer weiter in den Fokus der Debatte um den Einfluss von Laien auf die Kirche und die Forderung nach der sogenannten libertas ecclesiae geriet (es wäre anachronistisch, zu glauben, dass die Universalgewalten bereits zwei eigenständige Bereiche ausmachten. Das Auseinandertreten ist ein Prozess, wie auch Struve im Text selbst sagt. Der Einfluss des Königs als gedachtem Laien tritt natürlich erst stärker unter Heinrich IV. in die Kritik der Reformer, vgl. Struve, 1991).

In dieser Debatte kristallisierten sich zwei gegensätzliche Positionen mit prominenten Vertretern heraus: Die pro-päpstliche Position, vertreten durch Petrus Damiani und Humbert von Silva Candida auf der einen Seite und eine pro-königliche Argumentation, vertreten durch Autoren wie den Normannischen Anonymus oder Petrus Crassus. In dem zitierten Aufsatz stellt Tilman Struve diese einander gegenüber und zeigt die Intensivierung der Positionen auf, die sich schlussendlich in der politischen Ebene kristallisierten.

Angeregt durch Überlegungen Marian Zefferers sowie durch eigene Experimente mit ChatGPT entwickelte ich die Idee, generative KI gezielt in die universitäre Lehre zu integrieren. Der Einsatz sogenannter „Personae“ schien mir als besonders geeignet, um komplexe und teilweise disparat überlieferte Positionen der vorliegenden Argumentationsstränge in verdichteter Form argumentativ greifbar zu machen. Die KI übernahm dabei die Rolle eines fiktiven, aber historisch verorteten Sprechers, der eine bestimmte Argumentationslinie – etwa die eines kirchlichen Reformers oder königlichen Beraters – vertrat. Ziel dieses didaktischen Experiments war es einerseits, zu prüfen, inwiefern generative KI in der Lage ist, historische Denkstile und Argumentationsmuster so überzeugend wie möglich zu simulieren, und andererseits, ob Studierende diese Positionen kritisch analysieren, dekonstruieren und im Sinne einer quellenkritischen Haltung einordnen können. Zudem wollte ich danach schauen, ob der Einsatz dieser Art von KI bei der zuvor skizzierten „heiligen Scheu“ vor den Quellen Abhilfe schaffen kann.

Der Prompt sollte sowohl die historische als auch die argumentativ-inhaltliche Zielsetzung miteinander verbinden und die konkurrierenden Ordnungsvorstellungen der Zeit bewusst abbilden und einander gegenüberstellen. Ausgangspunkt ist die klare zeitliche und personelle Verortung der KI-Rolle: Mit der Aufforderung, sich in diese KI-Persona um das Jahr 1050 zu versetzen, soll die Argumentation in der zeitgenössischen Denkform (das heißt vor dem Zerwürfnis zwischen Heinrich IV. und Gregor VII. und möglichst in der noch gedachten Einheit von regnum und sacerdotium) dezidiert begrenzt werden, um möglichst teleologische Argumentationsweisen oder auch Anachronismen zu vermeiden.

Wir haben die zentrale Begründung der päpstlichen beziehungsweise der königlichen Legitimitätsverleihung vorgegeben, die das Konfliktpotential der Zeit adressiert. Insbesondere sollte bei der pro-päpstlichen Position die Gefahr für das Papsttum durch den Eingriff Heinrichs III. erläutert werden und auf gezielte theologische Argumente, dabei insbesondere die Zwei-Schwerter-Lehre des Papstes Gelasius eingegangen werden. Wir forderten die KI auf, im Rahmen von 600 bis 800 Wörtern zu antworten, damit sie auch  in längerer Form mehrere Argumente beziehungsweise Argumentationsketten bilden kann. Außerdem gaben die beiden theologischen Argumentationsvorgaben einen Rahmen vor, um die KI bewusst in eine Richtung lenken zu können, ohne jedoch zu strenge Vorgaben zu machen.

Beobachtungen in der Durchführung

Eine deutliche Beobachtung, die ich während der Arbeitsphase machen konnte, war, dass die Studierenden sich engagiert und kritisch-reflektiert  mit der geprompteten Nachbildung der Quelle durch die KI-Persona auseinandergesetzt haben. Die Studierenden haben nicht nur auf die von mir gezielten Aspekte geachtet (Argumentationsstrategien, Widersprüche und Parallelen zum Text von Tilman Struve) sondern sprachen ebenso die „Halluzinationen“ der KI hinsichtlich der angegebenen Bibelstellen deutlich an. 

Bei der Argumentation von der pro-königlichen KI-Persona nahmen die Studierenden vor allem Aspekte von Ordnung und Tradition wahr. So argumentierte die KI-Person mit der rechten Ordnung in der Welt, in der der König die zentrale und herausragende Persönlichkeit ist, die dies auf der irdischen Welt umzusetzen vermag. Besonders den letzten Aspekt der Tradition hat die KI häufig auf alttestamentarische Bezüge (Saul und David) genauer gesagt kaiserlich-proklamatorische, traditionsbehaftete Bezüge (sc. Otto d. Gr. und Karl d. Gr.) konstruiert, was auch die zeitgenössischen Argumentationen nach Tilman Struve widerspiegelt (vgl. Struve, 1991). Widersprüche erkannten die Studierenden allerdings in Bezug auf die pro-köngliche, zeitgenössische Argumentation in der Salbung, die seit der Königskrönung Pippins (751 bzw. 754) als die wichtigste, sakrallegitimierende Herrschaftsgrundlage im Seminar bereits benannt und herausgearbeitet wurde. Die KI gibt allerdings in diesem Bereich nicht die zeitgenössische Argumentation eines rex et sacerdos wieder – auch nicht in der barbarischen Sprache (vgl. Angenendt, 1982). Zwar tendiert die KI zur sakralen Legitimation des Königtums, benennt diese aber nicht eindeutig. So kann man nur über diese Sakrallegitimation des Königtums Mutmaßungen anstellen.

Die Studierenden, die sich mit der KI Persona mit pro-päpstlichen/ pro-monastischen Tendenzen beschäftigt haben, arbeiteten hinsichtlich der Argumentationsstrategie gezielt die deontischen Pflichten für die angesprochene Christenheit heraus, die insbesondere auf Grundlage des berühmten Zitats aus dem Matthäus-Evangelium (Mt. 16, 18) und der schon im Prompt vorgegebenen Zwei-Schwerter-Lehre des Papstes Gelasius herausgestellt wurden. Auffällig war für die Studierenden, dass die KI Persona unabhängig voneinander auf die Kirchenväter Ambrosius und Hieronymus verwiesen haben. Widersprüche fanden die Studierenden vor allem in der Angabe falsch-belegter biblischer Zitate, die sie auch selbstständig nachgeprüft haben und darlegen konnten. Des Weiteren fiel den Studierenden ein Widerspruch  in der Argumentation der Gottesgleichheit des Papstes auf, der sich in der Form nicht im Text wiederfand. Der gewaltigste Widerspruch in der Argumentation war jedoch, dass der Mönch Bernhard von Clairvaux genannt wurde, der kein Zeitgenosse der Ereignisse ist. Hier brach die KI-Persona deutlich die zeitlichen historischen Gegebenheiten. Parallelen zum Text von Tilman Struve eindeutig in der Forderung nach der libertas ecclesiae und dem Laientum des Königstums, die sich in der zeitgenössischen Argumentation wiederfinden. Von der „heiligen Scheu“, die ich bei realen, zeitgenössischen Quellen  in vorherigen Kursen wahrnehmen konnte, fand sich in der kurzen Spanne nichts mehr. Auffällig war zudem, dass die Studierenden durch diese gezielte Partnerarbeit viel stärker miteinander in den Austausch traten.

Kritische Reflexion der durchgeführten Methode und Verbesserungsvorschläge

Während und auch nach der Durchführung der hier geschilderten Methode lassen sich einige kritische Punkte bezüglich dieses Einsatzes von KI als Unterrichtsmethode identifizieren. Zunächst erscheint der vorgegebene Prompt zu spezifisch: Die Vorgaben wie die Argumenten durch die Zwei-Schwerter-Lehre oder die Gefahr durch Heinrich III. für die pro-päpstliche KI-Persona und die direkte Benennung der Salbung für die pro-königliche KI-Persona ließen ChatGPT wenig Spielraum für eigene Argumentation und so auch kaum Spielraum für die kritische Interpretation durch die Studierenden. Allgemeinere Prompts und auch eine allgemeinere Aufgabenstellung könnten hier Abhilfe schaffen.

Die Befürchtung, dass die KI nicht nah genug an der Quelle oder anachronistisch argumentiert, hat sich bewahrheitet. Allerdings zeigten die Studierenden hierfür ein sehr scharfes Auge, indem sie dies kritisch analysieren und benennen konnten. Hervorzuheben ist also, dass die  Studierenden Anachronismen als solche überhaupt erkennen und benennen können. Auffällig war auch, dass die Studierenden die Fragen nach den Inhalten der KI-Personae sehr schnell abgearbeitet haben: Es besteht bei einem solchen Ansatz durch meine gezielten Fragen die Gefahr, dass ein solcher Versuch viel zu allgemein bleibt.

Kritiker:innen eines KI-Einsatzes in Unterricht, Forschung und Studium könnten hier eine zu oberflächliche Bearbeitung durch die Studierenden und dadurch die Gefahr des Deskilling sehen (der Begriff des Deskilling im Einsatz mit generativer KI entstand erstmals in einem kritischen Paper von Prof. Gabi Reinmann im Hochschulforum Digitalisierung aus dem Jahr 2023. Diesen verwendete sie als kritischen Gegenbegriff zum vielpostulierten Upskilling, um mit der Forderung nach Future Skills hervorzukommen, die klar benannt werden sollten. Allerdings verbleibt der Deskilling-Begriff meines Erachtens viel zu allgemein, um einen wirklichen Kompetenzverlust bei Studierenden zu diagnostizieren). Dem würde ich erwidern, dass vielen Studierenden der Einsatz von generativer KI im Studium ein Anliegen ist, sie allerdings auch eine kritische Haltung gegenüber den von der KI generierten Inhalten besitzen und sie nicht einfach ungeprüft übernehmen.

Resümee

Es erscheint mir als logische und notwendige Konsequenz, dass generative KI zunehmend Einzug in die universitäre Lehre halten wird und man sich den neugeschaffenen Möglichkeiten nicht verwehren darf. Mein Einsatz von KI-Personae in einer Seminarsitzung hat allerdings nur deshalb so gut funktioniert, weil mehrere günstige Bedingungen zusammentrafen: das Zusammenwirken des ausgewählten Textes, die engagierte und kleine Studierendengruppe sowie die Bereitschaft aller Seiten – inklusive des KI-Helfers. Deutlich wurde dabei – und das ist kein Novum: Generative KI kann und wird historische Quellen nicht ersetzen und kann keine fundierte, historische Analyse und Quellenkritik ersetzen. Sie kann jedoch – richtig eingesetzt – einen produktiven Raum eröffnen, in dem Studierende ihren Blick erweitern, eigene Argumente angeleitet in kleinem Rahmen in die Arbeit an einer künstlichen Quelle einbringen, kritisch reflektieren und sich zugleich mit den Potenzialen und Grenzen generativer KI-Werkzeuge vertraut machen können.

Hier bot sich besonders die Möglichkeit, KI nicht nur als ein Tool zur Recherche oder zur fachwissenschaftlichen Texterzeugung zu sehen, sondern auch die Aussagen kritisch zu hinterfragen. Wenn KI eine Rolle übernimmt, so bietet es gerade in der Anfangsphase die Möglichkeit, Quellentexte kritisch zu hinterfragen, ohne bisherige Forschungsmeinungen zu wiederholen. Außerdem bekommen angehende Lehrpersonen eine Möglichkeit, sich durch den KI-Einsatz Techniken für ihren späteren Lehrberuf abzuschauen. Ich kann allerdings nicht genug betonen – und dies machte den Versuch für Dozierende und Studierende sehr wertvoll – wie wichtig die historische Quellenkritik ist, dass sie den Kern unseres Faches bildet und im Rahmen des Studiums nicht vernachlässigt werden darf. Wenn man Historiker:innen der nächsten Generationen betreuen wollte, so müssen die Probleme der Studierendenschaft ernst genommen werden. Die Studierenden haben vielleicht durch diesen gezielten Einsatz von KI im Studium eine Hürde überwunden: Sie haben sich getraut, den realen, „heiligen“ Quellen nicht nur mit ehrfürchtiger Distanz, sondern mit scharfem und kritischem Blick stärker und selbstbewusster entgegenzutreten. Ein:e Historiker:in, der oder die sich vor den Quellen fürchtet, hat weder im Beruf noch im Archiv etwas verloren. Der Ruf gilt also und erschallt in den Hallen der Universität – lauter denn je und diesmal mit Methode und Maschine: ad fontes – zu den Quellen!

Literatur

  • Angenendt, Arnold: Rex et Sacerdos. Zur Genese der Königssalbung, in: Tradition als historische Kraft, Berlin/New York 1982, S. 100-118.
  • König, Mareike: ChatGPT und Co. in den Geschichtswissenschaften. Grundlagen, Prompts und Praxisbeispiele, in: https://dhdhi.hypotheses.org/9197 [zuletzt abgerufen am: 26.06.2025].
  • König, Mareike: ChatGPT und Co. in den Geschichtswissenschaften. Grundlagen, Prompts und Praxisbeispiele, in: https://dhdhi.hypotheses.org/9197 [zuletzt abgerufen am: 26.06.2025].
  • Schieffer, Rudolf: Die Entstehung des Investiturverbots für den deutschen König, Stuttgart 1979.
  • Struve, Tilman: Die Stellung des Königtums in der politischen Theorie der Salierzeit, in: Die Salier und das Reich. Gesellschaftlicher und ideengeschichtlicher Wandel im Reich der Salier Bd. 3, hg. v. Stefan Weinfurter, Sigmaringen 1991.
  • Thieme, Sarah und Jana Weiß: Lesen im Geschichtsstudium, Wien/Köln/Weimar 2020.
  • Zefferer, Marian: Lernen mit KI: Der ultimative Guide für effektives und kognitiv aktivierendes Lernen, in: https://bildungsimpuls.com/ki/lernen-mit-ki-wie-kuenstliche-intelligenz-intelligentes-lernen-unterstuetzt/ [zuletzt abgerufen am 26.06.2025].

Autor

Bastian Turowski

Bastian Aljoscha Turowski ist seit 2024 wissenschaftlicher Mitarbeiter und Doktorand am Lehrstuhl für Geschichte des frühen und späten Mittelalters und der Hilfswissenschaften an der Universität Münster. Er studierte Latein und Geschichte sowie lateinische und griechische Philologie. Er ist Mitglied des Centrums für Mittelalter- und Frühneuzeitforschung und der Promotionsschule Geschichte der Universität Münster.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert