ChatGPT und Co als Chance für unsere Prüfungskultur: Schafft endlich die Noten ab!
ChatGPT und Co als Chance für unsere Prüfungskultur: Schafft endlich die Noten ab!
10.09.24Der Einsatz von Generativer KI in Prüfungssituationen ist äußerst umstritten, wenn nicht sogar bei einigen gefürchtet. Dass dabei auch die unzeitgemäßen Prüfungsformate das Problem sein können, wird heiß diskutiert. Die Autorin Dr. Ulrike Hanke geht noch einen Schritt weiter und plädiert für die Abschaffung der Noten. Sie erklärt in diesem Beitrag, warum wir nicht länger am traditionellen Benotungssystem festhalten sollten und welche Potenziale alternative Systeme auch für den Einsatz von KI haben.
Seit der Veröffentlichung von ChatGPT im November 2022 wächst die Sorge, dass Studierende dieses Tool zum Schummeln nutzen könnten, insbesondere bei Prüfungsleistungen wie Hausarbeiten oder Projektberichten. Diese Befürchtungen lenken jedoch den Blick auf ein grundlegenderes Problem unserer Prüfungskultur: den übermäßigen Fokus auf Noten. Lehrende geben Hausarbeiten, um Lernen zu fördern, und benoten die Ergebnisse. Studierende zielen jedoch auf gute Noten ab, wobei Tools wie ChatGPT hilfreich sein können. Der Fokus auf das Produkt und den Erhalt einer Note fördert damit also den Impuls zu schummeln. Was wäre, wenn es keine Noten gäbe und der Fokus auch für die Studierenden auf dem Lernen läge? Vermutlich wären Lehrende dann deutlich weniger besorgt, denn Lernen, der Erwerb von Wissen und Kompetenzen, kann man sich durch ChatGPT und Co nicht „erschummeln“. Ist es also Zeit, die Noten abzuschaffen?
Überlegungen, ob Noten abgeschafft werden sollten, sind sehr alt (Schiefele, 1960; Starch & Elliot, 1912, 1913, 1913a u.v.a.) und wurden und werden von unterschiedlichen Akteur:innen schon sehr lange sowohl im Kontext Hochschule als auch im Kontext Schule kontrovers diskutiert. Während die pädagogisch-didaktische Forschung (vgl. für einen Überblick Brookhart, 2016; Ingenkamp, 1958/1974; Cox, 1969) seit Jahrzehnten darauf hinweist und Daten über die Problematik von Noten vorlegt, ist die Öffentlichkeit inklusive vieler Lehrpersonen, Bildungsverantwortlichen, Eltern und den Lernenden selbst davon überzeugt, dass ein Bildungssystem ohne Noten nicht funktionieren kann (vgl. ZEIT online, 2006; Breitegger & Pauli, 2020). Auf welchen Forschungsergebnissen beruht also der kritische Blick auf Noten? Und welche Argumente bringen Notenbefürworter im Gegenzug hervor?
Fehlende Aussagekraft von Noten
Die traditionelle Notengebung gibt vor, darauf abzuzielen, Aussagen darüber zu machen, wie gut eine geprüfte Person über die gemessenen Kompetenzen verfügt. So werden Noten gemeinhin auch interpretiert und verstanden: Wer eine „gut“ in einem bestimmten Modul erzielt, ist „gut“ im Thema dieses Moduls. Die Forschung zeichnet hier aber ein deutlich anderes Bild: Ein umfassendes Review von Brookhart et al. (2016) zeigt, dass Noten nur zu etwa 50% mit standardisierten Testergebnissen korrelieren, was bedeutet, dass nur ein geringer Teil der Noten tatsächlich die gemessenen Kompetenzen widerspiegelt. Wenn nun aber nur ein kleiner Anteil von Noten wirklich die Kompetenz der Geprüften misst, was misst der Rest?
Nach Casillas et al (2012) sind dies z. B. die früheren Noten, psychosoziale Faktoren, aber auch das Verhalten, der demografische Hintergrund oder einfach nur die Schule, welche Schüler:innen besuchen. Andere Studien (Klapp Lekholm & Cliffordson, 2008; Thorsen & Cliffordson, 2012; Thorsen, 2014) zeigen auch, dass kognitive Faktoren, wie Kompetenzerleben, Selbstwirksamkeit, Coping-Strategien, fachliches Interesse und nicht kognitive Faktoren wie Motivation mitbenotet werden. Als weitere Zutat kommen Überzeugungen von Lehrenden hinzu, die Noten oft auch als Belohnung sehen (Kelly, 2008; Sun & Cheng, 2013) und die Lernenden, die sich anstrengen, auch gute Noten geben möchten (Bonner, 2016; Brookhart, 1994), und das unabhängig davon, ob diese die geforderte Kompetenz wirklich nachweisen können oder nicht. Wenn man dann noch die Anfälligkeit von menschlichen Bewerter:innen für Bewertungsfehler (vgl. auch Quarks & Co, 2017) berücksichtigt, wird klar: Noten sind nichts als ein Mischmasch (engl. Hedgepodge, vgl. Brookhart et al, 2016). Und dies trifft nicht nur für Noten in vermeintlich „weichen“ Fächern der Geisteswissenschaften zu. Die bisher aufgezeigte Studienlage bezieht auch Erkenntnisse aus den vermeintlich eindeutiger bewertbaren mathematisch-naturwissenschaftlichen Fächer mit ein (vgl. bereits die frühe Forschung von Starch & Elliot, 1912, 1913 und 1913a). Es lässt sich also mit Ingenkamp (1971, S. 68) konstatieren, dass „ein Instrument von derart geringer Objektivität und Zuverlässigkeit […] absolut ungeeignet [ist], so anspruchsvolle Funktionen zu übernehmen“, wie man sie Noten gemeinhin zuspricht. Und umso drängender wird die Frage, warum Noten nicht längst Makulatur sind.“
Die Argumente der Noten-Befürworter:innen
Noten als Anreiz fürs Lernen
Nicht selten sind es die Studierenden und Schüler:innen selbst und im Schulkontext auch deren Eltern (ZEIT online, 2006; Breitegger & Pauli, 2020), die sich gegen die Abschaffung von Noten aussprechen und gegen alternative Benotungssysteme wehren. Gründe hierfür sind wohl vor allem, dass die meisten Menschen kein Bildungssystem ohne Noten kennengelernt haben (Nölte & Wampfler, 2020). Bildungssystem und Noten gehört einfach zusammen. Auch wenn die meisten Menschen mit Noten mindestens teilweise auch negative Gefühle und negative Erfahrungen assoziieren, sind sie überzeugt davon, dass Noten ein Anreiz fürs Lernen sind. Dies wirft jedoch die Frage auf, ob Lernen nicht einen eigenen Wert hat oder haben sollte, ob es dafür wirklich externe Anreize wie Noten braucht. Außerdem weiß man aus der Forschung (vgl. Beutel & Pant, 2020; Pink, 2010, Kohn, 2018/1993, Deci, 1971), dass genau das Gegenteil der Fall ist: Statt einen Anreiz fürs Lernen zu bieten, nehmen Noten dem Lernen den Wert und zerstören intrinsische Motivation, machen Angst und führen zu geringerer Selbstkompetenz und Selbstreflexion (vgl. Nölte & Wampfler, 2020). Dementsprechend tun viele Lernende auch viel dafür, sich gute Noten zu „erschummeln“. Es geht ja nicht darum, etwas zu lernen, sondern eben nur darum, eine gute Note zu erhalten, für die Eltern und Großeltern im Schulkontext dann möglicherweise sogar noch bezahlen (Belohnung für gute Noten im Zeugnis).
Noten als Feedbackinstrument
Des Weiteren glauben viele, dass Noten als Feedbackinstrument taugen. So schreibt z.B. Meidinger (2019/2021), dass Ziffernnoten „eine schnelle Rückmeldung darüber [erlauben], wo ein Kind, ein Jugendlicher, bezogen auf die Klasse und auf das Verständnis einer bestimmten Lerneinheit, steht.“ Dass Noten diesem Anspruch nicht gerecht werden, wurde weiter oben bereits ausgeführt, und zeigt sich auch darin, dass Lehrende in der Regel Kriterien benötigen, um die Noten zu erklären (Nölte & Wampfler, 2020). Eine Note alleine gibt Lernenden keine Hinweise darauf, wo ihre Stärken und Schwächen liegen, wie sie sich verbessern und weiterlernen können. Vielmehr lässt es sie mit einer Note oft etwas ratlos zurück; sie sind entweder zufrieden oder frustriert. Qualitative Feedbacks dagegen „laden ein, über Lernen und Arbeiten mitzudenken, in Gespräche einzutreten und Verantwortung zu übernehmen“ (Nölte & Wampfler, 2020, S. 31). Daraus lässt sich ableiten, dass Noten tatsächlich auch nicht als Rückmeldung taugen und damit das Lernen auch nicht unterstützen.
Noten als einfach verständliche Kommunikation über Leistung
Ein weiteres Argument, das immer wieder Pro Noten angeführt wird, ist, dass sie einfach verständlich seien. So behauptet die Ministerin für Allgemeine und Berufliche Bildung, Wissenschaft, Forschung und Kultur von Schleswig-Holstein Prien, dass „Notenzeugnisse […] Beurteilungen nach klaren Kriterien [liefern], die den Lehrkräften durch die Fachanforderungen und die Bildungsstandards vorgegeben sind“ (Zitiert nach Anders, 2021). Stellt sich nur die Frage, welche klaren Kriterien das sind. Erstens sind es allenfalls die Kriterien, die einzelne Lehrpersonen höchst individuell und damit subjektiv festlegen, und zweitens fehlen bei nicht wenigen Leistungsnachweisen und Prüfungen bis heute vor allem gerade auch im Hochschulkontext klar formulierte Kriterien für die Lernenden, an denen sie sich orientieren könnten. So bleiben Lernende vielmehr häufig mit Noten ratlos zurück, da sie keine Anhaltspunkte dafür erhalten, wie die Note eigentlich zustande kam.
Zwischenfazit
Letztlich lässt sich also festhalten, dass Noten höchstens dafür gut sind, Zugangsberechtigungen zu vergeben oder zu versagen. Aber auch dies ist höchst problematisch, da bekannt ist, dass Menschen mit bildungsnahem Hintergrund, das System der Noten besser spielen als Menschen mit bildungsferneren Hintergründen. Dadurch fördern und zementieren sie also in hohem Maße Ungleichheit (Stommel, 2018; Klapp Lekholm & Cliffordson, 2008). Wozu also Noten?
- Sie sagen nichts aus.
- Sie zerstören intrinsische Motivation.
- Sie unterstützen das Lernen nicht, weil sie keine Ansatzpunkte für Verbesserungen und das Weiterlernen geben.
- Sie fördern das Schummeln.
- Sie fördern Ungleichheit.
Was verlieren wir, wenn wir Noten abschaffen? Wir verlieren eine einfache, aber höchst ungerechte Einordnung von Lernenden in die Notenkategorien.
Was gewinnen wir, wenn wir Noten abschaffen? Wir können gewinnen,
- dass Lernen für unsere Studierenden wieder einen intrinsischen Wert erhält, und schummeln nicht mehr attraktiv ist.
- dass Studierenden Rückmeldung erhalten, die sie wirklich in ihrem Weiterlernen unterstützen.
Alternativen zum klassischen Notensystem
Nun stellen Sie sich möglicherweise die Frage, wie Sie persönlich in einem System, das sicherlich nicht innerhalb kurzer Zeit die Noten wirklich abschafft, den Fokus weg von den Noten hin zum Lernen bringen können. Dafür bieten sich alternative Bewertungspraxen an, wie sie derzeit stark diskutiert werden. Gemeinsam sind diesen Ansätzen vier Säulen (Clark & Talbert, 2023):
- Es wird ganz klar definiert und transparent gemacht, was erfolgreiches Lernen in einer Lehrveranstaltung kennzeichnet.
- Es gibt Feedback-Loops, d.h. die Studierenden erhalten mehrfach im Prozess Feedback hinsichtlich ihres Lernfortschritts.
- Das Feedback erhält qualitative Erläuterungen zum Stand des Fortschritts, keine Noten oder Punkte.
- Es gibt die Möglichkeit, Prüfungen und Leistungsnachweise zu wiederholen oder zu überarbeiten, um sich zu verbessern.
Alternative Bewertungssysteme wie das sogenannte Standards-Based Grading (Clark & Talbert, 2023), das Specifications-Grading (Hall, 2018; Nilson, 2015) und das Ungrading (Blum, 2020; Stommel, 2018), die diese Säulen berücksichtigen, sind aus meiner Sicht sehr wertvoll. Und seit ich mich damit genauer beschäftige, kann ich nicht mehr nachvollziehen, wie ich jahrelang bewertet habe. Deshalb möchte ich Sie ermuntern, sich mit diesen Ansätzen zu beschäftigen. Einen guten Einstieg dazu bietet der Podcast und die dazu gehörige Website www.the-grading-pod.com.
Abschluss und Ausblick
Die Forschung zeigt eindeutig, dass Noten nicht das messen, was sie vorgeben zu messen. Es ist deshalb an der Zeit, unser Bewertungssystem zu überdenken und den Fokus auf das Lernen zu richten. Dies führt ganz automatisch auch dazu, dass Tools generativer KI wie ChatGPT ihren Schrecken hinsichtlich des Prüfens verlieren, denn Lernen lässt sich wie gesagt nicht „erschummeln“, Noten dagegen schon. Lassen Sie uns den Fokus weg von den Noten hin auf das Lernen richten.
Anders, F. (2021). Schulnoten – ja oder nein? Deutsches Schulportal. Abrufbar unter: https://deutsches-schulportal.de/unterricht/schulnoten-ja-oder-nein/
Beutel, S.-I. & Pant, H. A. (2020). Lernen ohne Noten. Alternative Konzepte der Leistungsbeurteilung. Stuttgart: Kohlhammer.
Blum, S. D. (2020). Ungrading. Why rating students undermines learning (and what to do instead). Mogantown: West Virginia University Press.
Bonner, S. M. (2016). Teacher perceptions about assessment: Relationship to practice and policy. In G. T. Brown, G. T. & Harris, L. (Hrsg.), Human factors and social conditions of assessment. London, United Kingdom: Routledge.
Breitegger, B. & Pauli, R. (9.11.2020). Brauchen wir Noten. Fluter. Abrufbar unter: https://www.fluter.de/brauchen-wir-noten-an-schulen-streit
Brookhart, S. M. (1994). Teachers‘ grading: Practice and theory. Applied Measurement in Education 7, S. 279–301. doi:10.1207/s15324818ame0704_2
Brookhart, S. M., Guskey, T. R., Bowers, A. J., McMillan, J. H., Smith, J. K., Smith, L. F., Stevens, M.T., Welsh, M. E. (2016). A Century of Grading Research: Meaning and Value in the Most Common Educational Measure. Review of Educational Research 86(4), S. 803-848. doi: 10.3102/0034654316672069
Casillas, A., Robbins, S., Allen, J., Kuo, Y. L., Hanson, M. A. & Schmeiser, C. (2012). Predicting early academic failure in high school from prior academic achievement, psychosocial characteristics, and behavior. Journal of Educational Psychology 104, S. 407– 420. doi:10.1037/a0027180
Clark, D. & Talbert, R. (2023). Grading for Growth: A Guide to Alternative Grading Practices that Promote Authentic Learning and Student Engagement in Higher Education. Routledge: New York.
Cox, R. (1969). Reliability and validity of examinations. In Lauwerys, J.A. & Scanlon, D. G. (Hrsg.), The world yearbook of education: examinations (S. 70-78). London: Evans Brothers.
Deci, E. L. (1971). Effects of Externally Mediated Rewards on Intrinsic Motivation.” Journal of Personality and Social Psychology 18, 105-115.
Farkas, G., Grobe, R. P., Sheehan, D. & Shuan, Y. (1990). Cultural resources and school success: Gender, ethnicity, and poverty groups within an urban school district. American Sociological Review 55, S. 127–142. doi:10.2307/2095708
Hall, M. (2018). What is specifications grading and why should you consider using it? Johns Hopkins University, Center for Teaching Excellence & Innovation. The Innovative Instructor Blog. 11. April 2018.
Ingenkamp, K.-H. (Hrsg.) (1958/1974). Die Fragwürdigkeit der Zensurengebung. Weinheim: Beltz.
Kelly, S. (2008). What types of students‘ effort are rewarded with high marks? Sociology of Education 81, S. 32–52. doi:10.1177/003804070808100102
Kohn, A. (2018/1993). Punished by Rewards: The Trouble with Gold Stars, Incentive Plans, A’s, Praise, and Other Bribes. Boston: Houghton Mifflin.
Klapp Lekholm, A. & Cliffordson, C. (2008). Discrepancies between school grades and test scores at individual and school level: effects of gender and family background. Educational Research and Evaluation 14, S. 181–199. doi:10.1080/13803610801956663
Meidinger, H.-P. (2019/aktualisiert 15.9.21). Keine Angst vor Ziffernnoten. Das Deutsche Schulportal. Abrufbar unter: https://deutsches-schulportal.de/expertenstimmen/keine-angst-vor-schulnoten/
Nilson, L. B. (2015). Specifications Grading: Restoring Rigor, Motivating Students, and Saving Faculty Time. Stylus Publishing: Sterling, VA.
Nölte, B. & Wampfler, P. (2021). Schule ohne Noten. Bern: hep.
Pink, D. (2010). Drive. Was Sie wirklich motiviert. Salzburg: Ecowin Verlag.
Quarks & Co (2017). Sind Schulnoten objektiv? Abrufbar unter: https://www1.wdr.de/mediathek/video/sendungen/quarks-und-co/video-sind-schulnoten-objektiv-100.html
Schiefele, H. (1960). Sind unsere Noten gerecht? Welt der Schule 6, S. 251-257.
Starch, D. & Elliot, E. C. (1912). Reliability of the grading of high school work in English. School Review 20, S. 442-457.
Starch, D. & Elliot, E. C. (1913). Reliability of the grading of high school work in mathematics. School Review 21, S. 254-259.
Starch, D. & Elliot, E. C. (1913a). Reliability of the grading of high school work in history. School Review 21, S. 676-681.
Stommel, J. (2018). How to Ungrade. https://www.jessestommel.com/how-to-ungrade/
Sun, Y., & Cheng, L. (2013). Teachers‘ grading practices: Meaning and values assigned. Assessment in Education: Principles, Policy & Practice 21, S. 326–343. doi:10.1080/0969594.2013.768207
Thorsen, C. & Cliffordson, C. (2012). Teachers‘ grade assignment and the predictive validity of criterion-referenced grades. Educational Research and Evaluation 18, S. 153–172. doi:10.1080/13803611.2012.659929
Thorsen, C. (2014). Dimensions of norm-referenced compulsory school grades and their relative importance for the prediction of upper secondary school grades. Scandinavian Journal of Educational Research 58, S. 127–146. doi:10.1080/00313831.2012.705322
ZEIT online (29.6.2006). Kinder wollen Noten. Abrufbar unter: https://www.zeit.de/2006/27/Titel-Schulnoten-27
Autorin:
Dr. Ulrike Hanke ist Erziehungswissenschaftlerin und freiberufliche Dozentin in der Hochschuldidaktik. Sie betreibt das Portal hochschuldidaktik-online.de und die hochschuldidaktik-akademie.de. Ihre Arbeitsschwerpunkte sind Online-Lehre, KI in der Lehre und das kompetenzorientierte Prüfen.
- Facebook-Seite: https://www.facebook.com/Teachertraining.Ulrike.Hanke/
- Facebook-Gruppe Hochschuldidaktik: https://www.facebook.com/groups/Hochschuldidaktik/
- LinkedIn: https://www.linkedin.com/in/ulrike-hanke-40b48765/
So simpel ist das nicht. Siehe meinen Vortrag „Prüfungen abschaffen“.
https://www.youtube.com/watch?v=1VmjnxhRLKM