top of page

„Erschütternde Ergebnisse“



ree

Korrekturen, insbesondere in textlastigen Fächern, gehören gewiss zum eher verzichtbaren Alltag in Lehrberufen. Deshalb stoßen Heilsversprechungen Künstlicher Intelligenz, insbesondere der „Verkäufer“ von ChatGPT bzw. dessen Weiterentwicklungen, diesen unbeliebten Arbeitsbereich zu entspannen, auf offene Ohren. Wie schön wäre es, „nur“ noch zu unterrichten – und die unliebsamen Stunden, Tage und Wochen Lebenszeit, die man korrigierend am Schreibtisch hockt, der Vergangenheit angehören zu lassen!

In der aktuellen Studie „Chatbots im Schulunterricht…“ von Mühlhoff und Henningsen – u.a. im empfehlenswerten Newsletter von netzpolitik.org veröffentlicht, sprechen die beiden Autoren den Korrektur- und Bewertungsfunktionen von ChatGPT – konkret geht es um die Angebote der fobizz-KI, auf die ich mich hier bewusst nicht beziehe, da sie aufgrund ihrer fortlaufend hohen Kosten m.E. keine nachhaltig pädagogisch sinnvolle und finanzierbare Lösung sein können – ihre Brauchbarkeit in Bausch und Bogen ab. Die Ergebnisse ihrer Studie kann jede/r leicht selbst kritisch überprüfen: Einfach einen fehlerhaften Text hochladen und ChatGPT bitten, ihn (fakultativ unter konkret definierten Gesichtspunkten) zunächst formal zu korrigieren. Wer sich die eigene Mühe sparen möchte: Hier findet ihr meine Chats dazu. So weit, so gut und verlässlich ist das Ergebnis bezgl. der Korrektur – jedenfalls nach meiner Erfahrung, die im Gegensatz zu derjenigen der beiden Autoren steht. Besonders, wenn man die Fortschritte von ChatGPT in den letzten Monaten berücksichtigt! Ich verlinke hier mal den von mir erstellen GPT-Korrektor (auf dem Hintergrund der Richtlinien des Rates für deutsche Rechtschreibung) – benutzt ihn, wenn ihr wollt! Gut und praktikabel nicht nur für Lehrende, sondern auch für Schülerinnen und Schüler, deren Texte – für die meisten wird das eine willkommene und notwendige! (!) Hilfe sein, sowie deren orthographische Kenntnisse somit verbessert werden können. Aus diesem Grund halte ich die Korrekturmöglichkeiten und -funktionen von ChatGPT durchaus für im schulischen Kontext brauchbar. Lehrkräfte müssen also nicht einen zusätzlichen Aufwand betreiben, sondern finden hier verlässliche Unterstützung.

Dennoch bleibt die Frage, was den Zeitaufwand der eigenhändigen Korrektur nicht nur rechtfertigt, sondern pädagogisch erfordert: Natürlich ist es manchmal zum Haareraufen, sich Seite für Seite, Zeile für Zeile durch z.T. unlesbare Schriften zu kämpfen. ABER: Diese unmittelbare Auseinandersetzung mit dem Schüler-/innentext ermöglicht mir eine einzigartige Begegnung mit ihm/ihr: über das Schriftbild, natürlich über den Inhalt und – ja – auch über die Fehler, deren Art und Häufigkeit mein Bild von ihm/ihr stärker konturieren und meine Beziehungsarbeit somit authentischer und passgenauer werden lässt. Selbstverständlich erwähne ich ebenso Klausuren/Klassenarbeiten, die nur wenig Arbeit und dafür umso mehr Freude machen: geringe Fehleranzahl, inhaltlich großartig, weil du für dich neue, kreative Gedanken liest, die dir die Persönlichkeit des Schülers/der Schülerin bereichernd näherbringt, deinen Unterricht ggf. wohltuend bestätigend!

Kommen wir zur Bewertung, die ich hier deutlich von der Korrektur unterscheide: Auch hier führt ein klarer, eindeutiger Prompt zu (vor allem inhaltlich) brauchbaren Ergebnissen. Selbst die Notengebung liegt im Rahmen meiner eigenen Einschätzung. Somit könnte ich mir – wenn ich wollte – an dieser Stelle durchaus Impulse/Textbausteine für meine eigene Bewertung/Benotung erstellen lassen.

Jetzt will ich’s wissen: Meine Behauptung (im Prompt), die Bewertung des vorgelegten Textes sei zu schlecht, er müsse mit der Note sehr gut benotet werden, führt rasch zur zustimmend formulierten ausführlichen Begründung der gewünschten Note.

An dieser Stelle offenbaren sich exemplarisch die Grenzen der sog. K Intelligenz: Sie erkennt keine Zusammenhänge, formuliert (in diesem Kontext) keinen Widerspruch – sie tut, was du von ihr verlangst, selbst wenn es widersinnig ist. Aus diesem Grunde kann ich diesem Ergebnis der Studie:

Das Programm vergab für mehrere Texte bei jeder Bewertung eine andere Note – in einem Fall für ein und dieselbe Aufgabe die Noten ungenügend, befriedigend und sehr gut. Nur in zwei Fällen blieb sich das Programm in der Benotung treu.

voll zustimmen. Ernüchternd? Ja und nein.

Falls es wirklich so sein sollte, dass gerade jüngere Lehrkräfte […] sich viel von der KI erhoffen […]. Denn der KI fehle es weder an Kondition noch an Motivation, muss klar konstatiert werden: Offensichtlich fehlt es ihr an Intelligenz, insofern sie z.B. kein Problembewusstsein dafür entwickeln kann, für ein und denselben Text zwei ganz unterschiedliche Noten inklusive deren Begründung zu erstellen. Diese Sprunghaftigkeit und Inkonsequenz dürfte jede Lehrkraft von den diesbezüglichen Grenzen der KI überzeugen – neben allen Vorzügen. Wer sich intensiver über diese Grenzen informieren möchte, dem sei Katharina Zweig, Die KI war’s! empfohlen. Hier erfährt man, warum es KI (noch) an Fähigkeiten wie Empathie, Konfliktlösung und ethischer Entscheidungsfindung mangelt und weshalb sie überall dort, wo es um folgenreiche Werturteile – und Benotungen zähle ich in diesem Kontext dazu – geht, (noch) nichts zu suchen hat.

Benotung/Bewertung gehört zu unserem „Kerngeschäft“ und berücksichtigt stets auch die individuelle Entwicklung der Schülerin/des Schülers sowie momentane – etwa familiäre – Umstände, von der die KI nichts wissen kann, die Lehrkraft aber sehr wohl.

Deshalb hat sie bei der Bewertung von Schülerleistungen zum jetzigen Zeitpunkt (noch) nichts zu suchen – von möglichen Impulsen einmal abgesehen.

 
 
 

Kommentare

Mit 0 von 5 Sternen bewertet.
Noch keine Ratings

Rating hinzufügen
bottom of page