← Magazin 22. Mai 2026

Didaktik · 14 min

Aufgaben-Kultur 2026 — was die Klieme-Klassiker der frühen 2000er heute noch leisten

Zwanzig Jahre nach der Bildungsstandards-Expertise ist die kompetenzorientierte Aufgabe in der Praxis angekommen — meist als Sonderfall für die Vergleichsarbeit. Eine Lese-Analyse einer halb erledigten Reform.

Wer heute eine Mathematik-Klassenarbeit aus der Sekundarstufe I aufschlägt und gleich danach einen Aufgaben-Pool aus dem IQB-Bildungstrend nebeneinander legt, sieht zwei Aufgaben-Welten, die sich in zwei Jahrzehnten kaum aufeinander zubewegt haben. Die Klassenarbeit prüft, ob die Schüler:innen Verfahren der vergangenen sechs Wochen reproduzieren können. Der IQB-Pool prüft, ob sie mathematische Modellierungs-, Darstellungs- und Argumentations-Kompetenzen anwenden — also genau das, was die nationalen Bildungsstandards seit dem KMK-Beschluss vom 4. Dezember 2003 erwartbar machen sollen.

Diese Lücke ist nicht neu. Neu ist, dass sie inzwischen das Selbstverständnis der Aufgaben-Forschung selbst herausfordert.

Die Klieme-Expertise als didaktischer Referenzrahmen

Die im Februar 2003 vorgelegte Expertise Zur Entwicklung nationaler Bildungsstandards unter Federführung von Eckhard Klieme — Klieme, Avenarius, Blum, Döbrich, Gruber, Prenzel, Reiss, Riquarts, Rost, Tenorth und Vollmer — hat eine Sprache geprägt, die heute jede:r Referendar:in beherrscht: Kompetenzmodelle, Anforderungsbereiche, Outputorientierung. Was in der Praxis viel weniger beherrscht wird, ist die didaktische Konsequenz dieser Sprache: dass eine kompetenzorientierte Aufgabe einen anderen Schnitt durch den Lernweg legt als die klassische Übungsaufgabe.

Klieme et al. unterscheiden bekannt drei Anforderungsbereiche: Reproduktion (I), Zusammenhänge herstellen (II), Verallgemeinerung und Reflexion (III). Dieser Dreischritt ist in den Bildungsstandards aller Fächer übernommen worden und liegt etwa den IQB-Aufgaben-Sammlungen in Deutsch, Mathematik und den naturwissenschaftlichen Fächern zugrunde. In Schulbüchern findet er sich als Aufgaben-Markierung — bei Klett, Cornelsen und Westermann seit etwa 2010 systematisch — wieder.

Nur: Markiert ist nicht implementiert. Die Frage, was eine Aufgabe didaktisch tut, wenn sie auf Anforderungsbereich III gebracht wird, ist im Lehrbuch-Markup nicht abgebildet. Eine III-markierte Aufgabe nach einer 30-Minuten-Einführung in das Thema ist keine III-Aufgabe, sondern eine I-Aufgabe mit anspruchsvoller Oberfläche.

Die Hattie-Rezeption und ihre stille Verschiebung

Als John Hatties Visible Learning 2009 erschien und in der deutschen Übersetzung 2013 (Schneider Verlag Hohengehren, Übersetzung Beywl und Zierer) eine zweite Welle in die Lehrer:innenzimmer trug, verschob sich die didaktische Diskussion subtil. Hatties Effektgrößen-Logik — direkte Instruktion d=0.59, formative Evaluation d=0.90, Feedback d=0.75 — legte den Akzent zurück auf die Lehrer:innen-Steuerung. „Visible teaching, visible learning” ist gut belegt; was darin verschwand, war die Aufgaben-Kultur als eigenständiger Forschungsgegenstand.

Klaus-Jürgen Tillmann hat 2014 in der Pädagogik darauf hingewiesen, dass die Hattie-Rezeption in Deutschland weniger eine Methoden-Diskussion als eine Diskussion über Lehrer:innen-Wirksamkeit auslöste. Die Aufgaben-Frage — was die Lernenden eigentlich tun, wenn sie lernen — geriet dadurch in den Hintergrund. Wer heute jüngere Kolleg:innen fragt, mit welchem Begriff sie die Klieme-Tradition verbinden, hört „Kompetenzraster” und „Lernlandkarte”, selten „Aufgaben-Kultur”.

Maier, Bohl und die jüngere Aufgaben-Forschung

Es ist das Verdienst von Uwe Maier (PH Schwäbisch Gmünd) und Thorsten Bohl (Universität Tübingen), den Aufgaben-Begriff in den 2010er-Jahren wieder als zentrale Größe in die schulpädagogische Forschung eingebracht zu haben. Maiers Arbeiten zur Lernaufgabe — etwa der 2014 bei Klinkhardt erschienene Sammelband zur Aufgaben-Kultur — und Bohls Untersuchungen zur Leistungsbeurteilung haben einen Begriff geschärft, der vorher in der Praxis homogen klang und es nicht ist.

Die Unterscheidung, die Maier vorgeschlagen hat, ist hilfreich:

Übungsaufgaben dienen der Konsolidierung eines bekannten Verfahrens.
Anwendungsaufgaben prüfen, ob das Verfahren in einem leicht variierten Kontext gelingt.
Lernaufgaben sind so konstruiert, dass die Bearbeitung selbst zur Kompetenz-Erweiterung führt — also nicht nach der Lerneinheit kommt, sondern die Lerneinheit ist.

In dieser Trennschärfe wird sichtbar, warum die kompetenzorientierte Aufgabe in der schulischen Praxis so oft als Fremdkörper erscheint: Sie wird in der Übungsphase eingesetzt, in der eigentlich die Übungsaufgabe gebraucht würde, und sie wird in der Klausur weggelassen, weil sie sich nicht in der gewohnten Punkte-Logik bewerten lässt.

„Tasks” vs. „Aufgaben” — eine Begriffs-Klärung, die fehlt

Im englischsprachigen Diskurs hat sich der Begriff task — etwa bei Doyle (1983), bei Newmann/Wehlage/Lamborn (1996), in der task-based language teaching-Tradition nach Ellis — zu einem Fachterminus entwickelt, der genau das meint, was Maier als Lernaufgabe beschreibt: eine Anforderungssituation, die kognitiv-aktivierend, ergebnisoffen und auf substantielle Bearbeitung angelegt ist.

Die deutsche Übersetzung als „Aufgabe” trägt diese Bedeutung nicht. „Aufgabe” meint im schulischen Sprachgebrauch zuerst das nummerierte Item im Lehrbuch. In dieser semantischen Lücke verschwindet ein Großteil der angelsächsischen Aufgaben-Forschung, sobald sie in deutsche Lehrbücher übersetzt wird. Petra Stanat hat in einem 2019 erschienenen Beitrag zur empirischen Bildungsforschung darauf hingewiesen, dass diese terminologische Unschärfe die Implementations-Lücke der Bildungsstandards mitverursache.

Was die IQB-Aufgaben tatsächlich messen

Ein Blick in den IQB-Bildungstrend 2021 — der die Erprobung der Bildungsstandards im Primarbereich im Fach Deutsch und Mathematik dokumentiert — und in den IQB-Bildungstrend 2022 für die Sekundarstufe I in Deutsch und Englisch zeigt, dass die freigegebenen Aufgaben in einem überwiegenden Teil im Anforderungsbereich II angesiedelt sind. Reine III-Aufgaben — also solche, die Verallgemeinerung und Reflexion verlangen — bilden in den freigegebenen Pools eine Minderheit.

Das hat zwei Konsequenzen. Erstens: Die im IQB-Bildungstrend dokumentierten Kompetenzstände bilden vor allem das ab, was Anforderungsbereich II prüft. Die Befunde — etwa der dokumentierte Rückgang der Lese-Kompetenz im 9. Jahrgang im IQB-Bildungstrend 2022 — sind dadurch nicht ungültig, aber sie messen eine schmalere Kompetenz-Schicht als das Bildungsstandard-Modell theoretisch beansprucht.

Zweitens: Wer im Unterricht „auf die Vergleichsarbeit hin” lehrt, lehrt auf Anforderungsbereich II hin. Das ist nicht falsch — aber es ist nicht das, was die Klieme-Expertise als Reformziel formuliert hatte.

Die „Sonderaufgaben”-Wahrnehmung in der Praxis

In Lehrerfortbildungen, die noch immer auf das KMK-Strategiepapier Bildung in der digitalen Welt (Beschluss vom 8. Dezember 2016, Fortschreibung 2022) zurückgreifen, kommt eine Wahrnehmung regelmäßig zur Sprache: Kompetenzorientierte Aufgaben gelten als „Sonderaufgaben für die Vergleichsarbeit”. Sie werden im Unterricht punktuell vorbereitet, etwa in der Woche vor VERA-8, und gehören nicht zur regulären Aufgaben-Praxis.

Diese Wahrnehmung hat strukturelle Gründe. Eine Lernaufgabe nach Maier verlangt mehr Zeit pro Bearbeitung als eine Übungsaufgabe, sie verlangt eine andere Bewertungslogik, und sie verlangt eine andere Lehrer:innen-Rolle in der Bearbeitungsphase — moderierend statt erklärend. All das passt schlecht in den 45-Minuten-Takt der Sekundarstufe I.

Die kompetenzorientierte Aufgabe ist nicht am Curriculum gescheitert, sie ist an der Stundenstruktur gescheitert.

Felicitas Thiel hat das in einem Beitrag in der Zeitschrift für Pädagogik sinngemäß so formuliert. Die Diagnose verdient mehr Aufmerksamkeit, als sie bisher bekommt.

Was Olaf Köller zur Diagnostik beigetragen hat

Olaf Köller, langjähriger Direktor des IPN Kiel und einer der profiliertesten Bildungsforscher der Republik, hat in mehreren Beiträgen — etwa in seinem 2019 erschienenen Lehrbuch zur empirischen Bildungsforschung — auf die Frage hingewiesen, ob die Aufgaben-Konstruktion in den Vergleichsarbeiten und in den Bildungstrend-Erhebungen tatsächlich das Kompetenzmodell abbildet, das sie zu messen beansprucht. Die Antwort ist differenziert. Bei den Mathematik-Bildungsstandards für die Sekundarstufe I — Leitidee „Funktionaler Zusammenhang”, „Daten und Zufall”, „Raum und Form” — gelingt die Operationalisierung gut. Bei den Deutsch-Bildungsstandards, insbesondere im Bereich „Sprechen und Zuhören” und „Schreiben”, ist die schriftliche Test-Form ein notwendiger, aber problematischer Kompromiss.

Konsequenzen für die Aufgaben-Praxis

Was folgt aus alledem für die Unterrichts-Vorbereitung im Mai 2026?

Erstens: Die Klieme-Expertise ist als Referenzrahmen aktuell. Sie hat einen Begriff von Aufgabe geprägt, der in der Praxis nicht vollständig angekommen ist, aber theoretisch nicht überholt. Die Hattie-Rezeption ergänzt ihn um eine Wirksamkeits-Perspektive, ersetzt ihn aber nicht.

Zweitens: Die Trennschärfe Übungsaufgabe / Anwendungsaufgabe / Lernaufgabe nach Maier ist im Fachkollegium klärungsfähig. Sie lässt sich in einer Fachkonferenz an drei Beispielen aus dem eigenen Lehrbuch operativ machen. Sie lohnt sich, weil sie eine Diskussion über Aufgaben-Auswahl von einer Diskussion über Aufgaben-Typus trennt.

Drittens: Die Frage, was eine Aufgabe leisten soll, ist vor der Frage zu klären, welcher Aufgaben-Typus gewählt wird. Diese Reihenfolge — Funktion vor Typus — ist nicht selbstverständlich. In vielen Lehrbüchern wird sie umgedreht.

Viertens: Die kompetenzorientierte Aufgabe ist nicht für die Vergleichsarbeit konstruiert worden. Sie ist für den Unterricht konstruiert worden. Wer sie auf die Vergleichsarbeit reduziert, hat den Reform-Impuls nicht missverstanden — er hat ihn nur halb umgesetzt.

Ein didaktischer Vorschlag

Eine bescheidene operative Konsequenz wäre, in einer Fachkonferenz pro Schuljahr eine einzige Aufgaben-Sequenz aus dem laufenden Lehrwerk gemeinsam in den Aufgaben-Anforderungsbereichen zu rekonstruieren. Nicht die ganze Reihe, nicht das ganze Halbjahr — eine Sequenz. Wo liegt die Übungsaufgabe, wo die Anwendung, wo die Lernaufgabe? Welche fehlt? Welche ist überrepräsentiert? Was leistet eine III-Aufgabe nach einer 30-Minuten-Einführung — und was wäre die didaktische Vorbedingung, damit sie ihr Potenzial entfalten kann?

Das ist klein und langsam. Aber zwei Jahrzehnte nach der Klieme-Expertise sind klein und langsam vermutlich die einzigen Tempi, in denen die Aufgaben-Kultur sich noch verschieben lässt.

Eine zweite operative Konsequenz — die Bewertungs-Logik

Wer die Aufgaben-Kultur ernsthaft verschieben will, muss die Bewertungs-Logik mitverschieben. Eine kompetenzorientierte Lernaufgabe lässt sich nicht in der Punkte-Logik einer klassischen Klassenarbeit angemessen bewerten. Sie verlangt eine Bewertungs-Matrix, die die Anforderungs-Bereiche differenziert ausweist, die Teil-Kompetenzen ausweist und die qualitative Beurteilung der Bearbeitungs-Substanz neben der quantitativen Punkte-Vergabe zulässt.

Diese Bewertungs-Matrizen sind nicht neu. Sie sind in den Lehrwerken der vergangenen Jahre teilweise mitabgedruckt — bei Cornelsen in der Reihe der kompetenzorientierten Schulbücher seit Mitte der 2010er Jahre konsistent, bei Klett ähnlich, bei Westermann teilweise. Die Schwierigkeit ist nicht ihre Verfügbarkeit; die Schwierigkeit ist ihre Verbindlichkeit. Eine Bewertungs-Matrix, die nicht in der Fach-Konferenz besprochen, nicht in den Klassenarbeits-Korrektur-Stapeln verlässlich angewendet, nicht in den Eltern-Sprechtagen kommuniziert wird, ist eine Bewertungs-Matrix auf Papier.

Hier liegt eine pragmatische Anschluss-Möglichkeit zur ersten Konsequenz: Die Fach-Konferenz, die eine Aufgaben-Sequenz im Anforderungs-Bereich rekonstruiert, kann in einem zweiten Schritt eine Bewertungs-Matrix für die kompetenzorientierten Aufgaben dieser Sequenz teilen. Das ist nicht trivial, es ist auch nicht unmöglich. Es verlangt fachliche Investition, die in den Pflichtstunden-Modellen nicht abgebildet ist — und es lohnt sich.

Zwei Jahrzehnte nach der Klieme-Expertise ist die Aufgaben-Kultur in der deutschen Schule eine halb-implementierte Reform. Die andere Hälfte zu implementieren, ist eine Aufgabe der Fach-Konferenzen — die einzige Ebene, auf der die fachdidaktische Substanz der Aufgaben-Kultur tatsächlich operativ wird. Die Reform liegt nicht in der Lehrplan-Vorgabe und nicht in der Vergleichs-Arbeit. Sie liegt in der nächsten Fach-Konferenzs-Sitzung, in der eine Aufgaben-Sequenz aus dem laufenden Lehrwerk auf den Tisch gelegt wird.

Ressort: Didaktik ¶