Evaluation und Evaluationsforschung - Universität Bremen

Ursula Carle / Heinz Metzen (2003): 

Evaluation und Evaluationsforschung – ein neues 

Paradigma: Entwicklungsservice statt Werkzeugkiste 

The purpose of evaluation is to improve, not to prove. 

Daniel L. Stufflebeam et al. (1971) 

Gliederung 

1 Entwicklungslinien der Evaluation ...................................................... 2 

1.1 Perspektivenwechsel: Vom Begutachtungs- zum Serviceprozess ................ 6 

1.2 Zur Annäherung von Entwicklungsprojekt und Evaluationssystem ............... 8 

2 Evaluationsforschung im schulischen Bereich ................................. 12 

2.1 Unterstützungssystem für die Schulen statt nur Remote Control durch die 

Behörden .................................................................................................... 13 

2.2 Konsequenzen für die wissenschaftliche Begleitung von Schulversuchen . 16 

3 Die methodische Struktur und Strategie der Evaluation und der 

Evaluationsforschung ...................................................................... 18 

3.1 Fünf methodische Logiken entwicklungs- und evaluationsspezifischer 

Teiltätigkeiten .............................................................................................. 19 

3.2 Enwicklungsorientierte Evaluation .............................................................. 21 

3.2.1 Planungs- und Projektsteuerungskonsequenzen ...................................... 22 

3.2.2 Methodische Konsequenzen ..................................................................... 23 

4 Statt einer Bilanz ein Plädoyer: Vorrang hat die Qualifizierung 

der EvaluatorInnen .......................................................................... 26 

Literaturverzeichnis ............................................................................... 32 

Das Interesse, das Diskursvolumen, teilweise sogar die Aufregung sind groß. Seit gut zehn 

Jahren erobert der Begriff "Evaluation" (engl.: Wirkungs- oder Leistungsbewertung) die Welt 

der deutschen Bildungsinstitutionen in vorher unbekannter Geschwindigkeit und Intensität. 

Dabei scheint sie aus Sicht vieler 'nur eine neue Mode' zu sein. Aber anders als bei alltäglichen 

Moden, bei Kleidung, Autos oder Smalltalkthemen gibt es keine stolzen WertsymbolträgerInnen, 

sondern nur Opfer und Täter, Evaluierte und Evaluatoren. Dabei ist es eigentlich 

ganz anders gemeint, wie Stuffelbeam's Motto oben prosaisch nahe legt: Der Förderung soll 

sie dienen, nicht der Verurteilung. Aber anders als bei anderen Neuerungen, etwa der 'Verlässlichen 

Halbtagsschule' oder der 'Neuen Schuleingangsstufe' werben Schulen noch kaum 

mit ihrer "Evaluation" als öffentlichkeitswirksamem Prädikat. Stattdessen erzeugt Evaluation 

Opfer und Täter, Evaluierte und Evaluatoren, Gewinner und Verlierer. Das steht in einem auffallenden 

Widerspruch zu Stufflebeam's Evaluationsbegriff, soll doch aus seiner Sicht Evaluation 

der Förderung und nicht der Überprüfung dienen. 

Gibt es förderliche Forschungsmethoden? – Dazu zwei Vorbemerkungen und ein paradigmatisches 

Bekenntnis. Erstens: Evaluationsforschung war zwar ein historisch wichtiger 

Begriff eines der Gründerväter der Evaluationsforschung, Donald T. Campbell (siehe Isaac /

Ursula Carle / Heinz Metzen 

Evaluationsforschung: Entwicklungsservice statt Werkzeugkiste 

Michael 1997, 13; Campbell 1969 und 1988), ist aber aus heutiger Sicht nur noch ein notwendiger, 

keineswegs hinreichender Teilaspekt von Evaluation. Zweitens: Die Evaluationsforschung 

kennt keine eigenen Erhebungsmethoden. Spezifisch hingegen ist ihr historisch 

entwickelter Anwendungsbereich, Handlungs- und entscheidungsunterstützende Informationsbeschaffung 

in umfangreichen und deshalb ebenso komplexen (kontingenten) wie unübersichtlichen 

Entwicklungsprojekten bzw. –programmen und die dazu passende Methodenvielfalt 

und Methodenstruktur (zur Geschichte: Stockmann 2000; Mertens 2000; Leeuw 2000). 

Das Besondere an der Evaluationsforschung ist daher vor allem die anwendungsorientierte 

Felderfahrung der ForscherInnen und die Routine in der Zuordnung von Problemstellungen 

zu Instrumenten. Letztere zählen zig bis hunderte Varianten und finden sich in allen gängigen 

Methodenlehrbüchern für Pädagogen, Ökonomen, Soziologen, Politologen und Ethologen. 

Dort findet sich auch das grundsätzliche Wissensgenerierungs- und –überprüfungsmuster von 

Thematisierung, Problemeingrenzung, Fragestellung, Wirkungsmodellierung, Indikatorenbildung, 

Erhebung, Auswertung, Interpretation, erneuter Thematisierung und allen in dieser Kette 

möglichen kleinen und großen Zwischenschleifen, Sprüngen und Wiederholungen (z.B. 

Kromrey 1990; Bortz / Döring 2002). 

1 Entwicklungslinien der Evaluation 

Die folgenden Überlegungen sind insoweit auch methodischer Natur, als sie die zukünftige 

Entwicklung der grundsätzlichen Vorgehensweise (Methode = lat.-gr. "Weg oder Gang einer 

Untersuchung…") von Evaluationen im Bildungsbereich zu skizzieren versuchen, dabei aber 

weniger die einzelne Erhebungsform und das zugehörige Erhebungsinstrument im Blick haben 

als die gesamte Vorgehensstruktur und -logik. Diese Bemerkung ist an dieser Stelle wichtig, 

weil Evaluation keine "eigenen" Forschungsmethoden besitzt, Evaluationsforschung also 

das Methodenrepertoire der Sozialwissenschaften nutzt. 

Evaluationsforschung als tertiärer Serviceprozess 

Entwicklungsprojekt 

Kernprozess 

Unterstützungssystem 

Evaluationssystem 

Evaluationsforschung 

3. Serviceprozess 



Kompetenzüberschuss 

des Forschungssystems 


des Evaluationssystems 


des Unterstützungssystems 

evaluation_als_service.ppt U. Carle 2002-12 

Abbildung 1: Stellenwert der Evaluationsforschung im Evaluationsprozess 

camz2003evaluation_service.docx Seite 2 von 38



Diese evaluationsspezifische Methodenstruktur soll mit Blick auf ein hierzu entwickelndes 

systemisches Evaluationsverständnis im weiteren Verlauf dieser Abhandlungen noch um weitere 

Methoden und Instrumente erweitert werden. Dieses neue Evaluationsparadigma hat dabei 

noch eher prognostischen Charakter als dass es die gängige Praxis der Profession wider 

gibt. Insofern aber Prognosen niemals "richtig" sein können, sie aber trotzdem die Entwicklung 

dessen beeinflussen, was sie vorhersagen, ist die hier folgende Diskussion eines systemisch-evolutionären 

Evaluationskonzeptes vor allem das Bekenntnis zu einem für Schulentwicklung 

besonders zukunftsträchtigen Entwicklungsparadigma. 

Die obige Abbildung "Stellenwert der Evaluationsforschung im Evaluationsprozess" 

zeigt die Gewichtsverhältnisse zwischen realem (Schul-) Gestaltungsprojekt – auf welcher 

Strukturebene auch immer – und der sozialwissenschaftlichen Begleitforschung. Im Kern jeder 

Evaluation geht es um die Schaffung eines phasenspezifisches Prozessmonitoring- 

Systems: Klärung der Zielstellung => Ableitung von Indikatoren => Auswahl und Entwicklung 

von Erhebungsinstrumenten => Planung, Gestaltung und Durchführung entsprechender 

Erhebungen => Auswertung der Befunde => Interpretation der Ergebnisse => Kommunikation 

der Schlussfolgerungen und Initiierung bzw. Bereicherung eines strategischen Diskurses 

im Gestaltungsfeld. 

Das sich bereits in der obigen Abbildung andeutende Evaluationsverständnis von einer 

Evaluationsforschung als tertiärem (drittrangigem) Serviceprozess hebt sich deutlich aus dem 

breiten Feld der augenblicklich publizierten und ventilierten Begriffsverwendungen zwischen 

Schülerbeurteilung und Weltbildungsbericht ab. Die Differenzen im Wortgebrauch kommen 

nicht von Ungefähr und sind auch nicht auf eine typisch deutsche Evaluationsfeindlichkeit zurück 

zu führen. Vielmehr gibt es auch im angelsächsischen pädagogischen Kontext zwei, 

mittlerweile völlig verschiedene Begriffskontexte mit dem Namen "Evaluation". 

Auf der einen Seite steht der alte Begriff Evaluation-1 mit der Bedeutung "schulische 

Leistungsbewertung" – angewandt auf Schüler, Lehrer, gar ganze Schulen (das, was PISA 

2000 maß). Dieser Evaluationsbegriff ist retrospektiv. Entsprechende Studien ermitteln mit 

punktuellen Erhebungen einen Indikator für zurück liegende Leistungsveränderungen (Längsschnitt). 

Sie lassen im Querschnitt Leistungsvergleiche zwischen unterschiedlichen Systemen 

zu. Die zugrunde liegende testtheoretisch fundierte Messmethodik ist international hoch entwickelt 

und technisch so weit standardisiert, dass großflächiger Einsatz möglich ist. Die Aussagefähigkeit 

solcher Untersuchungen lässt sich also statistisch gut absichern. Sie hängt jedoch 

außerdem wesentlich davon ab, was der Indikator sicher repräsentiert, d. h. davon, in 

wie weit das der Testkonstruktion zugrunde liegende Wirkfaktorenmodell die realen Zusammenhänge 

abbildet. 

Auf der anderen Seite steht der (historisch gesehen) neue Begriff der sozialwissenschaftlichen 

Evaluation(-2), Evaluationsforschung oder Systementwicklungsevaluation – das 

"Joint Committee on Standards for Educational Evaluation" nennt seine diesbezüglichen 

Standards auch "Program Evaluation" (zur Unterscheidung von "Student Evaluation") als ein 

professionelles Verfahren und Wissensmanagementsystem zur informativen Versorgung von 

Unterstützungssystemen für umfassende (Um-) Gestaltungsprojekte ("Programs") sozialer 

Systeme. Hierbei handelt es sich um prozessnahe, meist prozessbegleitende Forschung. Ziel 

ist die Arbeit an einer systematischen Verbesserung des Lernens, Unterrichtens, Schule Gestaltens 

oder einer konkreten Erneuerung im Bildungswesen. In größeren sozialen Systemen 

kann Evaluation-2 und Unterstützung nicht von ein und derselben Person geleistet werden. 

Daher ist Systementwicklungsevaluation deutlicher auf Kooperation angewiesen als Evaluation 

mit Testcharakter. 

Was sich als Trend bei der sozialwissenschaftlichen Evaluation abzeichnet, nämlich die 

konstruktive Zielrichtung, Evaluationen vor allem zur informativen Unterstützung systematischer 

Entwicklungen einzusetzen, gewinnt auch für die schulische Leistungsbewertung zu- 


Institutionelle Strukturleiter 

(Von der Mikro- über die Meso- bis zur Makroebene) 

Gutachterliche 

Festsetzung des 

Wertes einer Sache 

Sozialwissenschaftliche 

Fundierung der 

Gutachtenerstellung 

Sozialwissenschaftlich 

fundierte Diagnose der 

erreichten Veränderung 

Sozialwissenschaftlich fundierte 

Bewertung aller Phasen eines 

Gestaltungsprojektes 

Bereitstellung der notwendigen 

Informationen zur Optimierung 

aller Phasen des Projektes 

Wissenschaftlich fundierte Prozess 

begleitende und –verbessernde 

Handlungs- und Teilergebnisbewertung 

Schaffung eines Informationssystems 

zur informativen Verbesserung 

des Projekt-Unterstützungssystems 

Partieller, leichter Eingriff 

Partieller, mittelfristiger Eingriff 

Vielseitiger, mittelfristiger Eingriff 

Umfassender, mittelfristiger Eingriff 

Nachhaltige Gestaltungsmaßnahme 



nehmend an Relevanz. Dazu hat im November 2002 das Joint Committee durch eine weitere 

grundlegende Arbeit beigetragen: "The Student Evaluation Standards. How to Improve Evaluations 

of Students" (dies. 2002). Das Joint Committee ist am gleichen "Evaluation Center" 

der Western Michigan University in Kalamazoo, Michigan (USA) beheimatet, in dem auch 

die von James R. Sanders heraus gegebenen "Program Standards" (1999) und die Evaluationsexpertisen 

von Stufflebeam und KollegInnen (1971) erarbeitet wurden 1 . Zwischen1997 

und heute hat das Joint Committee mit Unterstützung der W. K. Kellogg Foundation an der 

Entwicklung von Leistungsbewertungsstandards gearbeitet und damit sowohl den Lehrerinnen 

und Lehrern bei ihrer Bewertungsarbeit eine praktische Hilfe als auch den Schülern, Eltern 

und allen Interessierten eine konzise Information darüber geliefert, wie gute, faire, transparente 

und entwicklungsförderliche Leistungsermittlung (Assessment) und Leistungsbewertung, 

sensu Evaluation-1 aussehen kann. 

Die kulturelle Übereinstimmung und strukturelle Ähnlichkeit zwischen der individuellen 

Leistungsbewertung (Evaluation-1) mit der sozialwissenschaftlichen Entwicklungsunterstützung 

(Evaluation-2) schließen nun den Begriffskreis, der in den dreißiger Jahren mit einer 

Anleihe aus dem Werkzeugkasten der Lehrer (und staatlichen Gutachter) begann und heute 

mit einer gemeinsamen systemisch orientierten Feedbackprozedur, wenn auch auf zwei ganz 

unterschiedlichen institutionellen Strukturebenen (Carle 2000, 359 ff) und mit deutlich unterschiedlichem 

methodisch-apparativem Aufwand endet. Die eigentlich große Frage ist also, 

wie auf allen Strukturebenen die beiden Traditionen zusammen kommen können, wie also 

Leistungsbewertung zugleich der informativen Grundlegung der Entwicklung von Lernen, 

Unterricht, Schule und Bildungswesen dienen kann – individuell und gesellschaftlich. 

Tragweite von Evaluationsprojekten 

Dreidimensionales Kategorienschema zu ihrer Einschätzung 

Gesellschaftl. 

Ebene 

Organisationale 

Ebene 

Kollektive 

Ebene 

Individuelle 

Ebene 

Systemhaftigkeit der Evaluation 

(Sieben Grade: von der gutachterlichen Stellungnahme bis hin zum Entwicklungsservice) 

Veränderungstiefe 

(Intensität, Reichweite und 

Nachhaltigkeit des Wandels) 

eval-tragweite-wuerfel.ppt U. Carle 2002-12 

Abbildung 2: Drei Dimensionen zur Kennzeichnung der Tragweite von Evaluationsprojekten 

1 Ein Besuch auf der Homepage des "Evaluation Centers" ist von hohem professionellem Interesse, werden doch 

dort eine Fülle von Checklists und Artikel zur praktischen Evaluationsarbeit zum kostenlosen Herunterladen 

angeboten: 




Kern eines integrativen Evaluationsbegriffes ist das Veränderungsvorhaben – auf welcher 

Strukturebene auch immer. Die obige Abbildung der Tragweitedimensionen von zu evaluierenden 

Gestaltungsprojekten macht deutlich, dass diese Veränderungsprojekte von der begrenzten 

individuellen Lernaufgabe bis hin zum gesamtgesellschaftlichen Vorhaben zur Neugestaltung 

der schulischen, universitären und betrieblichen Bildung reichen können. 

Wie auch immer man die strukturelle Dimensionalität von anthropogenen Gestaltungsunternehmungen 

bewerten mag, von der Komplexität und vom methodischen Anspruch her sind 

"Nachhaltige Gestaltungsmaßnahmen" auf individueller Ebene methodisch nicht weniger anspruchsvoll 

und aufwendig große bildungspolitische "Revolutionen" – ein Blick auf Einzelfallstudien 

(siehe Lamnek 1995; Friebertshäuser / Prengel 1997), auf Untersuchungen ohne 

große Zahlen, belegt das. Professionelle Evaluation unterscheidet also nicht die Zahl der Fälle 

oder die globale Reichweite des Gestaltungsprojektes vom schlichten, situativen Gutachten, 

sondern die gestalterisch beanspruchte und methodisch abgebildete Veränderungstiefe. 

Wie verlief die Karriere eines mittlerweile für die Consulting Profession aber auch für die 

Scientific Community so bedeutungsschweren Alltagsbegriffs? - Der ebenso bescheidene wie 

methodisch anspruchsvolle oder gar existenziell überwältigende Begriff "Evaluation" wurde 

von amerikanischen Regierungsstellen in den dreißiger Jahren des zwanzigsten Jahrhunderts 

auf die sozialwissenschaftlich gestützte Begutachtung größerer sozial-ökonomischer Vorhaben 

übertragen und entwickelte sich nach dem 2. Weltkrieg zum kybernetisch inspirierten 

Wirkungsmodell der informativen Grundlegung (Feedback) bedeutsamer Eingriffe in große 

soziale Systeme. Die wissenschaftliche Politikberatung war geboren und ist zumindest in den 

USA nach mehreren Aufs und Abs zum Standard administrativer Projektgestaltung avanciert. 

Damit hat auch im öffentlichen Bereich die Verwissenschaftlichung der Alltagsarbeit Einzug 

gehalten – was es im deutschen Bildungssektor nach zu holen gilt. 

Die Improvement-Zielstellung ist seit den Siebzigern des vorigen Jahrhunderts in der 

deutschen Evaluationsprofession Gemeingut, nicht aber im überwiegenden Teil der deutschen 

behördlichen Evaluationspraxis, insbesondere nicht in der Kultusbürokratie. Wie klein die 

Profession noch ist, verrät ein Blick auf die Homepage der erst 1997 gegründeten "Deutschen 

Gesellschaft für Evaluation" (DeGEval) 2 . Damit hinken wir der amerikanischen Entwicklung 

gut 20 Jahre hinterher 3 . Entsprechend fallen hier die gängigen Fluchtmuster der "Evaluationsopfer" 

gegenüber den neuen behördlichen Bewertungszumutungen aus: Sie variieren zwischen 

Leugnung ("Evaluation ist eine Mode") und Ablenkung ("Wir evaluieren uns selbst 

nach unseren eigenen Kriterien"). Die zugehörigen Verfolgungsmuster der politisch-administrativen 

Täter bestehen aus Mittelkürzungsvorbehalten gestützt auf externen Sachverstand. 

Die Täterposition – obwohl im Sinne Stufflebeam's kontraproduktiv - ist unproblematisch, 

gründet sich ihre Praxis doch trotz des neuen Begriffes auf einer uralten Amtspraxis, nämlich 

der "Revision", der "Begutachtung" und der "Bewährungskontrolle". 

2 Die URL der Deutschen Gesellschaft für Evaluation (DeGEval) in Köln lautet (Stand Dezember 2002): 

http://www.degeval.de/ 

3 Lee J. Cronbach gründete bereits 1970 das "Stanford Evaluation Consortium", ein Forschungs-, Service- und 

Trainingszentrum an der School of Education der Stanford University. Das "Evaluation Center" an der Western 

Michigin University in Kalamazoo, Michigan, USA mit weltweit führenden Evaluationsmethodikern wie Daniel 

L. Stufflebeam wurde 1973 gegründet. Für den schulischen Bereich konstituierte sich bereits 1975 das 

"Joint Committee on Standards for Educational Evaluation". Ein Vorläufer des Berufsverbandes der "American 

Evaluation Association", das "Evaluation Network" wurde 1976 ins Leben gerufen… 




1.1 Perspektivenwechsel: 

Vom Begutachtungs- zum Serviceprozess 

Die Irritation der in der ganz überwiegender Zahl als Lehrende tätigen Evaluierten gründet in 

einer tiefen Verunsicherung des eigenen Professionsverständnisses: Sollen die traditionellen 

Werkzeuge der Pädagogik, persönliche Intuition, ein hoher pädagogischer Ethos und reiche 

berufliche Erfahrung durch die externen und nicht selten organisationsfremden Maßstäbe von 

Bürokraten völlig in Frage gestellt werden? Muss etwa die ganzheitliche, individuelle und situative 

Sicht- und Arbeitsweise der LehrerInnen einer punktuellen (und damit messbaren) und 

landeseinheitlichen Testbürokratie weichen? 

"Die Sau wird durchs Wiegen nicht fetter", kalauerte diesbezüglich vor wenigen Jahren 

ein großer deutscher Lehrerverband und spiegelte damit die Stimmung des Berufsstandes treffend. 

Aber er verfehlte damit die sich im aktuellen Evaluationskonflikt äußernde Aufgabenstellung 

völlig. Denn die berechtigte Erwartung an ein professionelles Evaluationssystem besteht 

nicht im schieren Messen, sondern in der Bereitstellung eines sozialwissenschaftlich 

fundierten Kommunikationssystems zur zielführenden Verbindung aller an Schule, Hochschule 

und anderen Bildungseinrichtungen Beteiligten und Betroffenen in Richtung auf eine moderne, 

prozess-, entwicklungs- und schülerorientierte Bildungssystemgestaltung über alle 

Strukturebenen hinweg. 

Auf das Bildungssystem bezogen lässt sich bis hier zusammen fassen: Evaluation soll im 

Gestaltungsprozess handlungsleitendes Wirkungswissen bereit stellen und zwar für den gemeinsamen 

strategischen Diskurs 4 der verschiedenen Interessengruppen über die weitere Ausformung 

des Gestaltungsprojektes. Dabei ist erfolgversprechende Evaluation – dies lehren alle 

Evaluationserfahrungen (Carle 2000, 67-70) im Bildungssektor - immer demokratisch und 

bietet den Gestaltenden für ihr gemeinsames Vorhaben: 

Zielführungssystem 

Kommunikationsplattform und 

Integrationsmedium der Strukturebenen 

Jede Ebene und jede Interessengruppe des Bildungssystems erhält so die Zahlen und Einschätzungen, 

die es ihr erlauben, ein höheres Maß an Verantwortung und Zweckmäßigkeit des 

eigenen und des gemeinsamen Handelns zu erreichen. Dies gilt auf der schulfernen Regierungsebene 

ebenso wie auf der konkreten Ebene des Unterrichts. Ein erfolgversprechendes 

Evaluationssystem verbindet persönliche Lernzuwachs-Portfolios mit staatsweiten Bildungskennzahlen. 

Eine solche "Umfassende (comprehensive) Evaluation" gibt Schülern, Eltern, 

Lehrern, Administratoren und Politikern eine Rückmeldung darüber: 

dass das, was sie wollen, auch wirklich getan wird 

(Implementation Evaluation – Durchführungskontrolle) 

dass das, was sie tun, auch tatsächlich wirkt 

(Impact Evaluation – Wirkungskontrolle) und 

dass die Art, wie es getan wird, der gebotenen Ökonomie und der aktuell möglichen 

Professionalität entspricht (Effectiveness Evaluation – Effizienzkontrolle) 

Das Design von Evaluationsforschungsvorhaben entsprach bereits um 1930 diesem grundlegenden 

Anspruch, nur dass das sozialwissenschaftliche Niveau und das Selbstverständnis der 

Gestalter wie das der Evaluatoren damals noch stark expertokratisch waren. Die weitere Ge- 

4 Wolfgang Beywl nennt diesen strategischen Diskurs prosaischer "Wirksamkeitsdialog" – ders. 2001: Die Perspektiven 

des Wirksamkeitsdialogs 


hoch innovative und 

trotzdem gesicherte 

Forschungsfrage 

ungelöste + schwierige 

Entwicklungsaufgabe 

eines Praxisfeldes 

Entwicklung einer praktisch 

relevanten Problemstellung 

Entwicklung einer theoretisch 

konsistenten Problemstellung 



schichte der Entwicklung der Evaluationsforschung spiegelt also vor allem die jeweils vorherrschenden 

wissenschaftlichen Paradigmen (sensu Kuhn 176 und 1997) wieder. Das der 

heutigen Wissenschaftsentwicklung angemessene Interventions- und Forschungsparadigma 

folgt dem systemisch-evolutionären Verständnis (sensu Carle 2000, 281 ff) 5 . 

Evaluation und Evaluationsforschung sind inzwischen im Bildungsbereich der USA bereits 

seit den 50er Jahren des 20. Jahrhunderts fest etabliert (Mertens 2000). Damit einher 

ging die Herausbildung einer Evaluationskultur, die einzig einem Ziel dient, dass alle besser 

lehren und lernen – dies in einem durchaus allgemeinen und in einem sehr persönlichen Sinne. 

Zwei Voraussetzungen sind dazu unabdingbar: Erstens muss das Gestaltungsvorhaben einem 

State-of-the-art-Wirkungsmodell des Gestaltungsfeldes folgen. Dieses Modell wird so 

gut wie aktuell möglich gestaltet und muss allen bewusst gemacht werden. Zweitens muss das 

Evaluationssystem, sprich seine Strategie und Methodenstruktur zur Erfassung der tatsächlich 

eintretenden Wirkungen diesem Wirkungsmodell angemessen sein. So können die entwicklungsrelevanten 

Wirkungsfaktoren erfassbar und der Systemgestaltung zugänglich gemacht 

werden. Ziel ist die Erhöhung des Einflusses auf das Wirkungsfeld durch die Wirkenden. 

Die folgende Abbildung zeigt eine Gleichgewichtigkeit des Gestaltens und Forschens, die 

in der alten Arbeitsteilung von universitärer Sozialforschung und betrieblich-lebensweltlicher 

Gestaltungspraxis so nicht denkbar war. Nicht die Dichotomie der beiden Welten, Evaluationsforschung 

und Systemgestaltung, sondern erst die Integration wichtiger Teile der jeweils 

anderen "Welt" in die eigene Disziplin oder Arbeit ermöglicht den gleitendenden Übergang 

von der nur praktisch einwirkenden zur reflexiv forschenden Entwicklungswerkstatt. 

Evaluationslogik zwischen 

Praxisproblem und Forschungsfrage 

Entwicklung einer wissenschaftlich beantwortbaren Fragestellung 

Zielstellung 

Problemstellung 

Vorgehen 

Auftrag 

Abklärung 

Bedarf 

prozessbegleitende Unterstützung 

und wechselseitige Abstimmung 

Untersuchungsfrage 

Design 

Publikation 

Interpretation 

Auswertung 

Erhebung 

Entwicklung einer praktisch bedeutsamen Antwort 

evaluationslogik.ppt U. Carle 2002-10 

Abbildung 3: Evaluationsforschung als Interaktionsprozess zwischen Gestaltungsprojekt 

und Forschungsprozess 

5 Ein Beispiel für entsprechende Evaluationsvorhaben schulischer Gestaltungsprojekte bietet der Ansatz der 

"Systemischen Schulbegleitforschung" von Ursula Carle (Carle 2000, 2001 und 2002; Carle u.a. 2002). 




Die Intervention des evaluationsunterstützten Projektes muss also im besten Falle einer wissenschaftlich 

fundierten Wirkungsprognose folgen, die das Evaluationssystem dann ebenso 

professionell im Projektverlauf abzubilden versucht. Dies könnte man aus amerikanischpragmatischer 

Sicht in Anlehnung an Rossi / Freeman / Lipsey (1999, zuerst 1985) die "Theoretische 

Wende" in der Evaluationsforschung nennen (s.a. Chen 1999; Bamberg 2000). Evaluation 

wird zu einem von mehreren wichtigen Serviceprozessen für das Entwicklungsprojekt. 

Ich schlage deshalb aus der europäischen, eher theorielastigen Position vor, die konzeptionelle 

Koppelung zwischen Projekt und Evaluation einer "Systemischen Wende" der Evaluationsforschung 

zuzuschreiben. Die obige Abbildung versucht, die Verschränkung und Parallelität 

der beiden Hälften erfolgversprechender Evaluationsprojekte zu veranschaulichen. Die hier 

skizzierte Systemverschränkung setzt allerdings mehr als nur konzeptionelle Anknüpfungspunkte 

voraus, nämlich die Fähigkeit zur strukturellen Koppelung auf beiden Systemseiten 

voraus – dazu später mehr. 

In der systemischen Evaluationsforschung oder – bezogen auf Schule – der "Systemischen 

Schulbegleitforschung" (Carle 2002) folgen Struktur und Methodik der Evaluationsstudie 

dem Sinn, der Struktur und der Methodik des Gestaltungsprojektes. Das Evaluationssystem 

muss also das Wirkungsmodell des Entwicklungssystems "verstanden" haben. Somit sind 

sozialwissenschaftliche Forschungsmethoden für erfolgreiche Evaluation nur eine notwendige, 

bei weitem aber keine hinreichende Bedingung. Hinzu kommt, dass die Art und Weise der 

Evaluationskommunikation für den Wissensgewinn und den Lernerfolg der Gestaltenden eine 

nicht minder wichtige Rolle spielt – zur schriftlichen Gestaltung von Evaluations-Exposees, - 

Berichten und –Artikeln siehe Isaac / Michael 1997, 237 ff). Felderfahrung und fundierte theoretische 

Feldmodellierung einschließlich der Feldsprachenbeherrschung bilden also mindestens 

ebenso wichtige Erfolgsbedingungen wie die Kenntnis sozialwissenschaftlicher Erhebungsmethoden 

–zur Methodik später mehr in Kapitel 4.3. 

1.2 Zur Annäherung von Entwicklungsprojekt und 

Evaluationssystem 

Auch die Väter der amerikanischen Evaluationsforschung Donald T. Campbell (1988), Michael 

Scriven (Donaldson / Scriven (Eds.) 2003), Lee J. Cronbach, Daniel L. Stufflebeam 

(Stufflebeam / Madaus / Kellaghan) 2001) Peter F. Rossi (Rossi / Freeman / Lipsey 1999), 

Ernest R. House 6 (1999) und andere unterstreichen alle die "dienende" Funktion der Evaluation 

(Evaluationsforschung als Serviceprozess für den Kernprozess der Systemgestaltung) und 

die Notwendigkeit der paradigmatischen Verwandtschaft zwischen Gestaltungsprojektansatz 

und Evaluationsansatz. Nicht verwandt sind beispielsweise ein schulisches Entwicklungsprojekt, 

z.B. der Versuch einer Einbeziehung der Eltern in die pädagogisch-didaktische Arbeit 

der Schule und ein behördliches Testvorhaben zur Ermittlung der Schülerleistungen. Paradigmatische 

Verwandtschaft läge vor, wenn die Behörde das Projekt der Schule durch ein Unterstützungssystem 

fördern will und den gesamten Entwicklungsverlauf mittels einer begleitenden 

Evaluation erfassen und dokumentieren will. 

Was beide dann trotz dieser Projektsympathie im Detail unterscheidet ist die Arbeits- und 

Forschungsmethodik sowie der "Fachdialekt", zumindest so lange bis die Gestaltung der Projekte 

– wie es Patton (1998) nennen würde – von der "Evaluationskultur" durchdrungen ist, 

bis also Evaluationsforschungskompetenz ein integraler Bestandteil der Systemgestaltungskompetenz 

geworden ist. Erst wenn eine ausreichende Evaluationskompetenz im Entwicklungssystem 

selbst ausgebildet ist und wenn diese in die Planung und Gestaltung des Ent- 

6 Prof. House, School of Education, University of Colorado, Boulder ist vielleicht der kompetenteste Kenner der 

Evaluationsforschung im schulischen Bildungssektor weltweit 




wicklungsprojektes als integraler Bestandteil verankert ist, kann die fruchtbringende strukturelle 

Koppelung zum Evaluationssystem gelingen. Die folgende Abbildung bietet zur schematischen 

Einschätzung der Evaluationskompetenz und der Feldkompetenz auf Seiten des Entwicklungssystems 

wie. des Evaluationssystems einen ersten Überblick. 

In den USA und den angelsächsischen Ländern ist die Evaluation von Bildungseinrichtungen 

bereits eine zunehmend alltägliche Praxis. Die 'Organisation für wirtschaftliche Zusammenarbeit 

und Entwicklung', die OECD (Organization for Economic Cooperation and Development) 

forciert die weltweite Verbreitung dieser institutionellen Bewertungspraxis. Dem liegt 

die Annahme zugrunde, dass sich nationale Bildungssysteme ohne Messen und Bewerten 

nicht verbessern lassen – die Ergebnisse der PISA 2000-Studie bestätigen diese Auffassung 

im Großen und Ganzen (Baumert, Jürgen (Hrsg.) 2001: PISA 2000), auch wenn es sich hierbei 

nicht um eine Evaluationsstudie, sondern allenfalls um ein Systemmonitoring im Sinne 

"vergleichender Leistungsmessung" (Baumert 2002; BMBWK 2000) handelt, denn es fehlt 

das Gestaltungsprojekt. 

Abbildung 4: Stufenschema zur Entwicklung struktureller Koppelungsfähigkeit zwischen 

Evaluationsprofession und Entwicklungsfeld 

Inzwischen hat sich weltweit eine veritable Profession der EvaluatorInnen und der sie empirisch 

tragenden Evaluationsforschung etabliert. Wobei der Begriff der Evaluationsforschung 

cum grano salis in vier Wortbedeutungen gebraucht wird – im Sinne einer Methodologie 

(Forschung über Forschung), im Sinne einer Methodik (Verfahren und Regeln der Evaluationsforschung), 

im Sinne einer methodisch orientierten Praxis (Evaluationsagenturen mit 

feldspezifischen Anwendungserfahrungen) und schließlich im Sinne der konkreten Evaluationsstudien 

selbst: 

Forschung über Evaluation (Methodologie der Evaluation, Metaevaluation, z.B. Widmer 

1996) 




Forschungs- und Lehrinstitute, die sich auf die Förderung der sozialwissenschaftliche 

Methodenkompetenz für Evaluationsprozesse konzentrieren (etwa das "Centrum für 

Evaluation (Ceval)", z.B. Stockmann, Universität des Saarlandes) 

Inhaltlich spezialisierte Forschungsinstitute bzw. Abteilungen sozialwissenschaftlicher 

Forschungseinrichtungen, die Evaluationsstudien durchführen (beispielsweise die 

"Konzeptstelle Evaluationsforschung" des Deutschen Jugendinstituts in München oder 

EvaNet der deutschen Hochschulrektorenkonferenz) 

Sozialwissenschaftliche Studien zur informativen Grundlegung von Evaluationen (z.B. zu 

Schulentwicklungsprogrammen – Orth 2002, Carle 2002) 

Die Verwendung der Begriffe Evaluation und Evaluationsforschung ist äußerst vielfältig 

und reicht vom Fachgutachten eines Professors (Aufenanger 1998) über die langjährige 

Schulbegleitforschung eines wissenschaftlichen Teams (Carle 2002; McEwan 1995) bis hin 

zu landesweiten Schulprogramm-Evaluationen (Ministerium für Schule, Wissenschaft und 

Forschung NRW 2002). Gut an dieser Beliebigkeit und der unscharfen Ausdrucksweise ist im 

memetischen Sinne die Offenheit und Anschlussfähigkeit für Neues. Die Beliebigkeit und begriffliche 

Unschärfe zeugt jedoch zugleich von einem geringen Professionalisierungsgrad. 

Dafür spricht auch, dass sich die Methodik der Evaluationsforschung in nichts von der Methodik 

der übrigen Sozialwissenschaften unterscheidet. Zudem handelt es sich bei Evaluationsforschung 

zumeist nur um den sozialwissenschaftlichen Teil des (informatorischen) Evaluationssystems. 

Die Kopplung zwischen Projekt- und Evaluationskonzept wird in der Regel 

noch nicht systematisch betrieben. 

Die gängigen Evaluationsdefinitionen helfen da auch nicht weiter, da sie sich allesamt auf den 

Autoren jeweils nahe liegende Teilaspekte eines umfassenderen, systemischen Evaluationsverständnisses 

beschränken – hier einige Kostproben mit aufsteigendem Komplexitätsniveau: 

Evaluation ist jegliche Art der Festsetzung des Wertes einer Sache (Scriven 1980 – 

Konzentration auf Effektbestimmung [Merit, Worth, Significance]) 

Evaluationsforschung ist die explizite Verwendung wissenschaftlicher Forschungsmethoden 

und Forschungstechniken für den Zweck der Durchführung einer Bewertung 

(Suchman 1968 – Wertbestimmung plus Sozialforschung) 

Evaluation ist eine begriffliche (bis hin zur mathematischen) Modellierung in einem 

Anwendungsfeld und dient dem Vergleich von angestrebter zu prognostizierter Veränderung 

(Henninger 2000 – Ergebnisbewertung als Soll-Ist-Vergleich im Sinne der 

Kybernetik 1. Ordnung) 

Evaluation ist die systematische Anwendung sozialwissenschaftlicher Methoden zur 

Bewertung der Konzeption, des Designs, der Implementation und des Nutzens einer 

sozialwissenschaftlichen Interventionsmaßnahme (Rossi / Freeman / Lipsey 1985 – 

prozessbegleitende Ergebnisbewertung plus Sozialforschung) 

Unterscheidung von "Formativer Evaluation", der Bereitstellung von Informationen 

und Bewertungen vor und während der Durchführung der Evaluation, um Probleme zu 

klären und die Gestaltung der Intervention (die evaluiert wird) zu konzipieren, zu 

steuern und zu optimieren) und "Summativer Evaluation", der Bewertung der Ausprägung 

der intendierten Effekte und der Nebenwirkungen einer bereits durchgeführten 

Intervention) (Bloom / Hastings / Madaus 1971 – Kennzeichnung der paradigmatischen 

Differenz zwischen Ergebnisbewertung und Gestaltungsprozessverbesserung) 

Evaluation ist Planungs- und Entscheidungshilfe und hat daher etwas mit Bewertung 

von Handlungsalternativen zu tun. Sie dient dazu praktische Maßnahmen zu überprüfen, 

zu verbessern oder über sie zu entscheiden. Die Vorgehensweise sollten dem ak- 




tuellen wissenschaftlichen Stand angepasst sein (Wottawa / Thierau 1986 – prozessbegleitende 

und prozessverbessernde Ergebnis- und Handlungsbewertung plus Sozialforschung) 

Was für die Vielfalt der Definitionen und Verwendungskontexte galt, gilt auch für die professionell 

klingenden Adjektive zur Evaluationsforschung, wie "Partizipative Evaluation" (Henninger) 

oder "Experimentierende Evaluation" (Heiner, Scherrer) oder andere. Sie spiegeln nur 

Aspekte (Ebenen, Methoden, Verwendungskontexte…) des bis hier ausformulierten, umfassenden 

Evaluationssystem-Begriffs. In einem Umfeld, wie dem deutschen, in dem sich Evaluation 

als Profession und Systemgestaltungsmedium erst zu etablieren beginnt, tragen solcher 

Art "Spezifikationen" zwar auch zur weiteren Verwirrung über Sinn, Zweck und Vorgehen 

guter Evaluation bei. Andererseits helfen sie Brücken bauen zwischen ehemaligen Evaluationsopfern 

und angehenden Evaluationsnutzern bzw. zwischen vormaligen Gutachtern und 

zukünftigen Evaluationsdienstleistern. 

Doch nicht genug der Vieldeutigkeit von Evaluation und Evaluationsforschung. Mindestens 

fünfzig Prozent der Wortverwendungen verweisen auf begriffliche Verwandtschaften 

mit: Leistungsbewertung, Erfolgskontrolle, Effizienzforschung, Begleit- oder Bewertungsforschung, 

Wirkungskontrolle, Qualitätskontrolle oder Controlling. Wer die technische Präzision 

liebt, wird sich grausen, wer mehr der sozialen Quirligkeit zugetan ist, wird sich über das verbale 

Interesse am zukunftsweisenden Praxisfeld freuen. Wer kompetente Evaluationspartner 

sucht, kann an der (mangelnden) Begriffsklarheit den Professionalisierungsgrad ablesen. Allen 

zum Trost: Das Professionsfeld Evaluation ist in Deutschland und in der Welt in einer 

stürmischen Entwicklung begriffen und wird sich in den nächsten zehn Jahren noch einmal 

sprunghaft verändern. 

Zum Schluss der allgemeinen Entwicklungsdarstellung sollen weitere Entwicklungen der 

Evaluationsforschung an einem der amerikanischen Evaluationsväter, prominenten Bildungsevaluatoren, 

weltweit tätigen Gutachter und zugleich zutiefst unkonventionellen Evaluations- 

"Philosphen" fest gemacht werden, an Prof. Ernest R. House von der School of Education an 

der University of Colorado in Boulder. Unter allen EvaluationsforscherInnen hat sich vor allem 

Ernest R. House mit der Frage der "kulturellen Koppelung" zwischen Gestaltungs- und 

Evaluationssystem befasst. 

So machten er und sein Kollege Prof. McQuillan in den meisten schulbezogenen Reformstudien 

der vergangenen Dekaden drei erkenntnisleitende Perspektiven aus: Eine technischorganisatorische, 

eine politisch-wirtschaftliche und eine sozial-kulturelle – aber nie alle drei 

zusammen. Jede dieser Sichtweisen konzentriert sich dabei auf relevante Faktoren schulischen 

Wandels und vernachlässigt die anderen. House' und McQuillan's Schlussfolgerung: "Schulreformen 

scheitern z.T. deshalb, weil sie wichtige Faktoren übersehen oder ihnen zu wenig Beachtung 

schenken" (House / McQuillan 1998, 199; Übers. Durch d.V.). Aus den drei Perspektiven 

auf schulischen Wandel lassen sich drei Leitfragen ableiten: 

Die technisch-organisatorische Leitfrage: 

Worin besteht die Aufgabe und wie wird sie erfüllt? 

Die wirtschaftlich-politische Leitfrage: 

Welche Fraktionen unterstützen diese Aufgabe und welche sind dagegen? 

Die human-kulturelle Leitfrage: 

Vereinigt die Aufgabe die Menschen zu gemeinsamen, kooperativen 

Anstrengungen? 

Die drei reformrelevanten Handlungsperspektiven von House / McQuillan entsprechen weitgehend 

den Luhmannschen Einflussfaktoren auf Organisationsverhalten (siehe Carle 2000, 




347). Sie können daher als allgemeine (unspezifische) Einflussmedien für den institutionellen 

(schulischen) Wandel betrachtet werden 7 . 

Es ist ein offenes Geheimnis, dass Schul- wie Organisationsreformen überwiegend nicht 

gelingen. House und McQuillan behaupten deshalb die Notwendigkeit einer Integration dieser 

drei Sichtweisen beim Studium und der Gestaltung institutionellen Wandels (ähnlich Fend 

1998, 353 oder Ropohl 1999, 43f). Vom konkreten Schularbeitsplatz bis zum übergeordneten 

gesellschaftlichen Engagement einer Organisation finden sich nie rein disziplinäre Problemstellungen, 

rein menschlich-soziale, rein ökonomische oder rein politische Aufgaben. Andererseits 

entstammen in der praktischen Reformarbeit Vorgehen und Werkzeuge zur Analyse 

und Behandlung konkreter Probleme meistens den Repertoires spezialisierter Reformschulen 

und Fachdisziplinen. Natürlich garantiert die bewusste Gestaltung dieser drei Einflussmedien 

für Schulreformen allein keineswegs den gewünschten Erfolg. Jedoch glauben House und 

McQuillan, dass diese eine notwendige Bedingung für Reformerfolg bildet und dass Schulreformen, 

die diese drei Dimensionen und die entsprechenden Interaktionen in Betracht ziehen, 

erheblich mehr Probleme in den Blick und damit 'in den Griff' bekommen 8 . 

2 Evaluationsforschung im schulischen Bereich 

Angelsächsisches Effizienzdenken hat früh einen Berufszweig entstehen lassen, von dem viele 

– auch PädagogInnen - in Deutschland nicht einmal wissen, dass es ihn gibt: EvaluationsforscherInnen. 

Die Evaluationsforschung ist ein Teil der angewandten Sozialforschung, so 

wie Meinungsforschung, Marketingforschung, Politikforschung etc. In den USA umfasst der 

Berufsverband der Evaluationsforscher, die »American Evaluation Association (AEA) zwischen 

2000 und 3000 Mitglieder (Widmer 1996, 11; Mertens 2000). Der Begriff "Evaluation" 

ist im Amerikanischen ein Allerweltsbegriff und heißt so viel wie Auswertung, Bewertung, 

Beurteilung. Schülerleistungen werden "evaluated" (Bloom / Hastings / Madaus 1971), Autos 

auch und staatliche Programme, wie etwa eines zur HIV-Prävention (The Measurement 

Group 1998). Vor allem letztere Funktion im Rahmen der Entdeckung des Prozessnutzens in 

sozialen Veränderungsprojekten verhalf dem Begriff zu wissenschaftlicher Aufmerksamkeit 

und methodischer Aufwertung. Nach dem zweiten Weltkrieg wurden in den USA zahlreiche 

Schul- und Immigrationsprogramme, später auch Wiederaufbau- und Entwicklungshilfeprogramme 

einer abschließenden Wirkungskontrolle, einer Evaluation unterzogen (Liebermann 

1998, 13ff; Übersicht bei Carsten Meyer 1996). 

Was kann Evaluation für Schulreformen oder zumindest für einzelne Schulentwicklungsprojekte 

leisten? Das Konzept der Evaluationsforschung ist ergebnisorientiert und stammt 

konzeptionell aus den Zeiten der frühen Kybernetik der fünfziger Jahre. Danach liefert der 

Evaluationsprozess als Sekundärprozess die notwendige Rückmeldung an den "Regler" über 

das Ergebnis seiner Intervention in die "Regelstrecke". Dies ist sinnvoll für solche Prozesse, 

deren Ergebnis nicht unmittelbar sichtbar ist, wie es ja allen komplexen sozialen Prozessen 

zueignet. Dieser rational-empirische Ansatz war kennzeichnend für eine Gruppe der Wegbereiter 

systemischer Forschungs-, Entwicklungs- und Gestaltungsansätze, wie den auf Kurt 

LEWIN zurückgehenden Disziplinen des "Planned Change" (heute: Change Management) und 

der Gruppendynamik (heute: Organisationsentwicklung - Liebermann 1998, 18). 

7 Bei Giddens lauten die dazu korrespondierenden drei Strukturdimensionen "Legitimation" (zu Fachautorität), 

"Herrschaft" (zu Macht) und "Sinn" (zu Führung); im pragmatisch-systemischen Ansatz von Morgan heißen 

die drei Subsysteme: "technisches", "strukturelles" (für Macht) und "menschlich-kulturelles" Subsystem (ebd. 

1997, 64) 

8 Eine eingehendere Diskussion der House / McGillan-Befunde einschließlich einer entsprechenden Checkliste 

findet sich bei Carle 2000, 345-351 




Insofern unterschied sich der Evaluationsansatz bereits wohltuend von dem Ansatz des 

"Großen Befähigungsnachweises" wie er handwerklichen Forschern und Designern qua Ausgangsqualifikation 

oder Amt zukommt, indem Evaluation die systemische Eigensinnigkeit 

und Zufälligkeit antizipiert und die tatsächliche Wirkung nachträglich überprüft. Er unterschied 

sich aber auch in seiner Intention vom alten selektiven Bewertungsansatz: Evaluierung 

dient den Schülern als Rückmeldung für die Weiterverfolgung ihres individuellen Entwicklungsprozesses 

und Evaluierung dient auf der nächst höheren Systemebene den LehrerInnen, 

den Schulen und allen LehrgestalterInnen gemeinsam zur informativen Grundlegung ihres 

Entwicklungsprozesses (Bloom / Hastings / Madaus 1971, 6 ff). 

Evaluation beeinflusst den Wandlungsprozess, so wie schulische Leistungsbeurteilung 

auf den Lernprozess wirkt. Evaluation kann denen nutzen, die den (Um-) Gestaltungsprozess 

betreiben, Evaluation kann ihnen aber auch schaden: "Die Schattenseite dieses Vorgehens 

zeigt sich dann, wenn die Einsätze zu hoch und Leistungsindikatoren zu eng gefasst sind. 

Dann wird der Evaluationsprozess schnell Gegenstand von Korruption und kann einen korrumpierenden 

Einfluss auf die wenigen Interventionen haben, auf deren Messung und Verbesserung 

er ursprünglich zugeschnitten war." So Michael Quinn Patton, , amerikanischer Evaluationsexperte, 

ehemaliger Präsident der »American Evaluation Society«, Hochschullehrer und 

Vertreter einer "nutzenorientierten Evaluation" (Patton 1998, 65; Heiner 1998, 302). 

Evaluation ist notwendig parteiisch und scheidet dadurch die Geister. Prof. Maja Heiner 

begegnet diesem Dilemma grundsätzlich, indem sie eine "experimentierende Evaluation" definiert, 

die Praxisentwicklung mit Praxisforschung verknüpft, die Evaluationsstudien partizipativ 

und unterstützend ausrichtet und die Prozessbeteiligten zur Selbstevaluation befähigt 

(Heiner 1998, 25 ff). Damit kehrt sie zwar zum Forschungsethos der frühen pädagogischen 

Evaluatoren zurück (Bloom / Hastings / Madaus 1971, 5-18) und unterstreicht nochmals den 

Nutzen der Evaluation für individuelles und organisationales Lernen, übersieht dabei aber die 

Flurschäden, die durch den administrativen Evaluationswildwuchs in den weltweiten Schulreformen 

angerichtet wurden. Für Heiners bzw. Patton's partizipative und unterstützende Evaluation 

müssten erst einmal bei den schulischen Reformbeteiligten massive Vorurteile abgebaut 

und aktives Interesse aufgebaut werden. Dass dies gelingen kann, beweisen zahlreiche geglückte 

Beispiele (siehe Müller-Kohlenberg und andere Beiträge in Heiner 1998). 

2.1 Unterstützungssystem für die Schulen statt nur Remote Control 

durch die Behörden 

Die staatliche Leistungskontrolle hat sich in vielen Ländern wegentwickelt von der persönlichen 

Beaufsichtigung der einzelnen Lehrpersonen durch ausgewählte LehrerInnen über die 

organisationale Bewertung (Evaluierung) der Schulen durch kommunale und regionale Behörden 

(Skandinavien, Portugal) bis hin zu standardisierten Klassentests (Frankreich) und 

Schulabschnittstests (Großbritannien, Irland und Italien). Das französische Evaluationsmodell, 

das in ersten bürokratischen Ansätzen eine Art Selbstevaluation der Schulen ermöglichen 

sollte, findet in der Lehrerschaft nicht den erhofften Anklang (Flitner 1999): "Der Begriff von 

»Effizienz« einer Schule, der sich rein am »out-put«, gemessen als Abiturerfolg, orientiert, 

führt erwartbar zu groben Fehlurteilen." Und hat damit nicht die geringste Chance von den 

LehrerInnen als "ultimate key to educational change and school improvement" (Hargreaves / 

Fullan 1993, IX), als interessierende Einflussgröße angenommen zu werden. Das impliziert 

also, eine Evaluation der Evaluation, eine neue Evaluationskultur zu fordern (Flitner 1999), 

wenn schulische Entwicklung allgemeinverbindliche Maßstäbe zur Fortschrittsbeobachtung 

braucht. 

Ein besonders interessantes Beispiel hierfür stellt das europäische Land mit der ältesten 

Lehrergewerkschaft der Welt dar, Schottland (dies und im weiteren aus Döbrich 1999). Im 




Gegensatz zu England und Wales findet sich in Schottland keine Politik des "naming and 

shaming", bei der in öffentlichen Ranglisten die besten und schlechtesten Schulen sich anhand 

von simplen Zahlenwerten (Rankings) verglichen und an den Pranger gestellt sehen. Das 

schottische Bewertungsverfahren wird von allen Verantwortlichen und Beteiligten zur kundenorientierten 

Selbstentwicklung der Schulen genutzt. Im Rahmen der Autonomisierung der 

Schulen erfahren nun auch die Eltern, welche Schlussfolgerungen ihre Schulen aus der 

Selbstevaluation gezogen haben und wie erfolgreich sie dies tun. Amtliche Inspektionen orientieren 

sich ebenfalls an gemeinsamen Evaluationsindikatoren und bieten so der Schule ein 

zusätzliches Feedback über die Allgemeingültigkeit ihrer Selbstbeurteilung. Sogar aus den für 

ganz Schottland verbindlichen Abschlussprüfungen der Sekundarschule werden eher Unterstützungsbemühungen 

für benachteiligte Schulen abgeleitet als Budgetabschläge wie beispielsweise 

in England (Bogner / Boscher 1999). Der Fall Schottland macht deutlich, dass es 

weniger die Evaluationsmethodik ist, die die Akzeptanz und entwicklungsförderliche Nutzung 

von Schulevaluation bestimmt, sondern eher die Evaluationsstrategie, wie sie sich in einem 

Schulsystem entwickelt hat. Der Nutzen des Informationsgewinnungsmittels Evaluation folgt 

seinem funktionalen Kontext. 

Dies bestätigt das Beispiel Norwegen, das nach Meinung von Per Dalin, einem weltweit 

renommierten norwegischen Schulentwicklungsforscher und Seniorconsultant des norwegischen 

Büros der »The International Learning Cooperative« wohl über die profundeste Erfahrung 

mit Schulevaluation verfügt. Er fasst die dortige Erfahrung so zusammen. "Es ist auch 

klar, dass es ohne eine kompetente und engagierte Schulleitung unwahrscheinlich ist, dass ein 

Evaluationsprozess überhaupt beginnt, geschweige denn erfolgreich wird. Viele Schulen haben 

nicht durch Evaluation gewonnen und einer der Hauptgründe ist, dass sie nicht wussten, 

was zu tun war und nicht durch eine professionell arbeitende Schulleitung geführt wurden" 

(Dalin 1995, 17). Also befindet sich die Evaluationsreform im diesbezüglich erfahrensten 

Land der Welt noch auf der Vergangenheitsskala 6, »Neue Instrumente« von Miles. 

Was läuft so falsch mit der Anwendung des unbezweifelbar nutzbringenden Reformwerkzeugs 

Evaluation? Kontraste helfen sehen. Deshalb fällt es Lander und Ekholm aus dem ehemals 

sehr zentralistischen Schweden vielleicht auch leichter, die Fehlnutzung von schulischen 

Reformevaluationen im Sinne einer 'Evalukratie' zu erkennen (1998, 119 ff): 

Wer das Hauptgewicht auf zielorientierte Rechenschaftspflicht legt, vernachlässigt 

automatisch professionelles Engagement und Selbstverantwortung 

Bildungspolitik und Schulverwaltung handhaben sozialwissenschaftliche Evaluierung 

eher als ein Werkzeug zur Informations- und Einflussgewinnung gegenüber der Schule 

denn als Medium eigener Verbesserungen 

Schulen mit starker Reformtradition nutzen die sozialwissenschaftlichen Evaluierungsdaten 

weniger zur Selbsteinschätzung als zur Selbstentwicklung; die meisten Schulen sind hierzu 

aber noch nicht in der Lage und empfinden Evaluation als bloße Belastung 

Für eine kompetente Nutzung von Evaluationsinstrumenten zur Unterstützung des professionellen 

Engagements der LehrerInnen, zur Förderung des schulischen Verbesserungsprozesses 

und zur Fundierung der Selbstentwicklung finden Lander und Ekholm insgesamt nur wenige 

Beispiele, wenn sie auch eine steigende Nutzung beobachten. Diese sehen sie aber extrem 

bedroht (ebd., 1132): "Evaluation und ihr bescheidener Beitrag zur Reform von Schulen 

kann durchaus im Kleinkrieg zwischen der sozialen Kunst des Lehrens und dem technischen 

Management der Schulverwaltung verloren gehen. Falls Evaluation als administratives Werkzeug 

dabei die Oberhand gewinnt, ist es wahrscheinlich, dass sich Lehrerinnen und Lehrer 

von der gesamten Idee von Evaluation als Verbesserung verabschieden." 

Per Dalin begleitet seit über dreißig Jahren Schulen auf ihrem Reformweg. 1971 formulierte 

er als Ausdruck seiner ersten Erfahrungen mit fehlgeschlagenen Schulreformversuchen 




einen zynischen Slogan: "Innovatoren haben alles zu gewinnen und nichts zu verlieren, während 

Konservative alles zu verlieren und nichts zu gewinnen haben" (Dalin 1998, 1059 - 

Übers. durch d.V.). Seit damals hat DALIN Schulprojekte in der ganzen Welt beobachtet und 

beraten. Sein Ergebnis: mehr Fragen als Antworten. "Warum z.B. kann ein Lehrer mit mehr 

als 70 Kindern in der Klasse, mitten im Dschungel von Sri Lanka, einen wunderbaren Projektunterricht 

durchführen, mit authentischen Lernmöglichkeiten für seine Kinder und dies 

ohne eine externe Unterstützung mit nur einem Minimum an vorhandenen Materialien?" 

(ebd.). Warum, fragt er weiter, funktioniert in Indonesien die schulische Autonomie auf Anhieb 

und warum gelingt es den deutschen Behörden im Unterschied dazu kaum, mehr Autonomie 

an die Schulen zu übertragen? Warum gelingt es den norwegischen Schulbehörden 

nicht, obwohl sie wahrscheinlich die "teuersten" Schüler der Welt fördern, eine drastische 

Vereinfachung des Sekundarstufenunterrichts auf schulischer Ebene durchzusetzen? 

Reformprojekte brauchen zwar Evaluation aber darüber hinaus noch sehr viel mehr. So 

ist denn Dalin's Liste der Reform- und Evaluationsenttäuschungen lang, länger allerdings geraten 

seine Empfehlungen zur erfolgversprechenden Durchführung von Schulreformprojekten 

- Evaluation taucht dabei nur noch in einem Nebensatz auf: 

Knüpfe jedes auch noch so wertvolle Projekt an die realen Bedürfnisse der Beteiligten 

an. 

Nehme die Bedenken aller Beteiligten ernst: Probleme sind unsere besten Verbündeten. 

Beteilige die Basis, die SchülerInnen und ihre Lebenswelt und gebe allen ausreichend 

Zeit, Raum und Gelegenheit für ihre Beiträge. 

Behalte einen langen Atem und beginne erst einmal nur mit den interessierten Personen, 

Gruppen, Schulen... 

Stütze die Projekte auf solider Finanzierung und erfolgssicherndem Projektmanagement 

mit weiter Perspektive und kurzer Ausführungskontrolle 

(Evaluation). 

Sichere den Veränderungsprozess gegen Überforderung, Stress und unzureichende 

Ressourcen - stelle ausreichende Expertise bereit, für alle Projektebenen. 

Gestalte die Projektorganisation mit Blick auf die Zukunft, nicht mit Führungskonzepten 

der Vergangenheit: Zugang zu allem relevanten Wissen; flache demokratische Organisation; 

Zusammenarbeit aller mit allen; Förderung von Respekt und Toleranz; 

Übergewicht weiblicher Werte gegenüber männlichen (Dalin 1998, 1068ff) 9 . 

Diese Projektierungsregeln gelten nach Dalin's Meinung weltweit, stützen sie sich doch auch 

auf weltweite Reformerfahrungen. Sie fokussieren insgesamt mehr auf die Art und Weise der 

Veränderung als auf ihre Inhalte bzw. Ziele. Wer ist durch Dalin's norwegisches Du angesprochen? 

In der augenblicklichen Situation erst einmal die Projektverantwortlichen. 

Wo aber sitzen diese konkret? Systemverantwortung ist auf keinen Fall über administrative 

Evaluationsinstrumente delegierbar, weder als Submission an die Evaluatoren, noch als 

Vollzugsanweisung an die Evaluierten. Der Begriff von 'Effizienz' einer Schule, der sich rein 

am »out-put«, gemessen mit standardisierten Abschlussarbeiten, und am 'In-put', gemessen an 

den Ausgaben pro "produzierter" SchülerIn, orientiert, führt nicht nur zu groben Fehlurteilen. 

Solche neoliberalen Wertmaßstäbe haben nicht die geringste Chance, von den LehrerInnen als 

motivierende Einflussgröße angenommen zu werden. Das heißt also, eine Evaluation der Evaluation, 

eine neue Evaluationskultur ist zu fordern, vorausgesetzt, schulische Entwicklung 

9 auch zur Geschlechterfrage in Schulentwicklungsprozessen: Dalin 1998, 1071; vertiefend hierzu: Fischer / Jakobi 

/ Koch-Priewe 1996 




braucht allgemeinverbindliche Maßstäbe zur Fortschrittsbeobachtung. Dies stellt sich aber 

erst im Verlaufe des Reformprozesses heraus und bildet als administrative Vorgabe erst einmal 

nur einen Reformhemmschuh. Dem widersprechen auch die innovativen und wohleingeführten 

Evaluationsbeispiele nicht. In ihnen hat Evaluation eine Servicefunktion für den 

selbstgesteuerten Reformprozess und keine Lenkungsfunktion. 

2.2 Konsequenzen für die wissenschaftliche Begleitung von Schulversuchen 

Was ergibt sich daraus an Konsequenzen für die wissenschaftliche Begleitung (sensu evaluative 

Unterstützung) künftiger Schulentwicklungsprozesse? Eine wissenschaftliche Begleitung 

von komplexen Entwicklungen sollte die Intentionen des Projekts stützen, um nicht zusätzlich 

zu den bereits vorhandenen Anforderungen neue Belastungen zu erzeugen. Die erforderliche 

zielgerichtete, planvolle Entwicklungsarbeit an den Schulen, deren Dokumentation und Evaluation 

sowie die Aufbereitung der entwickelten Produkte können zugleich der Reflexion wie 

der Auswertung des Modellversuchs dienen. Eine klare Struktur des Begleitungsprozesses, 

d.h. des Ablaufs, der Kooperationen, der Arbeitsteilung und der Ressourcen, ist die Voraussetzung 

für seine Handhabbarkeit. Entsprechende personelle Ressourcen müssen sowohl für 

die zusätzliche Arbeit der schulischen Akteure, für die Unterstützung des Schulentwicklungsprozesses 

durch ziel- und methodenbezogene Beratung und Fortbildung als auch für die wissenschaftliche 

Erhebung eingeplant werden. 

Da nun bereits aus mehreren Modellversuchen zur Neustrukturierung des Schulanfangs 

Ergebnisse vorliegen, sollte in künftigen Modellversuchen vor allem auf die Verbreitung der 

Entwicklungen aus den Schulen Wert gelegt werden. Dass einzelne Schulen den Anforderungen 

eines solchen Modellversuchs prinzipiell genügen können, ist bekannt, es fehlt jedoch 

auch international an Strategien, die Ergebnisse der innovativen Schulen breit gestreut weiteren 

Schulen für deren Entwicklung dienstbar zu machen (Hargreaves 1998; Carle 2002, 2001, 

2000). 

Die wissenschaftliche Begleitung eines schulübergreifenden, kooperativen Entwicklungsprozesses 

kann nicht in Form einer quasi-experimentellen Vorher-Nachher-Untersuchung erfolgen, 

wie sie noch Campbell vor rund dreißig Jahren erträumte (1988, 147 ff). Auch Vergleiche 

mit modellversuchsfremden Kontrollklassen versprechen in der derzeitigen Situation 

des State of the Art keine verwertbaren Erkenntnisse. Hochkomplexe, individuelle und institutionelle 

Entwicklungsarbeit von Schulen erlaubt keine Vergleiche mit unbeteiligten, lediglich 

stichprobencharakteristisch parallelisierten Schulen oder Schulklassen (etwa bei Nauck 

1999a+b). 

Während der Schulversuchszeit sollte die wissenschaftliche Begleitung statt dessen auf 

prozessfördernde Unterstützung der angestrebten Entwicklungen in den Schulen sowie auf die 

Systematisierung ihrer Ergebnisse im Sinne eines verallgemeinerbaren nachvollziehbaren 

Schulentwicklungsprozesses zielen (Argyris / Schön 1996). Dies schließt eine möglichst 

reichhaltige Dokumentation der Reflexions- und Entwicklungsprozesse ein, anhand derer 

dann eine abschließende Evaluation mit hoher interner und externer Validität erfolgen kann. 

Die Erprobung der Entwicklungen der einzelnen Schulen muss Bestandteil des Gesamtprojekts 

sein. 

Die wissenschaftliche Begleitung muss somit als prozessbegleitende und unterstützende 

(formative) Evaluation erfolgen. Ausgehend von einem Naturalistic Approach (Guba / Lincoln 

1989) darf angenommen werden, dass zielgerichtetes (Alltags-)Handeln immer auch bewertet, 

folglich evaluative Elemente jedem schulischen Entwicklungsprozess inhärent sind. 

Sie sind jedoch nur teilweise bewusstseinsfähig. Unterrichtliches Handeln ist stark routinisiert. 

Nur so ist es der Komplexität der Aufgaben angemessen. Viele schulische Handlungssi- 




tuationen sind extrem komplex, handlungssteuernde Signale kaum einer Beschreibung zugänglich 

(Carle 1995, 42ff.; Hacker 1986, 347). So klagen GrundschullehrerInnen und -lehrer, 

dass sie förderungsrelevante Signale der Kinder über ihren Lernprozess während des Unterrichts 

nicht erkennen, wohingegen prozessdiagnostisch geschulte routinierte Sonderpädagoginnen 

und -pädagogen ihr unterrichtliches Handeln in bedeutsamem Umfang auf solche Signale 

stützen, ohne diese wiederum unabhängig von der aktuellen Handlungssituation allgemeinverständlich 

beschreiben zu können. Es bedarf daher eines Systems, welches die Bewusstmachung 

des Handels im schulischen Entwicklungsprozess unterstützt nicht aber die 

notwendigen Routinen dadurch zu stark einschränkt (Argyris / Schön 1996). 

Bleiben weite Teile des Entwicklungsprozesses im Modellversuch unbewusst, so fallen in 

den Prozessprotokollen Beschreibungen typischer Probleme und der Erfahrungen bei ihrer 

Bewältigung dürftig aus und sind kaum bewertbar und nachvollziehbar. Dies verleitet dazu, 

Indikatoren für die Qualität schulischer Arbeit extern zu definieren, diese mit Hilfe von Tests 

und anderen Verfahren in den Schulen zu identifizieren und zu quantifizieren, folglich auf die 

Evaluation des Prozesses selbst aus der Innenperspektive weitgehend zu verzichten. 

In den beschriebenen Schulversuchen gleicht der Entwicklungsprozess jedoch einem kontinuierlichen 

Verbesserungsprozess, der zwischen aktuellen Engpässen und dem Zielmodell 

einer erneuerten Schuleingangsphase hin- und herpendelt. Es ist zwar nicht möglich, in einem 

so komplexen Veränderungsprozess wie der Entwicklung einer neuen Schuleingangsphase, 

alle diese Pendelbewegungen (Problembewältigungen / Weiterentwicklung der Zielmodelle) 

bewusst zu machen und zu protokollieren. Modelle von komplexen Entwicklungsprozessen - 

nichts anderes sind die Prozessdokumentationen der Schulversuche - haben immer noch den 

Nachteil der unvollständigen Widerspiegelung des Realen, jedoch sind sie weitaus reichhaltiger 

als indikatorbezogene Evaluationen. Vor allem: Ihre Ergebnisse können aufgearbeitet und 

interessierten anderen Schulen verfügbar und nutzbar gemacht werden. 

Kann das Problem der kaum bewältigbaren Überlastung der Schulen durch eine umfassende 

Prozessprotokollierung mithilfe eines arbeitsteiligen Verfahrens zwischen den Schulen 

gelöst werden? Für eine solche Vorgehensweise gibt es bislang kein in Schulversuchen erprobtes 

Modell. Sie hätte jedoch den Vorteil, dass die Schulen durch die Arbeitsteilung hinsichtlich 

der speziellen Entwicklungen detailreichere und reflektiertere Erfahrungsprotokolle 

und Hilfestellungen ausarbeiten könnten. Der Entwicklungsprozess wäre dann gekennzeichnet 

durch eine vorübergehende Fokussierung auf Teilaufgaben und eine gemeinsame Reintegration 

der Teilprodukte. Das Konzept der wissenschaftlichen Begleitung sollte eine Antwort auf 

die Frage liefern, wie in einem arbeitsteiligen Verfahren die Schulen jene Teilbereiche des 

Gesamtvorhabens vertieft erarbeiten können, in denen sie ihre Stärke sehen, ohne dass die 

Einzelschule das Gesamtkonzept aus dem Auge verliert. Die arbeitsteiligen Prozessevaluationen 

müssen dann später in einer abschließenden Auswertung zusammengefügt werden. 

Ist das Ziel, die in den Schulversuchen entwickelten Arbeitsmittel, Vorgehensweisen, 

Prozessmodelle und Entwicklungsstrategien anderen Schulen als Hilfen für deren eigene 

Entwicklung zur Verfügung zu stellen, dann ist zu beachten, dass hierfür im Projekt eine nutzerfreundliche 

Überarbeitung stattfinden muss. Im Alltag entwickelte Arbeitsmittel sind aber 

durch ihre Nähe zum Schöpfer und ihre Ferne zum fremden Nutzer gekennzeichnet. Ohne 

Überarbeitung taugen sie oft nicht einmal dazu, in einem zweiten Projektdurchlauf an der 

gleichen Schule wieder benutzt zu werden. Es ist daher erforderlich, die Produkte der Schulen 

den anderen zur Verfügung zu stellen und sie dabei gemeinsam laufend zu verbessern. Hierfür 

wäre das Vorgehen in arbeitsteiligen Schwerpunkten ideal. 

Darüber hinaus ist zu erwarten, dass Schulen außerhalb eines Modellversuchs sich die 

Teilprodukte zu Eigen machen. Sind diese doch auch zur Verbesserung des Unterrichts in Regelschulen 

geeignet. Dem Modellversuch liegen Prinzipien zugrunde - wie das der inneren 

Differenzierung -, die nicht nur in einer flexiblen Schuleingangsphase zum Tragen kommen. 




Die Verbreitung der erarbeiteten Produkte wirft viele Fragen auf: Wie müssen hilfreiche 

Produkte aus den Schulversuchen gestaltet sein? Ist ein Tutorsystem erforderlich, um den 

Einsatz in nichtbeteiligten Schulen zu stützen? Was kann getan werden, damit andere Schulen 

das entwickelte Produkt annehmen ohne es unreflektiert rezepthaft zu übernehmen? 

Wird die wissenschaftliche Begleitung folglich als formative Evaluation des gesamten 

Entwicklungsprojektes in Verbindung mit einer simultanen Prozessgestaltung durchgeführt, 

so hat das Auswirkungen auf die Erhebungsmethoden. Neben den üblichen qualitativen und 

quantitativen Forschungsmethoden sind dafür vor allem neue komplexe Prozessgestaltungsund 

-erhebungsmethoden erforderlich (vgl. Carle 2000, Kap. 10). Die Schulen sind bereits 

ohne Begleitung mit der zusätzlichen Entwicklungsarbeit stark ausgelastet. Alle Methoden 

müssen an den konkreten Fall angepasst werden, d.h. an die Ebene, auf der erhoben wird und 

die aktuell drängende Entwicklungsaufgaben zu lösen sind – z.B. Intensität von Lernprozessen 

der Kinder, Binnendifferenzierung im Unterricht, Kooperation im LehrerInnenteam, Zielplanung 

im Kollegium, Kommunikation der Entwicklungen nach außen und innen etc. Aus 

Modellversuchen in Schulen ist vor allem eines zu lernen, dass Reformen sehr viel bessere 

Unterstützungssysteme benötigen, ehe an den Aufbau aufwändiger Evaluationssysteme zu 

denken ist. Andererseits bleibt das Wissen von schulischen Entwicklungsprojekten ohne Evaluation 

verborgen. 

3 Die methodische Struktur und Strategie der Evaluation 

und der Evaluationsforschung 

Wie schon gesagt, verfügen die Evaluationsprofession und die Evaluationsforschung über 

keine eigenen Methoden und Erhebungsinstrumente. Was das Evaluieren auszeichnet, ist ihr – 

historisch gesehen (zur historischen Entwicklung siehe Stockmann 2000; Mertens 2000; Leeuw 

2000) neuartiger Gegenstand, die handlungs- und entscheidungsunterstützende Informationsbeschaffung 

in umfangreichen und deshalb ebenso komplexen (kontingenten) wie unübersichtlichen 

Entwicklungsprojekten. Sinn des Evaluierens ist die Schaffung einer Informationsgrundlage 

für expedetionale Projekte auf allen Ebenen der institutionellen Strukturleiter. 

Die Strategie des Evaluierens folgt dieser Sinnstellung und geht ihrer Methodik voraus. 

Es gibt inzwischen übergeordnete Handlungsprinzipien, der die Strategie eines konkreten 

Evaluationssystems folgen kann, so die Programm-Evaluations-Standards des "Joint Committee 

on Standards for Educational Evaluation" für Evaluationsvorhaben im Bildungsbereich, 

wie sie von der Deutschen Gesellschaft für Evaluation (DeGEval) übersetzt und veröffentlicht 

wurden (Joint Committee on Standards for Educational Evaluation / Sanders 1999). Danach 

sollen Evaluationen vier grundlegende Eigenschaften aufweisen: Nützlichkeit - Durchführbarkeit 

- Fairness 10 - Genauigkeit: 

Nützlichkeits- (Utility) Standards: Die Nützlichkeitsstandards sollen sicherstellen, 

dass die Evaluation sich an den geklärten Evaluationszwecken sowie am Informationsbedarf 

der vorgesehenen Nutzer und Nutzerinnen ausrichtet. 

Durchführbarkeits- (Feasibility) Standards: Die Durchführbarkeitsstandards sollen 

sicherstellen, dass eine Evaluation realistisch, gut durchdacht, diplomatisch und kostenbewusst 

geplant und ausgeführt wird. 

10 Im englischen Original "Propriety" (Schicklichkeit, Anstand, Benehmen), im Handbuch der Evaluationsstandards 

noch unkorrekt mit "Korrektheit" (Joint Committee… 1999, 7, in neueren Veröffentlichungen (siehe 

DeGEval-URL: ) besser mit dem neudeutschen "Fairness" 

übersetzt. 




Fairness- (Propriety) Standards: Die Fairnessstandards sollen sicherstellen, dass in 

einer Evaluation respektvoll und fair mit den betroffenen Personen und Gruppen umgegangen 

wird. 

Genauigkeits- (Accuracy) Standards: Die Genauigkeitsstandards sollen sicherstellen, 

dass eine Evaluation gültige Informationen und Ergebnisse zu dem jeweiligen 

Evaluationsgegenstand und den Evaluationsfragestellungen hervor bringt und vermittelt. 

Zu diesen vier generellen Eigenschaften guter Evaluation wurden insgesamt 30 Standards mit 

jeweils durchschnittlich 5-8 präzisierenden Richtlinien ausgearbeitet (für einen kurzen Überblick 

siehe Widmer 2000; ausführlich siehe Joint Committee / Sanders 1999). Mithilfe dieser 

Standards, ihrer Umschreibung, ihren Richtlinien und den zugehörigen Anwendungsbeispielen 

lassen sich die wesentlichen Kernaufgaben der Evaluationstätigkeit strukturieren und 

überprüfen (siehe Joint Committee… 1999, 13 ff): 

Entscheidung über die Durchführung einer Evaluation 

Definition des Evaluationsproblems 

Planung ("Designing") der Evaluation 

Informationsgewinnung 

Informationsauswertung 

Berichterstattung 

Budgetierung 

Vertragsgestaltung 

Leitung und Management 

Personalausstattung 

Die funktionale Zuordnung der einzelnen Standards zu diesen strategischen Evaluationsaufgaben 

wurde vom Joint Committee bereits vorgedacht (ebd., 13 ff) und ist für die sicher vorrangige 

Planungstätigkeit ausführlich dokumentiert (Joint Committee 1994). 

3.1 Fünf methodische Logiken entwicklungs- und evaluationsspezifischer 

Teiltätigkeiten 

Zur konzeptionellen Abgrenzung der Evaluation von Leistungsbewertung, Erfolgskontrolle, 

Qualitätskontrolle oder Controlling ist zu wiederholen, dass die handlungsunterstützende und 

handlungsorientierende Funktion der Evaluation in komplexen Entwicklungsprojekten – auf 

welcher Strukturebene auch immer - geht weit über Ziele und Methoden des Controllings 

(zielt auf Kontrolle der Leistungserreichung), oder des Qualitätsmanagements (zielt auf Verbesserung 

bestehender Leistungsprozesse) aber auch über die Verfahren und Techniken der 

unter "Projektmanagement" (zielt auf Arbeitsablauf- und Ressourcennutzungsoptimierung) 

subsummierten Vorgehensweisen der Programmplanung hinaus. Umgekehrt stützen sich Evaluationsvorhaben 

auf die Methodenrepertoires dieser vorgenannten Disziplinen und auf mehr. 

Dies wird noch einmal betont, da aktuell sehr viele traditionelle Studien das zierende Apercu 

"Evaluation" erhalten. 

Gute Evaluationsvorhaben folgen auf struktureller Ebene einer expliziten, systemischen 

Funktionslogik wie sie in diesen "Standards" mit ihren Grundsätzen für sozial verantwortliches, 

ökonomisch angemessenes, methodisch hinreichendes und inhaltlich relevantes Evaluieren 

von Neugestaltungsprogrammen und Entwicklungsprojekten charakterisiert ist. Wie aber 




verläuft gute Evaluation? Im methodischen Detail folgen gute Evaluationsvorhaben folgen 

zumindest den folgenden fünf tätigkeitsspezifischen Logiken. Diese wurden - bis auf die erste 

- allesamt bei anderen und zum Teil etwas älteren Professionen als die Evaluation entwickelt 

und sind dort auch zu lernen (siehe die entsprechenden Literaturangaben): 

der inhaltlichen Programmlogik von Entwicklungsprojekten (z.B. Lee 2000) 

der zeitlichen Prozesslogik von Produkt- und Prozessentwicklungen 

(z.B. Bösenberg / Metzen 1997, 167 ff) 

der Erhebungslogik explorativer und sozialwissenschaftlicher Studien 

(z.B. Kromrey 1990) 

der Zielfindungs- und Entscheidungslogik von Entwicklungsprozessen 

(z.B. Wottowa / Thierau 1998, 83 ff) 

der Programmlogik umfangreicher Entwicklungsprojekte (z.B. Hobbs 2001) 

Bereits seit den frühen siebziger Jahren wurden in den USA versucht, ein Modell, eine Theorie 

dessen zu entwickeln, was Evaluation für das evaluierte System leistet (Mertens 2000). 

Das erste und populärste ist das "CIPP-Modell" von Stufflebeam u.a. 1971 (siehe die folgende 

Abbildung). 

CIPP-Prozessmodell der Evaluationsforschung 

Daniel L. Stufflebeam u a. (1971): Educational Evaluation and Decision Making 

Context-Evaluation 

Welchen 

Einfluss 

hat das 

Umfeld 

auf Verlauf 

und Ergebnis 

des Projektes? 

Input-Evaluation 

Was tragen 

die beteiligten 

Projektfaktoren 

zum Projektablauf 

und zu 

den Projektergebnissen 

bei? 

Process-Evaluation 

Was tragen 

die realen 

Prozessbedingungen 

zum 

Verlauf und 

Gelingen des 

Projektes bei? 

Product-Evaluation 

Wie werden 

die realen 

Ergebnisse 

gesichert und 

von Beteiligten 

wie Umfeld 

aufgenommen? 

Projekt-Rahmenbedingungen: 

Soziale, kulturelle, individuelle 

materielle und organisatorische 

Bedingungen im 

Projektumfeld , z.B. Erwartungen 

an, aber auch Leistungen 

für das Projekt, so 

etwa verfügbare Zeiten, 

Hilfsmittel, Unterstützung… 

Projekt-Ausgangssituation: 

Erwartungen an das Projekt 

und seine Zielstellungen, 

Teilnehmervoraussetzungen, 

technisch-organisatorischer 

Stand, Planungen, Medien, 

Inhalte… 

Projekt-Verlauf: 

(„Formative Evaluation“) 

Verlaufs- und ergebnisrelevante 

Faktoren bzw. Entwicklungen, 

die erst im Verlauf 

des Vorhabens auftauchen – 

förderliche wie störende 

Projekt-Ergebnis: 

(„Summative Evaluation“) 

Feststellung, Abschätzung, 

Zugänglichmachung bzw. 

Eindämmung und Sicherung 

kurz-, mittel- und langfristiger 

Wirkungen – erwarteten wie 

unerwarteten 

cipp_evaluationsprozess.ppt U. Carle 2002-12 

Abbildung 5: CIPP-Evaluationsmodell der Wissensgenerierung in Entwicklungsprojekten 

von Stufflebeam u.a. 1971 

Der Grundgedanke des CIPP-Modells der Evaluation, die Evaluationsarbeit entlang der Entwicklungsstufen 

des Projektes zu definieren - Context (Projektkontext), Input (Projektausgangsbedingungen), 

Process (Projektverlauf) und Product (Projektergebnisse und – 

wirkungen) - entspricht dem in den sechziger Jahren auch in den Sozialwissenschaften populären 

kybernetischen Modell der sozialen Systeme als Informationsverarbeitungsaggregate. 




Danach besteht Evaluation in einem kontinuierlichen Wissensverarbeitungsprozess, der Fragen 

und Probleme aufgreift, dazu Zahlen, Daten und Fakten erhebt und diese dann zu entscheidungsrelevanten 

Informationen für die ProjektgestalterInnen weiter verarbeitet (siehe 

Isaac / Michael 1997, 12 ff). 

Da das CIPP-Prozessmodell der Evaluation auch den "Standards" des Joint Committee 

zugrunde liegt, soll dessen kurze Darstellung hier genügen. Weitere Evaluationstheorien oder 

-modelle finden sich bei Isaac / Michael 1997, bei Lee und Caracelli im Stockmann-Band von 

2000. Caracelli's Evaluationsmodell des "USA General Accounting Office (GAO)" weist einen 

etwas höheren Komplexitätsgrad als das CIPP-Modell auf (GAO… 1991; weitere GAO- 

Publikationen zum Evaluationsdesign siehe GAO… 2002). Für die Veranschaulichung der 

allgemeinen inhaltsbezogenen Programmlogik von Evaluation mag das CIPP-Modell genügen, 

zumal im weiteren Verlauf ein weiter führendes Evaluationsmodell entwickelt wird. 

Im Unterschied zum Prozessmodell der Evaluierung versuchen summative Evaluationen 

typischerweise, etwa die Wirkung eines mehrjährigen Schulversuches durch groß angelegte 

Vorher-Nachher-Massentests bei Schülern und/oder Befragungen bei Lehrern bzw. Eltern in 

einer großen Erhebung zu erfassen. Im Prinzip haben die PISA-Tests etwas von diesem Prinzip, 

wenn man (nicht ganz unberechtigt) unterstellt, dass sie die Ergebnisse der seit den frühen 

achtziger Jahren in vielen OECD-Ländern durchgeführten grundlegenden Schulreformen 

nun abschließend "auf die Waage" stellen (vergleiche dazu das Coverfoto auf Wottawa / Thierau 

1998). 

Der Nachteil eines solchen Vorgehens liegt auf der Hand: Man erfährt nur das DASS und 

nie das WIE, was also bei welchem Land warum zu diesen abschließenden Ergebnissen geführt 

hat (dazu Carle 2000, 67 ff). Diesem Nachteil versucht das Konzept der formativen Evaluation 

gerecht zu werden, indem sie programmbegleitende Zwischenuntersuchungen durchführt, 

quasi portionierte phasen-summative Evaluationen. Das ergibt prozessnähere Zwischenbefunde 

und erlaubt so rechtzeitiges Nachsteuern und Korrigieren. Wie aber wird dann 

die Wirkung der Korrekturen im Verhältnis zu den ursprünglichen Zielen erhoben? Manche 

Autoren versuchen darauf eine planerische Antwort: Modellierung und Planung des Entwicklungsvorhabens 

müssen verbessert werden (so etwa bei Wottawa / Thierau 1998, 83 ff), Evaluation 

und Erhebung müssen projektspezifischer arbeiten. 

3.2 Enwicklungsorientierte Evaluation 

Das Lernenwollen aus dem realen Projektverlauf wird dadurch zwar erheblich verbessert, 

aber auch erheblich verteuert: "Qualität hat eben ihren Preis!" Entwicklungen in der industriellen 

Projektgestaltung, Qualitätsverbesserung und Entwicklungsbeschleunigung (etwa Bösenberg 

/ Metzen 1994) erbrachten zusammen gesehen einen völlig neuen Ansatz "systemischer 

Schulbegleitforschung". Dieser kombiniert eine angepasstere Erhebungsstrategie mit einer 

höheren Methodenflexibilität zu einem völlig neuen oder zu Ende gedachten Evaluationskonzept: 

Nicht mehr das Überprüfen der geplanten Zukunftsentwicklung steht im Vordergrund, 

sondern das Versorgen des Entwicklungssystems mit den notwendigen Bedingungsund 

Wirkungsinformationen. Diese Informationen über entwicklungsrelevante Bedingungsund 

Wirkungsmomente finden sich auf mindestens fünf verschränkten Gestaltungsebenen: 

Soziale Strukturebenen: individuell, kollektiv, organisatorisch, institutionell, regional, 

global 

Zeitliche Entwicklungsphasen (chronosystemische Ebenen): langfristig, mittelfristig, 

kurzfristig, situativ 

Regulative Handlungsebenen: kulturell-normativ, strukturell, operativ 




Planungssichere Gestaltungshorizonte: Grobentwicklung plus phasenweise Feinentwicklung 

(„Simultaneous Engineering) 

Kontinuierliche Im-Prozess Verbesserungen 

Evaluation als professionelle informatorische Begleitung von sich planmäßig verändernden 

sozialen Systemen gibt im Prozess der Umgestaltung Hinweise auf entwicklungsrelevante 

Veränderungen und deren Bedingungen. Dazu bedarf es eines systemadäquaten Ziel-, Wirkungs-, 

Handlungs- und Indikatorenmodells (zur Strukturperspektive sozialer Organisationen 

siehe Carle 2000, 339 ff). Diese Modelle und die zugehörigen Indikatoren variieren mit der 

Handlungsebene und mit der Entwicklungsperspektive. Die Ausarbeitung eines Modell- und 

Indikatorensystems für die gesamte Entwicklungsphase eines Veränderungsprojektes setzt 

erstens voraus, dass man bereits alle Entwicklungsmomente und –bedingungen kennt (dann 

aber wäre es kein Entwicklungs- sondern ein Produktionsprogramm) und es verlangt zweitens 

einen immensen Planungs- und Programmierungsaufwand. 

3.2.1 Planungs- und Projektsteuerungskonsequenzen 

Kluge Entwicklungsplanung und –begleitung geht einen anderen, ökonomischeren und lernoffeneren 

Weg der hierarchisch-sequentiellen Planung (Carle 2000, 418 ff). Zuerst wird das 

übergeordnete Entwicklungsziel skizziert. Dabei sollten durchaus sehr ehrgeizige Ziele gesetzt 

werden, damit durch diese apriori Ausweitung des Zielhorizontes später unerwartet auftauchende 

Zusatzwirkungen verortet werden können. Entsprechend dieser übergeordneten, 

langfristigen, qualitativ definierten Ziele werden grobe Indikatoren formuliert – quasi das Basismodell 

der summativen Systementwicklungsevaluation. 

Detaillierter geplant wird im Hinblick auf die übergeordneten Ziele die erste überschaubare 

Entwicklungsphase. Hierfür können nun realistische strategische Ziel-, Wirkungs-, 

Handlungs- und Indikatorenmodelle ausgearbeitet werden. Die Möglichkeiten zur realistischen 

Planung dieser Phase definieren die Entwicklungsspanne, nicht abstrakte Zeitziele. Für 

diese erste Phase werden nun die detaillierten Entwicklungsbedingungen erhoben und erst auf 

dieser Basis die detaillierten Entwicklungsarbeiten und Evaluationsmaßnahmen geplant. Zu 

den vorgesehenen Indikatoren werden die passenden Erhebungsinstrumente ausgesucht bzw. 

entwickelt sowie ein Nutzenbestimmungs- und Entscheidungsmodell für die Handlungskonsequenzen 

aus erwartete bzw. unerwartete Befunde ("Bewertungsmodell"). 

Die Planung der jeweils folgenden Phase erfolgt dann, wenn genügend phasenspezifisches 

Systemwissen vorhanden ist. Dieses Wissen über die nächste Phase wird parallel zur 

Durchführung der vorherigen Phase erhoben. Denkbar ist sogar die zeitweise Parallelität von 

Gestaltung (Phase X), Planung (Phase X+1) und Grundlagenerhebung (Phase X+2). Es ergibt 

sich also eine simultan-sequentielle Planung und Evaluierung – quasi als Basismodell für die 

formative Systementwicklungsevaluation. Die Ergebnisse der jeweiligen Phase werden auf 

die übergeordnete Zielstellung bezogen, denn die Gesamtzielstellung der Phasen hängt ja vor 

allem am übergeordneten Entwicklungsziel. So ergibt sich eine phasenweise zunehmende 

Klarheit über die Gesamtentwicklung und die Entwicklungsdetails (zu weiteren Einzelheiten 

dieses "Simultaneous Engineering" siehe Bösenberg / Metzen 1994, 167 ff). 

Der ökonomische Effekt dieses phasenweisen Planens und Handelns ergibt sich daraus, 

dass nur das detailliert werden muss, was in naher Zukunft realisierbar und notwendig erscheint. 

Diese Art der Planung ist nicht nur weniger teuer, sondern sogar produktiv, da die 

Teilevaluationen sich auf die Dinge konzentrieren kann, die für das Entwicklungsvorhaben 

besonders relevant sind. Aus evaluatorischer Sicht hat dieses hierarchisch-sequentielle Vorgehen 

einen weiteren Vorteil: Gegenüber den häufig sehr teuren und aufwändigen Großevaluationen 

leiden "Kurzevaluationen", also einfachere und kleinere Evaluationen (Widmer / Rothmayr 

/ Serdült 1996) - bei allen Handhabungsvorteilen, die sie haben – vor allem an unzu- 




reichenden Informations- und Entscheidungsgrundlagen. Die phasenbezogenen (Kurz-) Evaluationen 

unterliegen durch ihren Bezug auf das übergeordnete Entwicklungsvorhaben unter 

dieser Beschränkung nicht. 

Entwicklungen leben ja vom Unerwarteten. Dieses äußert sich in der Regel nicht in großartigen 

Glücksgriffen oder schwerwiegenden Entwicklungshemmnissen, sondern tauchen zumeist 

– wie die Spitze eines Eisberges – in winzigen Abweichungen oder Problemen bei der 

alltäglichen Entwicklungsarbeit auf. Was aber unterscheidet ein unbekanntes aber relevantes 

Entwicklungsmoment aber von einer zufälligen Abweichung? Erst die längerfristige Weiterentwicklung! 

Auf die kann aber nicht gewartet werden, da sonst eine Vielzahl von zusätzlichen 

Varianten mit entwickelt und beobachtet werden müssten. Hier hilft nur die situative 

Minievaluation, eine erste Schnellerhebung, die ihre methodische Rechtfertigung nur aus dem 

Bezug zur Phasenzielstellung und dem korrespondierenden Nutzenmessungs- und Entscheidungsmodell 

erhält. Eine Minievaluation kann auch plötzlich auftauchende Handlungs- und 

Entscheidungsschwierigkeiten der Entwicklungsarbeiter lösen helfen. 

Dieses quasi spontane Eingehen auf alltägliche Entwicklungsprobleme ist allerdings nur 

dann sinnvoll, wenn das Entwicklungsvorhaben auch der grundsätzlichen Strategie der "Kontinuierlichen 

Verbesserung" folgt (siehe Bösenberg / Metzen 1994, 108 ff), wenn also jede 

Möglichkeit des Lernens in einer Optimierung der Arbeitsbedingungen und einer Verbreiterung 

der Wissensbasis aller Beteiligten im Entwicklungsprojekt mündet. 

Soweit zur neuen zeitlichen Prozesslogik des Entwickelns und Evaluierens, die ein sehr 

viel ökonomischeres und flexibleres methodisches Vorgehen ermöglicht und damit erst eine 

erfolgsförderliche Unterstützung des Entwicklungsvorhabens durch das Evaluationssystem erlaubt. 

Evaluation folgt damit einer professionellen Entwicklung wie sie sich im industriellen 

Qualitätsmanagement vollzog: Weg von der aufwendigen und teuren Prüfung am Ende der 

Leistungskette ("Qualitätssicherung") und hin zur produktiven und kreativen Integration der 

ständigen Qualitätsverbesserung in den Leistungsprozess ("Total Quality Management") – 

siehe Bösenberg / Metzen 1995, 153 ff. 

Die Energie zum Wandel weht aus Richtung der vitalen Eigeninteressen. Es ist also 

falsch, diese Egoismen hinter der Mauer eines vordergründigen Gemeininteresses zu sperren. 

Energetisch sinnvoller ist es, die in einem großen Entwicklungsvorhaben divergierenden Akteursinteressen 

zu konzertieren. Institutionelle Reformen unterscheiden zwischen vertikalen 

Strukturebenen und horizontale verteilten Subsystemen auf einer Strukturebene. Ein Beispiel 

für die Spezifität der vertikalen Ebeneninteressen sind etwa die Einrichtungsinteressen im 

Verhältnis zu den Trägerinteressen oder die Trägerinteressen in Bezug auf die Politikinteressen. 

Zielführungs- und Unterstützungssysteme einschließlich der Evaluation können diese Interessendifferenzen 

intelligent nutzen. Dafür steht unsere Formel von der Integration von interner 

und externer Evaluation. Diese Integration von interner und externer Evaluation auf den 

wichtigsten Strukturebenen von Sozialprojekten lässt sich anhand eines kybernetischen 

Mehrebenenmodells theoretisch und praktisch erläutern. Dieses Mehrebenenmodell geht davon 

aus, dass sich jede Entwicklung in einer mitgestaltenden Umgebung ("Ökosystem") vollzieht 

und umgekehrt bezieht sich jede selbstgesteuerte Entwicklung auf diese mitwirkenden 

Umfelder. 

3.2.2 Methodische Konsequenzen 

Die Energie zum Wandel weht aus Richtung der vitalen Eigeninteressen. Es ist also falsch, 

diese Egoismen hinter der Mauer eines vordergründigen Gemeininteresses zu sperren. Energetisch 

sinnvoller ist es, die in einem gro0en Entwicklungsvorhaben divergierenden Akteursinteressen 

zu konzertieren. Institutionelle Reformen unterscheiden zwischen vertikalen Strukturebenen 

und horizontale verteilten Subsystemen auf einer Strukturebene. Ein Beispiel für 

die Spezifität der vertikalen Ebeneninteressen sind etwa die Einrichtungsinteressen im Ver- 




hältnis zu den Trägerinteressen oder die Trägerinteressen in Bezug auf die Politikinteressen. 

Zielführungs- und Unterstützungssysteme einschließlich der Evaluation können diese Interessendifferenzen 

intelligent nutzen. Dafür steht unsere Formel von der Integration von interner 

und externer Evaluation. Diese Integration von interner und externer Evaluation auf den wichtigsten 

Strukturebenen von Sozialprojekten lässt sich anhand eines kybernetischen Mehrebenenmodells 

theoretisch und praktisch erläutern. Dieses soziologische Mehrebenenmodell 11 geht 

davon aus, dass sich jede Entwicklung in einer mitgestaltenden Umgebung ("Ökosystem") 

vollzieht und umgekehrt bezieht sich jede selbstgesteuerte Entwicklung auf diese mitwirkenden 

Umfelder. 

Abbildung 6: Mehrebenenmodell der Verbindung von interner und externer Evaluation 

In der o. a. Abbildung modellieren die inneren Regelkreise die ebenenspezifische „interne 

Evaluation“ 12 und die äußeren Verbindungslinien zwischen den Ebenen die „externe Evaluation“. 

Extern bezieht sich dabei auf die Rechenschaft der jeweiligen Strukturebene gegenüber 

der ihr übergeordneten Strukturebene - im Beispiel etwa die Kindergarten-Ebene gegenüber 

dem lokalen Träger. Diese Ebenen können zusammengefasst oder auch differenziert werden. 

Wichtig ist alleine die Bedeutsamkeit der evaluierenden / evaluierten Ebenen für den interessierenden 

Entwicklungsprozess. Die interne Evaluation dient der Selbstvergewisserung der 

Ebenen-Akteure, die externe Evaluation der Beratung der Zielvereinbarungserreichung. Die 

Evaluationsziele leiten sich aus den Zielvereinbarungen zwischen den Ebenen ab. Durch diese 

11 Das sozialogische Mehrebenenmodell sollte nicht verwechselt werden mit der statistischen Mehrebenenanalyse. 

Die statistische Mehrebenenanalyse (engl. Multilevel Analysis; Multilevel Modelling), auch "Hierarchisch 

Lineare Modellierung" (engl. Hierarchical Linear Modeling) bezeichnet, gehört zu den multivariaten statistischen 

Verfahren zur statistischen Analyse hierarchisch gruppierter Daten ("Clustern" wie Familien, Berufsgruppen, 

Kindergartengruppen etc.). In der empirischen Sozialforschung dient sie zum Herausrechnen von 

Gruppierungseffekten auf das individuelle Verhalten (z. B. Bildungsstand, soziökonomische Schicht, Arbeitslosigkeit 

etc.). Ein Paradebeispiel für dieses Herausrechnen soziaökonomischer Hintergrunddaten aus den 

Lernerfolgsdaten in Kindergarten und Schule bietet die englische Längsschnittstudie "Effective Provision of 

Pre-school Education Project (EPPE)" (Sylva et al. 2001); zur Einführung siehe Ditton 1998; ders. 2002. 

12 „Interne Evaluation ist der in unserem Evaluationskontext treffendere Ausdruck für „Selbstevaluation“; siehe 

hierzu DeGEVal 2002 (Standardsadaptation zur Selbstevalution, Buhren / Killus, / Müller 1998, Burkard 1999. 




evaluativen Verknüpfungen und Separierungen gewinnen die "Kunden" der Evaluation auf 

den verschiedenen Strukturebenen ein Eigeninteresse an der Konzertierung (Abstimmung und 

Ko-Produktion) von Entwicklungsprozessen, Projektmanagement und Evaluationen. 

Zurück zur Evaluationsmethodik: Aus welchem Schatz an Erhebungsmethoden man dann 

im konkreten Fall schöpft und welches Erhebungsdesign jeweils zur Geltung kommt ergibt 

sich aus dem Studium grundlegender Methodenbücher (etwa Kromrey 1990 oder Lamnek 

1995), aus der Lektüre evaluationsbezogener Methodenbücher (etwa Isaac / Michael 1997; 

Bortz / Döring 2002; Widmer 1996), aus bereichsspezifischen Anwendungsdokumentationen 

(etwa Bamberg u.a. 2000, Beywl u.a. Hrsg. 2001; Carle 2002; Demorgon u.a. 2001; Heiner 

Hrsg. 1998; Knox 2002, Reischmann 2003; Stockmann 2000 etc.) und natürlich aus der eigenen 

reichen Anwendungserfahrung – der eigentlichen Profession von EvaluatorInnen. Diese 

Andeutungen mögen ausreichen zur weiteren Vertiefung in die Probleme der Erhebungslogik 

explorativer und sozialwissenschaftlicher Studien in der Evaluationsforschung. Wichtig bei 

der Auswahl und / oder Entwicklung geeigneter Erhebungsinstrumente ist die Spezifität für 

die Strukturebenen einerseits wie auch die jeweiligen Evaluationskunden besonders interessierenden 

Tätigkeitsebenen der Entwicklungsprojekte. Die folgende Abbildung aus dem pädagogischen 

Bereich gibt eine übliche Unterscheidung der zentralen Handlungsregulationsmomente 

in eine Normenebene, eine Strukturebene und eine Operationsebene („Ausführungsweisen). 

Abbildung 7: Drei Ebenen der Methodo-Logie der Evaluationsforschung 

Welche Veränderungen auf welcher Ebene besonders betrachtet werden, hängt nicht nur vom 

Interesse der Evaluationskunden ab, sondern auch von der Entwicklungszeit, die erfasst werden 

kann und soll. Die schnellsten Veränderungen sind auf der operativen Ebene feststellbar. 

Veränderungen auf der strukturellen Ebene bedürfen in Bildungseinrichtungen - je nach 

Strukturebene - Monate bis Jahre. Auf der übergeordneten normativen Ebene braucht es sogar 

Generationen für nachhaltige und signifikante Veränderungen. Diese Überlegungen fließen in 

die Methoden- und Instrumentenwahl ein. - Das war früher einfacher: Am Anfang der Evaluation 

stand ja das Gutachten, das seinerseits einem von „Oben“ vorgegebenen Bewertungsmo- 




dell folgte. Im neuen Evaluationsparadigma erweiterten wir dieses Bewertungsmodell zum 

Nutzenbestimmungs- und Entscheidungsmodell für die Entwicklungsakteure auf der vereinbarten 

Basis von erwarteten bzw. unerwarteten Befunden der Evaluation. Was in der Komplexität 

des gutachterlichen Sachverstandes noch intuitiv verankert war, bedarf in einem kollektiven 

oder gar organisationalen Lernprozess der expliziten Zielfindungs- und Entscheidungslogik. 

Auch diese Zielfindungs- und Entscheidungsfeld ist ein sehr weites. Zum Glück haben 

aber Heinrich Wottawa und Heike Thierau für psychologische und pädagogische AnwenderInnen 

eine gut zugängliche Einführung in die Methodik der "Zielexplikation und Bewertungskriterien" 

geschrieben (dies. 1998, 83 ff). Hier werden uns erste Einblicke in grundlegende 

Entscheidungstechniken, etwa die Alternativenauswahl, Ideenfindung, Szenarioentwicklung, 

Planspieltechnik, Ideenclusterung, Strukturlegetechnik, Zielerreichungsskalierung 

und vieles mehr. Zur Einschränkung dieser Methoden muss gesagt werden, dass sie erstens 

nicht jedem gefallen, also Reaktanzen hervorrufen können und dass sie zweitens der Intuition 

immer unterlegen sind, andererseits man sich aber über Intuition nicht verständigen kann. Eine 

vorsichtige und immer auch durch Intuition geprüfte Handhabung solcher Entscheidungsund 

Bewertungstechniken ist also angeraten. 

Bei Wottawa und Thierau findet sich auch ein Kapitel zur Programmplanung von Entwicklungsprojekten 

und ihnen dienenden Evaluationsvorhaben (dies. 1998, 114 ff; eingehender 

bei Hobbs 2001). Schon die Überprüfung der bisherigen deutschen und internationalen 

Schulreformuntersuchungen ergab einen augenfälligen Mangel an konkreter praktischer Planungs- 

und Gestaltungsmethodik: "So viel scheint sicher, dass erst eine professionelle Reformmethodik 

die Zufälligkeit eines beherzten Veränderungsaktivismus in feldexperimentelle 

Treffer und Irrtümer verwandeln vermag" (Carle 2000, 381 ff). 

Daraus ergibt sich zwingend die Notwendigkeit zur Methodeninnovation von schulischen 

Entwicklungsprojekten. Unter anderem gehört dazu auch Programmplanungsmethodik, wie 

sie unter dem Namen "Projektmanagement" entwickelt wurde. Nach Wottawa / Thierau zählen 

dazu die Aufarbeitung von Projektdetails und Rahmenbedingungen sowie die Ausarbeitung 

eines Arbeits-, Zeit- und Ressourcenplans (dies. 1998, 114 ff). Dazu gibt es vielerlei 

Techniken (ebd. Und Hobbs 2001) und vor allem entwickelte Planungssoftware wie etwa 

"MS Project". Umfangreiche Entwicklungs- und Evaluationsvorhaben müssen projektiert 

werden, sollen sie nicht – wie die meisten Schulreformprojekte – im singulären Aufleuchten 

bedeutsamer neuer Handlungsmöglichkeiten enden. 

Auf welchem Wege auch immer, helfen nahezu alle Evaluationssysteme, einem sich 

wandelnden Sozialsystem im Veränderungsstrudel die übergeordnete Entwicklungsperspektive 

nicht aus den Augen zu verlieren. Dies gelingt, indem man die mittlerweile als Standards 

geltenden Evaluationsgrundsätze und -methoden beherzigt, vor allem aber die wechselseitigen 

Beziehungen zwischen dem Entwicklungssystem und dem Evaluationssystem auf eine durch 

ausreichende Kenntnis der Besonderheiten des jeweils anderen Systems ausgezeichnete Kooperationsqualität 

gründet. 

4 Statt einer Bilanz ein Plädoyer: 

Vorrang hat die Qualifizierung der EvaluatorInnen 

Vor der Evaluationsprofession und der Evaluationsforschung stehen gewaltige Aufgaben. Gilt 

es doch um nicht weniger, als den Erfolg der großen schulischen und sozialen Probleme sichern 

zu helfen, damit es künftigen Kindern und Jugendlichen in jeder Hinsicht gut geht. Evaluationsforschung 

ist dabei vor allem gefordert, den schulischen Reformeinzelfall in den Blick 

zu nehmen und informatorisch zu fördern. 




Zusammenfassend ergibt sich für gute Evaluation keine andere Durchsetzungschance als 

erst einmal die Ausbildung von Professionellen mit der hier angedeuteten vielfältigen Methodenkompetenz, 

bereichsspezifischer Feldkenntnis und ausreichender Anwendungserfahrung. 

Die neue Evaluationskompetenz verspricht dabei zwar reichhaltiges Lernen in Entwicklungsprojekten, 

ja sogar deren ökonomische Optimierung, sie erfordert aber auch eine Kooperationsqualität 

zwischen Entwicklungs- und Evaluationssystem für die es in Deutschland erst 

noch Beispiele zu konstituieren gilt. Zurzeit prägen drei sehr unterschiedliche Bewegungen 

das bunte Bild der methodischen und praktischen Evaluationsdiskurse in Deutschland: 

die hektische Aufholbewegung der von den Möglichkeiten und Mitteln betroffenen 

Professionen in Praxis und Wissenschaft in Deutschland, die rund zwanzig Jahre 

Kompetenzvorsprung der internationalen, insbesondere der US-amerikanischen nach 

zu holen versuchen 

die im Vergleich dazu hoch professionelle, auf höchste qualitative Standardisierung 

und methodische Raffinesse zielende Vollendungsbewegung, die von einer umfassenden 

Implementierung von Evaluationsmaßnahmen in nahezu alle staatlichen und privatwirtschaftlichen 

Großprojekte begleitet wird – in vielen OECD-Ländern, insbesondere 

in den USA 

die weltweite Transzendierungsbewegung einer Minderheit professioneller EvaluatorInnen 

und EvaluationsforscherInnen, die, auf der Vollendungsbewegung aufbauend, 

eine zukunftsweisende, "systemisch-evolutionäre" methodische wie theoretische Neuorientierung 

der Evaluationspraxis konzipiert und ausprobiert 

Insgesamt verfolgen nahezu alle Evaluationsansätze den Sinn, Gestaltungsakteuren bei ihren 

Planungen, Reformprozessen und Erfolgskontrollen so zu assistieren, dass ihre Bedürfnisse 

bzw. Ziele besser erreicht und ihre Arbeitsergebnisse optimiert werden. Diese handlungsunterstützende 

und handlungsorientierende Funktion der Evaluation in komplexen – auf welcher 

Strukturebene auch immer - Entwicklungsprojekten geht weit über Ziele und Methodik des 

Controllings (zielt auf Kontrolle der Leistungserreichung), oder des Qualitätsmanagements 

(zielt auf Verbesserung bestehender Leistungsprozesse) aber auch über die Verfahren und 

Techniken der unter "Projektmanagement" subsummierten Vorgehensweisen der Programmplanung 

hinaus. Dies wird hier betont, da häufig aus Controlling, Qualitätsmanagement oder 

Projektmanagement stammende Verfahren das aktuell zierende Apercu "Evaluation" erhalten. 

Die Evaluationsforschung ist darüber hinaus dabei, ein neues Tätigkeitsniveau der Steuerung 

und Gestaltung großer sozialer Entwicklungsprojekte zu entwickeln. Dieses ist zwar 

auch durch strategische Kompetenzen ("Programm Standards") und methodische Kompetenzen 

(Prozessunterstützung, Erhebungsmethodik, Entscheidungsunterstützung, Programmplanung) 

vor allem aber durch die Qualität der Kooperation zwischen Entwicklungsvorhaben und 

Evaluationssystem geprägt (kulturell-normative Kompetenz). So ist Evaluationsforschung vor 

allem geeignet, den schulischen Reformeinzelfall in den Blick zu nehmen. Dieser Einzelfall 

kann eine Schülerin, eine Klasse, eine Schule, gar ein nationales Bildungssystem sein. 

Gute Evaluation bietet umfangreichen Reform- und Entwicklungsvorhaben ein sozialwissenschaftlich 

fundiertes System zur zielbezogenen projektunterstützenden Informationsversorgung. 

Was diese Art Evaluation auszeichnet, ist ihre strukturelle Eignung zur systemischen 

Koppelung mit dem zu begleitenden Veränderungs- und Gestaltungsfall. Erfolgreich ist gute 

Evaluation aber nur dann, wenn auch das zu evaluierende System über die Strukturen verfügt, 

die die Integration von Evaluationsforschung ermöglicht. Das Evaluation nutzende System 

muss also evaluationsfähig, das Evaluation bietende System förderungsfähig sein. 

Eines aber geht allen Evaluationsdetails voraus: Die erfolgversprechende Gestaltung 

schulischer Reformprojekte. Diese knüpft zuerst an den realen Bedürfnissen der Beteiligten 




an - Evaluation taucht an dieser Stelle zumeist noch nicht auf. Sie nimmt die Bedenken aller 

Beteiligten ernst (Probleme als beste Verbündete), beteiligt die Basis, die SchülerInnen und 

ihre Lebenswelt und gibt allen ausreichend Zeit, Raum und Gelegenheit sich einzubringen. 

Dies ist der Kern, und ihm folgen die Rahmenbedingungen: Reformprojekte brauchen einen 

langen Atem und beginnen erst einmal nur mit den interessierten, den motivierten Personen, 

Gruppen und Schulen; sie stützen sich auf solide Finanzierung und erfolgssicherndes Projektmanagement; 

sie sichern den Veränderungsprozess gegen Überforderung, Stress und unzureichende 

Ressourcen bzw. Expertise; sie gestalten schließlich die konkrete Projektorganisation 

mit Blick auf die Zukunft und nicht mit Führungskonzepten der Vergangenheit; zukunftsfähige 

Projektführung bietet Zugang zu allem relevanten Wissen, flache demokratische Organisation, 

Zusammenarbeit aller mit allen, Förderung von Respekt und Toleranz. 

Schulische Weiterentwicklung kann man fördern oder hemmen, nicht lenken. Insgesamt 

braucht schulische Entwicklung also zusätzlich zum internen Entwicklungsinteresse und der 

externen Entwicklungsunterstützung (einschließlich eines Evaluationssystems) die vermittelnde 

Entwicklungsgestaltfindung (System Design). Soll Evaluation als gestaltungsbegleitendes 

Feedbacksystem auch diesem Funktionsanspruch genügen, muss es dem hier entwickelten, 

"systemischen" Evaluationsansatz entsprechen, der sich durch die folgenden (wechselseitigen) 

sieben Beziehungsqualitäten zusammenfassen: 

1. Orientierungsqualität: Evaluationssysteme als integrierter Teil des Unterstützungssystems 

für Reform- oder Entwicklungsvorhaben unterstützen für die Reformakteure vor allem die 

folgenden informatorischen Funktionen: 

Erkenntnisfunktion 

Selbstkontrollfunktion 

Dialogfunktion 

Verantwortungs- und Legitimitätsfunktion 

2. Indikatorenqualität: Zur Unterstützung der Selbstkontrollfunktion machen Evaluationssysteme 

für alle Beteiligten sichtbar, was alleine aus den unmittelbaren Arbeitsabläufen und – 

ergebnissen nicht hervorgeht, nämlich: 

dass das, was sie wollen auch getan wird 

(Implementation Evaluation - Durchführungskontrolle) 

dass was sie tun auch wirkt 

(Impact Evaluation – Wirkungskontrolle) und 

dass, wie es getan wird, der gebotenen Ökonomie und der aktuell möglichen 

Professionalität entspricht (Effectiveness Evaluation – Effizienzkontrolle) 

3. Informationsqualität: Zur technisch-organisatorischen Fundierung des Lernens, der Selbststeuerung, 

der Kommunikation und des Erfolgsnachweises im Reform- oder Entwicklungsprozess 

bieten Evaluationssysteme: 

eine Kommunikationsplattform 

ein Zielführungssystem und 

ein Integrationsmedium für die Konzertierung der Bemühungen aller 

Strukturebenen 

4. Methodenflexibilitätsqualität: Die steigende wechselseitige Kooperationsfähigkeit eröffnet 

methodisch neue Unterstützungsmöglichkeiten durch eine Ausrichtung der Methodik an 




übergeordneten, phasenspezifischen und situativen Entscheidungsbedürfnissen des Entwicklungsprojektes: 

Methoden zur Erfassung übergeordneter und nachhaltiger Gestaltungswirkungen 

Methoden zur Erfassung phasenspezifischer Teilwirkungen 

Methoden zur Erfassung situativer Entscheidungsbedingungen und -alternativen 

5. Systemintegrationsqualität: Evaluationssysteme müssen geeignet sein, einen weiten pädagogisch-sozialen 

Ansatz und damit das relevante Umfeld der Schulen und ihrer Familien zu 

erfassen. Gute Evaluation und Evaluationsforschung ist deshalb gekennzeichnet durch: 

Transdisziplinarität 

ein ergebnisorientiertes Management 

Bestärkung und Unterstützung der Gestaltungsträger 

Integration aller Gestaltungsakteure 

praxisorientierte, systemische Prozessmodellierung 

kulturelle Kompetenz in der Evaluationskommunikation und durch 

Leitbilder, die geeignet sind, unterschiedliche Evaluationsansätze zu vereinigen 

6. Theoriequalität: Zwischen Gestaltungsprojekt und Evaluationssystem muss es nicht nur eine 

instrumentell-technische, sondern auch eine theoretische, kulturell-strukturelle Koppelung 

geben: 

erstens bedarf es der paradigmatischen Verwandtschaft zwischen Gestaltungsprojektansatz 

und Evaluationsansatz 

zweitens muss das Gestaltungsvorhaben einem State-of-the-art-Wirkungsmodell des 

Gestaltungsfeldes folgen und 

drittens muss das Evaluationssystem zur Erfassung der tatsächlich eintretenden Wirkungen 

entsprechend diesem Wirkungsmodell geeignet sein – ökonomisch wie methodisch-instrumentell 

7. Konsultationsqualität: Zusätzlich braucht es eine neue Art Lieferanten-Kunden-Beziehung 

zwischen Evaluationsobjekt und Evaluatoren mit folgenden Kennzeichen: 

auf Seiten der Evaluatoren steht die "dienende" Funktion der Evaluation im Vordergrund: 

Evaluationsforschung als Serviceprozess für den Kernprozess der Systemgestaltung; 

dazu muss das Evaluationssystem über ausreichende Feldkompetenz verfügen 

auf Seiten des Gestaltungssystems muss eine ausreichende Evaluationsforschungskompetenz 

zum integraler Bestandteil der Systemgestaltungskompetenz werden 

Bezogen auf schulische Reformvorhaben bestimmen diese sieben Beziehungsmerkmale zwischen 

Evaluationsforschung und Reformvorhaben zusammen den Erfolg sowohl der Wandlungsprozesse 

wie auch seiner Ergebnisse im Hinblick auf die gemeinsamen Ziele aller Beteiligten, 

die professionelle Entwicklung der Lehrenden, der Steigerung der Schülerleistung und 

dem Engagement der Eltern. Durch die Integration von Evaluation in die Gestaltungsplanung 

wurde überdies die Kostenproblematik (große Evaluationen sind sehr teuer) in eine Gewinnoption 

verwandelt: Evaluationen sind nicht mehr nur teuer, sondern helfen sogar den Entwicklungsprozess 

effektiver zu gestalten. 




Folgt man dieser Logik, dürfte sich der aktuelle Diskurs, ja Disput um Evaluation, Evaluationsansätze 

und Forschungsmethoden der Evaluation eigentlich nur noch um die notwendigen 

Kompetenzen, also um die Frage der Aus- und Weiterbildung von EvaluatorInnen drehen. 

Dass er dies nur erst in zumeist erst in Ansätzen tut und dies auch noch begrenzt auf auch sozialwissenschaftliche 

Aspekte, verweist auf sehr viel mehr als auf ein nachholendes Kompetenzgerangel 

unter den verschiedenen Bildungsprofessionen und Sozialforschungsschulen. 

Dieser Umstand verweist auf die Notwendigkeit zur Überwindung eines uralten weltanschaulichen 

Streits zwischen Schrift- und Tatgelehrten: Was war am Anfang, die Interpretation, die 

Bewertung (das Wort) oder die Intervention, die Entwicklungsarbeit (die Tat)? 




Dazu eine frühmoderne Bekenntnislyrik: 

"Geschrieben steht: »Im Anfang war das Wort!« 

Hier stock ich schon! Wer hilft mir weiter fort? 

Ich kann das Wort so hoch unmöglich schätzen, 

Ich muss es anders übersetzen, 

Wenn ich vom Geiste recht erleuchtet bin. 

Geschrieben steht: Im Anfang war der Sinn. 

Bedenke wohl die erste Zeile, 

Dass deine Feder sich nicht übereile! 

Ist es der Sinn, der alles wirkt und schafft? 

Es sollte stehn: Im Anfang war die Kraft! 

Doch, auch indem ich dieses niederschreibe, 

Schon warnt mich was, dass ich dabei nicht bleibe. 

Mir hilft der Geist! Auf einmal seh ich Rat 

Und schreib getrost: Im Anfang war die Tat!" 

Goethe, Faust I, Der Tragödie erster Teil, Studierzimmer, V. 

Neue produktive Evaluation folgt der Faustischen Logik: Zuerst kommt die Tat, bewegt von 

einem kraftvollen Motiv, getragen von einem weit reichenden Sinn – diese gilt es allerdings 

auch per 'Wort' (Zahlen, Daten, Fakten) zu verbinden, denk-, kommunizier- und verhandelbar 

zu machen. Und gerade weil das Wort als Medium die Botschaften von Tat, Motiv und Sinn 

ebenso trägt wie prägt, muss zum Qualifikationsprofil der EvaluatorInnen, zu den vielen Methoden 

noch eine Kunst hinzugefügt werden, die Fähigkeit zur ästhetischen Gestaltung der 

strategischen und operativen Evaluationskommunikation und Evaluationskommentare. Sollen 

diese angenommen und wirksam werden, müssen sie dem Kunstwerk von Goethe ähneln, das 

diesen Gedanken immerhin schon rund zweihundert Jahre lebendig hielt. 




Literaturverzeichnis 

Ackermann, Heike / Wissinger, Jochen (Hrsg.): Schulqualität managen. Von der Verwaltung der 

Schule zur Entwicklung von Schulqualität. Neuwied: Luchterhand, 1998 

Allgäuer, Ruth: Evaluation macht uns stark! Zur Unverzichtbarkeit von Praxisforschung im schulischen 

Alltag. Zweite Auflage. Frankfurt am Main,1998 [1997] 

Altrichter, Herbert / Pechar, Hans / Schratz, Michael (Hrsg.): Hochschulen auf dem Prüfstand. Was 

bringt Evaluation für die Entwicklung von Universitäten und Fachhochschulen? Innsbruck: Studienverlag, 

1997 

Altrichter, Herbert / Schley, Wilfried / Schratz, Michael: Handbuch zur Schulentwicklung. Innsbruck: 

Studienverlag, 1998 

Argyris, Christ / Schön, Donald A.: Organizational Learning II. Theory, Method, and Practice. Reading, 

Massachusetts: Addison-Wesley, 1996 

Aufenanger, Stefan: Grundschule und Computer. Internet-URL: www.learnline.nrw.de/angebote/berichtsarchiv/pdf/ar0004.pdf, 

1998 [28. Dezember 2002] 

Bamberg, Sebastian / Gumbl, Harald / Schmidt, Peter: Rational Choice und theoriegeleitete Evaluationsforschung. 

Am Beispiel der Verhaltenswirksamkeit verkehrspolitischer Maßnahmen. Opladen: 

Leske + Budrich, 2000 

Bastian, Johannes (Hrsg.): Pädagogische Schulentwicklung, Schulprogramm und Evaluation. 

Hamburg: Bergmann + Helbig, 1998 

Baumert, Jürgen (Hrsg.): PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen 

Vergleich. Opladen: Leske + Budrich, 2001 

Baumert, Jürgen: Evaluationsmaßnahmen im Bildungsbereich. Eine kritische Sicht auf mögliche Zugänge. 

OFEB-Newsletter Heft 2 (2001), 3-14 

BDS Berufsverband Deutscher Soziologinnen und Soziologen (Hrsg.): Evaluation. Themenheft. Sozialwissenschaft 

und Berufspraxis (SUB), 24. Jg. (2001) H. 2. Internet-URL: http://userpage.fuberlin.de/~ifs/bds/downloads.html, 

2001 [28. Dezember 2002] 

Beck, Manfred: Evaluation als Maßnahme der Qualitätssicherung. Tübingen: DGVT-Verlag, 1998 

Beywl, Wolfgang: Zur Weiterentwicklung der Evaluationsmethodologie. Grundlegung, Konzeption 

und Anwendung eines Modells der responsiven Evaluation. Köln: Univation, 1998 [Reprint der 1. 

Auflage von 1988 Frankfurt am Main: Peter Lang, 1988] 

Beywl, Wolfgang / Schobert, Berthold: Evaluation - Controlling - Qualitätsmanagement in der betrieblichen 

Weiterbildung. Kommentierte Auswahlbibliographie. Bielefeld: Bertelsmann, 2000 

Beywl, Wolfgang: Konfliktfähigkeit der Evaluation und die 'Standards für Evaluationen'. Sozialwissenschaft 

und Berufspraxis (SUB), 24. Jg. (2001) H. 2, 151-164. Internet-URL: http://userpage.fuberlin.de/~ifs/bds/downloads/2001-2-beywl.pdf, 

2001 [28. Dezember 2002] 

Beywl, Wolfgang (Moderation): Die Perspektiven des Wirksamkeitsdialoges. In ders.: Evaluation im 

Alltag. Jugendverbände untersuchen ihre Wirkung. Münster: Votum, 2001, 156-175 

Beywl, Wolfgang u.a. (Hrsg.): Evaluation im Alltag. Jugendverbände untersuchen ihre Wirkung. 

Münster: Votum, 2001 

Bloom, Benjamin S. / Hastings, J. Thomas / Madaus, George F.: Handbook on Formative and Summative 

Evaluation of Student Learning. New York: McGraw-Hill, 1971 

BMBWK Bundesministerium für Bildung, Wissenschaft und Kultur (AT): System-Monitoring- 

Homepage. Internet-URL: www.system-monitoring.at, 2000 [28. Dezember 2002] 

BMFSFJ Bundesministerium für Familie, Senioren, Frauen und Jugend (DE): QS-Kompendium. Gesamtausgabe 

aller Qs-Hefte (1995-2001). Stichwort-Datenbank, Glossar, Register (CD-Rom). Berlin, 

2002 

Bösenberg, Dirk / Metzen, Heinz: Lean Management. Vorsprung durch schlanke Konzepte. Fünfte 

Auflage. Landsberg am Lech: Moderne Industrie, 1994 [1992] 




Bogner, Andree / Boscher, Tamara: Schulinspektion in England - Erfahrungen aus einem Studienprojekt. 

In: Carle, Ursula / Buchen, Sylvia (Hrsg.): Jahrbuch für Lehrerforschung. Band 2. Weinheim: 

Juventa, 1999, 211-220 

Bortz, Jürgen / Döring, Nicola: Forschungsmethoden und Evaluation für Human- und Sozialwissenschaften. 

3. Auflage. Berlin: Springer, 2002 [1984] 

Bonsen, Martin / Killus, Dagmar: Hilfen für Schüler in schwierigen Problemlagen. Externe Evaluation 

der Einrichtung Regionaler Beratungs- und Unterstützungsstellen in Hamburg. Dortmund: IFS- 

Verlag, 2000 

Buhren, Claus G. / Killus, Dagmar / Müller, Sabine: Qualitätsindikatoren für Schule und Unterricht - 

Ein Arbeitsbuch für Kollegien und Schulleitungen. Dortmund: IFS-Verlag, 1999 

Buhren, Claus G./ Killus, D. / Müller, S.: Wege und Methoden der Selbstevaluation. Ein praktischer 

Leitfaden für Schulen. Dortmund: IFS-Verlag, 1998 

Buhren, Claus G. / Lindau-Bank, Detlev u. Müller, Sabine: Lernkultur und Schulentwicklung. Dortmund: 

IFS-Verlag, 1997 

Burkhard, Christoph: Externe Evaluation - Ein Beitrag zur Qualitätsentwicklung von Einzelschulen? 

Soest: Landesinstitut für Schule und Weiterbildung, 1995 

Burkhard, Christoph: Schulentwicklung durch Evaluation? Handlungsmöglichkeiten der Schulaufsicht 

bei der Qualitätsentwicklung. Frankfurt am Main: Peter Lang, 1998 

Burkard, Christoph: Wie Selbstevaluation gelingen kann. In: Carle, Ursula / Buchen, Sylvia (Hrsg.): 

Jahrbuch für Lehrerforschung. Band II. Weinheim: Juventa, 1999, 175-190 

Burkhard, Christoph: Praxishandbuch Evaluation in der Schule. Berlin: Cornelsen-Sciptor, 2000 

Campbell, Donald T.: Reforms as experiments. American Psychologist, 24 (April) 1969, 409-429. 

(Reprint in Campbell 1988), 261 -289 

Campbell, Donald T.: Methodology and Epistemology for Social Science. Selected Papers (1956 – 

1986) edited by E. Samual Overman. Chicago: University of Chicago Press, 1988 

Caracelli, Valerie J.: Methodology: Building Bridges to Knowledge. In: Stockmann, Reinhard (Hrsg.): 

Evaluationsforschung. Grundlagen und ausgewählte Forschungsfelder. Opladen: Leske + Budrich, 

2000, 165-192 

Carle, Ursula: Mein Lehrplan sind die Kinder. Eine Analyse der Planungstätigkeit von Lehrerinnen 

und Lehrern an Förderschulen. Weinheim: Deutscher Studienverlag, 1995 

Carle, Ursula: Was bewegt die Schule. Internationale Bilanz, praktische Erfahrungen, neue systemische 

Möglichkeiten für Schulreform, Lehrerbildung, Schulentwicklung und Qualitätssteigerung. 

Baltmannsweiler: Schneider, 2000 

Carle, Ursula: Ausgangslage der Schulen im Schulversuch Veränderte Schuleingangsphase in Thüringen. 

Erster Zwischenbericht der wissenschaftlichen Begleitung. Bremen: Universität Bremen FB 

12, Grundschulpädagogik. Internet-URL: www.grundschulpaedagogik.uni-bremen.de/archiv/, 2001 

[28. Dezember 2002] 

Carle, Ursula (2002): Systemische Schulentwicklungsforschung am Beispiel des Schulversuchs „Veränderte 

Schuleingangsphase an Thüringer Grundschulen“. In: Hanns Petillon (Hrsg.): Individuelles 

und soziales Lernen - Kindperspektive und pädagogische Konzepte. Beiträge zur 9. Jahrestagung 

der Kommission "Grundschulforschung und Pädagogik der Primarstufe" der Deutschen Gesellschaft 

für Pädagogik (DGfE), Landau, Oktober 2000. Jahrbuch Lehrerforschung, 5. Opladen: Leske 

und Budrich (Jahrbuch Grundschulforschung Bd. 5., 5), S. 209–216 [Kurzbeleg: Carle 2002]. 

Carle, Ursula / Berthold, Barbara / Klose, Sabine / Henschel, Martina: Zweiter Zwischenbericht der 

wissenschaftlichen Begleitung: Veränderte Schuleingangsphase in Thüringen. Bremen: Universität 

Bremen FB 12, Grundschulpädagogik. Internet-URL: www.grundschulpaedagogik.unibremen.de/archiv/, 

2001 [28. Dezember 2002] 

Carle, Ursula / Buchen, Sylvia (Hrsg.): Jahrbuch für Lehrerforschung. Band 2. Weinheim: Juventa, 

1999 




Chen, Huey-Tsyh: Theory-Driven Evaluations - Second Edition, Preface by Peter H. Rossi. Thousand 

Oaks, CA: Sage, 1999 [1990] 

Cronbach, Lee J.: Designing Evaluations of Educational and Social Programs. San Francisco: Jossey- 

Bass, 1982 

Dalin, Per: Developing the Twenty-First Century School: A Challenge to Reformers. In: Hargreaves, 

Andy et al. (Eds.): International Handbook of Educational Change. Dordrecht / NL: Kluwer, 1998, 

1059-1073 

Dalin, Per: Evaluation als Instrument von Schulentwicklung in Norwegen. In: Landesinstitut für Schule 

und Weiterbildung (Hrsg.): Schulentwicklung und Qualitätssicherung in Norwegen. Bönen / 

Westfalen: Verlag für Schule und Weiterbildung, 1995, 13-17 

DeGEval – Gesellschaft für Evaluation (Hrsg.) (2004): Empfehlungen zur Anwendung der Standards 

für Evaluation im Handlungsfeld der Selbstevaluation. 1. Aufl. Alfter: DeGEval – Gesellschaft für 

Evaluation e. V. Online verfügbar unter www.alt.degeval.de/calimero/tools/proxy.php?id=24059, 

zuletzt geprüft am 20120720 

DeGEval – Gesellschaft für Evaluation (Hrsg.) (2002): Standards für Evaluation. auf der Grundlage 

der Standards des US-amerikanischen Joint Committee on Standards for Educational Evaluation 

(2000). Unter Mitarbeit von Wolfgang Beywl, Dieter Brauns, Hansjörg Drewello, Andreas Hellmann, 

Thomas Kuby, Sabine Müller et al. Mainz: DeGEval – Gesellschaft für Evaluation e. V. Online 

verfügbar unter www.alt.degeval.de/calimero/tools/proxy.php?id=24065, zuletzt 20120720 

Demorgon, Jacques u.a.: Europakompetenz lernen. Interkulturelle Ausbildung und Evaluation. Frankfurt 

am Main: Campus, 2001 

Ditton, Hartmut (2002): Lehrkräfte und Unterricht aus Schülersicht. Ergebnisse einer Untersuchung 

im Fach Mathematik. In: Zeitschrift für Pädagogik (ZfP) 48 (2), S. 262–286. Online verfügbar unter 

http://www.pedocs.de/volltexte/2011/3833/pdf/ZfPaed_2_2002_Ditton_Lehrkraefte_und_ 

Unterricht_aus_Schuelersicht_D_A.pdf, zuletzt geprüft am 20120720 [Kurzbeleg: Ditton 2002]. 

Ditton, Hartmut (1998): Mehrebenenanalyse: Grundlagen und Anwendungen des Hierarchisch- 

Linearen Modells. Weinheim: Juventa [Kurzbeleg: Ditton 1998]. 

Döbrich, Peter: Aspekte der Qualitätssicherung im schottischen Schulwesen. In: Carle, Ursula / Buchen, 

Sylvia (Hrsg.): Jahrbuch für Lehrerforschung. Band 2. Weinheim: Juventa, 1999, 155-174 

Donaldson, Stewart I. / Scriven, Michael (Eds.): Evaluating Social Programs and Problems. Mahawah, 

NJ (USA): Lawrence Erlbaum, 2003 

Faßmann, Hendrik: Forschungspraktische Probleme der Evaluation von Programmen im Bereich der 

Rehabilitation. Sozialwissenschaft und Berufspraxis (SUB), 24. Jg. (2001) H. 2, 133-148. Internet- 

URL: http://userpage.fu-berlin.de/~ifs/bds/downloads/2001-2-fassmann.pdf, 2001 [28. Dezember 

2002] 

Fend, Helmut: Qualität im Bildungswesen. Schulforschung zu Systembedingungen, Schulprofilen und 

Lehrerleistung. Weinheim: Juventa, 1998 

Fetterman, David M. / Kaftarian, Shakeh J. / Wandersman, Abraham (Eds.): Empowerment Evaluation. 

Knowledge and Tools for Self-Assessment and Accountability. Thousand Oaks, CA, USA: 

Sage 1996 

Fischer, Dietlind / Jacobi, Juliane / Koch-Priewe, Barbara (Hrsg.): Schulentwicklung geht von Frauen 

aus. Zur Beteiligung von Lehrerinnen an Schulreformen aus professionsgeschichtlicher, biographischer, 

religionspädagogischer und fortbildungsdidaktischer Perspektive. Weinheim: Deutscher Studienverlag, 

1996 

Flitner, Elisabeth: Zwischen Pädagogik und Bildungsökonomie: Schul-Evaluation in Frankreich. In: 

Carle, Ursula / Buchen, Sylvia (Hrsg.): Jahrbuch für Lehrerforschung. Band 2. München: Juventa, 

1999,191-210 

Giddens, Anthony: Die Konstitution der Gesellschaft. Grundzüge einer Theorie der Strukturierung. 

Dritte Auflage. Frankfurt / Main: Campus, 1997 [1995; engl. Orig. 1984: The Constitution of Society. 

Outline of the Theory of Structuration) 




Friebertshäuser, Barbara / Prengel, Annedore (Hrsg.): Handbuch Qualitative Forschungsmethoden in 

der Erziehungswissenschaft. Weinheim: Juventa, 1997 

GAO USA General Accounting Office / Program Evaluation and Methodology Division: Designing 

Evaluation. Washington, DC: GAO. Internet-URL: www.gao.gov/special.pubs/pe1014.pdf, 1991 


GAO USA General Accounting Office: Special Publications: Evaluation Research and Methodology. 

Internet-URL: www.gao.gov/special.pubs/erm.html, 2002 [28. Dezember 2002] 

Guba, Egon G. / Lincoln, Yvonna S.: Fourth Generation Evaluation. Thousand Oaks, CA: Sage, 1989 

Hacker, Winfried. Arbeitspsychologie. Psychische Regulation von Arbeitstätigkeiten. Berlin: 

Deutscher Verlag der Wissenschaften, 1986 

Hargreaves, Andy: The Emotions of Teaching and Educational Change. In: Hargreaves, Andy et al. 

(Eds.): International Handbook of Educational Change. Dordrecht / NL: Kluwer, 1998, 558-575 

Hargreaves, Andy / Fullan, Michael G. (Eds): Understanding Teacher Development – Second Edition. 

New York: Teacher College Press, 1993 [1992] 

Hargreaves, Andy / Liebermann, Ann / Fullan, Michael / Hopkins, David (Eds.) (1998): International 

Handbook of Educational Change - Part One and Two (Kluwer International Handbook of Education, 

Volume 5). Dordrecht: Kluwer Academic Publisher 

Heiner, Maja (Hrsg.): Experimentierende Evaluation. Ansätze zur Entwicklung lernender Organisationen. 

München: Juventa, 1998 

Henninger, Michael: Evaluation. Diagnose oder Therapie? In: Harteis, Christian / Heid, Helmut / 

Kraft, Susanne: Kompendium Weiterbildung - Aspekte und Perspektiven betrieblicher Personalund 

Organisationsentwicklung. Opladen: Leske + Budrich, 2000, 249-260 

Herrmann, Joachim / Höfner, Christoph: Evaluation in der Schule - Unterrichtsevaluation. Berichte 

und Materialien aus der Praxis.. Gütersloh: Bertelsmann Stiftung, 1999 

Hobbs, Peter: Professionelles Projektmanagement. Aus dem Englischen übertragen von Anette Böckler. 

Zweite Auflage. Landsberg am Lech: MVG, 2001 [2000] 

Holtappels, Heinz Günter: Schulqualität durch Schulentwicklung und Evaluation. Neue Konzepte – 

Strategien – Instrumente. Neuwied: Luchterhand, 2003 (Stand Dezember 2002: in Vorbereitung) 

House, Ernest R.: Values in Evaluation and Social Research. Thousand Oaks, CA: Corwin Press, 1999 

House, Ernest R.: Schools for Sale: Why Free Market Policies Won't Improve America's Schools, and 

What Will. New York: Teachers College Press, 1998 

House, Ernest R.: Professional Evaluation: Social Impact and Political Consequences. Thousand Oaks, 

CA: Sage, 1993 

House, Ernest R.: New Directions in Educational Evaluation. London: Taylor & Francis, 1985 

House, Ernest R.: School Evaluation: The Politics and Process. Richmond, CA: McCutchan, 1973 

House, Ernest R. / McQuillan, Patrick J.: Three Perspectives on School Reform. In: Hargreaves, Andy 

et al. (Eds.): International Handbook of Educational Change. Part One. Dordrecht / NL: Kluwer, 

1998, 198-213 

Institut für Schulentwicklungsforschung (Hrsg.): IFS-Schulbarometer. Ein mehrperspektivisches Instrument 

zur Erfassung von Schulwirklichkeit. Dortmund: IFS-Verlag, 1996 

Irle, Günter / Windisch, Matthias: Forschungstransfer In die Schulpraxis. Was wissenschaftliche Begleituntersuchungen 

bewirken. Weinheim: Deutscher Studienverlag, 1989 

Isaac, Stephen / Michael, William B.: Handbook in Research and Evaluation. A Collection of Principles, 

Methods, and Strategies Useful in the Planning, Design, and Evaluation of Studies in Education 

and the Behavioral Sciences – Third Edition. San Diego, CA: EdITS Educational and Industrial 

Testing Services, 1997 [1971] 

Joint Committee on Standards for Educational Evaluation / Gullickson, Arlen R: The Student Evaluation 

Standards. How to Improve Evaluations of Students. Thousand Oaks, CA: Corwin Press, 2003 




Joint Committee on Standards for Educational Evaluation: What the Program Evaluation Standards 

say about Designing Evaluations. Internet-URL: www.wmich.edu/evalctr/jc/DesigningEval.htm, 

1994 [28. Dezember 2002] 

Joint Committee on Standards for Educational Evaluation: Homepage of 'The Student Evaluation 

Standards'. Internet-URL: http://ec.wmich.edu/jointcomm/SES/, 2002 [28. Dezember 2002] 

Joint Committee on Standards for Educational Evaluation: Homepage: The Evaluation Center. Internet-URL: 

www.wmich.edu/evalctr/index.html, 2002 [28. Dezember 2002] 

Joint Committee on Standards for Educational Evaluation / Sanders, James R. (Hrsg.): Handbuch der 

Evaluationsstandards. Zweite Auflage. Opladen: Leske + Budrich, 2000 [1999] 

Journal für Schulentwicklung: Externe Evaluation. Themenheft. Journal für Schulentwicklung, 5. Jg. 

(2001) H. 2 

Kellaghan, Thomas / Stufflebeam, Daniel L. (Ed.): International Handbook of Educational Evaluation. 

Dordrecht: Kluwer Academic, 2003 

Klemm, Klaus / Schratz, Michael (Redaktion): Externe Evaluation. Themenheft. Journal für Schulentwicklung, 

5. Jg. (2001) H. 2 

Knox, Alan B.: Evaluation for Continuing Education. A Comprehensive Guide to Success. San Francisco, 

CA: Jossey-Bass, 2002 

Kordes, Hagen: Evaluation. Lemma in: Haft, Henning / Kordes, Hagen (Hrsg.): Enzyklopädie Erziehungswissenschaft, 

Band 2, Methoden der Erziehungs- und Bildungsforschung. Stuttgart: Klett, 

1995, 359 – 366 

Kromrey, Helmut: Empirische Sozialforschung. Modelle und Methoden der Datenerhebung und Datenauswertung. 

Unter Mitarbeit von Rainer Ollmann. Vierte Auflage. Opladen: Leske + Budrich, 

1990 [1980] 

Kromrey, Helmut: Evaluation – ein vielschichtiges Konzept. Begriff und Methodik von Evaluierung 

und Evaluationsforschung. Empfehlungen für die Praxis. Sozialwissenschaft und Berufspraxis 

(SUB), 24. Jg. (2001) H. 2, 105-131. Internet-URL: http://userpage.fuberlin.de/~ifs/bds/downloads/2001-2-kromrey.pdf, 

2001 

Kromrey, Helmut: Fallstricke bei der Implementations- und Wirkungsforschung sowie methodische 

Alternativen. In: Müller-Kohlenberg, Hildegard / Münstermann, Klaus (Hrsg.): Qualität von Humandienstleistungen. 

Evaluation und Qualitätsmanagement in Sozialer Arbeit und Gesundheitswesen. 

Opladen: Leske + Budrich, 2000. Zusatzquelle: Internet-URL: http://userpage.fuberlin.de/~ifs/bds/downloads/eval_humandl.pdf 

Kuhn, Thomas S.: Die Struktur der wissenschaftlichen Revolution. Zweite revidierte Auflage. Frankfurt 

am Main: Suhrkamp, 1976 [1973; engl. Orig. 1962] 

Kuhn, Thomas S.: Die Entstehung des Neuen. Studien zur Struktur der Wissenschaftsgeschichte. Herausgegeben 

von Lorenz Krüger. Fünfte Auflage. Frankfurt am Main: Suhrkamp, 1997 [1978; engl. 

Orig. 1977] 

Lamnek, Siegfried: Qualitative Sozialforschung. Zwei Bände. Dritte Auflage. Weinheim: Beltz, 1995 

[1989] 

Lander, Rolf / Ekholm, Mats: School Evaluation and Improvement: A Scandinavian View. In: Hargreaves, 

Andy et al. (Eds.): International Handbook of Educational Change. Dordrecht/NL: Kluwer, 

1998, 1119-1134 

Lee, Barbara: Theories of Evaluation. In: Stockmann, Reinhard (Hrsg.): Evaluationsforschung. Grundlagen 

und ausgewählte Forschungsfelder. Opladen: Leske + Budrich, 2000, 127-164 

Leeuw, Frans L.: Evaluation in Europe. In: Stockmann, Reinhard (Hrsg.): Evaluationsforschung. 

Grundlagen und ausgewählte Forschungsfelder. Opladen: Leske + Budrich, 2000, 57-76 

Liebermann, Ann: Introduction. The Growth of Educational Change as a Field of Study: Understanding 

its Roots and Branches. In: Hargreaves, Andy et al. (Eds.): International Handbook of Educational 

Change. Dordrecht / NL: Kluwer, 1998, 710-729 

McEwan, Patrick J.: Primay School Reform for Rural Development: An Evaluation of Colombia New 

Schools. Washington DC: Inter-American Development Bank-IDB, 1995 




Mertens, Donna M.: Institutionalizing Evaluation in the United States of America. In: Stockmann, 

Reinhard (Hrsg.): Evaluationsforschung. Grundlagen und ausgewählte Forschungsfelder. Opladen: 

Leske + Budrich, 2000, 41-56 

Meyer, Carsten: Umwelterziehung im authentischen Handlungskontext. Zur theoretischen Fundierung 

und Evaluation Regionalen Lernens. Frankfurt / Main: Lang, 1996 

Miles, Matthew B.: Finding Keys to School change: A 40-Year Odyssey. In: Hargreaves, Andy et al. 

(Eds.): International Handbook of Educational Change. Dordrecht / NL: Kluwer, 1998, 37-69 

Ministerium für Schule, Wissenschaft und Forschung NRW / Landesinstitut für Schule und Weiterbildung 

(Hrsg.): Schulprogrammarbeit in NRW. Ergebnisse der wissenschaftlichen Evaluationsstudien. 

Bönen / Westfalen: Kettler, 2002 

Müller-Kohlenberg, Hildegard / Münstermann, Klaus (Hrsg.): Qualität von Humandienstleistungen. 

Evaluation und Qualitätsmanagement in Sozialer Arbeit und Gesundheitswesen. Opladen: Leske + 

Budrich, 2000 

Nauck, Joachim: "Neustrukturierung des Schulanfangs" als Schulversuch. In: Kiper, Hanna / Nauck, 

Joachim (Hrsg.): Unterrichten im ersten Schuljahr. Baltmannsweiler: Schneider, 1999a, 228-248 

Nauck, Joachim: Diagnostische Aufgaben in einer Grundschule für alle Kinder. In: Kiper, Hanna / 

Nauck, Joachim (Hrsg.): Unterrichten im ersten Schuljahr. Baltmannsweiler: Schneider Hohengehren, 

1999, 49-66 

Neul, Wolfgang: Strategien der Evaluation von Curricula und der Curriculumentwicklung. Stuttgart : 

Klett-Cotta, 1977 

OECD Organization for Economic Cooperation and Development: Education at a Glance. OECD Indicators 

– 2002 Edition. Paris: OECD, 2002. Zusatzquelle: Internet-URL: 

www.oecd.org/EN/links_abstract/0,,EN-links_abstract-604-5-no-no-1239-604,00.html, 2002 [28. 

Dezember 2002] 

OECD Organization for Economic Cooperation and Development: Home: Education Statistics and Indicators. 

Internet-URL: www.oecd.org/EN/home/0,,EN-home-604-5-no-no-no-no,00.html, 2002 


OECD / UNESCO-UIS UNESCO Institute for Statistics: Teachers for Tomorrow's Schools. Analysis 

of the World Education Indicators. Paris: OECD, 2001 

Orth, Gerhard: Schulentwicklung in Nordrhein-Westfalen. Internet-URL: www.learnline.nrw.de/angebote/lehrerfortbildung/medienbildung/artikel/orth.pdf, 

2002 [28. Dezember 2002] 

Patry, Jean-Luc / Thonhauser, Josef: Evaluation im Bildungsbereich. Wissenschaft und Praxis im Dialog. 

Innsbruck: Studienverlag, 1999 

Patton, Michael Quinn: Utilization-Focused Evaluation. The New Century Text – third Edition. 

Thousand Oaks, CA: Sage Publications, 1997 [1986] 

Patton, Michael Quinn: Die Entdeckung des Prozessnutzens. Erwünschtes und unerwünschtes Lernen 

durch Evaluation. In: Heiner, Maja (Hrsg.): Experimentierende Evaluation. Ansätze zur Entwicklung 

lernender Organisationen. München: Juventa, 1998, 55-66 

Philipp, Elmar u. Rolff, Hans-Günter: Schulprogramme und Leitbilder entwickeln. Ein Arbeitsbuch. 

Weinheim: Beltz, 1998 

Posch, Peter / Altrichter, Herbert: Möglichkeiten und Grenzen der Qualitätsevaluation und Qualitätsentwicklung 

im Schulwesen. Innsbruck: Studien Verlag , 1999 

Reischmann, Jost: Weiterbildungs-Evaluation. Lernerfolge messbar machen. Neuwied: Luchterhand, 

2003 

Rolff, Hans-Günter / Buhren, Claus G. / Lindau-Bank, Detlev: Manual Schulentwicklung. Handlungskonzept 

zur pädagogischen Schulentwicklungsberatung (SchuB). Dritte Auflage. Weinheim: Beltz, 

2000 [1998] 

Ropohl, Günter: Allgemeine Technologie. Eine Systemtheorie der Technik. Zweite Auflage. München: 

Hanser, 1999 [1978] 




Rossi, Peter H. / Freeman, Howard E. / Lipsey, Mark W.: Evaluation. A Systematic Approach - Sixth 

Edition. Thousand Oaks, CA: Sage, 1999 [1985 ohne Lipsey) 

Scriven, Michael: The logic of evaluation. Inverness, CA: Edgepress, 1980 

Shinkfield, Anthony J. / Stufflebeam, Daniel L.: Teacher Evaluation guide to Effective Practice. Dordrecht: 

Kluwer Academic, 1996 

Stamm, Margret: Qualitätsevaluation und Bildungsmanagement im sekundären und tertiären Bereich. 

Zweite Auflage. Aarau, CH: Sauerländer, 1999 [1998] 

Stern, Cornelia / Döbrich, Peter (Hrsg.): Wie gut ist unsere Schule? Selbstevaluation mit Hilfe von 

Qualitätsindikatoren. International Network of Innovative School Systems. Dritte Auflage. Gütersloh: 

Bertelsmann-Stiftung, 2000 [1999] 

Stockmann, Reinhard: Evaluation in Deutschland. In: Stockmann, Reinhard (Hrsg.): Evaluationsforschung. 

Grundlagen und ausgewählte Forschungsfelder. Opladen: Leske + Budrich, 2000, 11-40 

Stockmann, Reinhard (Hrsg.): Evaluationsforschung. Grundlagen und ausgewählte Forschungsfelder. 

Opladen: Leske + Budrich, 2000 

Stufflebeam, Daniel L. / Foley, Walter J. / Gephard, William J. / Guba, Egon G. / Hammond, Robert 

L. / Merriman, Howard A. / Provus, Malcom M. (Phi Delta Kappa National Study Committee on 

Evaluation): Educational Evaluation and Decision Making. Itasca, IL: F. E. Peacock, 1971 (Meilenstein 

der Evaluationsmodellierung: CIPP Evaluation Model) 

Stufflebeam, Daniel L. / Madaus, George F. / Kellaghan, Thomas (Eds.): Evaluation Models: Viewpoints 

on Educational and Human Services Evaluation – Second Edition. Dordrecht: Kluwer Academic, 

2001 [1983] 

Suchman, Edward A.: Evaluative Research: Principles and Practice in Public Service and Social Action. 

New York: Russel Sage Foundation, 1968 

Szaday, Christopher/ Bueler, Xaver / Favre, Bernhard: Schulqualität und Schulentwicklung. Bern: 

Schweizerische Koordinationsstelle für Bildungsforschung (SKBF), 1996 

Sylva, Kathy; Sammons, Pam; Siraj-Blatchford, Iram; Melhuish, Edward; Taggart, Brenda; Quinn, 

Louise (Hrsg.) (2001): The Effective Provision of Pre-School Education (EPPE) Project. A Longitudinal 

Study funded by the DFES (1997 - 2003). The EPPE Symposium Paper presented at the 

British Educational Research Association (BERA). Annual Conference, Leeds University, England, 

13-15.09.2001. British Educational Research Association (BERA). 1. Aufl. London;: Department 

for Education and Deployment. Online: 

http://eppe.ioe.ac.uk/eppe/eppepdfs/berapaper2001.pdf, [20120720] [Kurzbeleg: Sylva et al. 2001]. 

The Measurement Group: 1997 American Evaluation Association Meeting Resource Page. Internet- 

URL: http://www.tmg-web.com/ppt_aea.htm, 1998 [28. Dezember 2002] 

Tillmann, Klaus-Jürgen / Winscher, Beate (Hrsg.): Schulinterne Evaluation an Reformschulen. Positionen, 

Konzepte, Praxisbeispiele (Impuls-Reihe. Bd. 30). Bielefeld: Laborschule Bielefeld, 1998 

Ulrich, Ina (Hrsg.): Evaluation - Start oder Stolperstein für pädagogische Schulentwicklung. Dokumentation 

von "Schulmanagement VII" am 27.04.1999 in Schortens (Oldenburger VorDrucke Nr. 

407/99). Oldenburg: Didaktisches Zentrum der Universität Oldenburg, 1999 

Widmer, Thomas: Meta-Evaluation. Kriterien zur Bewertung von Evaluationen. Bern: Paul Haupt, 

1996 

Widmer, Thomas / Rothmayr, Christine / Serdült, Uwe: Kurz und gut? Qualität und Effizienz von 

Kurzevaluationen. Vorwort von Ulrich Klöti. Chur: Rüegger, 1996 

Wittmann, Werner W.: Evaluationsforschung. Aufgaben, Probleme und Anwendungen. Berlin:: 

Springer, 1985 

Wottawa, Heinrich: Evaluation. In: Krapp, Andreas / Weidenmann, Bernd (Hrsg.) Pädagogische Psychologie. 

Vierte Auflage. Weinheim: Beltz, 2001 [1986] 

Wottawa, Heinrich / Thierau, Heike: Lehrbuch Evaluation. Zweite Auflage. Bern: Hans Huber 

1998 [1990]

Evaluation und Evaluationsforschung - Universität Bremen

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?