schen Gehalt zu bearbeiten - Kuratorium Deutsche Altershilfe
schen Gehalt zu bearbeiten - Kuratorium Deutsche Altershilfe
schen Gehalt zu bearbeiten - Kuratorium Deutsche Altershilfe
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Institut: Sozialpsychologisches Institut Köln, SPI KÖLN<br />
Titel: Eine empirische Fragestellung, die nicht konsequent empirisch bearbeitet wird:<br />
Personalbedarfsbemessung in der Pflege<br />
Autor : Albert Brühl<br />
Zusammenfassung:<br />
Zur Personalbedarfsbemessung existiert aktuell kein empirisch entwickeltes, valides System, das den<br />
Personalbedarf in der Pflege erklären und begründen könnte. Alle Systeme, die das aktuell behaupten,<br />
setzen an die Stelle wirklich empirischer Arbeit einfach normative, fachlich untermauerte Annahmen.<br />
Personalbedarf wird somit behauptet und diese Behauptungen werden nicht anhand personenunabhängig<br />
prüfbarer Hypothesen getestet. Eine wirklich empirisch gehaltvolle Bearbeitung der Personalbedarfsbemessung<br />
in der Pflege erforderte:<br />
1. Das Thema „Erklärung und Begründung von Personalbedarf“ wirklich als Fragestellung mit empiri<strong>schen</strong><br />
<strong>Gehalt</strong> <strong>zu</strong> <strong>bearbeiten</strong><br />
2. Eine Instrumententwicklung, die sich an einer Handlungs- und einer Testtheorie orientiert<br />
3. Eine empirisch gehaltvolle Definition des Konstrukts „Personalbedarf“<br />
4. Die Definition eines Messmodells<br />
5. Die Implementation eines Verfahrens mit Be<strong>zu</strong>g <strong>zu</strong>r Qualität der produzierten Daten<br />
Rechtfertigungsdruck der Sozial- und Gesundheitsberufe erfordert in der Pflege eine empirisch gehaltvolle<br />
Bearbeitung gerade dieser Fragestellung. Die normativ behaupteten notwendigen Personalressourcen<br />
müssen <strong>zu</strong>künftig empirisch erklärt und begründet werden können. Dies wird wegen der Komplexität<br />
der Aufgabe noch lange ein Thema für die Pflegeforschung bleiben.<br />
Title:<br />
An empirical question which isn't processed consistently empirically:<br />
Manpower requirements assessment in the care.<br />
Summary:<br />
Not one system exists empirically developed, valide currently to the manpower requirements assessment<br />
which could explain and justify the manpower requirements in the care.<br />
All systems which claim this currently put acceptances to the place of really empirical work which are<br />
simply normative and supported technically.<br />
1
Manpower requirements are therefore claimed and these assertions aren't tested with objective testable<br />
hypotheses.<br />
A really empirically nutritious processing of the manpower requirements in the care required:<br />
1. An empirical definition of the topic 2. An action- and a test-theory 3. An empirical definition of the<br />
construct 4. The definition of a measuring model 5. The implementation of a method with reference to<br />
the quality of the produced data<br />
2
Inhaltsverzeichnis<br />
Einleitung<br />
(1) Ein gegenüber empiri<strong>schen</strong> Methoden abgeschlossener Zugang <strong>zu</strong>r Fragestellung ................................ S. 03<br />
(2) Einsatz empirischer Methoden in einer nicht empirisch verstandenen Fragestellung . ............................. S. 12<br />
(3) Fünf Schritte: Was der Einsatz empirischer Methoden erforderte.............................................................. S. 15<br />
(4) Literatur. ...................................................................................................................................................... S. 17<br />
Einleitung<br />
Die Bearbeitung der Aufgabe der Personalbedarfsbemessung wird in der Pflege immer noch durch<br />
einen nicht konsequent empiri<strong>schen</strong> Zugang <strong>zu</strong> dieser empiri<strong>schen</strong> Fragestellung behindert. Nirgends<br />
in der Pflege werden Methoden <strong>zu</strong>r empiri<strong>schen</strong> Entwicklung und Bewertung von entsprechenden Instrumenten<br />
wirklich konsequent eingesetzt.<br />
Erfahrungen aus dem Bereich Sozialer Arbeit zeigen, wie notwendig die Entwicklung von Klassifikationssystemen<br />
jenseits derer der Medizin im Gesundheitswesen ist. Die Entwicklung der Fallgruppen<br />
der Sozialarbeit (FdS®) (Brühl, 2004) ist durch eine konsequente Orientierung an empirisch gehaltvollen<br />
Hypothesen, empiri<strong>schen</strong> Methoden und ebenso definierten Gütekriterien möglich gewesen. Das<br />
gleiche gälte auch für Entwicklungsarbeiten für Systeme <strong>zu</strong>r Erklärung und Begründung von Zeit- und<br />
damit Personalbedarf in der Pflege.<br />
3
Dies wird im Folgenden in den ersten beiden Kapiteln erläutert und im dritten Kapitel werden <strong>zu</strong>sammenfassend<br />
fünf Thesen <strong>zu</strong>r konsequent empiri<strong>schen</strong> Bearbeitung dieser empiri<strong>schen</strong> Fragestellung<br />
formuliert.<br />
(1) Ein gegenüber empiri<strong>schen</strong> Methoden abgeschlossener Zugang <strong>zu</strong>r Fragestellung<br />
Erhebungsinstrumente <strong>zu</strong>r Bemessung des Personalbedarfs werden in der Akut- wie auch der Altenpflege<br />
seit längerem eingesetzt. Einen sehr guten Überblick <strong>zu</strong> Leistungserfassungsinstrumenten liefern<br />
Isfort und Weidner (2001). Als Beispiele für aktuelle Instrumente mit Be<strong>zu</strong>g <strong>zu</strong>r Personalbemessung<br />
werden das Leistungserfassungssystem in der Pflege (LEP®) und das PLAISIER® (Planification<br />
informatisée des soins infirmiers requis)- Instrument herausgegriffen.<br />
Was ist das im Kern für eine Fragestellung, die mit Hilfe der oben genannten Instrumente bearbeitet<br />
wird? Zunächst einmal kann festgehalten werden, dass Daten produziert werden, die auch eine Bemessung<br />
des Personalbedarfs ermöglichen sollen.<br />
Es handelt sich hierbei also um eine empirische Fragestellung. Ob ein Instrument den Personalbedarf<br />
erklärt oder nicht, kann anhand konkreter Daten überprüft werden. Die Instrumente beanspruchen für<br />
sich alle empiri<strong>schen</strong> <strong>Gehalt</strong>, der anhand definierter Kriterien der Objektivität, Validität und Reliabilität<br />
eindeutig personenunabhängig messbar wäre.<br />
Folgerichtig bestünde die Möglichkeit, die Konstruktion von derartigen Instrumenten auf der Basis empirischer<br />
Konstruktionsprinzipien für Erhebungsinstrumente <strong>zu</strong> gestalten und zwar angefangen vom<br />
grundlegenden Konstruktdefinitionen, dem Messmodell, Itemformulierungen, Itemselektionen, bis hin <strong>zu</strong><br />
Validierungsstichproben <strong>zu</strong>r Konstrukt- und <strong>zu</strong>r kriterienbezogenen Validität.<br />
Auch eine Kritik der Instrumente könnte diesen Weg nehmen und von der Konstruktdefinition über das<br />
Messmodell, Itemformulierungen bis hin <strong>zu</strong>r Itemselektion auf der Basis von geordneten Erfahrungen,<br />
also methodischer Datenerhebungen, die Eignung oder fehlende Eignung bestimmter Konstrukte,<br />
Messmodelle, einzelner Items bzw. ganzer Item-/Skalenarten oder Instrumente für den sehr konkreten<br />
Zweck der Personalbemessung schrittweise diskutieren.<br />
4
Wenn man sich aber die Konstruktion, Prüfung und auch die Kritik der beiden oben genannten Instrumentenbeispiele<br />
stellvertretend für das Vorgehen in dieser wichtigen Fragestellung ansieht, so spielen<br />
zentrale empirische Kriterien für ihre Kritik, Prüfung oder Konstruktion keine entscheidende Rolle.<br />
Auf der Seite der Instrumentenkonstrukteure und -befürworter äußert sich das in einer Art Immunisierungsstrategie<br />
gegenüber für das eigene Instrument möglicherweise ungünstiger Empirie und<br />
auf der Seite der Kritiker in einer empirisch nicht fundierten Kritik.<br />
Im Ergebnis stehen sich Diskussionspartner gegenüber, die die bei einer empiri<strong>schen</strong> Fragestellung<br />
immer gegebene Verständigungs- und Entwicklungsebene konkreter empirischer Ergebnisse nicht<br />
mehr <strong>zu</strong>r Verständigung und Entwicklung nutzen können.<br />
Hauptproblem ist die Tatsache, dass<br />
• keine empirisch gehaltvollen Hypothesen formuliert werden, die die Instrumentenqualität eindeutig<br />
testbar werden ließen,<br />
• Daten erhoben und Analysemethoden ohne klaren Hypothesentest eingesetzt werden, um empirische<br />
Ergebnisse je nach Bedarf interpretieren <strong>zu</strong> können,<br />
• in zentralen Fragen kriterienbezogener Validität (Erklärung von Pflegeleistungen) nicht veröffentlichte<br />
Untersuchungen als Beleg angeführt werden, ohne dass eine Wiederholung der Ergebnisse<br />
versucht wird, was nahe liegend wäre<br />
Beides, die Immunisierung der Instrumente gegenüber aussagekräftiger empirischer Überprüfung und<br />
die nicht-empirische Kritik bilden ein gegenüber hypothesentestender Empirie abgeschlossenes System<br />
und stabilisieren sich bei allen inhaltlichen Differenzen gegenseitig in ihren erkenntnistheoreti<strong>schen</strong><br />
Grundhaltung, die die Rolle von Theorien rationalistisch-idealistisch konzipiert:<br />
„Rationalisten (..) würden das Primat der Theorie über die Erfahrung betonen, beispielsweise indem sie<br />
darauf hinweisen, dass Beobachtungen und Experimente durch vorhandene Erwartungen, Vermutungen<br />
und Theorien angeregt werden und dass es keine vorausset<strong>zu</strong>ngs- oder theoriefreie Erfahrung<br />
gibt“ (..)<br />
5
„Idealisten (..) würden leugnen, dass eine (..) Theorie etwas tatsächlich Existierendes beschreibt, oder<br />
sie würden <strong>zu</strong>mindest nicht annehmen wollen, dass jede Theorie als ein derartiger Beschreibungsversuch<br />
angesehen werden muss“ (Westermann, 1987, S. 6)<br />
Realismus und Empirie als Grundlage der Problembehandlung wären weitere denkbare erkenntnistheoretische<br />
Zugänge:<br />
„Für einen reinen Empiristen dürfte eine (..) Theorie nichts anderes sein als eine Zusammenfassung der<br />
in (..) Beobachtungen und Experimenten gesammelten, möglichst <strong>zu</strong>verlässigen Erfahrungen (..)<br />
Ein Realist würde in einer (..) Theorie <strong>zu</strong>mindest einen Versuch sehen, einen Aspekt der Wirklichkeit<br />
ab<strong>zu</strong>bilden, d.h. also beispielsweise den tatsächlichen Aufbau und die tatsächliche Funktion des<br />
menschlichen Gehirns <strong>zu</strong> beschreiben“ (Westermann, 1987, S.6)<br />
Die Negierung der empirisch-realisti<strong>schen</strong> Seite des z.B. „aus der Praxis für die Praxis“ entwickelten<br />
LEP® zeigt sich an der Stelle, an der das empirisch definierte, für diese Fragestellung zentrale Konstrukt<br />
des „Messens“ von den LEP® Entwicklern rational umdefiniert wird. Damit verliert es seine empirische<br />
Bedeutung und kann nicht <strong>zu</strong>r Instrumentenentwicklung beitragen.<br />
Im Fall des LEP® ist eine „Messtheorie“ entwickelt worden, die in Anlehnung an Beobachtungen erster<br />
und zweiter Ordnung nach Luhmann ein<br />
„Messen erster Ordnung und ein Messen zweiter Ordnung“ (Brosziewski et al. 2001, S. 61)<br />
unterscheiden möchte:<br />
„Entscheidungen und Ausführungen, die sich von solchen - selten oder gar nicht quantifizierbaren -<br />
Maßstäben leiten lassen, wollen wir hier als Messen erster Ordnung bezeichnen“ (s.o.).<br />
Das Messen erster Ordnung ist immer abhängig von einer Verbindung mit bereits vorhandenen Maßstäben,<br />
die die Autoren als Soll-Größen bezeichnen. Das Messen erster Ordnung, wie die Autoren es<br />
6
definieren, berücksichtigt die Tatsache, dass bei einer Messung eines Konstrukts wie jenem des Personalbedarfs<br />
eine bereits vorvermessene Welt existiert, von der jedwedes weitere Messen abhängig ist.<br />
Das Messen erster Ordnung ist also kein Messen im Sinne der Zuordnung eines empirisch relationalen<br />
Systems <strong>zu</strong> einem numerisch relationalen, sondern verdeutlicht die Relevanz vorab bestehender Soll-<br />
Größen.<br />
Als Messen zweiter Ordnung<br />
„sollen Messungen gelten, die an solchen Messungen erster Ordnung anschließen (s.o.)“.<br />
Hier wird die Abhängigkeit eines jeden Messvorgangs, der sich nicht vollkommen personenunabhängiger<br />
Methoden bei der Definition des <strong>zu</strong> messenden Konstrukts bedienen kann, von eben jenen<br />
Konventionen <strong>zu</strong> Begriffen und Kategorien betont, auf die er sich bezieht. Dies ist eine Abhängigkeit,<br />
die jede Messung von Konstrukten wie „Intelligenz“, „Motivation“, „Einstellung“ oder eben auch<br />
„Personalbedarf“ kennzeichnet.<br />
In dem Augenblick, in dem mit der Messung eines derartigen Konstrukts eine Funktion verbunden wird,<br />
steht ein Außenkriterium der Güte einer Messung <strong>zu</strong>r Verfügung. Dieses Außenkriterium ist dann immer<br />
personenunabhängig und unabhängig von Soll-Größen empirisch prüfbar.<br />
Beispiel: Soll ein Schulabschluss z.B. als Prädikator für das spätere Einkommen von Schülern dienen,<br />
kann klar festgestellt werden, wie gut ein Schulabschluss Einkommen vorhersagt.<br />
Das gleiche gilt auch für die Personalbemessungsinstrumente, bei denen die Aufklärung der für Patienten<br />
benötigten Arbeitszeit in ihrer Varianz bei bestehendem Pflegeangebot und damit die konkrete Stellenerklärung<br />
ein klar personenunabhängig <strong>zu</strong> erfassendes Außenkriterium bildet.<br />
Empirisch verstanden bedeutet Messen die<br />
7
„systematische Zuordnung einer Menge von Zahlen oder Symbolen <strong>zu</strong> den Ausprägungen einer Variablen<br />
(mithin auch <strong>zu</strong> den Objekten), und zwar so, dass die Relationen unter den Zahlenwerten den Relationen<br />
unter den Objekten entsprechen“ ( Kromrey, 1991, S. 168).<br />
In diesem Sinne versuchen sowohl das LEP® als auch das PLAISIR® Zahlen der Variablen „Personalbedarf“<br />
<strong>zu</strong><strong>zu</strong>ordnen. Trotz aller Probleme, die ein solches Messen immer mit sich bringt, bleibt es ein<br />
Messen, für das entscheidend ist, mit welcher Validität und Reliabilität aufgrund der Zahlenunterschiede<br />
Aussagen über Merkmalsunterschiede gemacht werden können.<br />
Der Versuch, eine Art Messen <strong>zu</strong> definieren, dass nicht mehr den Messvorgang selbst fokussiert, sondern<br />
die Tatsache, das er auch in der Pflege mit nur personenabhängig <strong>zu</strong> operationalisierenden Kategorien<br />
stattfindet, macht aus dem Messvorgang eine selbständig nicht mehr aussagekräftige Zahlenproduktion.<br />
Das ist innerhalb der Logik des LEP® - Messmodells ja auch sinnvoll. Denn:<br />
Wenn alles Messen nur durch die Verbindung mit vorhandenen Maßstäben seine Bedeutung erhält,<br />
dann ist es konsequent, in der Frage der Zeitkalkulation direkt die Konvention an die Stelle des empiri<strong>schen</strong><br />
Messvorgangs selbst <strong>zu</strong> setzen. Dies geschieht beim letzten Schritt der „Messung“ sowohl beim<br />
LEP® als auch beim PLAISIR® durch die normative Zuordnung vorgegebener Zeitwerte <strong>zu</strong> Skalenausprägungen<br />
mit denen Leistungen unterschieden werden sollen.<br />
Die Erklärung von Zeitvarianz ist dann von vornherein kein messbares Gütekriterium dieser Instrumente<br />
mehr und der mit ihnen festgestellte Zeit- und damit Personalbedarf kann nie falsifiziert werden.<br />
Weil sie nicht falsifizierbar sind, handelt es sich beim Einsatz der Instrumente, den produzierten Daten<br />
<strong>zu</strong> ihrer Prüfung und ihrer Analyse bislang um ein gegenüber hypothesentestender Empirie abgeschlossenes<br />
System.<br />
Die Fragestellung selbst bleibt trotzdem aber eine empirisch-realistische.<br />
Für LEP® und PLAISIR® werden Zielgrößen auch eindeutig empirisch-realistisch definiert:<br />
„Der sich verschärfende Kostendruck auf die Leistungserbringer im Gesundheitswesen hat auch vor<br />
den Pflegenden nicht halt gemacht. Nur mit einem solchen Instrument („LEP“ Anm. d.Verf.) sind die<br />
8
Pflegenden in der Lage, mengen- und belastungsmässige Aspekte ihrer Arbeit auf eine Weise <strong>zu</strong> begründen,<br />
dass sie auch Gehör finden: mit Zahlen“ (Maeder et al. zit. n. Isfor,Weidner 2002, S. 19).<br />
Halten wir fest: Mengen und - sehr viel anspruchsvoller - auch belastungsmässige „Aspekte“ sollen mit<br />
Zahlen „begründet“ werden.<br />
Empirische Kriterien spielen bei der Konstruktion und Bewertung keine entscheidende Rolle, trotzdem<br />
sollen empirisch klar prüfbare Ziele erreicht werden. Hier klafft eine Differenz zwi<strong>schen</strong> rationalem Anspruch<br />
und empirischer Wirklichkeit, die alle in der Pflege Daten produzierenden Instrumente im Rahmen<br />
von Versuchen der Personalbedarfsbemessung aufweisen.<br />
Auch für PLAISIR® wird eine empirische Zieldefinition gewählt, die wie beim LEP® eigentlich empirische<br />
Messoperationen erforderte:<br />
„Das System erlaubt also die Pflegeintensität der abhängigen Bewohner, die während unterschiedlich<br />
langer Zeit (viele bis <strong>zu</strong>m Lebensende) in einer Einrichtung beherbergt werden, <strong>zu</strong> qualifizieren und <strong>zu</strong><br />
quantifizieren“ (PLAISIR 93, S.2)<br />
Auch hier haben wir es mit einer Messung <strong>zu</strong> tun, bei der der Pflegeintensität als empirisch relationalen<br />
System die Skalenausprägungen im PLAISIR® und mit den hinterlegten Zeiten dann die notwendige<br />
Arbeitszeit als numerisch relationalem System <strong>zu</strong>geordnet wird.<br />
Auch hier werden Zeitbedarfe nicht wirklich empirisch gemessen, sondern normativ vorgegeben. Die<br />
Zeit ist Teil des Systems und kann deshalb als ein dem System immanentes Element niemals durch<br />
PLAISIER® erklärt werden.<br />
Empirisch hypothesentestende Datenanalysen werden als zentrale Kriterien <strong>zu</strong>r Beurteilung der Güte,<br />
<strong>zu</strong>r Weiterentwicklung oder gar <strong>zu</strong>r Entwicklung von Instrumenten nicht genutzt.<br />
„Über die Auswahl der Variablen, ihre teststatistische Untersuchung, der Reliabilität und der Validität<br />
des Instruments liegen keine differenzierten Daten vor. LEP wurde vor allem aus der Praxis für die Pra-<br />
9
xis konzipiert und die Variablen sind demnach nicht mittels statistischer Verfahren ermittelt worden“ (..)<br />
An dieser Stelle wird deutlich, dass es im LEP vor allem darum geht, eine hohe Akzeptanz der Methode<br />
<strong>zu</strong> bewirken und so <strong>zu</strong> einer guten Datenqualität <strong>zu</strong> gelangen. (..) Die Zeitangaben, die den Variablen<br />
<strong>zu</strong>grunde liegen, entsprechen einer normativen Festset<strong>zu</strong>ng einer nicht näher beschriebenen Expertengruppe.<br />
(..) Es gab in einzelnen Häusern in der Schweiz Untersuchungen bezüglich der Gegenüberstellung<br />
von LEP-Zeiten und Ist-Zeiten. Diese Untersuchungen sind allerdings nicht veröffentlicht und<br />
daher einer Analyse nicht <strong>zu</strong>gänglich. (..) (Isfort, 2002. S. 23).<br />
Hauptgütekriterien wie die kriterienbezogene Validität als tatsächliche Aufklärung der Zeitvarianz oder<br />
Techniken <strong>zu</strong> ihrer Entwicklung sind in der Diskussion von Personalbemessunginstrumenten aktuell<br />
von vornherein ausgeschlossen.<br />
(2) Einsatz empirischer Methoden in einer nicht empirisch verstandenen Fragestellung<br />
Wenn eine empirische Fragestellung ohne empirisch gehaltvolle Hypothesen, mit nicht-empirisch konstruierten<br />
Instrumenten behandelt und dann trotzdem „evaluierende“ empirische Daten <strong>zu</strong>r Güte der<br />
Instrumente erhoben werden, dann ist das von vornherein insgesamt nicht sinnvoll und kann es auch<br />
nicht in Ausschnitten werden.<br />
Dies sei beispielhaft an der Evaluation genannten „Einführung“ des PLAISIR® und später anhand der<br />
Prüfung der Soll-Zeiten des LEP® demonstriert.<br />
Als empirisches Gütekriterium wird in der Evaluation von PLAISIER® die Reliabilität des Instruments<br />
angesprochen, in einer Form, die wiederum der Behandlung dieser Frage in einem gegenüber Empirie<br />
abgeschlossenen nicht-empiri<strong>schen</strong> System entspricht:<br />
„Die Bedenken, dass eine Evaluation durch einen internen Evaluator, also einen Beschäftigten der Einrichtung,<br />
andere Resultate erbringt als eine Erhebung durch einen externen, also nicht bei dem Träger<br />
Beschäftigten, wurden sehr ernst genommen, und es wurde eine ausgewiesene Pflegefachkraft verpflichtet,<br />
in einer Einrichtung eine begrenzte Zahl von so genannten Doppelevaluationen vor<strong>zu</strong>nehmen.<br />
10
Hierbei soll nicht der Anschein erweckt werden, dass mit einer so geringen Fallzahl, es handelte sich<br />
um 65 BewohnerInnen zweier Wohnbereiche, das Verfahren als solches in Hinblick auf seine Reliabilität<br />
überprüft werden könnte und sollte. Dies wurde in Kanada schon ausreichend geprüft und war für<br />
die Entscheidung, dieses Verfahren <strong>zu</strong> erproben, von entscheidender Bedeutung“ (Gennrich, 2000, S.<br />
103).<br />
Die Reliabilität wird als empirisches Gütekriterium angesprochen, gleichzeitig aber ausgesagt, das sie<br />
in dieser Form gar nicht ausreichend untersucht werden könne und ja bereits ein Grund für die Auswahl<br />
des Instruments gewesen sei, weil sie ja schon ausreichend untersucht worden sei.<br />
Hier erfolgt keine hypothesengeleitete Testung von Reliabilität, sondern nur eine Wiederholung der<br />
Vorannahmen und eine Datenerhebung ohne Hypothese und damit ohne Ziel.<br />
Nachdem die Datenerhebung durch fehlende Hypothesen nicht auf ein definiertes prüfbares Ziel ausgerichtet<br />
war, ist keine eindeutige Datenanalyse mehr möglich. So schwanken die Bewertung des Methodeneinsatzes<br />
und die Analyse der Daten je nach Bedarf zwi<strong>schen</strong> Marginalisierung und bedeutungsvoller<br />
Interpretation hin und her.<br />
Für eine Überprüfung der Vorannahmen <strong>zu</strong>r Reliabilität soll die Fallzahl von 65 Fällen laut Gennrich von<br />
vornherein nicht ausreichen.<br />
Zur Bestätigung der erwünschten Aussage „dass die Ergebnisse beider EvaluiererInnen konvergent<br />
sind“ (s.o.) soll die gleiche Fallzahl aber ausreichen.<br />
Gennrich berichtet von Abweichungen zwi<strong>schen</strong> den zwei geschulten EvaluatorInnen in der Größenordnung<br />
„eines Grades auf der Skala“<br />
in verschiedenen Bereichen (vgl. Gennrich, 2000, S. 103).<br />
11
Zur Abschät<strong>zu</strong>ng der Übereinstimmungen werden die aus der Summation der den Skalenwerten <strong>zu</strong>geordneten<br />
Minutenwerte resultierenden Gesamtminutenwerte verglichen.<br />
Diese Gesamtminutenwerte resultieren aus der Zuordnung von Zeitwerten <strong>zu</strong> Skalenwerten und nicht<br />
auf der mehr oder minder großen Übereinstimmung in den aus den Einschät<strong>zu</strong>ngen resultierenden<br />
Skalenwerten der EvaluatorInnen selbst.<br />
Diese Analysen ermöglichen keine eindeutige empirische Beurteilung der Güte des Instruments, obwohl<br />
das möglich wäre.<br />
Irrelevante, weil nicht hypothesengeleitete empirische Datenanalysen passen gut in ein geschlossenes<br />
nicht empirisches System, weil man sich so immer wieder aussuchen kann, wie man empirische Ergebnisse<br />
so interpretiert, dass sie die eigenen rationalen Vorannahmen nicht falsifizieren.<br />
Das ist ungefähr genau so, wie wenn man ein Pferderennen so gestaltete, dass man es genau <strong>zu</strong> dem<br />
Zeitpunkt für beendet erklären und „gewonnen“ rufen könnte, wenn der eigene Favorit gerade vorne<br />
läge. Ohne definiertes, messbares Ziel gibt es kein richtiges Pferderennen und auch keine empirische<br />
Evaluation von Erhebungs-Instrumenten.<br />
Auch die Kritik des Plaisier®-Instruments wird nicht empirisch begründet.<br />
So wird im Kern angezweifelt, was die Konstrukteure des PLAISIR® behaupten: Dass das bio-psychosoziale<br />
Profil wirklich die Grundlage biete, um Pflegeaktionen <strong>zu</strong> überprüfen (vgl. Bartholomeyczik et al.<br />
2002, S. 23/24).<br />
Es werden dann inhaltlich rationale Wertediskussionen geführt, die sicher sinnvoll um empirische Hypothesentests<br />
bereichert werden könnten.<br />
Ohne empirische Hypothesentests stehen den wertsetzenden Aussagen der Kritiker<br />
12
„ Als besonders gravierend ist an<strong>zu</strong>sehen, dass die Pflegeaktionen keinerlei Pflegemethoden erfassen,<br />
die gerade in der modernen Altenpflege eine große Rolle spielen und dringend gefördert werden müssen“<br />
(Bartholomeyczik, 2002, S. 25)<br />
allein die wertsetzenden Aussagen der Befürworter gegenüber:<br />
„ Aus Sicht des <strong>Kuratorium</strong>s <strong>Deutsche</strong> <strong>Altershilfe</strong> erfüllt das Verfahren PLAISIR alle wesentlichen Vorausset<strong>zu</strong>ngen,<br />
die an ein zeitgemäßes Verfahren <strong>zu</strong>r Bestimmung der erforderlichen Pflegezeit- und<br />
des Personalbedarfes gestellt werden müssen“ (Gennrich 2000, S. 104).<br />
Im Fall des LEP® liegt als empirische Prüfung eine Gegenüberstellung von postulierten LEP®-Zeiten<br />
und tatsächlich gemessenen Echt-Zeiten für einzelne Items vor, die bislang keine Konsequenzen für die<br />
im Instrument verwandte Form der Skalierung hatte.<br />
Bei der Gegenüberstellung von Echt- und LEP®-Zeiten zeigen sich genau die Schwierigkeiten, die für<br />
den Einsatz empirischer Methoden in einem geschlossenen nicht empiri<strong>schen</strong> System kennzeichnend<br />
sind. Es ist unmöglich die Ergebnisse im Anschluss an ein Forschungsprojekt auch für eine Instrumentenweiterentwicklung<br />
<strong>zu</strong> nutzen, wenn das nicht empirisch konstruierte Instrument bereits fertig ist und<br />
seine Akzeptanz im Feld das Hauptqualitätskriterium darstellt.<br />
Für das LEP sind Werte für die Tätigkeit „Mobilisation“ gemessen worden. Sie wurden den Minutensollwerten<br />
des LEP für die einzelnen Handlungen gegenübergestellt (vgl. Isfort, Weidner, 2002, S.62,<br />
N=1808 Einzelhandlungen):<br />
Tätigkeit LEP-Soll-Zeit Ist-Zeit-Mittelwert<br />
Mobilisation einfach 5 3,23<br />
Mobilisation wenig aufwendig 15 5,95<br />
Mobilisation aufwendig 30 7,64<br />
Mobilisation sehr aufwendig 60 8,14<br />
13
Von einer validen Differenzierung von Pflegeleistungen durch die Kategorien „einfach“ bis „aufwendig“<br />
aus<strong>zu</strong>gehen, ist nicht sinnvoll.<br />
Mit dem Instrument <strong>zu</strong>r Zeiterfassung „DocuLine“ wird das einzelleistungsbezogene Messmodell mit der<br />
einfachen Skalierungen trotz seiner offensichtlichen Mängel weiter beibehalten. Doculine bietet eine<br />
technische Lösung, um einzelne Leistungen zeitbezogen direkt <strong>zu</strong> erfassen.<br />
Das Instrument „Dokuline“ zeigt, dass die Fragestellung der Personalbedarfsbemessung ganz grundlegend<br />
nicht wirklich als empirische Messoperation verstanden wird, selbst wenn viele Daten produziert<br />
werden:<br />
„Die klassi<strong>schen</strong> teststatisti<strong>schen</strong> Angaben <strong>zu</strong>r Objektivität, Validität und Reliabilität spielen bei diesem<br />
Ist-Daten basierten Ansatz keine Rolle, bzw. es handelt sich per se um objektive, valide und reliable<br />
Daten für die jeweilige Einrichtung“ (Esther Klug, 2002, S.57)<br />
Das ist kein empirisches Verständnis von Personalbemessung, sondern ein empiristisches, bei dem<br />
Pflegeleistung das ist, was mit dem Instrument gemessen wird. Wenn Ist-Zeiten gemessen werden, so<br />
müssen die auf eine Tätigkeit bezogen werden. Diese Tätigkeit ist im Dokuline-instrument hinterlegt.<br />
Gemessen wird dann die Zeit, die vom Beginn bis <strong>zu</strong>m Ende der Tätigkeit verstreicht.<br />
Wenn jetzt die Exaktheit der Zeitmessung in den Vordergrund gestellt wird, ohne das die Angemessenheit<br />
der <strong>zu</strong>gehörigen Unterscheidungen verschiedener Tätigkeiten und die Angemessenheit<br />
der Abstufungen der Komplexitätsgrade der Tätigkeiten im Blick bleibt, dann wird die Zeit <strong>zu</strong>m alleinig<br />
eindeutigen Kriterium der Unterscheidung von Leistungen.<br />
Zeiten werden bei gleichen Tätigkeiten und zwi<strong>schen</strong> verschiedenen Tätigkeiten variieren.<br />
Zeitvarianz bei gleichen Tätigkeiten kann mit DokuLine genau so wenig durch pflegerisch-fachliche<br />
Kriterien erklären wie ohne DokuLine, nur die Zeiterfassung selbst wird vereinfacht.<br />
DocuLine ist ein Beitrag <strong>zu</strong>r Zeiterfassung aber kein Beitrag <strong>zu</strong>r Erhöhung der Erklärung oder Begründung<br />
von Zeitvarianz, solange diese bei gleichen Tätigkeiten mindestens genauso hoch ist wie zwi-<br />
14
<strong>schen</strong> verschiedenen und damit auch kein Beitrag <strong>zu</strong>r Verbesserung der Validität eines Personalbemessungsinstruments,<br />
wenn es Erklärung und Begründung von Personalbedarf <strong>zu</strong>m Ziel hat und deshalb<br />
auf gar keinen Fall<br />
„per se (..) valide“(S.O.).<br />
(3) Fünf Schritte: Was der Einsatz Empirischer Methoden erforderte<br />
1. Erklärung des Personalbedarfs muss als empirische Fragestellung verstanden werden<br />
Ihr empirischer <strong>Gehalt</strong> resultiert aus dem Faktum, dass empirisch falsifizierbare Hypothesen formuliert<br />
werden können. Hypothesen <strong>zu</strong>r Prüfung von Systemen <strong>zu</strong>r Erklärung und Begründung müssen an<br />
Erfahrung scheitern können ansonsten sind Datenerhebungen irrelevant.<br />
Arbeitszeit ist und bleibt die <strong>zu</strong> erklärende Variable und wird nie selbst Klassifikationskriterium eines<br />
Systems sein, das als Ziel die Erklärung oder Begründung von Pflegebedarf verfolgt. Die Einzelleistungen<br />
mit Zeit sind kein Ersatz für eine wirkliche Handlungstheorie der Pflege, die die Basis für ein Messmodell<br />
sein muss.<br />
2. Testentwicklung testtheoriegeleitet<br />
Testentwicklung erfordert eine Entscheidung für einen testtheoreti<strong>schen</strong> Rahmen. Pflegebedarf als <strong>zu</strong><br />
messendes Merkmal variiert auch in kurzen Abständen. Das spricht für eine Abkehr von Rahmenkonzept<br />
der klassi<strong>schen</strong> Testtheorie und eine Hinwendung <strong>zu</strong> einem probabilisti<strong>schen</strong> Rahmenkonzept der<br />
Testentwicklung. Veränderungsmessung ist hierin besser möglich, weil eben nicht wie in der klassi<strong>schen</strong><br />
Testtheorie Merkmalskonstanz vorausgesetzt werden muss.<br />
Ein weiterer Vorteil eines probabilisti<strong>schen</strong> Testentwicklungsansatzes liegt im niedrigeren Skalenniveau<br />
der verwendbaren Daten.<br />
Die Konstruktvalidität einzelner Items und Skalenformen sind innerhalb des probabilisti<strong>schen</strong> Rahmens<br />
sehr exakt über das Rasch-Modell testbar, das einen eindeutigen Vergleich zwi<strong>schen</strong> theoretisch durch<br />
das Instrument postulierten und tatsächlich produzierten Daten <strong>zu</strong>ließe.<br />
15
3. Definition des Konstrukts<br />
Pflege reagiert auf Einschränkungen physisch-funktionaler Art und Einschränkungen in der Fähigkeit <strong>zu</strong><br />
sozialem Austausch. Eine wirkliche Handlungstheorie wäre Vorausset<strong>zu</strong>ng für die Definition des Konstrukts<br />
„Pflegebedarf“. Aktuell wird diese Leerstelle durch die normativen Ansätze überdeckt.<br />
4. Definition des Messmodells<br />
Das Messmodell sollte Zustandseinschät<strong>zu</strong>ngen und Leistungselemente enthalten. Dann kann sowohl<br />
eine Erklärung als auch eine Begründung von Pflegeleistungen über den Pflegebedarf angegangen<br />
werden.<br />
Eine grundsätzliche Abkehr von der Einzelleistungsperspektive wäre dabei sehr sinnvoll.<br />
Wenn <strong>zu</strong> unterscheidende Gesamtleistungsprofile klar sind, wäre der nächste Schritt die valide Klassifikation<br />
von Patienten<strong>zu</strong>ständen. Beide, Zustände wie Leistungsprofile, sollten dann gemeinsam <strong>zu</strong> typi<strong>schen</strong><br />
Fallgruppen <strong>zu</strong>sammengefasst werden. Die Fallgruppenbildung selbst kann dann über eine Verbindung<br />
von Cluster- und Regressionsanalysen erfolgen. Einen ersten derartigen Versuch haben wir in<br />
Ausschnitten bereits unternommen (vgl. Isfort, Brühl, Weidner 2004).<br />
5. Implementation<br />
Ein Vorgehen wie bei der Einführung der DRG wäre auch für die Einführung eines empiri<strong>schen</strong> Instruments<br />
<strong>zu</strong>r Erklärung von Pflegeleistungen und <strong>zu</strong>r Begründung über Pflegebedarf denkbar:<br />
Es könnten Basiswerte für Hauptgruppen von Fallbearbeitungen festgelegt und Fallgewichte <strong>zu</strong>r Differenzierung<br />
einzelner Fallgruppen ermittelt werden. Eine Angleichung würde dann nicht normativ durch<br />
eine Anpassung aller mit einem fertigen Instrument, sondern empirisch über die Implementation des<br />
Instruments mit <strong>zu</strong> ermittelnden Gewichtungsfaktoren erfolgen.<br />
Die Lösung des Problems der Pflegepersonalbemessung führt über eine Instrumentenentwicklung und -<br />
bewertung, die mit geeigneten empiri<strong>schen</strong> Techniken in ihrer Qualität an einer testbaren Erklärung und<br />
Begründung von Pflegeleistungen über Pflegebedarf <strong>zu</strong> orientieren ist. Es wäre deshalb sinnvoll, die<br />
vielfältigen Widerstände gegenüber einem konsequenten Einsatz empirischer Methoden <strong>zu</strong>r Instrumentenentwicklung<br />
und -bewertung <strong>zu</strong> überwinden.<br />
16
(4) LITERATUR<br />
BARTHOLOMEYCZIK, S., ABT-ZEGELIN, A. HUNSTEIN, D. (2002) Kann PLAISIR halten was es verspricht.<br />
Altenheim, 4/2002, S. 20 – 25<br />
BARTHOLOMEYCZIK, S., HUNSTEIN, D. (2000) Erforderliche Pflege - <strong>zu</strong> den Grundlagen einer Personalbemessung.PfleGe<br />
5.Jg, Nr. 4 S. 105 - 109<br />
BROSZIEWSKI, A, , BRÜGGER, U. (2001) Zur Wissenschaftlichkeit von Messinstrumenten im Gesundheitswesen:<br />
Am Beispiel der Methode LEP .Pflege; 14: 59-66, Hans Huber Bern<br />
Brühl A. (2004) Fallgruppen der Sozialarbeit (FdS®) als Antwort auf die Einführung der Diagnosis Related<br />
Groups in Akut-Krankenhäusern 243. S., Nomos-Verlag, Baden-Baden ISBN 3-8329-0488-<br />
3<br />
GENNRICH, R. (2000) Ergebnisse der wissenschaftlichen Begleitung des Verfahrens PLAISIR. PflegeGe<br />
5Jg., Nr. 4, S. 101 - 104<br />
ISFORT, M., BRÜHL A..,WEIDNER,F. (2004) Pflegerelevante Fallgruppen. ISBN 3-89993-107-6<br />
ISFORT, M. WEIDNER, F. Pflegequalität und Pflegeleistungen 1. Erster Zwi<strong>schen</strong>bericht <strong>zu</strong>r ersten Phase<br />
des Projektes „Entwicklung und Erprobung eines Modells <strong>zu</strong>r Planung und Darstellung von Pflegequalität<br />
und Pflegeleistungen“, Freiburg, Köln, 2002 (www.dip-home.de)<br />
ISFORT, M. WEIDNER, F. Pflegequalität und Pflegeleistungen 2. Zweiter Zwi<strong>schen</strong>bericht <strong>zu</strong>r zweiten<br />
Phase des Projektes „Entwicklung und Erprobung eines Modells <strong>zu</strong>r Planung und Darstellung<br />
von Pflegequalität und Pflegeleistungen“, Freiburg, Köln, 2002 (www.dip-home.de)<br />
KLUG E., IN : ISFORT, M. WEIDNER, F. Pflegequalität und Pflegeleistungen 2. Zweiter Zwi<strong>schen</strong>bericht <strong>zu</strong>r<br />
zweiten Phase des Projektes „Entwicklung und Erprobung eines Modells <strong>zu</strong>r Planung und Darstellung<br />
von Pflegequalität und Pflegeleistungen“, Freiburg, Köln, 2002 (www.dip-home.de), S.<br />
57<br />
KROMREY, H, (1991) Empirische Sozialforschung. Opladen, Leske + Budrich<br />
Wagner Medizinische Klassifikationen und Fallgruppensysteme – ein Überblick. Dieser Beitrag erschien<br />
erstmals in der Nr. 9/1999 des Schweizer Spital“ und wurde von Frau Dr. Wagner für diese<br />
Ausgabe des Bulletins SGMI-SSIM leicht überarbeitet (Die online Redaktion).www.sgmissim.ch/bulletin<br />
WESTERMANN, R. (1987) Wissenschaftstheoretische Grundlagen der experimentellen Psychologie. In:<br />
Lüer, G.(Hrsg.) Allgemeine experimentelle Psychologie (S. 5-42), Stuttgart, Fischer<br />
17
Dr. Albert Brühl, Sozialpsychologisches Institut Köln, Arnoldsstraße 31, D – 50679 Köln, E-mail:<br />
SPIKOELN@aol.com<br />
18