schen Gehalt zu bearbeiten - Kuratorium Deutsche Altershilfe

Institut: Sozialpsychologisches Institut Köln, SPI KÖLN 

Titel: Eine empirische Fragestellung, die nicht konsequent empirisch bearbeitet wird: 

Personalbedarfsbemessung in der Pflege 

Autor : Albert Brühl 

Zusammenfassung: 

Zur Personalbedarfsbemessung existiert aktuell kein empirisch entwickeltes, valides System, das den 

Personalbedarf in der Pflege erklären und begründen könnte. Alle Systeme, die das aktuell behaupten, 

setzen an die Stelle wirklich empirischer Arbeit einfach normative, fachlich untermauerte Annahmen. 

Personalbedarf wird somit behauptet und diese Behauptungen werden nicht anhand personenunabhängig 

prüfbarer Hypothesen getestet. Eine wirklich empirisch gehaltvolle Bearbeitung der Personalbedarfsbemessung 

in der Pflege erforderte: 

1. Das Thema „Erklärung und Begründung von Personalbedarf“ wirklich als Fragestellung mit empirischen 

Gehalt zu bearbeiten 

2. Eine Instrumententwicklung, die sich an einer Handlungs- und einer Testtheorie orientiert 

3. Eine empirisch gehaltvolle Definition des Konstrukts „Personalbedarf“ 

4. Die Definition eines Messmodells 

5. Die Implementation eines Verfahrens mit Bezug zur Qualität der produzierten Daten 

Rechtfertigungsdruck der Sozial- und Gesundheitsberufe erfordert in der Pflege eine empirisch gehaltvolle 

Bearbeitung gerade dieser Fragestellung. Die normativ behaupteten notwendigen Personalressourcen 

müssen zukünftig empirisch erklärt und begründet werden können. Dies wird wegen der Komplexität 

der Aufgabe noch lange ein Thema für die Pflegeforschung bleiben. 

Title: 

An empirical question which isn't processed consistently empirically: 

Manpower requirements assessment in the care. 

Summary: 

Not one system exists empirically developed, valide currently to the manpower requirements assessment 

which could explain and justify the manpower requirements in the care. 

All systems which claim this currently put acceptances to the place of really empirical work which are 

simply normative and supported technically. 

1

Manpower requirements are therefore claimed and these assertions aren't tested with objective testable 

hypotheses. 

A really empirically nutritious processing of the manpower requirements in the care required: 

1. An empirical definition of the topic 2. An action- and a test-theory 3. An empirical definition of the 

construct 4. The definition of a measuring model 5. The implementation of a method with reference to 

the quality of the produced data 

2

Inhaltsverzeichnis 

Einleitung 

(1) Ein gegenüber empirischen Methoden abgeschlossener Zugang zur Fragestellung ................................ S. 03 

(2) Einsatz empirischer Methoden in einer nicht empirisch verstandenen Fragestellung . ............................. S. 12 

(3) Fünf Schritte: Was der Einsatz empirischer Methoden erforderte.............................................................. S. 15 

(4) Literatur. ...................................................................................................................................................... S. 17 

Einleitung 

Die Bearbeitung der Aufgabe der Personalbedarfsbemessung wird in der Pflege immer noch durch 

einen nicht konsequent empirischen Zugang zu dieser empirischen Fragestellung behindert. Nirgends 

in der Pflege werden Methoden zur empirischen Entwicklung und Bewertung von entsprechenden Instrumenten 

wirklich konsequent eingesetzt. 

Erfahrungen aus dem Bereich Sozialer Arbeit zeigen, wie notwendig die Entwicklung von Klassifikationssystemen 

jenseits derer der Medizin im Gesundheitswesen ist. Die Entwicklung der Fallgruppen 

der Sozialarbeit (FdS®) (Brühl, 2004) ist durch eine konsequente Orientierung an empirisch gehaltvollen 

Hypothesen, empirischen Methoden und ebenso definierten Gütekriterien möglich gewesen. Das 

gleiche gälte auch für Entwicklungsarbeiten für Systeme zur Erklärung und Begründung von Zeit- und 

damit Personalbedarf in der Pflege. 

3

Dies wird im Folgenden in den ersten beiden Kapiteln erläutert und im dritten Kapitel werden zusammenfassend 

fünf Thesen zur konsequent empirischen Bearbeitung dieser empirischen Fragestellung 

formuliert. 

(1) Ein gegenüber empirischen Methoden abgeschlossener Zugang zur Fragestellung 

Erhebungsinstrumente zur Bemessung des Personalbedarfs werden in der Akut- wie auch der Altenpflege 

seit längerem eingesetzt. Einen sehr guten Überblick zu Leistungserfassungsinstrumenten liefern 

Isfort und Weidner (2001). Als Beispiele für aktuelle Instrumente mit Bezug zur Personalbemessung 

werden das Leistungserfassungssystem in der Pflege (LEP®) und das PLAISIER® (Planification 

informatisée des soins infirmiers requis)- Instrument herausgegriffen. 

Was ist das im Kern für eine Fragestellung, die mit Hilfe der oben genannten Instrumente bearbeitet 

wird? Zunächst einmal kann festgehalten werden, dass Daten produziert werden, die auch eine Bemessung 

des Personalbedarfs ermöglichen sollen. 

Es handelt sich hierbei also um eine empirische Fragestellung. Ob ein Instrument den Personalbedarf 

erklärt oder nicht, kann anhand konkreter Daten überprüft werden. Die Instrumente beanspruchen für 

sich alle empirischen Gehalt, der anhand definierter Kriterien der Objektivität, Validität und Reliabilität 

eindeutig personenunabhängig messbar wäre. 

Folgerichtig bestünde die Möglichkeit, die Konstruktion von derartigen Instrumenten auf der Basis empirischer 

Konstruktionsprinzipien für Erhebungsinstrumente zu gestalten und zwar angefangen vom 

grundlegenden Konstruktdefinitionen, dem Messmodell, Itemformulierungen, Itemselektionen, bis hin zu 

Validierungsstichproben zur Konstrukt- und zur kriterienbezogenen Validität. 

Auch eine Kritik der Instrumente könnte diesen Weg nehmen und von der Konstruktdefinition über das 

Messmodell, Itemformulierungen bis hin zur Itemselektion auf der Basis von geordneten Erfahrungen, 

also methodischer Datenerhebungen, die Eignung oder fehlende Eignung bestimmter Konstrukte, 

Messmodelle, einzelner Items bzw. ganzer Item-/Skalenarten oder Instrumente für den sehr konkreten 

Zweck der Personalbemessung schrittweise diskutieren. 

4

Wenn man sich aber die Konstruktion, Prüfung und auch die Kritik der beiden oben genannten Instrumentenbeispiele 

stellvertretend für das Vorgehen in dieser wichtigen Fragestellung ansieht, so spielen 

zentrale empirische Kriterien für ihre Kritik, Prüfung oder Konstruktion keine entscheidende Rolle. 

Auf der Seite der Instrumentenkonstrukteure und -befürworter äußert sich das in einer Art Immunisierungsstrategie 

gegenüber für das eigene Instrument möglicherweise ungünstiger Empirie und 

auf der Seite der Kritiker in einer empirisch nicht fundierten Kritik. 

Im Ergebnis stehen sich Diskussionspartner gegenüber, die die bei einer empirischen Fragestellung 

immer gegebene Verständigungs- und Entwicklungsebene konkreter empirischer Ergebnisse nicht 

mehr zur Verständigung und Entwicklung nutzen können. 

Hauptproblem ist die Tatsache, dass 

• keine empirisch gehaltvollen Hypothesen formuliert werden, die die Instrumentenqualität eindeutig 

testbar werden ließen, 

• Daten erhoben und Analysemethoden ohne klaren Hypothesentest eingesetzt werden, um empirische 

Ergebnisse je nach Bedarf interpretieren zu können, 

• in zentralen Fragen kriterienbezogener Validität (Erklärung von Pflegeleistungen) nicht veröffentlichte 

Untersuchungen als Beleg angeführt werden, ohne dass eine Wiederholung der Ergebnisse 

versucht wird, was nahe liegend wäre 

Beides, die Immunisierung der Instrumente gegenüber aussagekräftiger empirischer Überprüfung und 

die nicht-empirische Kritik bilden ein gegenüber hypothesentestender Empirie abgeschlossenes System 

und stabilisieren sich bei allen inhaltlichen Differenzen gegenseitig in ihren erkenntnistheoretischen 

Grundhaltung, die die Rolle von Theorien rationalistisch-idealistisch konzipiert: 

„Rationalisten (..) würden das Primat der Theorie über die Erfahrung betonen, beispielsweise indem sie 

darauf hinweisen, dass Beobachtungen und Experimente durch vorhandene Erwartungen, Vermutungen 

und Theorien angeregt werden und dass es keine voraussetzungs- oder theoriefreie Erfahrung 

gibt“ (..) 

5

„Idealisten (..) würden leugnen, dass eine (..) Theorie etwas tatsächlich Existierendes beschreibt, oder 

sie würden zumindest nicht annehmen wollen, dass jede Theorie als ein derartiger Beschreibungsversuch 

angesehen werden muss“ (Westermann, 1987, S. 6) 

Realismus und Empirie als Grundlage der Problembehandlung wären weitere denkbare erkenntnistheoretische 

Zugänge: 

„Für einen reinen Empiristen dürfte eine (..) Theorie nichts anderes sein als eine Zusammenfassung der 

in (..) Beobachtungen und Experimenten gesammelten, möglichst zuverlässigen Erfahrungen (..) 

Ein Realist würde in einer (..) Theorie zumindest einen Versuch sehen, einen Aspekt der Wirklichkeit 

abzubilden, d.h. also beispielsweise den tatsächlichen Aufbau und die tatsächliche Funktion des 

menschlichen Gehirns zu beschreiben“ (Westermann, 1987, S.6) 

Die Negierung der empirisch-realistischen Seite des z.B. „aus der Praxis für die Praxis“ entwickelten 

LEP® zeigt sich an der Stelle, an der das empirisch definierte, für diese Fragestellung zentrale Konstrukt 

des „Messens“ von den LEP® Entwicklern rational umdefiniert wird. Damit verliert es seine empirische 

Bedeutung und kann nicht zur Instrumentenentwicklung beitragen. 

Im Fall des LEP® ist eine „Messtheorie“ entwickelt worden, die in Anlehnung an Beobachtungen erster 

und zweiter Ordnung nach Luhmann ein 

„Messen erster Ordnung und ein Messen zweiter Ordnung“ (Brosziewski et al. 2001, S. 61) 

unterscheiden möchte: 

„Entscheidungen und Ausführungen, die sich von solchen - selten oder gar nicht quantifizierbaren - 

Maßstäben leiten lassen, wollen wir hier als Messen erster Ordnung bezeichnen“ (s.o.). 

Das Messen erster Ordnung ist immer abhängig von einer Verbindung mit bereits vorhandenen Maßstäben, 

die die Autoren als Soll-Größen bezeichnen. Das Messen erster Ordnung, wie die Autoren es 

6

definieren, berücksichtigt die Tatsache, dass bei einer Messung eines Konstrukts wie jenem des Personalbedarfs 

eine bereits vorvermessene Welt existiert, von der jedwedes weitere Messen abhängig ist. 

Das Messen erster Ordnung ist also kein Messen im Sinne der Zuordnung eines empirisch relationalen 

Systems zu einem numerisch relationalen, sondern verdeutlicht die Relevanz vorab bestehender Soll- 

Größen. 

Als Messen zweiter Ordnung 

„sollen Messungen gelten, die an solchen Messungen erster Ordnung anschließen (s.o.)“. 

Hier wird die Abhängigkeit eines jeden Messvorgangs, der sich nicht vollkommen personenunabhängiger 

Methoden bei der Definition des zu messenden Konstrukts bedienen kann, von eben jenen 

Konventionen zu Begriffen und Kategorien betont, auf die er sich bezieht. Dies ist eine Abhängigkeit, 

die jede Messung von Konstrukten wie „Intelligenz“, „Motivation“, „Einstellung“ oder eben auch 

„Personalbedarf“ kennzeichnet. 

In dem Augenblick, in dem mit der Messung eines derartigen Konstrukts eine Funktion verbunden wird, 

steht ein Außenkriterium der Güte einer Messung zur Verfügung. Dieses Außenkriterium ist dann immer 

personenunabhängig und unabhängig von Soll-Größen empirisch prüfbar. 

Beispiel: Soll ein Schulabschluss z.B. als Prädikator für das spätere Einkommen von Schülern dienen, 

kann klar festgestellt werden, wie gut ein Schulabschluss Einkommen vorhersagt. 

Das gleiche gilt auch für die Personalbemessungsinstrumente, bei denen die Aufklärung der für Patienten 

benötigten Arbeitszeit in ihrer Varianz bei bestehendem Pflegeangebot und damit die konkrete Stellenerklärung 

ein klar personenunabhängig zu erfassendes Außenkriterium bildet. 

Empirisch verstanden bedeutet Messen die 

7

„systematische Zuordnung einer Menge von Zahlen oder Symbolen zu den Ausprägungen einer Variablen 

(mithin auch zu den Objekten), und zwar so, dass die Relationen unter den Zahlenwerten den Relationen 

unter den Objekten entsprechen“ ( Kromrey, 1991, S. 168). 

In diesem Sinne versuchen sowohl das LEP® als auch das PLAISIR® Zahlen der Variablen „Personalbedarf“ 

zuzuordnen. Trotz aller Probleme, die ein solches Messen immer mit sich bringt, bleibt es ein 

Messen, für das entscheidend ist, mit welcher Validität und Reliabilität aufgrund der Zahlenunterschiede 

Aussagen über Merkmalsunterschiede gemacht werden können. 

Der Versuch, eine Art Messen zu definieren, dass nicht mehr den Messvorgang selbst fokussiert, sondern 

die Tatsache, das er auch in der Pflege mit nur personenabhängig zu operationalisierenden Kategorien 

stattfindet, macht aus dem Messvorgang eine selbständig nicht mehr aussagekräftige Zahlenproduktion. 

Das ist innerhalb der Logik des LEP® - Messmodells ja auch sinnvoll. Denn: 

Wenn alles Messen nur durch die Verbindung mit vorhandenen Maßstäben seine Bedeutung erhält, 

dann ist es konsequent, in der Frage der Zeitkalkulation direkt die Konvention an die Stelle des empirischen 

Messvorgangs selbst zu setzen. Dies geschieht beim letzten Schritt der „Messung“ sowohl beim 

LEP® als auch beim PLAISIR® durch die normative Zuordnung vorgegebener Zeitwerte zu Skalenausprägungen 

mit denen Leistungen unterschieden werden sollen. 

Die Erklärung von Zeitvarianz ist dann von vornherein kein messbares Gütekriterium dieser Instrumente 

mehr und der mit ihnen festgestellte Zeit- und damit Personalbedarf kann nie falsifiziert werden. 

Weil sie nicht falsifizierbar sind, handelt es sich beim Einsatz der Instrumente, den produzierten Daten 

zu ihrer Prüfung und ihrer Analyse bislang um ein gegenüber hypothesentestender Empirie abgeschlossenes 

System. 

Die Fragestellung selbst bleibt trotzdem aber eine empirisch-realistische. 

Für LEP® und PLAISIR® werden Zielgrößen auch eindeutig empirisch-realistisch definiert: 

„Der sich verschärfende Kostendruck auf die Leistungserbringer im Gesundheitswesen hat auch vor 

den Pflegenden nicht halt gemacht. Nur mit einem solchen Instrument („LEP“ Anm. d.Verf.) sind die 

8

Pflegenden in der Lage, mengen- und belastungsmässige Aspekte ihrer Arbeit auf eine Weise zu begründen, 

dass sie auch Gehör finden: mit Zahlen“ (Maeder et al. zit. n. Isfor,Weidner 2002, S. 19). 

Halten wir fest: Mengen und - sehr viel anspruchsvoller - auch belastungsmässige „Aspekte“ sollen mit 

Zahlen „begründet“ werden. 

Empirische Kriterien spielen bei der Konstruktion und Bewertung keine entscheidende Rolle, trotzdem 

sollen empirisch klar prüfbare Ziele erreicht werden. Hier klafft eine Differenz zwischen rationalem Anspruch 

und empirischer Wirklichkeit, die alle in der Pflege Daten produzierenden Instrumente im Rahmen 

von Versuchen der Personalbedarfsbemessung aufweisen. 

Auch für PLAISIR® wird eine empirische Zieldefinition gewählt, die wie beim LEP® eigentlich empirische 

Messoperationen erforderte: 

„Das System erlaubt also die Pflegeintensität der abhängigen Bewohner, die während unterschiedlich 

langer Zeit (viele bis zum Lebensende) in einer Einrichtung beherbergt werden, zu qualifizieren und zu 

quantifizieren“ (PLAISIR 93, S.2) 

Auch hier haben wir es mit einer Messung zu tun, bei der der Pflegeintensität als empirisch relationalen 

System die Skalenausprägungen im PLAISIR® und mit den hinterlegten Zeiten dann die notwendige 

Arbeitszeit als numerisch relationalem System zugeordnet wird. 

Auch hier werden Zeitbedarfe nicht wirklich empirisch gemessen, sondern normativ vorgegeben. Die 

Zeit ist Teil des Systems und kann deshalb als ein dem System immanentes Element niemals durch 

PLAISIER® erklärt werden. 

Empirisch hypothesentestende Datenanalysen werden als zentrale Kriterien zur Beurteilung der Güte, 

zur Weiterentwicklung oder gar zur Entwicklung von Instrumenten nicht genutzt. 

„Über die Auswahl der Variablen, ihre teststatistische Untersuchung, der Reliabilität und der Validität 

des Instruments liegen keine differenzierten Daten vor. LEP wurde vor allem aus der Praxis für die Pra- 

9

xis konzipiert und die Variablen sind demnach nicht mittels statistischer Verfahren ermittelt worden“ (..) 

An dieser Stelle wird deutlich, dass es im LEP vor allem darum geht, eine hohe Akzeptanz der Methode 

zu bewirken und so zu einer guten Datenqualität zu gelangen. (..) Die Zeitangaben, die den Variablen 

zugrunde liegen, entsprechen einer normativen Festsetzung einer nicht näher beschriebenen Expertengruppe. 

(..) Es gab in einzelnen Häusern in der Schweiz Untersuchungen bezüglich der Gegenüberstellung 

von LEP-Zeiten und Ist-Zeiten. Diese Untersuchungen sind allerdings nicht veröffentlicht und 

daher einer Analyse nicht zugänglich. (..) (Isfort, 2002. S. 23). 

Hauptgütekriterien wie die kriterienbezogene Validität als tatsächliche Aufklärung der Zeitvarianz oder 

Techniken zu ihrer Entwicklung sind in der Diskussion von Personalbemessunginstrumenten aktuell 

von vornherein ausgeschlossen. 

(2) Einsatz empirischer Methoden in einer nicht empirisch verstandenen Fragestellung 

Wenn eine empirische Fragestellung ohne empirisch gehaltvolle Hypothesen, mit nicht-empirisch konstruierten 

Instrumenten behandelt und dann trotzdem „evaluierende“ empirische Daten zur Güte der 

Instrumente erhoben werden, dann ist das von vornherein insgesamt nicht sinnvoll und kann es auch 

nicht in Ausschnitten werden. 

Dies sei beispielhaft an der Evaluation genannten „Einführung“ des PLAISIR® und später anhand der 

Prüfung der Soll-Zeiten des LEP® demonstriert. 

Als empirisches Gütekriterium wird in der Evaluation von PLAISIER® die Reliabilität des Instruments 

angesprochen, in einer Form, die wiederum der Behandlung dieser Frage in einem gegenüber Empirie 

abgeschlossenen nicht-empirischen System entspricht: 

„Die Bedenken, dass eine Evaluation durch einen internen Evaluator, also einen Beschäftigten der Einrichtung, 

andere Resultate erbringt als eine Erhebung durch einen externen, also nicht bei dem Träger 

Beschäftigten, wurden sehr ernst genommen, und es wurde eine ausgewiesene Pflegefachkraft verpflichtet, 

in einer Einrichtung eine begrenzte Zahl von so genannten Doppelevaluationen vorzunehmen. 

10

Hierbei soll nicht der Anschein erweckt werden, dass mit einer so geringen Fallzahl, es handelte sich 

um 65 BewohnerInnen zweier Wohnbereiche, das Verfahren als solches in Hinblick auf seine Reliabilität 

überprüft werden könnte und sollte. Dies wurde in Kanada schon ausreichend geprüft und war für 

die Entscheidung, dieses Verfahren zu erproben, von entscheidender Bedeutung“ (Gennrich, 2000, S. 

103). 

Die Reliabilität wird als empirisches Gütekriterium angesprochen, gleichzeitig aber ausgesagt, das sie 

in dieser Form gar nicht ausreichend untersucht werden könne und ja bereits ein Grund für die Auswahl 

des Instruments gewesen sei, weil sie ja schon ausreichend untersucht worden sei. 

Hier erfolgt keine hypothesengeleitete Testung von Reliabilität, sondern nur eine Wiederholung der 

Vorannahmen und eine Datenerhebung ohne Hypothese und damit ohne Ziel. 

Nachdem die Datenerhebung durch fehlende Hypothesen nicht auf ein definiertes prüfbares Ziel ausgerichtet 

war, ist keine eindeutige Datenanalyse mehr möglich. So schwanken die Bewertung des Methodeneinsatzes 

und die Analyse der Daten je nach Bedarf zwischen Marginalisierung und bedeutungsvoller 

Interpretation hin und her. 

Für eine Überprüfung der Vorannahmen zur Reliabilität soll die Fallzahl von 65 Fällen laut Gennrich von 

vornherein nicht ausreichen. 

Zur Bestätigung der erwünschten Aussage „dass die Ergebnisse beider EvaluiererInnen konvergent 

sind“ (s.o.) soll die gleiche Fallzahl aber ausreichen. 

Gennrich berichtet von Abweichungen zwischen den zwei geschulten EvaluatorInnen in der Größenordnung 

„eines Grades auf der Skala“ 

in verschiedenen Bereichen (vgl. Gennrich, 2000, S. 103). 

11

Zur Abschätzung der Übereinstimmungen werden die aus der Summation der den Skalenwerten zugeordneten 

Minutenwerte resultierenden Gesamtminutenwerte verglichen. 

Diese Gesamtminutenwerte resultieren aus der Zuordnung von Zeitwerten zu Skalenwerten und nicht 

auf der mehr oder minder großen Übereinstimmung in den aus den Einschätzungen resultierenden 

Skalenwerten der EvaluatorInnen selbst. 

Diese Analysen ermöglichen keine eindeutige empirische Beurteilung der Güte des Instruments, obwohl 

das möglich wäre. 

Irrelevante, weil nicht hypothesengeleitete empirische Datenanalysen passen gut in ein geschlossenes 

nicht empirisches System, weil man sich so immer wieder aussuchen kann, wie man empirische Ergebnisse 

so interpretiert, dass sie die eigenen rationalen Vorannahmen nicht falsifizieren. 

Das ist ungefähr genau so, wie wenn man ein Pferderennen so gestaltete, dass man es genau zu dem 

Zeitpunkt für beendet erklären und „gewonnen“ rufen könnte, wenn der eigene Favorit gerade vorne 

läge. Ohne definiertes, messbares Ziel gibt es kein richtiges Pferderennen und auch keine empirische 

Evaluation von Erhebungs-Instrumenten. 

Auch die Kritik des Plaisier®-Instruments wird nicht empirisch begründet. 

So wird im Kern angezweifelt, was die Konstrukteure des PLAISIR® behaupten: Dass das bio-psychosoziale 

Profil wirklich die Grundlage biete, um Pflegeaktionen zu überprüfen (vgl. Bartholomeyczik et al. 

2002, S. 23/24). 

Es werden dann inhaltlich rationale Wertediskussionen geführt, die sicher sinnvoll um empirische Hypothesentests 

bereichert werden könnten. 

Ohne empirische Hypothesentests stehen den wertsetzenden Aussagen der Kritiker 

12

„ Als besonders gravierend ist anzusehen, dass die Pflegeaktionen keinerlei Pflegemethoden erfassen, 

die gerade in der modernen Altenpflege eine große Rolle spielen und dringend gefördert werden müssen“ 

(Bartholomeyczik, 2002, S. 25) 

allein die wertsetzenden Aussagen der Befürworter gegenüber: 

„ Aus Sicht des Kuratoriums Deutsche Altershilfe erfüllt das Verfahren PLAISIR alle wesentlichen Voraussetzungen, 

die an ein zeitgemäßes Verfahren zur Bestimmung der erforderlichen Pflegezeit- und 

des Personalbedarfes gestellt werden müssen“ (Gennrich 2000, S. 104). 

Im Fall des LEP® liegt als empirische Prüfung eine Gegenüberstellung von postulierten LEP®-Zeiten 

und tatsächlich gemessenen Echt-Zeiten für einzelne Items vor, die bislang keine Konsequenzen für die 

im Instrument verwandte Form der Skalierung hatte. 

Bei der Gegenüberstellung von Echt- und LEP®-Zeiten zeigen sich genau die Schwierigkeiten, die für 

den Einsatz empirischer Methoden in einem geschlossenen nicht empirischen System kennzeichnend 

sind. Es ist unmöglich die Ergebnisse im Anschluss an ein Forschungsprojekt auch für eine Instrumentenweiterentwicklung 

zu nutzen, wenn das nicht empirisch konstruierte Instrument bereits fertig ist und 

seine Akzeptanz im Feld das Hauptqualitätskriterium darstellt. 

Für das LEP sind Werte für die Tätigkeit „Mobilisation“ gemessen worden. Sie wurden den Minutensollwerten 

des LEP für die einzelnen Handlungen gegenübergestellt (vgl. Isfort, Weidner, 2002, S.62, 

N=1808 Einzelhandlungen): 

Tätigkeit LEP-Soll-Zeit Ist-Zeit-Mittelwert 

Mobilisation einfach 5 3,23 

Mobilisation wenig aufwendig 15 5,95 

Mobilisation aufwendig 30 7,64 

Mobilisation sehr aufwendig 60 8,14 

13

Von einer validen Differenzierung von Pflegeleistungen durch die Kategorien „einfach“ bis „aufwendig“ 

auszugehen, ist nicht sinnvoll. 

Mit dem Instrument zur Zeiterfassung „DocuLine“ wird das einzelleistungsbezogene Messmodell mit der 

einfachen Skalierungen trotz seiner offensichtlichen Mängel weiter beibehalten. Doculine bietet eine 

technische Lösung, um einzelne Leistungen zeitbezogen direkt zu erfassen. 

Das Instrument „Dokuline“ zeigt, dass die Fragestellung der Personalbedarfsbemessung ganz grundlegend 

nicht wirklich als empirische Messoperation verstanden wird, selbst wenn viele Daten produziert 

werden: 

„Die klassischen teststatistischen Angaben zur Objektivität, Validität und Reliabilität spielen bei diesem 

Ist-Daten basierten Ansatz keine Rolle, bzw. es handelt sich per se um objektive, valide und reliable 

Daten für die jeweilige Einrichtung“ (Esther Klug, 2002, S.57) 

Das ist kein empirisches Verständnis von Personalbemessung, sondern ein empiristisches, bei dem 

Pflegeleistung das ist, was mit dem Instrument gemessen wird. Wenn Ist-Zeiten gemessen werden, so 

müssen die auf eine Tätigkeit bezogen werden. Diese Tätigkeit ist im Dokuline-instrument hinterlegt. 

Gemessen wird dann die Zeit, die vom Beginn bis zum Ende der Tätigkeit verstreicht. 

Wenn jetzt die Exaktheit der Zeitmessung in den Vordergrund gestellt wird, ohne das die Angemessenheit 

der zugehörigen Unterscheidungen verschiedener Tätigkeiten und die Angemessenheit 

der Abstufungen der Komplexitätsgrade der Tätigkeiten im Blick bleibt, dann wird die Zeit zum alleinig 

eindeutigen Kriterium der Unterscheidung von Leistungen. 

Zeiten werden bei gleichen Tätigkeiten und zwischen verschiedenen Tätigkeiten variieren. 

Zeitvarianz bei gleichen Tätigkeiten kann mit DokuLine genau so wenig durch pflegerisch-fachliche 

Kriterien erklären wie ohne DokuLine, nur die Zeiterfassung selbst wird vereinfacht. 

DocuLine ist ein Beitrag zur Zeiterfassung aber kein Beitrag zur Erhöhung der Erklärung oder Begründung 

von Zeitvarianz, solange diese bei gleichen Tätigkeiten mindestens genauso hoch ist wie zwi- 

14

schen verschiedenen und damit auch kein Beitrag zur Verbesserung der Validität eines Personalbemessungsinstruments, 

wenn es Erklärung und Begründung von Personalbedarf zum Ziel hat und deshalb 

auf gar keinen Fall 

„per se (..) valide“(S.O.). 

(3) Fünf Schritte: Was der Einsatz Empirischer Methoden erforderte 

1. Erklärung des Personalbedarfs muss als empirische Fragestellung verstanden werden 

Ihr empirischer Gehalt resultiert aus dem Faktum, dass empirisch falsifizierbare Hypothesen formuliert 

werden können. Hypothesen zur Prüfung von Systemen zur Erklärung und Begründung müssen an 

Erfahrung scheitern können ansonsten sind Datenerhebungen irrelevant. 

Arbeitszeit ist und bleibt die zu erklärende Variable und wird nie selbst Klassifikationskriterium eines 

Systems sein, das als Ziel die Erklärung oder Begründung von Pflegebedarf verfolgt. Die Einzelleistungen 

mit Zeit sind kein Ersatz für eine wirkliche Handlungstheorie der Pflege, die die Basis für ein Messmodell 

sein muss. 

2. Testentwicklung testtheoriegeleitet 

Testentwicklung erfordert eine Entscheidung für einen testtheoretischen Rahmen. Pflegebedarf als zu 

messendes Merkmal variiert auch in kurzen Abständen. Das spricht für eine Abkehr von Rahmenkonzept 

der klassischen Testtheorie und eine Hinwendung zu einem probabilistischen Rahmenkonzept der 

Testentwicklung. Veränderungsmessung ist hierin besser möglich, weil eben nicht wie in der klassischen 

Testtheorie Merkmalskonstanz vorausgesetzt werden muss. 

Ein weiterer Vorteil eines probabilistischen Testentwicklungsansatzes liegt im niedrigeren Skalenniveau 

der verwendbaren Daten. 

Die Konstruktvalidität einzelner Items und Skalenformen sind innerhalb des probabilistischen Rahmens 

sehr exakt über das Rasch-Modell testbar, das einen eindeutigen Vergleich zwischen theoretisch durch 

das Instrument postulierten und tatsächlich produzierten Daten zuließe. 

15

3. Definition des Konstrukts 

Pflege reagiert auf Einschränkungen physisch-funktionaler Art und Einschränkungen in der Fähigkeit zu 

sozialem Austausch. Eine wirkliche Handlungstheorie wäre Voraussetzung für die Definition des Konstrukts 

„Pflegebedarf“. Aktuell wird diese Leerstelle durch die normativen Ansätze überdeckt. 

4. Definition des Messmodells 

Das Messmodell sollte Zustandseinschätzungen und Leistungselemente enthalten. Dann kann sowohl 

eine Erklärung als auch eine Begründung von Pflegeleistungen über den Pflegebedarf angegangen 

werden. 

Eine grundsätzliche Abkehr von der Einzelleistungsperspektive wäre dabei sehr sinnvoll. 

Wenn zu unterscheidende Gesamtleistungsprofile klar sind, wäre der nächste Schritt die valide Klassifikation 

von Patientenzuständen. Beide, Zustände wie Leistungsprofile, sollten dann gemeinsam zu typischen 

Fallgruppen zusammengefasst werden. Die Fallgruppenbildung selbst kann dann über eine Verbindung 

von Cluster- und Regressionsanalysen erfolgen. Einen ersten derartigen Versuch haben wir in 

Ausschnitten bereits unternommen (vgl. Isfort, Brühl, Weidner 2004). 

5. Implementation 

Ein Vorgehen wie bei der Einführung der DRG wäre auch für die Einführung eines empirischen Instruments 

zur Erklärung von Pflegeleistungen und zur Begründung über Pflegebedarf denkbar: 

Es könnten Basiswerte für Hauptgruppen von Fallbearbeitungen festgelegt und Fallgewichte zur Differenzierung 

einzelner Fallgruppen ermittelt werden. Eine Angleichung würde dann nicht normativ durch 

eine Anpassung aller mit einem fertigen Instrument, sondern empirisch über die Implementation des 

Instruments mit zu ermittelnden Gewichtungsfaktoren erfolgen. 

Die Lösung des Problems der Pflegepersonalbemessung führt über eine Instrumentenentwicklung und - 

bewertung, die mit geeigneten empirischen Techniken in ihrer Qualität an einer testbaren Erklärung und 

Begründung von Pflegeleistungen über Pflegebedarf zu orientieren ist. Es wäre deshalb sinnvoll, die 

vielfältigen Widerstände gegenüber einem konsequenten Einsatz empirischer Methoden zur Instrumentenentwicklung 

und -bewertung zu überwinden. 

16

(4) LITERATUR 

BARTHOLOMEYCZIK, S., ABT-ZEGELIN, A. HUNSTEIN, D. (2002) Kann PLAISIR halten was es verspricht. 

Altenheim, 4/2002, S. 20 – 25 

BARTHOLOMEYCZIK, S., HUNSTEIN, D. (2000) Erforderliche Pflege - zu den Grundlagen einer Personalbemessung.PfleGe 

5.Jg, Nr. 4 S. 105 - 109 

BROSZIEWSKI, A, , BRÜGGER, U. (2001) Zur Wissenschaftlichkeit von Messinstrumenten im Gesundheitswesen: 

Am Beispiel der Methode LEP .Pflege; 14: 59-66, Hans Huber Bern 

Brühl A. (2004) Fallgruppen der Sozialarbeit (FdS®) als Antwort auf die Einführung der Diagnosis Related 

Groups in Akut-Krankenhäusern 243. S., Nomos-Verlag, Baden-Baden ISBN 3-8329-0488- 

3 

GENNRICH, R. (2000) Ergebnisse der wissenschaftlichen Begleitung des Verfahrens PLAISIR. PflegeGe 

5Jg., Nr. 4, S. 101 - 104 

ISFORT, M., BRÜHL A..,WEIDNER,F. (2004) Pflegerelevante Fallgruppen. ISBN 3-89993-107-6 

ISFORT, M. WEIDNER, F. Pflegequalität und Pflegeleistungen 1. Erster Zwischenbericht zur ersten Phase 

des Projektes „Entwicklung und Erprobung eines Modells zur Planung und Darstellung von Pflegequalität 

und Pflegeleistungen“, Freiburg, Köln, 2002 (www.dip-home.de) 

ISFORT, M. WEIDNER, F. Pflegequalität und Pflegeleistungen 2. Zweiter Zwischenbericht zur zweiten 

Phase des Projektes „Entwicklung und Erprobung eines Modells zur Planung und Darstellung 

von Pflegequalität und Pflegeleistungen“, Freiburg, Köln, 2002 (www.dip-home.de) 

KLUG E., IN : ISFORT, M. WEIDNER, F. Pflegequalität und Pflegeleistungen 2. Zweiter Zwischenbericht zur 

zweiten Phase des Projektes „Entwicklung und Erprobung eines Modells zur Planung und Darstellung 

von Pflegequalität und Pflegeleistungen“, Freiburg, Köln, 2002 (www.dip-home.de), S. 

57 

KROMREY, H, (1991) Empirische Sozialforschung. Opladen, Leske + Budrich 

Wagner Medizinische Klassifikationen und Fallgruppensysteme – ein Überblick. Dieser Beitrag erschien 

erstmals in der Nr. 9/1999 des Schweizer Spital“ und wurde von Frau Dr. Wagner für diese 

Ausgabe des Bulletins SGMI-SSIM leicht überarbeitet (Die online Redaktion).www.sgmissim.ch/bulletin 

WESTERMANN, R. (1987) Wissenschaftstheoretische Grundlagen der experimentellen Psychologie. In: 

Lüer, G.(Hrsg.) Allgemeine experimentelle Psychologie (S. 5-42), Stuttgart, Fischer 

17

Dr. Albert Brühl, Sozialpsychologisches Institut Köln, Arnoldsstraße 31, D – 50679 Köln, E-mail: 

SPIKOELN@aol.com 

18

schen Gehalt zu bearbeiten - Kuratorium Deutsche Altershilfe

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?