Praxisleitfaden QualitÃ¤t - M-QM

Praxisleitfaden Qualität 

Walter Jahn, Lorenz Braun 

Prozessoptimierung mit multivariater Statistik in 150 

Beispielen 

ISBN 3-446-40616-6 

Leseprobe 

Weitere Informationen oder Bestellungen unter 

http://www.hanser.de/3-446-40616-6 sowie im Buchhandel

5 Qualität in der Fertigung 

Dieses Kapitel ist zweifelsfrei für den Nutzer aus der Fertigung das wichtigste, da in diesem 

grundsätzliche Fragen, wie z. B. 

• Was ist Qualität? 

• Was besagen die Bezeichnungen Produktqualität, Prozessqualität und Lieferantenqualität? 

• Wie kann die Qualität für Vergleiche messbar gemacht werden? 

• Wie können Sie die Kundenanforderungen spezifizieren? 

• Was ist Fähigkeit? 

• Wie können Sie die Fähigkeit ermitteln? 

• Wie können Sie aufgrund der Fähigkeiten entscheiden? 

• Welche Entscheidungsmöglichkeiten haben Sie? 

• Was heißt Prozessverbesserung? 

• Was ist eine Prozessgleichung? 

• Wie können Sie mit der Prozessgleichung die Prozesse steuern? 

• Wie können Sie die Ergebnisse der statistischen Prozessanalyse und Steuerung der Prozesse 

in die Praxis überführen? 

beantwortet werden. 

Zur Beantwortung dieser und zahlreicher anderer Fragen müssen wir strukturiert vorgehen, 

um die komplizierte Materie für Sie so aufzubereiten, damit Sie die Methoden zur notwendigen 

Lösung Ihrer betrieblichen Probleme anwenden und vor allem deren Ergebnisse zum Nutzen 

für das Unternehmen interpretieren können. 

5.1 Was ist ein Produkt ? 

Das Ergebnis jeder Tätigkeit und jedes (Herstellungs- oder Dienstleistungs-) Prozesses ist ein 

Produkt. 

Das Produkt kann z. B. ein Nahrungsmittel sein, oder es ist ein Teil für die Weiterverwendung 

in umfassenderen Produkten, wie z. B. der Motor für ein Auto usw. Das Produkt kann aber 

auch eine Dienstleitung, z. B. eine Taxi-Fahrt oder die Bestellung von Materialien für die Herstellung, 

der Vertrieb der Produkte usw. sein. 

Jedes Produkt wird auf einem Markt realisiert, d. h. angeboten und gekauft. Aber damit ein 

Produkt gekauft wird, muss es Anforderungen von Kunden erfüllen. Diese Anforderungen werden 

häufig durch Eigenschaften charakterisiert, so z. B. muss ein PKW modern sein, geringen 

Benzinverbrauch haben, ständig einsatzbereit sein. Die Eigenschaften werden z. B. auch für 

Produktweiterentwicklungen durch die WAS Fragen ermittelt.

156 5 Qualität in der Fertigung 

Eigenschaften sind aber häufig nicht oder nicht einfach zu messen. Daher müssen die Eigenschaften 

parametrisiert werden. Oft sind die Parameter physikalisch, chemisch, biologisch oder 

ökonomisch stetig messbare Variablen. Der Spritverbrauch beim PKW ist ein physikalisch 

messbarer Parameter. Die Eigenschaft „modern“ muss aber erst noch in solche Parameter 

übersetzt werden. Modern könnte sich auf die Elektronik im PKW beziehen und die Motorsteuerung 

oder die Klimaanlage betreffen. Diese Aggregate können dann durch eine Vielzahl 

von Variablen parametrisiert werden. 

Die Ausprägungen der Variablen, d. h. welche Werte sollen die Variablen annehmen, werden 

unter der Frage WIE z. B. bei QFD charakterisiert. 

Die immense Vielzahl verschiedener Produkte, die unterschiedlichen Anforderungen an die 

Produkte und die zahlreichen Weiterverwendungen der Produkte zwingen uns dazu, eine 

Ordnung in diese riesige Menge und den unterschiedlichen Sprachgebrauch zu bringen. 

Daher vereinbaren wir, dass ein Produkt durch m, m ≥ 1 Produktvariable Y 1 , …, Y m beschrieben 

wird. 

Die Produktvariablen sind Realisierungen von Zufallsgrößen. Das wird deutlich, wenn wir uns 

ein konkretes Produkt anschauen. 

Beispiel 5.1.1: Ziegelsteinherstellung. Nicht unabhängige Zufallsgrößen 

Ein Ziegelstein besteht aus einer Mischung aus Lehm, Kalk, Feldspat und gewissen Additiven. 

Die Verteilung der Komponenten wird auch nach sehr langer Mischzeit nicht völlig 

homogen sein. 

Die geformten Ziegelsteine werden in Stapeln auf Paletten geschichtet und langsam durch 

einen Brennofen gefahren. 

Das heterogene Gemisch aus verschiedenen Komponenten, die unterschiedliche Lage eines 

Ziegelstein im Stapel, die unterschiedlich lange Dauer der Ofenreise und die damit verbundene 

unterschiedliche Temperaturkapazität pro Stein führen dazu, dass die Produktvariablen 

des Ziegelsteins, wie die Bruchfestigkeit, die geometrischen Abmessungen, das Gewicht usw. 

selbst für eine „gleichbehandelte“ Charge in gewissen Grenzen schwanken. Die Messwerte 

für die Produktvariablen sind zufallsbehaftet, d. h. die Messwerte haben einen mehr oder 

weniger großen zufälligen Fehler. 

Die Produktvariablen sind nicht unabhängig voneinander, sondern sie sind mehr oder weniger 

stark miteinander korreliert. Diesen Sachverhalt können Sie sich anhand der Abbildung 5.1.1 

verdeutlichen. 

r 12 

Y 2 ±Δ Y 2 

Y 1 

r 23 

r 13 

Y 3 

Abb. 5.1.1: Korrelative Abhängigkeiten für Produktvariable

5.1 Was ist ein Produkt? 

157 

Diese Abbildung zeigt Ihnen, dass sich z. B. die Veränderung des Wertes von Y 2 um den Betrag 

ΔY 2 sowohl auf Y 1 als auch auf Y 3 auswirken kann. Die „Größe“ dieser Abhängigkeiten, 

besser der Grad der linearen Abhängigkeiten zwischen jeweils zwei Zufallsvariable wird durch 

den Korrelationskoeffizienten r jk , j, k = 1,2,3 gemessen. Das sind dimensionslose Zahlen, die 

zwischen –1 und +1 liegen. Sind zwei Variablen unabhängig voneinander, dann ist der Korrelationskoeffizient 

gleich null. 

Beispiel 5.1.2: Dämpfung der Motorvibration. Abhängigkeiten 

Für die Dämpfung der Motorvibration werden Hydrolager verwendet. An diesem Produkt 

werden viele Produktvariablen gemessen. Wir wollen hier nur die beiden Produktvariablen 

Y 1 = dynamische Steifigkeit [N/mm] und Y 2 = Phasenverschiebung [Φ] betrachten Mit den 

Daten aus einer großen Stichprobe wurde die dreidimensionale Häufigkeitsverteilung in 

Abbildung 5.1.2 gezeichnet. 

Was können Sie aus der Abbildung 5.1.2 ablesen? 

• 

• 

• 

Die Werte für die beiden Produktvariable streuen sehr stark. Das ist ein Ausdruck für 

den zufälligen Charakter der Produktvariablen. 

Es gibt viele Ausreißer. 

Die Grundfläche der Häufigkeitsverteilung, d. h. die Punktwolke für die Messwertpaare, 

ausgedrückt durch das Streudiagramm in Abbildung 5.1.3, ist offensichtlich nicht kreisförmig, 

sondern elliptisch umrissen. Das zeigt Ihnen, dass die beiden Produktvariablen 

nicht unabhängig voneinander sind. 

Abb. 5.1.2: Dreidimensionale Häufigkeitsverteilung für zwei Produktvariablen eines Hydrolagers


250 

CDYN 

200 

150 

100 

0 10 20 30 40 50 60 

PHASE 

Abb. 5.1.3: Streudiagramm für die hydraulischen Motorlager 

Aus Abbildung 5.1.2 und Abbildung 5.1.3 müssen Sie die Schlussfolgerungen ziehen, 

dass 

• die Daten aufbereitet werden müssen; Ausreißer sind zu erkennen und zu eliminieren, 

• jeder Prozess zu Herstellung eines Produktes gesteuert werden muss, um die vielen 

Ausreißer zu vermeiden und die Streuung zu reduzieren. 

Für die Steuerung benötigen Sie Zielwerte und zulässige Streuintervalle für die Produktvariablen 

und eine Prozessgleichung. 

5.2 Wie können Sie entscheiden, ob Ihre Prozesse in 

Ordnung sind oder verbessert werden müssen? 

Die konkreten Produktdarstellungen zeigen Ihnen, dass 

• jedes Produkt durch die Angabe von Sollwerten und Toleranzgrenzen für alle nicht unabhängigen 

Produktvariablen präzisiert werden muss – man spricht in diesem Zusammenhang 

von der Spezifizierung aller relevanten Kundenanforderungen und 

• ein Kriterium gesucht wird, nach dem entschieden wird, ob ein Produkt simultan alle 

relevanten Kundenanforderungen erfüllt oder der Prozess verbessert werden muss.

5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind? 

159 

5.2.1 Was ist ein modernes Produktaudit ? 

Audits im Qualitätsmanagement sind durch die Unternehmensleitung initiierte, systematische 

und unabhängige Qualitätsprüfungen, um festzustellen, ob die qualitätsbezogenen Tätigkeiten 

den geplanten Anforderungen entsprechen, ob diese Anforderungen tatsächlich verwirklicht 

sind und ob sie geeignet sind, die Ziele zu erreichen (Linß [2005, 393]). Nach Linß wird in 

Systemaudits, Produktaudits und Prozessaudits unterschieden. 

Durch das Produktaudit soll nach ISO 9000: 2000 ff. und Linß [2004, 394] die Übereinstimmung 

der Ausführung von Produkten mit den festgelegten Qualitätsforderungen untersucht 

und beurteilt werden. 

Die beiden Seiten eines Audits, nämlich die 

• 

• 

Anforderungen und 

der Istzustand eines Produktes 

müssen quantifiziert werden. Das Gleiche gilt für die Beurteilung der Übereinstimmung, damit 

z. B. Übereinstimmungen verglichen werden können, um festzustellen, ob Verbesserungsmaßnahmen 

wirksam waren. Zu diesem Zweck zählen wir zum „modernen“ Produktaudit 

die Aktivitäten: 

1. Zusammenstellung der (ex- und/oder internen) Kundenanforderungen zu einem Kunden- 

Anforderungs-Profil (KAP), 

2. Parametrisierung der Kundenanforderungen durch die Produktvariablen, 

3. Datensammlung für alle Produktvariablen, 

4. Zusammenstellung der Sollwerte und Toleranzgrenzen; falls erforderlich muss die statistische 

Tolerierung für alle nicht unabhängigen Produktvariablen durchgeführt werden, 

5. Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen mit 

6. korrigierten univariaten und multivariaten Prozessfähigkeitsindizes, 

7. Entscheidung aufgrund der Indizes für 

– Prozessverbesserung im Sinne der 

– 

– 

– 

· 

· 

Reduktion der Variabilität mindestens einer Produktvariablen, 

Übereinstimmung der Mittel- mit den Sollwerten, 

neue statistische Tolerierung, 

Kontrolle des Prozesses mit den uniund/oder multivariaten Kontrollkarten, 

Investitionen in Maschinen, Anlagen, Mitarbeiter, Methodik usw. 

5.2.1.1 Was beinhaltet das Kunden-Anforderungs-Profil (KAP)? 

Ein (in- oder externer) Kunde, der eine Dienstleistung oder das materielles Produkt eines Vorläuferprozesses 

benötigt, stellt Anforderungen an das Produkt und seine zu gewährleistenden 

Funktionen. Die Anforderungen werden häufig in Form von Eigenschaften formuliert. 

Über die Kundenanforderungen wird das Produkt definiert.


Beispiel 5.2.1: Kunststoffscheiben. Definition von Kundenanforderungen 

Problem: 

Die Glasscheiben in einem PKW sollen durch Kunststoffscheiben auf Basis von Polycarbonat 

mit Hartbeschichtung ersetzt werden, um das 

• 

• 

• 

zukünftige Design von Scheiben und Karosserie durch ganzheitliches Design und 

Konstruktion zu revolutionieren. 

die Sicherheitsaspekte zu verbessern, 

das Gewicht zu reduzieren usw. 

Aus der Analyse der Marktsituation sollen unter Beachtung der KAP der europäischen 

Automobilhersteller nachfolgenden Studien 

1. über die Machbarkeit und 

2. internationalen Verfügbarkeit der Prozesse 

erarbeitet werden. 

Hierbei sollen die globalen Ziele 

• 

• 

• 

• 

• 

• 

• 

• 

• 

Verbesserung der Sicherheit gegen Einbruch, 

Reduktion des Gewichts, 

Verbesserung des Komfort (Geräuschdämpfung, thermische Eigenschaften) 

Verbesserung des Schutzes gegen Unfälle, Überfälle usw., 

Erhöhung der Verschleißfestigkeit (Kratzfestigkeit, …) 

Verbesserung der Formgebung/Design und Konstruktion, 

Erhaltung der optischen Eigenschaften des Glases, 

Erhöhung der Wirtschaftlichkeit bei den Herstellern und 

Verbesserung der Instandhaltungsfreundlichkeit 

verfolgt werden. 

Die globalen Ziele werden auf geforderte Eigenschaften und auch schon geforderte Parameter 

zurückgeführt und im Kunden-Anforderungs-Profil (KAP) zusammengefasst. 

Unter einem Parameter wollen wir hier eine messbare Variable verstehen. 

Zu den Eigenschaften gehören z. B. 

• 

• 

die Zähigkeit 

diese kann parametrisiert werden durch die physikalischen Variablen 

– 

– 

– 

– 

Biegefestigkeit, 

Schlagfestigkeit, 

Bruchfestigkeit, 

E-Modul 

• Beständigkeit der Oberfläche nach dem Verkleben, 

– 

– 

Temperaturbereich, 

Medien,


161 

– 

– 

– 

Luftfeuchte, 

NaCl bzw. CaCl-Lösungen, 

Tenside 

• Verformbarkeit, 

– 

– 

– 

– 

Spannungs- Verformungs- Verhalten mit der 

Normalspannung, 

Tangentialspannung, 

Scherspannung 

• optische Eigenschaften, 

– 

– 

– 

– 

– 

– 

Trübung 

Lichtreflektion, 

Lichttransmission, 

Verzerrung, 

Brechungsindex, 

Lichtdurchlässigkeit 

• Oberflächeneigenschaften 

– 

– 

– 

– 

– 

– 

– 

Farbe 

Verfärbung, 

Schlierenbildung, 

Glanz, 

Beschichtungsdefekte, 

Abriebfestigkeit, 

Kratzfestigkeit 

• Thermisches Verhalten 

– 

– 

– 

– 

Wärmedämmung, 

Wärmedurchgang, 

Wärmeausdehnung, 

Überwölbung 

Anforderungen in Parameterform sind z. B. 

• 

• 

• 

• 

• 

Steifigkeit, 

Gewicht, 

Lebensdauer, 

geometrische Maße, wie z. B. Scheibendicke, Kantenrundung, 

Oberflächenspannung, 

und vieles mehr. 

Die Parametrisierung führt zur Benennung der Produktvariablen. Hier einige Beispiele: 

Y 1 = Biegefestigkeit 

Y 2 = Bruchfestigkeit (gleiche Bruchfestigkeit über einem großen Temperaturbereich) 

Y 3 = Formbarkeit 

Y 4 = Lichtdurchlässigkeit (Transparenz) 

Y 5 = Elastizitätsmodul 

Y 6 = Einbaustabilität 

Y 7 = Geräuschdämpfung


Y 8 = Kratzfestigkeit 

Y 9 = Witterungsbeständigkeit 

Y 10 = Korrosionsbeständigkeit 

Y 11 = Gewicht 

Y 12 = Reflexion der Wärmestrahlung 

Y 13 = Wirtschaftlichkeit, Preis 

Y 14 = Abriebfestigkeit 

Y 15 = optische Verzerrung 

und viele mehr. 

Die Produktvariable sind mit Sicherheit nicht unabhängig voneinander. 

Alle Eigenschaften müssen parametrisiert werden. Das ist bisher nicht gelungen. Ursachen 

hierfür sind: 

• 

• 

• 

• 

• 

• 

• 

fehlende Gewissheit über die Vollständigkeit der Eigenschaften und damit der Parametrisierung, 

fehlende Invarianz der vom Kunden beschriebenen Eigenschaften, 

mehrere Eigenschaften sind Funktionen von diversen anderen Parametern. 

Diese Funktionen sind mitunter kompliziert. 

Keine klare Trennung von Eigenschaften, Parametern und deren Prüfungen. 

Die bisher parametrisierten Eigenschaften sind unvollständig spezifiziert. 

Die Sollwerte liegen z. T. als Bereiche und nur selten als Zahlen vor, Toleranzgrenzen fehlen 

grundsätzlich. 

Dieses Beispiel demonstriert, das die Zusammenstellung des KAP eine wichtige und auch 

komplizierte Aufgabe ist, an der verschiedene Experten zusammenarbeiten sollten. 

5.2.1.2 Wie kann man die parametrisierten Kundenanforderungen statistisch 

tolerieren? 

Bei der Definition des Produktaudits wird auf die beiden Seiten, nämlich die 

• 

• 

Anforderungen und 

den Istzustand eines Produktes 

hingewiesen. Hier wollen wir uns damit befassen, wie 

• 

• 

gegebene CAD Toleranzen zu überprüfen sind oder 

diese beim Fehlen von Sollwerten und Toleranzgrenzen berechnet werden können. 

Die Frage der statistischen Tolerierung ist bedeutsam, da die Produktvariablen in der Regel 

nicht unabhängig, sondern im Gegenteil sehr häufig sehr stark miteinander korreliert sind. Die 

meisten – bisher bekannten – statistischen Tolerierungsverfahren basieren auf dem Faltungssatz 

für Zufallsgrößen. Dieser setzt die Unabhängigkeit der Zufallsgrößen voraus. Wie wir bei der 

Korrelationsanalyse im Abschnitt 5.6 sehen, wird die Straffheit einer Abhängigkeitsstruktur 

durch die Determinante der Korrelationsmatrix beurteilt.


163 

Bei einem Autobauer sollten für den Karosseriebau die Toleranzen vieler Maße überprüft 

werden, da es Probleme bei der Montage gab. Zur Auswahl standen 

• 

• 

das Maßkettenkonzept nach dem Faltungssatz und 

die statistische Tolerierung von Jahn. 

Als Entscheidungskriterium wählte ich die Determinante der Korrelationsmatrix. 

Für ca. 60 Produktvariable galt Det(R YY ) = 1.28 10 –135 . Dieser Wert liegt sehr viel näher an 

der Null als an der für das Maßkettenkonzept geforderten 1! Das Maßkettenkonzept muss 

zugunsten der statistischen Tolerierung von Jahn verworfen werden. 

Problem 

Ein Kunde kommt mit seinem Wunsch nach einem bestimmten Produkt zu einem Unternehmen. 

Z. B. ein Autobauer möchte ein Dämpfungssystem (Motorlager) von seinem Lieferanten. Der 

Kunde formuliert seine Anforderungen an die Eigenschaften des Motorlagers hinsichtlich 

der Vibration, des Fahrverhaltens und der Dämmung des Geräuschpegels. Der Hersteller des 

Dämpfungssystems (der Lieferant) akzeptiert den Wunsch, parametrisiert die Eigenschaften, 

z. B. in die Produktvariablen statische und dynamische Steifigkeiten, Phasenverschiebung, 

Ausreißkräfte usw., spezifiziert die Produktvariablen in Form von Sollwerten und Toleranzgrenzen 

für die Produktentwicklung mit Hilfe eines CAD Systems oder des Maßkettenkonzeptes. 

Für die Herstellung sind diese Toleranzen in der Regel nicht geeignet. Hierfür sollten 

aufgrund der Abhängigkeitsstruktur der Produktvariablen die Maßtoleranzen zumindest 

durch die statistische Tolerierung für alle relevanten Produktvariablen überprüft werden. Die 

statistischen Toleranzen für eine Pilotfertigung oder für Vorläuferprodukte werden mit dem 

Kunden abgestimmt, denn die Anforderungen können zu einem Widerspruch innerhalb der 

Maßkettentoleranzen oder zwischen den Maßketten- und statistischen Toleranzen führen, wie 

auch im vorliegenden Fall, zu einer hohen Steifigkeit der Gummimischung für das Fahrverhalten 

und einer niedrigen Steifigkeit für die Geräuschdämmung. Die statistischen Toleranzen 

werden als Toleranzen anerkannt und die Produkte werden produziert. Der Produzent für 

das Motorlager liefert die Produkte und weist nach, dass die geforderte Qualität im Sinne der 

simultan Erfüllung aller relevanten Kundenanforderungen geliefert wird. Danach stellt er die 

Rechnung und verlangt sein Geld. 

Das Problem beinhaltet zwei zu lösende Teilprobleme: 

• 

• 

Tolerierung der nicht unabhängigen Produktvariable für die Entwicklung und Fertigung, 

Nachweis der simultanen Erfüllung aller spezifizierten relevanten Kundenanforderungen. 

Problemlösung 

Bisheriges Kernstück einer funktions-, fertigungs- und montagegerechten Tolerierung ist die 

Maßkettentheorie . Sie ist die Lehre von der funktionsgerechten Bemessung aneinander gereihter 

Maße, deren Toleranzen sich summieren. Die Maßkette ist eine Aneinanderreihung von 

zusammenwirkenden Einzelmaßen und dem von ihnen abhängigen Schlussmaß. Sie bildet bei 

schematischer Darstellung einen geschlossenen Linienzug (eine Masche). Die Maße (Einzelmaße 

– Schlussmaß) sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette mit 

Schlussmaß ist ihre Geschlossenheit. Bei der Berechnung von Maßketten (Toleranzketten) ist zu


beachten, dass die Einzelmaße unterschiedlichen Systemen angehören können, und zwar dem 

herzustellenden Gerät, dem Werkstück, der Bearbeitungseinheit aus Maschine, Vorrichtung, 

Werkzeug usw. Die Maßkette schafft Voraussetzungen zur Festlegung der Abmessungen der 

Einzelteile und des Gerätes, der Einzeltoleranzen, der Bearbeitungsfolge, der Arbeitszugaben 

usw. Die Toleranzkettentheorie ist die Lehre von der möglichen Größe und Lage der Toleranz 

(Schlusstoleranz) des funktionsbestimmenden resultierenden Maßes (Summenmaß) einer 

Maßkette. Unter Funktionssicherheit wird dabei die Einhaltung der für ein Erzeugnis vorgegebenen 

Funktionsfehlergrenzen für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen 

verstanden. Innerhalb dieser Grenzen ist das Produkt funktionstüchtig. Die Funktionstoleranz 

ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten aller die 

Funktionstüchtigkeit beschreibenden Eigenschaften eines Produktes. Die Herstellungstoleranz 

ist die Differenz zwischen dem oberen und unteren erreichten Grenzwert bei der Herstellung 

mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigprodukte. Die Maßtoleranz ist die 

Differenz zwischen dem zulässigen Größt- und Kleinstmaß. Die Messtoleranz ist die Differenz 

zwischen der zulässigen oberen und unteren Abweichung des Messwertes von der Messgröße. 

Sie entspricht der zulässigen Fehlergrenze der Messung. 

Die Bedeutung der Tolerierung liegt in 

• der Gewinnung von Zielwerten und den zugehörigen Intervallen für die Steuer- und Regelung 

von Prozessen und 

• der Ableitung von Genauigkeitsintervallen (Toleranzintervallen) für die Input- und Prozessvariablen. 

Wie wird eine Maßkette berechnet? 

Das Nennmaß N 0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen 

Maßkettengliedern additiv aus den Nennmaßen N j der m Einzelmaße 

N 

0 

m 

= ∑kj 

N 

j= 

1 

j 

zusammen, wobei die k j die Richtungskoeffizienten sind, siehe z. B. Hofmann [1986]. Diese 

Koeffizienten nehmen die Werte +1 oder –1 an, je nachdem, ob der Einfluss des Einzelmaßes auf 

das Schlussmaß positiv oder negativ ist. Positive Einzelmaße bewirken bei ihrer Vergrößerung 

oder Verkleinerung eine gleichsinnige Veränderung des Schlussmaßes. Der Richtungskoeffizient 

ist der Maßkette zu entnehmen. 

Wie wird eine Toleranzkette berechnet? 

Sind die Toleranzen der Einzelmaße und die Kleinstspiele S kj gegeben, so beträgt nach Hofmann 

[1986] die Schlusstoleranz T 0 des Schlussmaßes 

0 

m−e m 

∑ j ∑ kj 

j= 1 j= m− e+ 

1 

T = T + S 

Hieraus können die Einzeltoleranzen T j berechnet werden. 

.


165 

Unterscheidet sich die Tolerierung für die Produktentwicklung von der für die Fertigung? 

Dem Maßkettenkonzept soll die statistische Tolerierung gegenüber gestellt werden, denn 

• 

• 

die Produktvariablen der gefertigten Produkte sind Zufallsgrößen und 

die Zufallsgrößen sind nicht unabhängig voneinander. 

Das Maßkettenkonzept auf die Fertigung angewandt, basiert auf der Faltung von Zufallsgrößen 

und setzt Unabhängigkeit voraus. Diese Voraussetzung ist aber nur selten erfüllt. Daher wollen 

wir uns mit einer Möglichkeit der statistischen Tolerierung befassen, die auch bei korrelierten 

Produktvariablen richtige Resultate liefert. 

Die statistische Tolerierung quantifiziert das „Können des Prozesses“. Folglich müssen die 

statistischen Toleranzgrenzen für alle relevanten Produktvariablen mit den Experten der Produktentwicklung 

abgestimmt werden, damit aus den statistischen allgemeingültige Toleranzen 

werden. 

Für die Berechnung der multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten 

Potentials des Prozesses, Produkte mit vorgegebenen Eigenschaften zu produzieren (Qualität), 

benötigen wir, neben dem Können des Prozesses, die Möglichkeit des Vergleiches des Soll- und 

Istzustandes der Fertigung für den multivariaten Fall. 

Der Vektor der Produktvariablen sei wieder Y T = (Y 1 , …, Y m ). Dieser Vektor sei m-dimensional 

normal verteilt Y ~ N m (µ, Σ YY ), wobei die Kovarianzmatrix Σ YY positiv definit sein soll oder die 

Verteilung von Y gehöre zur Familie der elliptisch umrissenen Verteilungen. 

5.2.1.3 Auf welchem Prinzip basiert die statistische Tolerierung ? 

Der Vektor Y wird in die beiden Teile 

Y T = (Y j , Y T m – j ) 

zerlegt. 

Die einzelnen Produktvariablen sind nicht unabhängig voneinander, sondern durch die 

Abhängigkeitsstruktur, ausgedrückt durch die folgende partitionierte Kovarianzmatrix des 

aufgespalteten Vektors der Produktvariablen, miteinander verbunden. 

Die Kovarianzmatrix der Produktvariablen ist 

⎛ 

2 

σ 

⎞ 

j σj. 

m− 

j 

ΣYY 

= ⎜ ⎟. 

⎝ Σm−j. 

m−j⎠ 

Die Realisierungen (Messwertvektoren) des normal verteilten Vektors der Produktvariablen 

sind Punkte im m-dimensionalen euklidischen Raum und liegen wegen der Verteilungsvoraussetzung 

innerhalb eines Hyperellipsoides. Das sieht man, wenn man den Exponent der 

multivariaten Normalverteilung 

1 ⎧ 1 

T −1 

⎫ 

f( y; μΣ , YY ) = ⋅ exp ⎨− ⋅( Y − μ) ⋅Σ ⋅( − ) 

1 

YY Y μ⎬ 

⎩ 2 

⎭ 

2 ⋅ π ⋅ Σ 2 

gleich einer Konstanten setzt, z. B. 

YY 

T −1 

Y − ⋅ YY ⋅ Y − = c1−α 

( μ) Σ ( μ ) . (1)


Dann ist das die Gleichung für ein Hyperellipsoid mit dem Mittelpunkt µ, wobei 1 – α die 

Wahrscheinlichkeit ist, mit der die Punkte innerhalb des Hyperellipsoides liegen. Das Hyperellipsoid 

beschreibt das Können des Prozesses. Die Form des Hyperellipsoides wird durch die 

Abhängigkeitsstruktur bestimmt. Diese wiederum haben wir durch den Grad der Multikollinearität 

−1 

YY 

δ = R (2) 

charakterisiert. 

Zunehmender Grad der Multikollinearität führt zu größeren Diagonalelemente der inversen 

Korrelationsmatrix, 

R 

−1 

YY 

⎧ 

2 −1 

(1 − ρj/ 

m− 

j) , für alle j = 1, …, 

m 

⎪ −ρ 

= ⎨ jk / m−( j, k) 

, j, k 1, , , 

1 

= … m j 

⎪ ≠ 

⎡ 

2 2 

(1 − ρ 

2 

j/ m−j) (1 − ρk/ 

m−k) 

⎤ 

⎪ ⎩ ⎣ 

⎦ 

wobei ρ 2 j/m – j das Quadrat des multiplen Korrelationskoeffizienten zwischen Y j und einer Linearkombination 

in den restlichen (Y 1 , …, Y j – 1 , Y j + 1 , …, Y m ) = Y m – j ist. ρ jk/m – (j, k) sind die 

partiellen Korrelationskoeffizienten zwischen Y j und Y k unter der Bedingung der restlichen 

Produktvariablen. 

Zumindest einige der multiplen Korrelationskoeffizienten für beliebige Y j in Abhängigkeit von 

den Linearkombinationen in den anderen Produktvariablen werden mit wachsendem δ größer. 

Damit werden die Differenzen 1 – ρ 2 j/m – j kleiner und somit die Quotienten (1 – ρ2 j/m – j )–1 

größer. Das heißt aber nicht anderes, als dass sich ein oder mehrere Produktvariablen sehr gut 

durch andere darstellen lassen. Sind die zugehörigen multiplen Korrelationskoeffizienten groß 

genug, dann sagt man, diese Produktvariablen sind redundant. 

Beachtet man noch den dritten Fakt, dass die Längen der Hauptachsen des Hyperellipsoides 

gleich L j sind, mit 

2 

j λj χm 

,1 −α 

L = 2⋅ ⋅ für j = 1, … m 

wobei λ j die Eigenwerte der Kovarianzmatrix Σ YY sind, dann sieht man, dass mit zunehmendem 

Grad der Multikollinearität das Hyperellipsoid einer „Zigarre“ immer ähnlicher und zumindest 

die 1. Hauptachse des Ellipsoides immer länger wird. 

Ist der Grad der Multikolinearität δ = 1, dann sind die Produktvariablen nach der obigen 

Beziehung unkorreliert und das Hyperellipsoid wird zu einer Hyperkugel. 

Bei vielen Anwendungen ist für jede Produktvariable Y j , j = 1, …, m ein Toleranzintervall 

gegeben. Inwieweit bei deren Festlegungen die Abhängigkeitsstruktur zwischen den Produktvariablen 

beachtet wurde, muss in jedem konkreten Fall hinterfragt werden. In der Regel wird 

das nicht der Fall sein. In diesen Fällen müssen die Toleranzgrenzen aufgrund der statistischen 

Kenntnisse über den Prozess zumindest überprüft, meist jedoch neu berechnet und mit den 

Konstrukteuren abgestimmt werden. Sind die Toleranzgrenzen aus technischer Sicht bindend, 

dann könnte das kartesische Produkt dieser Toleranzintervalle, das ist dann ein Hyperkubus für 

den gemeinsamen Toleranzbereich, gebildet werden. Die Forderung der simultanen Erfüllung 

aller relevanten Kundenanforderungen bedeutet geometrisch, dass das Hyperellipsoid mit 

vorgebbarer Wahrscheinlichkeit in diesem Hyperkubus enthalten sein muss, d. h.


167 

⎡ 

m ⎤ 

T −1 

P⎢( Yj − μj) ⋅ ΣYY ⋅( Yj − μj) ∈X( To, j − Tu, 

j) ⎥ = 1 − α. 

⎢⎣ j = 1 ⎥⎦ 

(5) 

Die Frage ist nun, 

5.2.1.4 Wie können unter der Bedingung (1) die Toleranzintervalle für jede 

einzelne Produktvariable unter Beachtung der Abhängigkeitsstruktur 

statistisch bestimmt werden? 

So, dass das kartesische Produkt der einzelnen Toleranzintervalle die Bedingung (2) erfüllt. 

Y 2 (Produktvariable) 

Abb. 5.2.1: Toleranzgebiet und Streuungsellipse 

Y 1 (Produktvariable) 

Die Lösung dieses Problems ist: 

Wie aus der Abbildung ersichtlich ist, müssen hier im 2-dimensionalen Fall die Tangenten an 

die Ellipse, parallel zu den beiden Achsen der Produktvariable, bestimmt werden. Im m-dimensionalen 

Fall müssen die Tangentialhyperebenen an das Hyperellipsoid bestimmt werden. 

Für diese Konstruktion ist das nachfolgende Theorem von ausschlaggebender Bedeutung. 

Satz 1 (Jahn): Die Projektionen der Ellipse bzw. des Hyperellipsoides auf die Koordinatenachsen 

haben die Längen 

2 

j ≤ j/ m−j = j/ m−j, 

Y σ σ 

wobei σ 2 j/m – 1 die bedingte Varianz der j-ten Komponente von Y unter der Bedingung der 

Konstanz der restlichen Komponenten des Vektors der Produktvariable ist, wobei m – j = m – 1 

wieder die Indexmenge {1, …, j – 1, j + 1, …, m} bezeichnet. 

Den Beweis für diesen überaus wichtigen Satz findet man auf der beiliegenden CD.


Bemerkungen: 

1. Das Theorem ist für die Berechnung der statistischen Toleranzgrenzen über die Momente 

der bedingten Verteilung von Y j unter der Bedingung Y m – j = y m – j d. h. konstant, überaus 

bedeutsam. 

Korollar 1 (Jahn): Die oberen und unteren statistischen Toleranzgrenzen für die einzelnen, 

nicht unabhängigen Produktvariablen können nach den Beziehungen 

USL 

LSL 

2 2 

j = μj + χm,1 −α 

⋅σj/ 

m−j 

2 2 

j = μj − χm,1 −α 

⋅σj/ 

m−j 

berechnet werden, wobei χ 2 m,1 – α das 1 – α Quantil der Chi Quadrat Verteilung mit m 

Freiheitsgraden ist. 

2. Die statistischen Toleranzgrenzen USTL und LSTL (upper and lower tolerance limits) 

beschreiben das “Können” des Prozesses. Diese Grenzen sind daher unbedingt mit den 

Konstrukteuren abzustimmen. 

Korollar 2 (Wang et. al[1999]): Die statistischen Toleranzgrenzen werden nach den Beziehungen 

und 

USL 

LSL 

berechnet. 

2 −1 2 

χm,1−α 

⋅ SY−1. Y−1 χm,1 

−α 

⋅ SYY 

j = μj + = μ 

1 

j + 

− 

Det( SYY ) Det( SY −1. Y −1) 

Det( ) Det( ) 

2 −1 2 

χm,1−α 

⋅ SY−1. Y−1 χm,1 

−α 

⋅ SYY 

j = μj − = μ 

1 

j − 

− 

Det( SYY ) Det( SY −1. Y −1) 

Det( ) Det( ) 

Korollar 3 (Jahn): 

Die bedingten Stichprobenvarianzen S 2 j/m – j können auch aus den Diagonalelementen der 

inversen Kovarianzmatrix berechnet werden. Es gilt 

S 

−1 

YY 

⎧⎡ 

− 

⋅ − ⎤ 

− = − = 

⎣ 2 2 1 -2 

Sj (1 Rj/ m j) Sj/ 

m j, für j 1, …, 

m 

⎦ 

⎪ S ⋅S ⋅ R 

k 

= ⎨ j k jk/ m− 

j, 

k 

− , für j ≠ 

⎪ 1 

⎪ ⎡ 

2 2 

(1 − R − ⋅ − − ⎤ 2 

j/ m j) (1 Rk/ 

m k) 

⎩ 

⎣ 

⎦


169 

Beispiel 5.2.2: Akkubohrschrauber. Statistische Tolerierung 

Die Produktvariablen und der Sollzustand für dieses Beispiel sind in der Tabelle 5.2.1 

zusammengestellt. 

Tabelle 5.2.1: Sollzustand für die Plastikschalen 

Parameter Sollwert Toleranzgrenzen 

Y 1 = Thermoschrumpf 1,1 0,2 2 

Y 2 = Axialität 0 –0,3 0,3 

Y 3 = Dicke 3,1 2,9 3,3 

Y 4 = Parallelität, 0 –0,6 0,6 

Für die Berechnung der statistischen Toleranzgrenzen benötigen wir die Stichprobenkovarianzmatrix 

und deren Inverse. Beide Matrizen sind in Tabelle 5.2.2 und Tabelle 5.2.3 

enthalten. 

Tabelle 5.2.2: Kovarianzmatrix für die Produktvariablen 

Thermoschrumpf Axialität Dicke Parallel 

Thermoschrumpf 0,22495 0,00353 –0,00455 –0,10751 

Axialit 0,00353 0,04206 –0,00081 0,04239 

Dicke –0,00455 –0,00081 0,00882 0,01654 

Parallel –0,10751 0,04239 0,01654 0,24588 

T u 

T o 

Tabelle 5.2.3: Inverse Kovarianzmatrix 

Thermoschrumpf Axialität Dicke Parallel 

Thermoschrumpf 62.301 –44.043 –42.555 37.697 

Axialit –44.043 334.037 173.955 –88.554 

Dicke –42.555 173.955 1.394.678 –142.413 

Parallel 37.697 –88.554 –142.413 82.002 

Mit den Elementen der inversen Kovarianzmatrix kann man nach Korollar 1 die statistischen 

Toleranzgrenzen für die vier Produktvariablen berechnen. In der Tabelle 5.2.4 sind 

die Werte zusammengestellt. 

Tabelle 5.2.4: Sollwerte und statistische Toleranzgrenzen 

Sollwert 

±Toleranz 

Thermoschrumpf 1,1 ±1,62 

Axialität 0 ±0,7 

Dicke 3,1 ±0,34 

Parallelität 0 ±1,4 

Mit den statistischen Toleranzgrenzen können wir die univariaten und multivariaten Prozessfähigkeitsindizes 

berechnen (vgl. Abschnitt 5.2.1.6 und 5.2.1.7).


5.2.1.5 Wie kann man das „Produkt“ statistisch tolerieren? 

Wir stellten bereits fest, dass ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen 

Y 1 , …, Y m beschrieben wird. 

Wir forderten auch schon, dass ein Prozess so gesteuert werden muss, dass simultan alle Kundenanforderungen 

erfüllt werden. Wir wissen auch, dass ein Prozess nur 

• 

• 

• 

• 

mit einer Einstellung der Input- und Prozessvariablen, 

mit einer optimalen Teilmenge von Input- und Prozessvariablen, 

entweder mit Blick auf eine Produktvariable oder einer geschickten Zusammenfassung 

aller Produktvariablen gesteuerten werden kann und 

dass wir hierfür entweder den Sollwert und die Toleranzgrenzen für die eine Produktvariable 

oder die vereinigten Sollvorgaben für das „Produkt“ als Ziele für die Steuerung 

benötigen. 

Die vereinigten Sollvorgaben wollen wir Toleranzbereich für das Produkt nennen und deren 

Grenze Toleranzgrenze für das Produkt (TG Prod ) nennen. 

Σ 

* 

YY 

In dem Ausdruck Σ ∗ YY 

⎛T , − , ⎞ ⎛ o, − u, ⎞ 

= diag ⎜ oj T uj T 

⎝ 

⎟ diag 

6 ⎠ 

⎜ j T 

R 

j 

YY 

⎝ 6 

⎟ 

⎠ 

bezeichnen R YY die Abhängigkeitsstruktur und T o T = (T o,1 … T o,m ) bzw. T u T = (T u,1 … T u,m ) die 

Vektoren der oberen bzw. unteren Toleranzgrenzen für alle relevanten Produktvariablen. Die 

Korrelationsmatrix muss aus einer großen Stichprobe geschätzt werden. 

Unter diesen Annahmen gilt 

T * −1 

o ΣYY 

o Prod 

c* = ( T − M) ( ) ( T − M) = TG . 

TG Prod ist die Toleranzgrenze für das Produkt T 2 , d. h. die über T 2 zusammengefassten Produktvariablen. 

Die Toleranzgrenze (TG Prod ) für das Produkt hängt ab von 

1. der Abhängigkeitsstruktur R YY – über die theoretische Kovarianzmatrix Σ * YY , 

2. die Toleranzgrenzen für die einzelnen Produktvariablen und 

3. den Vektor der Sollwerte. 

Mit der berechneten Toleranzgrenze TG Prod wird die simultane Erfüllung aller relevanten Kundenanforderungen 

geprüft. Die Gleichung für T 2 ist auch bekannt als Mahalanobis Abstand. 

5.2.1.6 Univariate Prozessfähigkeitsindizes 

W as heißt „ein Prozess ist fähig“? 

Die Fähigkeit i st das inhärente Potential eines Prozesses, Produkte mit vorgegebenen Eigenschaften 

zu produzieren. Die Anwendung auf betriebliche Prozesse bedeutet, 

• dass für eine, mehrere oder alle Produktvariablen Toleranzgrenze vorliegen, die den „vorgegebenen 

Eigenschaften“ entsprechen und


171 

• impliziert, dass geprüft werden kann, ob die produzierten Produkte den vorgegebenen 

Eigenschaften entsprechen. 

In der Folge werden wir uns ausführlich mit 

• 

• 

den univariaten und 

multivariaten Prozessfähigkeitsindizes 

befassen. 

Wie kann die Eigenschaft „ein Prozess ist fähig“ nachprüfbar formuliert und quantifiziert 

werden? 

Für die Beantwortung der Frage stellen wir zunächst alles zusammen, was uns bekannt ist. Die 

Produktvariable sei Y. T o und T u seien die gegebenen Toleranzgrenzen und M sei der Soll wert. 

Die Produktvariable Y sei normal verteilt mit dem geforderten Erwartungswert µ = Sollwert 

= M und der zulässigen Standardabweichung 

σ 

T 

− T 

6 

Zul = o u . 

Dieser Ausdruck ist das Ergebnis der 3 σ-Regel, die besagt, dass im Intervall µ – 3 σ ≤ Y ≤ µ + 3 σ 

ca. 99.73 % aller Einzelwerte der vorausgesetzten Normalverteilung mit dem Erwartungswert 

µ und der Standardabweichung σ liegen. 

Die Produktion liefert Produkte an denen nach einer zufälligen Auswahl die Werte Y i , i = 1, …, N 

gemessen werden, wobei N den Stichprobenumfang bezeichnet. 

Es ist nun zu prüfen, ob die Stichprobe mit den spezifizierten Kundenanforderungen in Form 

des Sollwertes und der Toleranzgrenzen übereinstimmt. Hierfür können statistische Hypothesentests 

verwendet werden. 

• Die Nullhypothese H 0 : σ 2 = σ 2 zul gegen die Alternative H 1 : σ2 ≠ σ 2 zul kann mit dem F-Test 

Fˆ 

2 2 

σzul ( To − Tu 

) 

= = 

2 2 

σ 36 ⋅ S 

• und die Hypothese H 0 : µ = M gegen H 1 : µ ≠ M kann mit dem Abweichungstest 

Y − M 

zˆ = N −1. 

σ 

zul 

geprüft werden. 

Die beiden Tests wurden formalisiert, so dass wir Ausdrücke für die univariaten Prozessfähigkeitsindizes 

erhalten. 

Wie können Sie die univariate Prozessfähigkeitsindizes für eine Produktvariable berechnen? 

Eine Produktvariable wird mit Y bezeichnet, deren Verhalten durch die Verteilungsfunktion 

(Vf)Y ~ P(Y ≤ y) = F(y) oder falls sie existiert durch die Verteilungsdichte (Vd) f(y) charakterisiert 

wird. Durch die Prozessfähigkeiten wird beurteilt, ob die statistische Breite von f(y)


vollständig oder nur z. T. innerhalb des Toleranzintervalls liegt. Die statistische Breite wird 

nach der 3 σ-Regel berechnet. 

Bevor wir eine Formel für den Vergleich zwischen der Toleranzbreite und Breite der Verteilungsdichte 

angeben, sollen noch einige wichtige Begriffe erläutert und präzisiert werden. 

Häufig wird der Ausdruck, „der Prozess wird beherrscht“ ver wendet und durch die Zeitinvarianz 

der Verteilung erklärt, wobei darauf hingewiesen wird, dass die zeitlichen Veränderungen 

eine Verschiebung der Verteilung auf der Achse der Produktvariablen, eine Änderung der 

Streuung oder eine Änderung der Form der Verteilung sein kann, siehe z. B. Rinne, Mittag 

[1999]). 

An dieser Stelle muss darauf hingewiesen werden, dass der Prozess zur Herstellung eines Produktes 

durch die Häufigkeitsverteilung einer Produktvariablen beurteilt werden soll. Das ist 

nur bedingt möglich. Die Beherrschbarkeit eines Prozesses wird durch die folgende Definition 

präzisiert. 

Definition: Die Aufschlüsselung der Varianz der Produktvariablen Y durch die in der Prozessgleichung 

vorkommenden Input- und Prozessvariablen wird durch das Maß der Beherrschbarkeit 

gemessen. 

Diese Definition ist notwendig, denn die Produktvariable Y ist Ergebnis des Wirkens eines 

Prozesses, die Produktvariable ist eine Zufallsgröße und die Verteilung der Produktvariablen 

kann nur nach dem Ursache-Wirkungs-Prinzip über die Veränderung der Input- und Prozessvariablen 

verändert werden. Ein beherrschter Prozess bedeutet, dass er so gesteuert werden 

muss, dass alle spezifizierten Kundenanforderungen an das Produkt simultan erfüllt werden, 

d. h. der Vektor der Mittelwerte der gemessenen Werte für die Produktvariablen Y 1 , …, Y m 

muss im statistischen Sinne mit dem Vektor der Sollwerte M 1 , …, M m übereinstimmen, die 

Variabilität des Vektors der Produktvariablen muss so klein sein, dass die Verteilung innerhalb 

des Toleranzbereiches liegt und die Verteilung muss zeitlich stabil bleiben, d. h. die Mittelwertvektoren 

und die Stichprobenkovarianzmatrizen zeitlich aufeinanderfolgender Stichproben 

dürfen keinen Trend besitzen. 

Für die Überprüfung der statistischen Beherrschbarkeit eines Prozesses müssen wir die Maße 

der Beherrschbarkeit und die uniund multivariaten Prozessfähigkeitsindizes berechnen. 

Die uniund multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten Potential 

eines Prozesses, Produkte mit den durch die Toleranzgrenzen für alle relevanten Produktvariablen 

vorgegebenen Eigenschaften zu produzieren, werden als Entscheidungskriterium 

für die Notwendigkeit der Prozessverbesserung im Sinne der Reduktion der Variabilität der 

Produktvariablen und damit der Vergrößerung des Maßes der Beherrschbarkeit verwendet. 

Die Maße der Beherrschbarkeit dienen ebenfalls für die Entscheidung zur Prozessverbesserung 

im Sinne der Suche nach weiteren Input- und Prozessvariablen, die die Variabilität der 

Produktvariablen besser erklären. 

Bei der Festlegung der CAD Toleranzgrenzen unterscheiden wir die Möglichkeiten, die in der 

Abbildung dargestellt sind. 

• Einseitige Tolerierung, d. h. es gibt nur eine obere T o oder untere T u Toleranzgrenze. 

• Auf die Angabe des Sollwertes wird in diesen Fällen häufig verzichtet. Wir müssen prüfen, 

ob das sinnvoll ist, denn der Sollwert wird als Zielwert für die Steuerung des Prozesses 

benötigt. 

• Zweiseitige Tolerierung. Hier müssen wir zwischen dem symmetrischen und unsymmetrischen 

Fall unterscheiden.


173 

Fall 1 

Fall 2 

Fall 3 

Abb. 5.2.2: Toleranzintervalle 

Die Toleranz wird nun wie folgt definiert: 

Δ 

T u Sollwert T o 

Produktvariable Y 

⎧To 

− Sollwert, bei Vorgabe von To 

⎪ 

Sollwert − Tu, bei Vorgabe von T 

⎪ 

u 

⎪T − T bei Vorgabe von T und T 

= 

o u 

o u 

⎨ , 

⎪ 2 

⎪ − Tu To − 

Tu To 

⎪ 

⎩ 

min{(Soll ),( Soll)}, bei gegebenen und und 

asymmetrischer Tolerierung 

Für den Toleranzbereich schreiben wir in der Regel [T o , T u ] = T o – T u = 2 Δ. 

Im symmetrischen Fall gilt 

To 

+ Tu 

Sollwert = = Toleranzmittelwert. 

2 

Zweiseitige Toleranzgrenzen – die Produktvariable ist normal verteilt 

Der Sollzustand für die Produktvariable Y wird durch 

• 

• 

den Sollwert M und die 

Toleranzgrenzen 

– 

– 

T u untere Toleranzgrenze 

T o obere Toleranzgrenze 

definiert. 

Der Prozess sei optimal eingestellt. An zufällig ausgewählten Produkten wird die normal 

verteilte Produktvariable Y gemessen. Die Messwerte sind Y 1 , …, Y N , wobei N der Stichprobenumfang 

ist. 

Visuell kann der Istzustand mit dem Sollzustand verglichen werden, indem man schaut, ob 

die Häufigkeitsverteilung der Messwerte, wie die Durchmesser der gedrehten Welle in der 

Abbildung 5.2.3, innerhalb der eingezeichneten Toleranzgrenzen liegt und der Mittelwert der 

Wellendurchmesser im statistischen Sinne mit dem Sollwert übereinstimmt. Bei der Welle in


Häufigkeiten 

50 

Sollwert 

T o 

T u 

-3s 

40 

30 

+3s 

20 

10 

0 

19.8 19.9 20 20.1 20.2 

Wellendurchmesser [mm] 

Abb. 5.2.3: Häufigkeitsverteilung der Durchmesser einer Welle 

Abbildung 5.2.3 liegt die ±3 S Breite der Häufigkeitsverteilung vollständig im Toleranzintervall. 

Die univariate Prozessfähigkeit als Quotient der Toleranzbreite zur Breite der Häufigkeitsverteilung 

muss größer als 1 sein. Es wird kein Ausschuss produziert. Der Sprachgebrauch „im 

statistischen Sinn“ soll jeweils deutlich machen, dass wir es mit stochastischen Sachverhalten 

zu tun haben. Hieraus folgt, dass alle Aussagen mit einer Unschärfe versehen sind, die der 

Streuung von Variablen adäquat sind. 

Der zahlenmäßige Vergleich zwischen dem Soll- und Istzustand basiert auf einem Charakterisierungssatz, 

nach dem eine Normalverteilung vollständig durch den Mittelwert y 

und die Standardabweichung s beschrieben wird. Die Schätzfunktionen y für den Erwartungswert 

und s 2 für die Varianz sind unabhängig voneinander. Nach der 3 σ-Regel erhält 

man mit der Irrtumswahrscheinlichkeit α = 0.0027 die Breite der Häufigkeitsverteilung 

y + 3 ⋅ s −[ y − 3 ⋅ s] = 6⋅ 

s . 

Die einfache Prozessfähigkeit C p (siehe Bhote [1990], Omnias [1992], Rinne, Mittag [1999]) 

vergleicht die Sollbreite (T o – T u ) mit der Breite 6 · s der Häufigkeitsverteilung: 

Toleranzbreite 

was der Kunde fordert To 

− Tu 

Cp 

= = = 

(1) 

Breite der Häufigkeitsverteilung was der Kunde erhält 6 ⋅ s 

Wenn C p < 1, dann ist die Breite der Häufigkeitsverteilung größer als die Toleranzbreite. 

Produkte mit Werten für den Produktvariable, die nicht den Anforderungen genügen sind 

die Folge. 

Wenn C p > 1, dann ist die Breite der Häufigkeitsverteilung kleiner als die Toleranzbreite, d. h. 

die Häufigkeitsverteilung passt vollständig in das Toleranzintervall. 

Aber trotzdem kann Ausschuss produziert werden. Das liegt daran, dass bisher nur das 

Streuverhalten des Produktes mit der Toleranzbreite verglichen wurde. Nach dem Charakterisierungssatz 

muss in diesen Vergleich die Abweichung zwischen dem Soll- und Mittelwert 

einbezogen werden. Hierzu muss der Korrekturfaktor


175 

k = 

y − M 

1 ⋅ ( To 

− T ) u 

2 

(2) 

berechnet werden, mit dem C p zu 

C pk = (1 – k) C p (3) 

korrigiert wird. Diese Darstellung setzt voraus, dass der Sollwert in der Mitte des Toleranzintervalls 

liegt und bewertet die Abweichungen vom Sollwert. 

Ist C pk < 1, dann wird Ausschuss produziert, der Prozess muss verbessert werden, siehe Juran 

[1990]. Ist C pk > 1, dann genügen die Produkte der durch den Sollwert und die Toleranzgrenzen 

spezifizierten Anforderung. 

Welche Entscheidungen aufgrund der univariaten Prozessfähigkeitsindizes können Sie treffen? 

Die besprochenen möglichen Entscheidungen aufgrund der Prozessfähigkeiten werden durch 

die Abbildung 5.2.4 visualisiert. 

Damit kann man sagen, die Fähigkeit beschreibt das inhärente Potential eines Prozesses, Produkte 

oder Dienstleistungen zu produzieren, die spezifizierten Anforderungen genügen. 

Daten 

T u M T o T u M T o T u M T o 

Cp ≤ 1 Cp > 1 Cp > 1 

Cpk ≤1 Cpk < 1 Cpk > 1 

Prozessverbesserung 

oder Überprüfung der 

Tolerierung 

SPC 

Reduktion der 

Streuung 

Justierung 

Abb. 5.2.4: Entscheidungen aufgrund der Prozessfähigkeiten 

Beispiel 5.2.3: Wellendurchmesser. Univariate Prozessfähigkeit 

Eine zu drehende Welle soll den Solldurchmesser M = 12.5 [mm] und die Toleranzen 

T u = 12.35 [mm] und T o = 12.65 [mm] haben. Eine Stichprobe von N = 130 Wellen ergab 

die statistischen Maßzahlen 

Y = 12,499 [mm] und s = 0,05012 [mm].


Setzt man diese Größe in die Formeln für die Prozessfähigkeitsindizes ein, dann erhält 

man 

C p = 1,00, k = –0,01 und C pk = 0,99. 

Die Häufigkeitsverteilung liegt vollständig im Toleranzintervall, darf aber nicht hin- und 

herbewegen. Nach der Abbildung 5.2.4 muss der Prozess verbessert werden, um zu garantieren, 

dass kein Ausschuss produziert wird. 

Bemerkung zu den univariaten Prozessfähigkeitsindizes 

Die univariaten Prozessfähigkeitsindizes besitzen die äquivalente Darstellung 

und 

C 

p 

To 

− T 

= 

6 S 

u 

⎧To 

− Y Y − Tu⎫ 

Cpk = Min ⎨ , ⎬ = Min { Clo, Cpu}, 

⎩ 3S 

3S 

⎭ 

wobei C po die Prozessfähigkeit für die obere und C pu für die untere einseitige Toleranzgrenze 

bezeichnen. 

Diese Darstellung bewertet eindeutig die Abweichungen von den Toleranzgrenzen und ist 

insbesondere dann zu empfehlen, wenn die Streuung der Produktvariablen sehr groß ist, oder 

die Verteilung der Werte der Produktvariablen nahe bei einer Toleranzgrenze liegt. 

Sind Rückschlüsse von den Fähigkeiten auf den Ausschussanteil möglich? 

Bei der Antwort auf diese Frage sind einige Aspekte zu beachten. 

Prozessfähigkeiten und Verlustfunktion 

Die ökonomisch en Kennzahlen werden über die Verlustfunktion bewertet, wobei der ökonomische 

Verlust einer produzierten Einheit durch den Abstand seines Wertes für die Produktvariablen 

vom Sollwert entsteht. Der erwartete Verlust ist dann im Grunde genommen eine 

Kennzahl für die Fähigkeit. 

Erste Hinweise auf diese Problematik finden sich bereits bei den British Standards 2564 aus 

dem Jahre 1955 und bei Juran [1974] in seinem Quality Control Handbook. 

L(y) 

1 

Abb. 5.2.5: Verlustfunktion 

Tu Sollwert To Y


177 

Um diese Zusammenhänge zu verdeutlichen, betrachten wir zunächst einmal den Ausschussanteil 

p. 

Zu p gehört die binäre Verlustfunktion 

⎧0, für Y ∈[ To 

− Tu] 

Ly ( ) = ⎨ 

⎩ 1, für Y ∉[ To 

− Tu] 

Diese Verlustfunktion ist ein Sprungfunktion. Das zeigt die Abbildung 5.2.5. 

Besitzt Y die Vd f(y) und die Vf F(y), dann erhält man den erwarteten Verlust 

∞ 

∫ 

E[ L( Y)] = L( y) ⋅ f( y)dy 

−∞ 

∫ 

= 0 ⋅ f( y)dy + 1 ⋅ f( y)dy 

y∈TB 

= P( Y∉ TB) = : p 

∫ 

y∉TB 

wobei [T o – T u ] =: TB. 

Für die zweiseitige Betrachtung erhält man 

p = 1 – P(T u ≤ Y ≤ T o ) = 1 – F(T o ) + F(T u ) = p o + p u . 

Für die einseitige Betrachtung erhält man 

bzw. 

p = P(Y > T o ) = 1 – F(T o ) 

p = P(Y < T u ) = F(T u ). 

Diese Betrachtung über die traditionelle Verlustfunktion hat wesentliche Nachteile. Zum einen 

drückt sie nur den Verlust des Produzenten aus, obwohl der Konsument natürlich ebenfalls 

durch die nicht zielwertkonformen Produkte Verluste erleidet. Zum anderen ist der Verlauf 

dieser Verlustfunktion in keiner Weise plausibel. Betrachten wir z. B. ein Produkt, dessen Wert 

für die Produktvariable in unmittelbarer Nähe der oberen oder unteren Toleranzgrenze, aber 

noch innerhalb des Toleranzintervalls liegt, so wird der Verlust mit 0 bewertet. Für einen anderen 

Wert, der sich vom vorangegangenen nur ganz wenig unterscheidet, aber außerhalb des 

Toleranzbereiches liegt, wird der Verlust 1 angenommen. 

Taguchi hat diesen Missstand durch die Einführung der quadratischen Verlustfunktion korrigiert. 

Danach ist ein Produkt umso besser, je näher der Wert seines Produktvariables am 

Sollwert liegt. Je größer die Differenz zwischen Soll- und Istwert ist, desto größer ist der Verlust 

über die gesamte Lebenszeit des Produktes. 

Für die zweiseitige Tolerierung lautet die Taguchi-Verlustfunktion 

L T (y) = c (y – M Y ) 2 , 

wobei M Y der Sollwert für die Produktvariable Y und c ein Proportionalitätsfaktor sind. Analog 

kann man die Verlustfunktion für einseitige Tolerierung aufschreiben.


Für den Erwartungswert der Verlustfunktion – das Risiko – erhält man mit der Vd f(y) 

∞ 

∫ 

∞ 

2 2 

y ∫ μy μY Y 

−∞ 

∞ ∞ ∞ 

∫ 

2 2 

μY μY Y ∫ μY μY Y ∫ 

−∞ −∞ −∞ 

E[ L( y)] = c ⋅( y − M ) ⋅ f( y)d y = c ⋅ [( y − ) + ( − M )] f( y)dy 

−∞ 

⎧⎪ 

⎫⎪ 

= c ⋅⎨ 

( y− ) f( y)dy+ 2 ⋅( −M ) ⋅ ( y− ) ⋅ f( y)d y+ ( −M ) ⋅ f( y)dy⎬ 

⎪⎩ 

⎪⎭ 

= c ⋅ { σ + ( − ) } 

2 2 

μY 

MY 

Das ist der bekannte mittlere quadratische Fehler (engl. mean square error), der z. B. für die 

Güte einer Schätzfunktion verwendet wird. Der Term (µ Y – M Y ) 2 ist der quadratische Bias. 

Damit werden die zwei Hauptaufgaben aus der Abbildung zur Entscheidung mit den Prozessfähigkeiten 

noch einmal verdeutlicht. Der Bias gibt die Abweichung des Mittelwertes vom 

Sollwert an. Ist ein Bias vorhanden, dann muss der Prozess neu zentriert werden, sodass diese 

Abweichung null wird. Ist die Streuung so groß, dass die „Schwänze“ der Verteilung über die 

Toleranzgrenzen hinausragen, dann muss der Prozess so verbessert werden, dass die Streuung 

kleiner wird. 

Prozessfähigkeit nach Taguchi auf der Grundlage der Verlustfunktion 

Nach Rammelmüller [1993] und Taam [1993] können die univariaten Prozessfähigkeitsindizes 

auch wie folgt geschrieben werden 

To 

− Tu 

T − T 6 S Cp 

C = = = 

D 

wobei 

o u 

pm 

2 2 

1 

6 S + ( Y − M) 

⎡ 

2 

( Y − M) 

⎤2 

⎢1 

+ 

2 ⎥ 

1 

2 2 

⎡ ( Y − M) 

⎤ 

D = ⎢1 

+ 

2 ⎥ 

⎣ S ⎦ 

⎣ S ⎦ 

die Abweichung des Mittelwertes der Werte für die Produktvariable vom Sollwert M misst. 

Beispiel 5.2.4: Wellendurchmesser. Prozessfähigkeit nach Taguchi 

Verwenden Sie die Angaben für den Soll- und Istzustand von oben und setzen diese Werte 

in die Formeln für die Taguchi Fähigkeiten ein, dann erhalten Sie die Werte D = 1.000199 

und C pm = 0,9998. Diese Werte stimmen mit den Werten von oben überein. Damit ist auch 

die zu fällende Entscheidung dieselbe. 

Welche Schlüsse können Sie aus den verschiedenen univariaten Prozessfähigkeitsindizes für 

die praktische Anwendung ziehen? 

C p beschreibt das Verhältnis von Spezifikationsbreite zur Breite der Verteilung der Messwerte für 

die Produktvariable. Je größer C p wird, desto weniger streuen die Werte für die Produktvariable. 

Bei C p = 1 stimmt die 6 s Breite der Häufigkeitsverteilung mit der Toleranzbreite überein.


179 

C pk wächst für jedes konstante σ linear mit der Annäherung des Mittelwertes Y an den Sollwert. 

Das heißt aber, ein Mittelwert Y nahe beim Sollwert wird genauso bewertet wie ein Mittelwert 

nahe einer der Toleranzgrenzen. Daraus folgt für die Anwendung, dass ein großer C pk -Wert 

mitunter zu wenig über die Zentriertheit des Prozesses aussagt. 

C pm beinhaltet sowohl die Streuung der Produktvariablen, wie auch die Zentriertheit ( Y − M ) 

der Verteilung der Produktvariablen auf den Sollwert. C pm = 1 besagt, dass Y innerhalb der mittleren 

Drittels von (T o – T u ) liegt. Hieraus folgt, der Index C pk sollte durch C pm ersetzt werden. 

Das ist ein positiver Beitrag zur Diskussion, welcher Philosophie bei der Kontrolle von Prozessen 

zu folgen ist, 

• 

• 

dem Nachweis der Erfüllung der spezifizierten Kundenanforderungen oder 

der Erfüllung gewisser statistischer Gesetzmäßigkeiten. 

Im Kapitel 6 wird diese Diskussion noch einmal aufgegriffen. 

Prozessfähigkeit und Ausfallrate 

Wir betrachten nur die univariate Produktvariable Y mit dem Sollzustand M = Sollwert und 

der unteren T u und oberen T o Toleranzgrenze. 

[T o – T u ] ist das Toleranzintervall. Falls der Wert Y i eines Produktes für die Produktvariable 

Y innerhalb des Toleranzintervalls liegt, d. h. falls Y i ∈ [T o – T u ], dann sagen wir das Produkt 

ist konform zur Spezifikation. Wenn Y i ∉ [T o – T u ], dann sagen wir, das Produkt ist nicht 

konform zur Spezifikation. 

Die Wahrscheinlichkeit dafür, dass ein Messwert Y i , i = 1, …, N von Y außerhalb der Toleranzgrenzen 

liegt, ist 

p = 1 – F(T o ) + F(T u ). 

Die Fähigkeit des Prozesses ist eine Funktion der Ausfallrate, d. h. 

p = P( Y ∈[ To 

− Tu]) = 1 − ∫ f( y)d y. 

[ To−Tu] 

Prozesse mit kleinem p werden fähig genannt. Wie klein p sein muss, um einen Prozess als 

fähig zu charakterisieren ist das Anliegen des Qualitätsverantwortlichen des Unternehmens. In 

der Praxis hat sich die Forderung p < 0.0027 für fähige Prozess bewährt. Es muss aber darauf 

verwiesen werden, dass eine solche Forderung von den Herstellungskosten abhängig ist und 

daher nur akademischen Charakter hat. 

Setzen wir noch voraus, dass Y ~ N (µ, σ 2 ) gilt, dann erhalten wir für das einseitig nach oben 

begrenzten Toleranzintervall 

∞ 

⎧ 

2 

1 ⎪ ( y − μ) 

⎫⎪ 

po = P( Y > To) = ∫ exp⎨− 

2 ⎬d y. 

σ 2 π ⎪⎩ 

2 σ ⎪⎭ 

To 

Hierfür können wir nach der Standardisierung der Zufallsgröße Y und deren Toleranzgrenzen 

auch schreiben 

∞ 

o − μ o − μ μ − o 

⎛ T ⎞ ⎛T ⎞ ⎛ T ⎞ 

po = P ⎜Z > ⎟ = = − ⎜ ⎟ = 

⎝ ⎠ ∫ Φ()d z z 1 Φ Φ 

⎝ ⎠ 

⎜ 

⎝ 

⎟. 

σ ω σ ⎠ 

To 

−μ 

σ


Hieraus folgt, 

p o = 1 – Φ (3 C po ) = Φ (–3 C po ). 

Ein analoger Ausdruck ist der Ausschussanteil bei dem einseitig unten begrenzten Toleranzintervall. 

Das p ist nun leider unbekannt. Daher betrachten wir für eine Stichprobe die Schätzung 

N 

1 

Fˆ( y ) = ∑I ( Yi 

< y ) 

N 

i= 

1 

für unbekannte Verteilungsfunktion F, wobei I (Y i < y) die Indikatorfunktion 

⎧1, falls Yi 

< y 

I( Yi 

< y) 

= ⎨ 

⎩0, falls Yi 

≥ y 

bezeichnet. 

Damit erhalten wir 

1 

pˆ = 1 − Fˆ( T ) + Fˆ( T ) = 1 − I( T ≤ Y ≤ T ) 

und die Schätzungen 

bzw. 

und 

∑ 

o u u i o 

N 

i= 

1 

̃ ⎛T − ⎞ ⎛ − ⎞ 

= − ⎜ o Y Y T 

p 1 Φ ⎟ + Φ 

⎝ ⎠ 

⎜ u 

s ⎝ s 

⎟ 

⎠ 

p̃ 

Tu 

⎛ u − ⎞ ⎛ − ⎞ 

= ⎜ ⎟ 

̃ 

o 

Φ 

T Y , pT 

= Φ 

T Y 

o 

⎝ s ⎠ 

⎜ 

⎝ s 

⎟ 

⎠ 

p̃ = p̃ + p̃ 

T . 

u To Damit können wir für den Prozessfähigkeitsindex schreiben 

N 

⎛Y − Tu 

⎞ ⎛To 

− Y ⎞ 1 

−1 − 

= ⎜ ⎟ ⎜ ⎟ = − ̃ 

1 

C ̃ 

pk min , min { Φ ( pT 

), Φ ( p )} 

u 

T . 

o 

⎝ s ⎠ ⎝ s ⎠ 3 

Beispiel 5.2.5: Fähigkeiten und Ausfallrate 

Y ~ N(0, σ 2 ). Der Sollzustand für diese Produktvariable ist 

Sollwert M = 0, 

T u = –0,3 

T o = 0,3. 

Da s und p unbekannt sind, ziehen wir eine Stichprobe vom Umfang N = 113. 

Mit den Werten dieser Stichprobe berechnen wir den Mittelwert = 0,00968 und die Standardabweichung 

s = 0,20509. 

Damit berechnen wir die statistischen 3 s-Grenzen [–0,605596, 0,624958]. 

Die univariaten Prozessfähigkeitsindizes sind C p = 0,49, k = 0,03 und C pk = 0,47.


181 

Damit gilt 

To − Y 0,3 − 0,00968 

= = 1,415 

s 0,20509 

und 

Y 

− Tu 0,00968 − ( −0,3) 

= = 1,51 

s 0,20509 

Aus einer Tafel mit den Werten der standardisierten Normalverteilung erhalten wir für 

diese beiden Zahlen die Werte 

F(1,42) = 1 – 0,92219 = 0,0778 

und 

F(1,51) = 1 – 0,934478 = 0,0655. 

Oberhalb der oberen Toleranzgrenze T o liegen 7,78 % aller Einzelwerte und unterhalb der 

unteren Toleranzgrenze liegen 6,55 % der Werte. 

Zusammenfassend können sagen, bei der univariaten Prozessfähigkeit C pk = 0,47 liegen ca. 

14,3 % aller Werte außerhalb der Toleranzen. 

Bei einer Prozessfähigkeit C pk = 0,8 lägen nur noch ca. 1,4 % außerhalb der Toleranzgrenzen. 

Hieraus lesen wir ab, dass die Vergrößerung der Prozessfähigkeit um ca. 58 % eine Verringerung 

des Ausschusses von ca. 90 % zur Folge hat. 

Beispiel 5.2.6: Wellendurchmesser. Ausfallrate 

Die Prozessfähigkeit C p = 1 zeigt, dass kein Messwert für die gefertigten Wellen außerhalb 

des Toleranzintervalls liegt, d. h. die Anteil der Messwert oberhalb der oberen Toleranzgrenze 

ist null und der Anteil der Messwerte unterhalb von T u ist ebenfalls null. 

Wenn wir allerdings diese Anteile nach obiger Formel schätzen, dann erhalten wir die 

Werte: 

• 

• 

geschätzter Anteil oberhalb der oberen Toleranzgrenze ist 1296 [ppm] 

geschätzter Anteil unterhalb der unteren Toleranzgrenze ist 1472 [ppm] 

Zusammen ergibt das einen Anteil außerhalb des Toleranzintervalls von 2768 [ppm]. 

Voraussetzungen für die Durchführung von Fähigkeitsnachweisen 

Wie jedes mathematische oder mathematisch statistisches Verfahren ist die Durchführung von 

Prozessfähigkeitsnachweisen an Voraussetzungen geknüpft. Diese betreffen 

• 

• 

• 

• 

• 

die Fähigkeit des Mitarbeiters, 

die Fähigkeit des Messprozesses, 

die Fähigkeit der Prozesse, Maschinen und Anlagen, 

Verteilung der Produktvariablen, 

die Prozessbeherrschung.


Wenn Sie die Fähigkeit des Messprozesses oder der Maschinen untersuchen wollen, verweise 

ich Sie auf das Buch von Rinne, Mittag [1999]. Dort werden diese Verfahren sehr ausführlich 

beschrieben. 

Wenn Sie Hypothesen über die zugrunde liegende Verteilung der Produktvariablen Y prüfen 

wollen, verweise ich Sie auf die einschlägigen Bücher über die univariate Statistik von Schwarze 

[1997], Lehnen, Wegmann [1985], Rinne, Mittag [1999] u. a. 

In der Literatur, so z. B. auch bei Rinne und Mittag, wird auf die Bedeutung der Stabilität der 

„Verhältnisse in der Produktion“ hingewiesen und erklärt, dass damit die zeitliche Konstanz 

der Verteilung der Produktvariablen gemeint ist. 

Braucht man die Stabilität für die Interpretation der Prozessfähigkeitsindizes? 

Ich meine nicht, denn die Stabilitätsanforderung müsste vor der Fähigkeitsanalyse überprüft 

werden. Erst nachdem nachgewiesen wurde, dass ein Prozess fähig ist, sollten Regelkarten 

eingeführt werden. Andererseits wird behauptet, die Stabilität mit Regelkarten nachzuweisen. 

Das sieht aus, wie eine Katze, die sich in den Schwanz beißt. 

Die Toleranzgrenzen liegen fest. Jedes Produkt, dessen Wert für die Produktvariable außerhalb 

des Toleranzintervalls liegt, ist Ausschuss. Der Grund, warum das Produkt Ausschuss ist, ist 

zwar interessant, aber erst bei der Ursachenforschung und nicht bei der Definition der Fähigkeiten. 

Der Begriff Stabilität sorgt immer wieder für Irritationen, so z. B. in den Arbeiten von 

Stark [1999] und Kaiser, Nowack [1999]. In diesen Arbeiten will man neue Gesichtspunkte 

für die univariaten Fähigkeitsberechnungen und Kontrollkartentechniken ableiten, lässt aber 

die spezifizierten Kundenanforderungen außer acht und bezieht nur statistische Aspekte ein. 

Das ist nicht zulässig. 

Können wir auch univariate Prozessfähigkeitsindizes berechnen, wenn die Produktvariable 

nicht normal verteilt ist? 

Ja. Wir betrachten als Benchmark den Fall, die 

Produktvariable Y ist binomial verteilt. 

Die Produktvariable Y kann nur zwei verschiedene Werte annehmen, z. B. 

Y 

⎧0, wenn das Produkt n. i. O. 

= ⎨ 

⎩ 1, wenn das Produkt i. O. 

wie z. B. bei der Wareneingangsprüfung. 

Die Wahrscheinlichkeiten für diese beiden Fälle seien P(Y = 0) = p und P(Y = 1) = 1 – p. Die 

Ausschusswahrscheinlichkeit p ist unbekannt und wird mit einer Stichprobe von N Werten, 

die ja nur 0 oder 1 sein können, bestimmt. 

Die Wahrscheinlichkeit dafür, dass in der Stichprobe vom Umfang N k Produkte defekt sind, 

ist durch die folgende Formel gegeben, 

⎛ 

N 

⎞ ⎛N 

⎞ 

P ⎜∑ 

yi 

= k⎟ 

= ⎜ ⎟ p ⋅(1 − p) 

⎝ ⎠ ⎝ k ⎠ 

i= 

1 

wobei k zwischen 0 und N liegt. 

k N−k


183 

Die Häufigkeiten für die verschiedenen k, d. h. für k = 0, k = 1, … werden durch die Häufigkeitsverteilung 

visualisiert und durch das Einzeichnen des Sollwertes p und der Toleranzgrenzen 

p u und p o mit dem Sollzustand verglichen. Die Binomialverteilung wird ebenfalls vollständig 

durch den Mittelwert 

Y = pˆ und die Standardabweichung s = 

pˆ 

(1 − pˆ) 

N 

charakterisiert. Damit können die obigen Formeln 1, 2 und 3 zur Berechnung der Prozessfähigkeitsindizes 

verwendet werden. Man erhält 

p − 

− 

o p 

pˆ 

p 

u 

Cp = , k = und Cpk = (1 − k) ⋅Cp. 

6 ⋅ s 1 

( po 

− pu) 

2 

Wir betrachten noch den etwas selteneren Fall, 

die Produktvariable Y ist nach Poisson verteilt. 

Bei dieser Verteilung sind Mittelwert und Standardabweichung gleich, d. h. es gilt Y = λ und 

s = λ . Hiermit sind wiederum die Formeln 1, 2 und 3 von oben anwendbar. 

Müssen Sie etwas über die Verteilungen der Prozessfähigkeitsindizes wissen? 

Ja, den n die univariaten Prozessfähigkeitsindizes sind Zufallsgrößen. Das wird deutlich, wenn 

Sie beachten, dass diese von Y und s abhängen. Y und s sind aber Zufallsgrößen, denn diese 

hängen wiederum nur von den Stichprobenwerten Y 1 , …, Y N ab. 

Aus der Verteilung der Prozessfähigkeitsindizes können Sie die Konfidenzintervalle für die 

Indizes berechnen. 

Wozu benötigen Sie die Konfidenzintervalle für die Prozessfähigkeitsindizes? 

Die Prozessfähigkeitsindizes sind Zufallsgrößen. Sie schwanken von Stichprobe zu Stichprobe, 

obwohl die Produktionsbedingungen gleich sind. Ist die ursprüngliche Streuung groß, so kann 

das zu Fehlentscheidungen führen. Daher wollen wir Ihnen mit den Konfidenzintervallen ein 

Instrument in die Hand geben, um die Unsicherheit zu quantifizieren. 

Für die Ableitung der Konfidenzintervalle benötigen wir die Verteilung der Indizes. Um diese 

berechnen zu können, fasse ich die bisherigen Ergebnisse zusammen. 

Unter der Voraussetzung Y ∼ N (μ, σ 2 ) gilt 

1. 

Y 

⎛ 

2 

σ ⎞ 

∼ N ⎜μ 

, ⎟ , wobei N der Stichprobenumfang ist 

⎝ N ⎠ 

2. 

( N −1) 

⋅ s 

σ 

2 

2 

2 

∼ χ , falls Y 1 , …, Y N unabhängig nach N (0, 1) verteilt sind 

3. Y und s 2 sind unabhängig voneinander verteilt und


4. 

Y − μ 

⋅ 

σ 

( N −1) 

( N −1) 

N 

⋅ s 

2 

⋅σ 

2 

Y − μ 

= ⋅ N ∼ t 

s 

N −1 

5. Konfidenzintervall für σ 2 ist durch 

2 2 

( N −1) ⋅ s 2 ( N −1) 

⋅ s 

≤ σ ≤ 

2 2 

χ 

χ 

α 

α 

1− 

2 2 

gegeben. Daraus folgt 

( N −1) ⋅ s 2 ( N −1) 

⋅ s 

≤ σ ≤ 

2 2 

χ 

χ 

R 

2 2 

L 

, 

wobei R den rechten Schwanz und L den linken Schwanz der χ 2 -Verteilung bezeichnen. 

Beweise: siehe z. B. Schmetterer [1956, S 131]. 

In 

C 

p 

To 

− T 

= 

6 ⋅ s 

u 

sind T o und T u fest. Nur s ist eine Zufallsgröße. Damit erhält man für C p das Konfidenzintervall: 

C 

≤ κ 

≤ C 

p p p 

mit 

wobei 

1 1 

Cp = Cp ⋅ und Cp = Cp 

⋅ 

b 

b 

u 

o 

N − 1 

bo, α = 

2 

χ α 

N −1,1− 

2 

N − 1 

bu, α = 

2 

χ α 

N −1, 2 

κ 

p 

To 

− T 

= 

6 ⋅ σ 

u 

In ähnlicher Weise kann man ein Konfidenzintervall für C pk berechnen. Ausgangspunkt ist die 

Darstellung von C pk in der Form


185 

C 

pk 

1 

T ( o u ) 

o Y Y T 

⋅ T − T − Y − M 

⎧ − − u⎫ 

= Min , 2 

⎨ 

⎬ = 

. 

⎩ 3⋅ s 3⋅ s ⎭ 

3⋅ 

s 

Die Konfidenzintervalle für µ und σ 2 sind: 

und 

s ⋅t s ⋅t 

Y − ≤ μ ≤ Y + 

N 

N 

α 

α 

N−1, N−1, 

2 2 

2 2 

( N −1) ⋅ s 2 ( N −1) 

⋅ s 

≤ σ ≤ 

χ 

χ 

α 

α 

N−1,1− N−1, 

2 2 

Indem man die Konfidenzintervalle für µ und σ 2 in die Formel für C pk einsetzt, erhält 

man das Konfidenzintervall für C pk mit der unteren Intervallgrenze C pk 

C 

pk 

= 

t α ⋅ s 

1 

N −1, ⋅ ( T − − − 2 

o Tu 

) Y − M 

2 

N 

3 ⋅ s ⋅ 

N − 1 

χ 

2 

α 

N −1, 2 

. 

Zur Abkürzung setzen wir 

und 

a 

b 

α 

α 

N −1, 2 

: = , 

N 

= 

t 

N − 1 

o. α 2 

χ α 

N −1,1− 

2 

N − 1 

bu, α = 

2 

χ α 

N −1, 2 

Damit erhält man 

C 

pk 

1 1 

⋅( To − Tu) − Y − M − aα 

⋅ s ⋅( To − Tu) 

− Y − M 

= 

2 

= 

2 

aα 

− 

3⋅ s ⋅b 3⋅ s ⋅b 3⋅b 

1 a 3 ⋅Cpk 

− a 

α 

= Cpk 

⋅ − = 

b 3⋅b 3⋅b 

u, α u, α u, α 

u, α u, α u, α 

α 

.


Analog erhält man für die obere Intervallgrenze Cpk 

3 ⋅ Cpk 

+ aα 

Cpk 

= 

3 ⋅ bo, 

α 

so dass 

⎛3⋅Cpk 

− aα 

3⋅ Cpk 

+ aα 

⎞ 

P ⎜ 

≤ κpk 

≤ ⎟ = 1 − α. 

⎝ 3⋅b 

3⋅b 

⎠ 

u, ε 

o, ε 

Beispiel 5.2.7: Akkubohrschrauber. Konfidenzintervalle für C p und C pk 

Die Sollvorgaben für die Produktvariable Y 2 Produktvariable sind 

M 2 = 0 [mm] 

T u,3 = –0.3 [mm] 

T o,3 = 0.3 [mm] 

Aus der Stichprobe von N = 113 vermessenen Gehäusen erhält man die statistischen Maßzahlen 

für den Istzustand 

Y 2 = 0.0099 [mm] 

s 2 = 0.204 [mm] 


C 

k 

p 

0.6 

= = 0.49 

6 ⋅ 0.204 

0.0099 

= = 

0.3 

C pk = 0.474. 

0.033 

Die Konfidenzintervalle zu C p und C pk sollen für die Irrtumswahrscheinlichkeit α = 0.05 

bestimmt werden. Dazu muss man die Koeffizienten a α und b o , α und b u , α berechnen. 

a 

α 

t 

N 

α 

−1, = 2 1.9814 

= = 0.18639 

N 113 

mit 

und 

t 112,0.025 = 1.9814 

N − 1 112 

= = = 0.92998 

129.5 

bo, α 2 

χ α 

N −1,1− 

2 

und 

N − 1 112 

= = = 1.22842 

χ α 

74.22 

N −1, 2 

bu, α 2


187 

mit 

χ 

χ 

2 

112,0.975 

2 

112,0.025 

= 129.5 

= 74.22 


P( Cp ≤ κp ≤ Cp) = 1− 

α 

P (0.3989 ≤ κ ≤ 0.5268) = 0.95 

und 

p 

P( Cpk ≤ κpk ≤ Cpk 

) = 1− 

α 

P (0.335 ≤ κ ≤ 0.577) = 0.995 

pk 

Die berechneten Prozessfähigkeiten und deren Konfidenzintervalle zeigen, dass der Prozess 

zur Herstellung der Plastikschalen verbessert werden muss. 

Zusammenstellung der Eigenschaften des univariaten Prozessfähigkeitsindizes C p 

• 

• 

Der einfache Prozessfähigkeitsindex C p ist eine streng monoton fallende Funktion von σ. 

Die Funktion C p ist konvex, d. h. 

dC p To 

− Tu 

1 

=− =− C 

2 

dσ 

6 ⋅ σ σ 

p 

Die grafische Darstellung von C p ist in der Abbildung 5.2.6 enthalten 

5 

Cpj 

0.33333 

0.2 s j 

3 

Abb. 5.2.6: C p in Abhängigkeit von σ 

Die Elastizität der Funktion C p wird nach der Beziehung 

dC 

Cp 

η( Cp) = = −1 

dσ 

σ 

p


berechnet. Dieser Ausdruck bedeutet, C p ist isoelastisch, d. h. eine Vergrößerung von σ um 1 % 

führt zu einer Verkleinerung von C p von 1 %. 

• 

• 

Die Anforderung an C p lautet nach Montgomery [1996], S. 446 C p > 1.33. 

Die Aussagen über C p betreffen die Verbindung zum Gutanteil der Produktion oder zur 

Ausschussquote. Diese können erst nach der Korrektur mit dem Korrekturfaktor k formuliert 

werden, da eine Verteilung, insbesondere die Normalverteilung, durch die beiden 

Momente Mittelwert und Standardabweichung vollständig charakterisiert wird. 

• Die Schätzfunktion für C p , hier mit 

ˆ To 

− Tu 

Cp 

= 

6 ⋅ s 

Ĉp 

bezeichnet, ist 

• Die Verteilung von C p ist unter der Annahme Y ~ N(μ, σ 2 ) eine χ 2 N – 1 Verteilung mit 

N – 1 FG. Die Schätzfunktion Ĉ p ist asymptotisch erwartungstreu und MSE-konsistent 

• Das Konfidenzintervall für C p ist 

⎛⎧ 

2 2 

χ 

⎫⎞ 

α χ α 

⎜ 

⎪ 

− − − 

⎪⎟ 

⎜⎨ 

ˆ N 1, N 1,1 

2 2 

P Cp 

⋅ ≤ Cp 

≤ ⎬⎟ 

= − 

⎪ −1 −1 

⎪ 

1 α 

N 

N 

⎜ 

⎝⎪ 

⎪⎟ 

⎩ 

⎭⎠ 

• Ein Test zur Prüfung der Hypothese H 0 : C 

χ 

N − 1 

2 0 

= C p ⋅ 

2 

χ α 

N −1,1− 

2 

p 

0 

p 

≤ C gegen die Alternative H 1 : C 

p 

0 

p 

> C ist 

Die Hypothese H 0 bedeutet, der Prozess ist nicht fähig. C p bezeichnet die Vorgabe des 

0 

Unternehmens bzgl. der Prozessfähigkeit, z. B. den Wert c p = 1.33 . 

• Für den Korrekturfaktor k erhält man die Resultate 

μ − M 

k = 

1 ( To 

− T ) u 

2 

k = 0 ⇔ µ = M 

k = 1 ⇔ µ = T o oder µ = T u 

0 < k < 1 ⇔ µ ∈ {( T o , T u ) \ {M}} 

k > 1 ⇔ µ ∉ [T u , T o ] 

lim k =∞ 

μ →±∞ 

k ist eine lineare Funktion von µ, wie die Abbildung 5.2.7 zeigt. 

k ist nur von µ abhängig. Die Funktion k ist nicht monoton. 

K ist linear fallend für µ < M und linear wachsend für µ > M. 

k ist somit ein dimensionsloses Maß für die Dezentrierung, bzw. 1 – k ist ein Maß für die 

Zentrierung des Prozesses auf den Sollwert M. 

0


189 

0.6667 

0.8 

0.6 

k i 

0.4 

0.2 

0 

-2 -1 0 1 2 

m i 

Abb. 5.2.7: Darstellung von k 

Eine Schätzfunktion für k ist 

kˆ 

= 

Y − M 

1 ( To 

− Tu 

) 

2 

mit 

2 

k ˆ ∼ N1 

( μk 

, σk 

), 

μ 

k 

2 2 

μ − M 

2 σY 

σY 

= und σk 

= = . 

1 N 

( T − 

− 

⋅ 

o Tu ) ( To Tu 

) 

N Δ 

2 2 

Die Schätzfunktion ˆk ist verzerrt. k wird systematisch zu groß geschätzt. Die Schätzfunktion 

ist aber asymptotisch erwartungstreu, d. h. der Bias konvergiert mit dem Stichprobenumfang 

N gegen null. 

Für die Ableitung eines Tests zur Prüfung von Hypothesen über k muss ˆk etwas umgeformt 

werden. 

Es gilt 

ˆ Y − M k − μk 

μk 

k = : Z = = σk 

+ . 

Δ σ σ 

Der Ausdruck 

k − μk 

U = ∼ N (0, 1) 

σ 

k 

Für den 2. Ausdruck kann man schreiben 

k 

k 

δ 

2 

2 2 

2 2 

⎛μ ⎞ ⎛ − ⎞ 

k μY 

M Δ k N 

= ⎜ ⎟ = ⎜ ⎟ = 

2 

⎝σ ⎠ ⎝σ / N ⎠ σ 

k Y Y 

Der Ausdruck (U + δ) 2 ~ χ 2 (1; δ 2 ), d. h. das Quadrat der Summe der beiden Summanden U und 

δ 2 ist nichtzentral χ 2 verteilt mit einem Freiheitsgrad und dem Nichtzentralitätsparameter δ 2 .


Mit diesen Darstellungen erhält man das Schwankungsintervall für ˆk 

σ Y 

χ 

⎛Δ ⎞ ˆ σ ⎛Δ 

⎞ . 

Δ N 

2 2 2 2 

2 k N Y 2 k N 

α ⎜ ⎟ ≤ k ≤ χ 

2 1− 

α ⎜ 2 ⎟ 

2 

⎝ σY 

⎠ Δ N 

2 

⎝ σY 

⎠ 

Setzt man in den Nichtzentralitätsparameter ein hypothetisches k 0 ein, dann kann man das 

Intervall als Test verwenden. 

Vorstellung von C pk : 

Die Verbindung zwischen C pk und der Ausschussquote bzw. dem Anteil der guten Produktion 

(Gutanteil) ist gegeben durch 

⎛To 

− μY 

⎞ ⎛Tu 

− μY 

⎞ 

Q = P({ Tu 

≤ Y ≤ To}) 

= Φ⎜ ⎟ − Φ 

⎝ σ ⎠ 

⎜ 

⎝ σ ⎟ 

⎠ 

Löst man C p nach σ auf, dann erhält man 

⎛ To 

− μY 

⎞ ⎛ Tu 

− μY 

⎞ 

Q = Φ⎜6⋅Cp 

⎟ − Φ⎜6⋅Cp 

⎝ T − T ⎠ ⎝ T − T ⎟ 

⎠ 

o u o u 

Y 

Hieraus kann man zunächst ablesen, dass C p allein zur Beschreibung der Ausschusses oder 

alternativ dazu des Gutanteils nicht ausreicht. 

Die Verwendung von 

liefert 

To + Tu To − T 

μY 

= + κ u , mit κ ∈R 

2 2 

Q = Q( C , κ) = Φ[3 ⋅(1 − κ) C ] − Φ[ −3 ⋅ (1 + κ) C ]. 

p p p 

Sind k und C p bekannt, dann ist die zweiseitige Ausschussquote eindeutig durch 

d. h. 

bestimmt. 

P = 2 − Φ[3 ⋅ C (1 + k)] − Φ[3 ⋅C (1 − k)] 

p 

⎛ 1 + k ⎞ 

P = 2 − Φ(3 Cpk 

) + Φ⎜3Cpk 

⎝ 

⎟ 

1 − k ⎠ 

p 

Y 

Korrigierter Prozessfähigkeitsindex C pk 

min ( To 

− μY; μY 

− Tu) 

Δ − μY 

− M 

Cpk 

= = = (1 − k) 

C 

3σ 

3σ 

Y 

C pk soll möglichst groß sein, denn große C pk garantieren geringe Ausschussquoten. 

Y 

p 

C 

pk 

⎧ Cpo 

für μY 

< M 

⎪ 

= ⎨Cp 

fürμY 

= M 

⎪ 

⎩Cpu 

fürμY 

> M


191 

μY 

− Tu 

To 

− μY 

wobei Cpu 

= und Cpo 

= . 

3 ⋅ σY 

3 ⋅ σY 

Die Funktion C pk = C pk (µ Y , σ Y ) besitzt bezüglich der Argumentvariablen die Eigenschaften 

max 

C ( μY; σY) = C ( M; σY) 

= C 

μ ∈ R 

μ 

Y 

Y 

pk pk p 

lim 

C −∞ 

→±∞ 

pk ( μY; σY) 

und bzgl. der Variablen σ 

und 

⎧∞ für Tu 

< μY 

< To 

lim 

⎪ 

C ( μY; σY) = ⎨0 fürμY = T oderμY 

= T 

σ → 0 

⎪ 

⎩ −∞ für μY 

< Tu 

oder μY 

> T 

Y 

pk u o 

lim 

C = 

→∞ 

pk ( μY; σY) 0. 

σ 

C pk > η, wenn der Streubereich [μ Y – 3 η σ Y ; μ Y + 3 η σ Y ] vollständig im Toleranzbereich 

[T u ; T o ] enthalten ist. Hieraus folgt, dass C pk > 1, wenn [μ Y – 3 σ Y ; μ Y + 3 σ Y ] vollständig in 

[T u ; T o ] liegt. 

Die partiellen Ableitungen von C pk nach µ Y und σ Y sind 

⎧ 1 

− für μY 

> M 

∂Cpk 

⎪ 3 σY 

= ⎨ 

∂μY 

⎪ 

1 

für μY 

< M 

⎪⎩ 3 σY 

∂C 

∂σ 

pk 

Y 

1 

=− C 

σ 

Y 

pk 

. 

Hiermit können die Elastizitäten berechnet werden Es gilt 

η σ 

∂Cpk 

Cpk 

( Cpk 

) = : = −1 

∂σ 

σ 

Y 

d. h. bzgl. σ Y ist C pk eine isoelastische Funktion. 

Y 

⎧ μ 

− 

Y 

∂Cpk 

Cpk 

⎪ Δ − μY 

− M 

ημ 

( Cpk 

) = : = ⎨ 

∂μY 

μY 

⎪ 

μ + 

Y 

⎪ ⎩ Δ − μY 

− M 

ist nicht eindeutig, so dass bzgl. µ Y keine Aussage über die Elastizität formuliert werden kann. 

Die Darstellung von C pk ist in der Abbildung 5.2.8 zu sehen. 

o


4 

3 

2 

40 

20 

10 

0 

1 

0 

10 

20 

30 

Abb. 5.2.8: Darstellung des korrigierten Prozessfähigkeitsindexes 

Die Schätzfunktion für C pk ist 

Cˆ 

pk 

0.5 ( To 

− Tu) 

− Y − M 

= = (1 − k) 

Cˆ 

s 

3 Y 

p 

Die Verteilungsdichte für Ĉ pk ist recht kompliziert. Diese wurde von Chou, Owen [1989] 

abgeleitet. Hier soll auf die Wiederholung der Darstellung verzichtet werden, da deren Angabe 

keinen praktischen Nutzen zeigt. 

Prozessfähigkeitsindex C pm nach Taguchi 

Ausgangspunkt für diese Darstellung ist die Variabilität τ 2 von Y bzgl. des Sollwertes M, d. h. die 

Beziehung E [(Y – M) 2 ] = σ 2 Y + (µ Y – M) 2 =: τ 2 , in der σ 2 Y die Varianz um den Erwartungswert 

µ Y und der zweite Term den quadratischen Bias angibt. Da σ ≤ τ mit der Gleichheit nur für 

µ Y = M, gilt selbstverständlich C pm ≤ C p . Genauer kann man schreiben 

C pm = σ Y / τ C p . 

Die grafische Darstellung von C pm ist in der Abbildung 5.2.9 enthalten. 

Die beiden Graphen für C pk und C pm unterscheiden sich vor allem hinsichtlich der nichtlinearen 

Abhängigkeit des Indexes C pm von µ Y und σ Y .


193 

2 

1.5 

1 

30 

40 

20 

10 

10 

0.5 

0 0 

Abb. 5.2.9: Darstellung des Prozessfähigkeitsindexes nach Taguchi 

20 

5.2.1.7 Was sind multivariate Prozessfähigkeitsindizes? 

Problem 

Ein Prozess wird fähig genannt, wenn er konsequent Produkte produziert, dessen Produktvariablen 

innerhalb des Spezifikationsbereiches liegen. Ein Produkt wird durch m, m ≥ 1 nicht 

unabhängige Produktvariable Y 1 , …, Y m beschrieben. Der rechteckige Spezifikations- oder 

Toleranzbereich ist 

m 

TB : = { Y : Y ∈R 

und Y ∈ [ T , T ] für j = 1, …, m}. 

j u, j o, j 

Manchmal ist TB durch ein Hyperellipsoid oder ein anderes Gebilde spezifiziert. 

Ein Maß für die Fähigkeit des Prozesses, der aufgrund aller relevanten, nicht unabhängigen 

Produktvariablen beurteilt werden soll, wird multivariater Prozessfähigkeitsindex genannt und 

mit MC p (einfacher) bzw. MC pk (korrigierter) bezeichnet. Das Problem besteht nun darin, 

die multivariaten Prozessfähigkeitsindizes zu bestimmen und Entscheidungen aufgrund der 

multivariaten Prozessfähigkeitsindizes zu treffen. 

Sind die Entscheidungsmöglichkeiten analog denen der univariaten Prozessfähigkeitsindizes? 

In der neueren Literatur gibt es einige Ansätze für multivariate Prozessfähigkeitsindizes, so wie 

diese in den Arbeiten von Chan, Chen, Spiring [1988], Taam et al. [1993], Wang et al. [2000], 

Jahn [1997]. 

Die Notwendigkeit für die Ableitung von Formeln soll an Beispielen mit unterschiedlicher 

Abhängigkeitsstruktur betrachtet werden.


Beispiel 5.2.8: Simulationen. Maßzahlen und univariate Fähigkeiten 

Es wird der zweidimensionale Fall mit den beiden Produktvariablen Y 1 und Y 2 betrachtet. 

Der Y sei normal verteilt mit dem Vektor der Erwartungswerte µ T = (µ 1 , µ 2 ) und der 

Kovarianzmatrix 

Σ 

YY 

⎛ 

2 

σ ⎞ 

1 σ12 

= ⎜ 

2 

⎟. 

⎝ σ ⎠ 

2 

Die Sollwerte seien M T = (5.0, 5.0), 

und die unteren und oberen Toleranzgrenzen seien 

T o T = (7.5, 7.5) 

T u T = (2.5, 2.5). 

Für die beiden Fälle werden Stichproben mit den sehr großen Stichprobenumfängen 

N 1 = N 2 = 5000 simuliert. 

Für den unkorrelierter Fall erhält man die Schätzungen r 12 = –0.0078, 

S YY 

⎛0.6261 −0.0053 ⎞ 

= ⎜ 

⎝ 

⎟, 

0.7395 ⎠ 

und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.5. 

Tabelle 5.2.5: Univariate Prozessfähigkeitsindizes für den unkorrelierten Fall 

T u T o Mittel Stdabw. C p k C pk 

Y 1 2,5 7,5 5,505 0,7913 1,053 0,202 0,8401 

Y 2 2,5 7,5 4,288 0,86 0,969 0,2846 0,6933 

Für den extrem hoch korrelierten Fall erhält man die Schätzungen r 12 = 0.9987, 

S YY 

⎛0.6591 0.70827 ⎞ 

= ⎜ 

⎝ 

⎟, 

0.76344⎠ 

und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.6. 

Tabelle 5.2.6: Univariate Prozessfähigkeitsindizes für den hoch korrelierten Fall 

T u T o Mittel Stdabw. C p k C pk 

Y 1 2,5 7,5 5,4904 0,8122 1,0261 0,1962 0,8248 

Y 2 2,5 7,5 4,2899 0,8732 0,9544 0,2841 0,6833 

Aus den Tabellen liest man ab, dass sich die statistischen Maßzahlen für den unkorrelierten 

und hoch korrelierten Fall im statistischen Sinne nicht unterscheiden und die Kovarianzmatrizen 

und damit natürlich die Korrelationsmatrizen sich wesentlich unterscheiden.


195 

Sind der unkorrelierte und hoch korrelierte Fall aber bzgl. der simultanen Erfüllung der 

Kundenanforderungen beider Produktvariablen als gleich anzusehen? 

Zur Beantwortung dieser Frage müssen weitere Charakteristika berechnet werden. Zu diesen 

zählen die Eigenwerte, die Längen der Hauptachsen der Streuungsellipsen, in deren Inneren 

alle Punkte (Y i1 , Y i2 ), i = 1, …, N mit der Wahrscheinlichkeit 1 – α = 0.0027 liegen und die 

Projektionen der Hauptachsen auf die Achsen der Produktvariablen. 

Längen der Hauptachsen der Ellipse : 

Für die Kovarianzmatrix Σ YY können wir die Eigenwerte über die charakteristische Gleichung 

det(S YY – λ I) = 0, 

d. h. 

2 

1 s12 

2 

21 s2 

s − λ 

s 

− λ 

= 0 

berechnen. 

Wir erhalten die quadratische Gleichung 

2 2 2 2 2 2 2 2 2 

1 − λ 2 − λ − 12 = λ − λ 1 + 2 + 1 2 − 12 

2 

λ λ Sp SYY 

SYY 

( s )( s ) s ( s s ) ( s s s ) 

= − ⋅ ( ) + det( ) = 0 

Beispiel 5.2.9: Simulationen. Eigenwerte und Längen der Hauptachsen 

Hieraus können wir für beide Fälle die Eigenwerte für den 

unkorrelierten Fall 

λ 1 = 0.73975 und λ 2 = 0.62585 und den 

hoch korrelierten Fall 

λ 1 = 1.42092 und λ 2 = 0.0006178 

berechnen. 

Die Eigenwerte unterscheiden sich wesentlich. 

Mit den Eigenwerten können wir die Längen der Hauptachsen der Streuungsellipsen nach 

der Formel 

L 

j 

= 2 λ ⋅c, 

j 

berechnen, wobei 

c 

=−2⋅ln(2⋅π 

⋅h 

⋅ 1 −ρ12 

2 ). 

Die maximale Höhe h max der Vd ist Φ (0, 0). Die Höhe der Vd für eine vorgegebene Wahrscheinlichkeit 

α ist 

1 1 

h α = 0.0027 = = = 0.083367 

2π det( Σ YY ) 11.995087


Hieraus folgt 

c 

2 π ⋅0.0027 ⋅ det( ΣYY 

) 

=−2⋅ln(2⋅π 

⋅ h0.0027 

det( ΣYY 

) =−2ln 

2π 

det( Σ ) 

2 

1 −α, 

m 

=− 2 ln( α) =− 2 ln(0.0027) = 11.82973 = χ . 

YY 

Die Längen der Hauptachsen der Ellipsen für die beiden Fälle sind 

L 

L 

1,unkorr 

2,unkorr 

= 0.73975 ⋅ 11.82973 = 2 ⋅ 2.95822 = 5.9164 

= 0.62585 ⋅ 11.82973 = 2 ⋅ 2.72096 = 5.4419 

und 

L 

L 

1,hochkorr 

2,hochkorr 

= 2 ⋅ 1.42092 ⋅ 11.82973 = 2 ⋅ 4.09989 = 8.19978, 

= 2 ⋅ 0.0006178 ⋅ 11.82973 = 2 ⋅ 0.08548 = 0.17097 

Die Projektionen der ersten beiden Hauptachsen auf die Koordinaten- (Toleranz-) Achsen 

ergibt 

P 1 = 4.18 

P 2 = 5.798. 

Die Flächeninhalte der beiden Ellipsen sind 

für den unkorrelierten Fall F unkorr = 25.287 und 

für den hoch korrelierten Fall F hoch korr = 1.101. 

Aus dem Beispiel 5.2.9 erkennt man, dass im Falle der Unkorreliertheit die Ellipse im Toleranzgebiet 

liegen würde, wenn die Abweichung zwischen den Soll- und Mittelwerten klein 

genug wäre. 

Im Falle der starken Korreliertheit ragt die Ellipse auch für den Fall kleiner Abweichungen 

zwischen den Soll- und Mittelwerten über das Toleranzgebiet hinaus. 

Das bedeutet aber, dass in dem unkorrelierten Fall der Prozess hinsichtlich des 

Streuungsverhaltens fähig und im korrelierten Fall nicht fähig ist. 

Dieses Verhalten wird durch die univariaten Prozessfähigkeitsindizes nicht wider gespiegelt. 

Daher ist die Verallgemeinerung der uni- auf die multivariaten Prozessfähigkeitsindizes notwendig. 

Die nachfolgende Abbildung verdeutlich diesen Schluss geometrisch. 

In Abbildung 5.2.10. werden die beiden Grundflächen der schwach und hochkorrelierten 

Verteilung in einer Grafik in Bezug auf den 

• 

• 

gemeinsamen Sollzustand (M T = (5; 5) und T T = (T o,1 – T u,1 ; T o,2 – T u,2 ) = (5; 5) und 

T 

den Mittelpunkt Y = ( Y 1 Y 2 ) dargestellt. 

Wir können aus dieser Abbildung folgende Sachverhalte ablesen: 

1. Für den unkorrelierten Fall liegt die Streuungsellipse in Sollwertlage, d. h. mit dem Mittelpunkt 

M vollständig innerhalb des Toleranzrechteckes mit den Diagonalen der Länge 

7.071.


197 

T o2 = 7,5 

M 2 = 5 

Y2 

T u,2 = 2,5 

T u.1 = 2,5 M 1 = 5 

Y1 

T 0,1 = 7,5 

Abb. 5.2.10: Streuungsellipsen für den schwach und hoch korrelierten Fall im Toleranzgebiet 

2. Die Streuungsellipse für den hoch korrelierten Fall ragt auch in der Sollwertlage über das 

Toleranzgebiet hinaus. 

3. Die Streuungsellipsen in Mittelwertlage ragen in beiden Fällen über die Toleranzgrenzen 

hinaus, d. h. die zu beiden Verteilungen gehörenden Prozesse liefern Ausschuss. Die Prozesse 

sind nicht fähig. 

Diese Abbildung wird durch die Streuungsellipsen der Abbildung 5.2.11 und Abbildung 5.2.12 

für den unkorrelierten und hoch korrelierten Fall bestätigt. 

Die Abbildungen bestätigen die obigen Aussagen, dass mit größer werdenden Korrelationskoeffizienten 

der Anteil der Punkte außerhalb des Toleranzgebietes größer wird und dass 

dadurch die multivariaten Prozessfähigkeitsindizes kleiner werden und deren Berechnung 

notwendig ist. 

8 

6 

4 

Y2 

2 

0 

2 3 4 5 6 7 8 

Y1 

Abb. 5.2.11: Streudiagramm für den unkorrelierten Fall


8 

6 

4 

Y2 

2 

0 

2 3 4 5 6 7 8 

Y1 

Abb. 5.2.12: Streudiagramm für den hoch korrelierten Fall 

Vor der Ableitung neuer multivariater Prozessfähigkeitsindizes (multivariate process capability 

indices) MC p und MC pk werden die folgenden Voraussetzungen und Anforderungen gestellt: 

• Die Produktivität eines Unternehmens ist wesentlich von dem Niveau der im Unternehmen 

angewendeten Methoden für die Strukturierung des Unternehmens, die statistische Prozessanalyse 

und die Entscheidungsfindung für die Prozessverbesserung, die Tolerierung oder 

Überprüfung der Toleranzen mit multivariaten statistischen Methoden auf der Grundlage 

der Prozessfähigkeiten abhängig. 

• Jedes Produkt wird durch mehrere (m ≥ 1) Produktvariablen Y 1 , …, Y m beschrieben. Die 

Produktvariablen sind nicht unabhängig voneinander. 

Der Sollzustand wird durch 

• 

• 

den Vektor der Sollwerte M T = (M 1 , …, M m ) und 

die Vektoren der Toleranzgrenzen T T o = (T o1 , …, T om ) und TT u = (T u1 , …, T um ) 

und der Istzustand durch 

• 

• 

den Vektor der Mittelwerte Y = ( Y 1 … Y m ) und 

die positiv definite Stichprobenkovarianzmatrix S YY 

T 

beschrieben. 

Was ist Qualität? (Wir müss en hier von Produktqualität sprechen) 

Die Qualität eines Produktes wird durch die simultane Erfüllung aller relevanten Kundenanforderungen 

definiert. Für den Vergleich ist es notwendig, dass 

• die relevanten Kundenanforderungen unter Beachtung der Abhängigkeitsstruktur zwischen 

den Produktvariablen durch Sollwerte und Toleranzgrenzen spezifiziert werden müssen.


199 

• Zum anderen ist es ebenfalls notwendig, den Istzustand für alle relevanten, nicht unabhängigen 

Produktvariablen durch die m-dimensionale Häufigkeitsverteilung, bzw. durch die 

Angabe des Mittelwertvektors und der Stichprobenkovarianzmatrix S YY zu erfassen. 

• Über den Vergleich von Soll- und Istzustand muss die Qualität quantifiziert werden, um 

sinnvolle Entscheidungen treffen zu können. 

Die multivariaten Prozessfähigkeitsindizes quantifizieren die Qualität 

• Der Vektor der Produktvariable Y sei entweder 

gemeinsam normal verteilt, d. h. Y ~ N m (µ, Σ YY ), Σ YY > 0 

oder die gemeinsame Verteilung gehört zur Klasse der elliptisch umrissenen Verteilungen. 

• Die multivariaten Prozessfähigkeitsindizes sollen Eigenschaften haben, die analog zu denen 

der univariaten Prozessfähigkeitsindizes sind. Insbesondere sollen die multivariaten 

Prozessfähigkeitsindizes als Entscheidungsgrundlage für 

– 

– 

– 

die Prozessverbesserung im Sinne der Reduktion der Variabilität der Produktvariable, 

falls MC p < 1, 

der Justierung des Prozesses, falls MC p > 1 und MC pk < 1, 

der Überprüfung oder Neuberechnung der Toleranzgrenzen, falls MC p < 1 und die 

Differenz zwischen MC p und MC pk sehr groß ist, 

dienen. 

– 

– 

– 

– 

– 

– 

– 

– 

Der multivariate Prozessfähigkeitsindex MC p , der das Streuverhalten des zufälligen Vektors 

der Produktvariablen im Vergleich zum Toleranzbereich beurteilt, muss 1 sein, falls 

das Streuungsellipsoid den Toleranzbereich an allen Koordinatenebenen berührt, 

MC pk ≤ MC p für K ≥ 0. 

K ist nichtlinear von Y − M abhängig, 

die Form des Ellipsoids oder Hyperellipsoids der Realisierungen des Vektors der Produktvariablen 

ist vom Grad der Multikollinearität δ = 

1 

abhängig. 

Je größer der Grad der Multikollinearität ist, desto kleiner wird die kleinste Hauptachse 

des Hyperellipsoides. 

MC p muss folglich ebenfalls von δ abhängen. 

MC p soll für verschiedene Toleranzbereiche 

m 

· unabhängige Spezifikationsbereiche ( T − T ) 

∏ oj 

uj 

j= 

1 

R YY 

· abhängige Spezifikationsbereiche (T o – M) T A (T o – M) 

gelten. 

Sind die Produktvariablen unabhängig voneinander, kann die Benferoni Ungleichung angewandt 

werden, um sicher zustellen, dass dieselbe Wahrscheinlichkeit α für alle Produktvariablen 

gilt. Außerdem kann in diesem Fall die multivariate Prozessfähigkeit durch das Produkt über 

alle Prozessfähigkeiten für jeden Produktvariable 

m 

MPC′ = ∏C 

p p, j 

j= 

1 

abgeschätzt werden.


Sind die Produktvariablen nicht unabhängig voneinander, dann sind sie korreliert. Die 

Abhängigkeitsstruktur zwischen den Produktvariablen, ausgedrückt durch die Korrelationsoder 

Kovarianzmatrix, muss berechnet werden. In diesen Fällen liefern die Produkte über die 

einfachen Prozessfähigkeitsindizes unsinnige Ergebnisse. 

Was müssen wir tun, um im multivariaten Fall den Soll- mit dem Istzustand vergleichen zu 

können? 

Im univariaten Fall haben wir Intervalle (Breite des Toleranzintervalls und Breite der Häufigkeitsverteilung) 

miteinander verglichen. 

Im zweidimensionalen Fall könnten wir Flächen – die Streuungsellipse und den Toleranzbereich 

– miteinander vergleichen. Das hieße, dass wir im m-dimensionalen Fall Volumen 

vergleichen müssten. 

Welche Zahl können wir für m = 2 einer Fläche zuordnen? 

Die Flächeninhalte des Kreises und der Ellipse mit dem Flächeninhalt des Toleranzbereiches 

zu vergleichen, ergäbe für den unkorrelierten Fall den Wert 

Toleranzbereich 25 

= = 

Streuungsbereich 25.287 

und für den hoch korrelierten Fall 

Toleranzbereich 25 

= = 

Streuungsbereich 1.101 

0.988 

22.706. 

Dieser Vergleich macht keinen Sinn, denn die Abbildungen 5.14 und 5.15 zeigen, dass 

• 

• 

• 

Die „Ecken“ des Toleranzbereiches durch den Prozess nicht belegt werden können, 

der Streuungskreis für den unkorrelierten Fall und 

die Streuungsellipse für den hoch korrelierten Fall 

über die Toleranzgrenzen hinausragen. 

An dieser Stelle möchte ich Ihnen die Frage stellen, warum sind Schießscheiben rund? 

Natürlich weil die Trefferbilder eines jeden Schießgerätes kreisförmig umrissen sind. Die Ecke 

eines rechteckigen Zielgebietes zu treffen ist genauso schwierig, wie in das Zentrum zu treffen, 

ja man kann sagen, jeder Eckpunkt ist der Mittelpunkt eines Vierteilkreises. Da der Flächenvergleich 

kein Ergebnis liefert, müssen wir uns etwas anderes überlegen. 

Wir können die Definition des univariaten Prozessfähigkeitsindex auch anders interpretieren, 

indem wir fragen, wie groß ist der Abstand zwischen der oberen und unteren Toleranzgrenze 

relativ zur Standardabweichung der betrachteten Produktvariablen? 

Das würde bedeuten, dass wir die Abstände zwischen Punkten in beliebig dimensionalen Räumen 

unter Beachtung der Abhängigkeitsstruktur zwischen den Produktvariablen betrachten 

und nach passenden Abstandsdefinitionen suchen. 

Im Kapitel 10 über die Klassifikationsverfahren, speziell bei der Einführung der Clusteranalyse, 

werden einige Abstandsdefinitionen eingeführt und betrachtet. Der für die Ableitung der 

multivariaten Prozessfähigkeitsindizes passende Abstandsbegriff ist der


201 

Mahalanobis Abstand 

Der gewichtete A bstand zwischen den beiden Vektoren z. B. Y 1 und Y 2 mit den Gewichten, die 

durch die inversen Kovarianzmatrix geliefert werden, ist durch 

T 

1 2 1 2 

T −1 

1 2 ΣYY 

1 2 

D = ( Y − Y ) A( Y − Y ) 

= ( Y − Y ) ⋅ ⋅( Y − Y ) 

definiert, wobei die Gewichtsmatrix A durch die inverse Kovarianzmatrix ersetzt wird. Ist 

Σ YY unbekannt, so wird sie durch die Stichprobenkovarianzmatrix S YY ersetzt. Sind die Stichprobenkovarianzmatrizen 

von Y 1 und Y 2 verschieden, so kann man S YY durch die gemittelte 

(pooled) Kovarianzmatrix ersetzen. 

Nehmen wir wie oben an, dass der zufällige Vektor Y der Produktvariablen Y 1 , …, Y m m-dimensional 

normal verteilt ist, dann hat er die Verteilungsdichte 

1 ⎧ 1 

⎫ 

f ( y; , ) exp ( Y ) ( Y ) ⎬, 

⎭ 

T −1 

Y μΣ = ⋅ ⎨− − μY ⋅ΣYY ⋅ − μ 

m 

Y 

1 ⎩ 2 

(2 π) 

2 ⋅ ΣYY 

2 

wobei Σ YY eine positiv definite Kovarianzmatrix ist. Diesen Sachverhalt kürzen wir durch 

Σ YY > 0 ab. In dieser Darstellung erkennen wir, dass die quadratische Form im Exponenten 

der m-dimensionalen Normalverteilung mit den Abweichungen der Messwertvektoren Y i vom 

T −1 

i YY i 

Erwartungswertvektor µ genau ein Mahalanobis Abstand D = ( Y − μ) Σ ( Y − μ ) ist, der 

den „gewichteten“ Abstand einer Zufallsgröße Y i von ihrem Erwartungswert misst. 

Das wollen wir uns für die Definition der multivariaten Prozessfähigkeitsindizes zunutze 

machen. 

Neue Definition der multivariaten Prozessfähigkeitsindizes 

Beim Übergang von d en univariaten zu den multivariaten Prozessfähigkeitsindizes müssen 

wir anmerken, dass sich von Stichprobe zu Stichprobe mit den Vektoren der Einzelwerte 

Y i , i = 1, …, N auch die Vektoren der Mittelwerte Y und die Stichprobenkovarianzmatrizen 

ändern können. Die einzige nahezu unveränderliche „Größe“ ist die Korrelationsmatrix für 

die Produktvariablen. 

Bedingte Prozessfähigkeitsindizes 

Infolgedessen suchen wir den mit der Stichprobenkovarianzmatrix gewichteten Abstand 

zwischen dem Vektor der Abweichungen des Einzelwertes Y i vom Vektor der Mittelwerte. Das 

wäre der mittlere Mahalanobis Abstand 

1 

N 

N 

∑ 

i= 

1 

Nun gilt aber 

T −1 

i − SYY i 

( Y Y) ( Y − Y). 

⎡ ⎛ 

N 

− 

⎞⎤ 

⎧ 

N 

E 1 1 1 

− 

⎫ 

⎢ ⎜ − − ⎟⎥ = ⎨ ⎡ 

1 

Sp ∑ ( ∑ − − ⎤ 

⎣ ⎦⎬ 

⎢⎣ 

⎝ 

Y T 

T 

i Y ) SYY ( i ) Sp YY ( i )( i ) 

N 

Y Y i= 1 ⎠⎥⎦ 

⎩N 

E S Y Y Y Y 

i= 

1 

⎭ 

n 

= = const 

N


Zudem muss dieser Abstand relativ zu dem gewichteten Abstand zwischen den Vektoren der 

oberen Toleranzgrenzen und den Sollwerten 

−1 

YY 

( T − M) S ( T − M) 

o 

T 

o 

betrachtet werden. 

Dieser Abstand kann auch mit dem Spurkriterium in den Ausdruck 

⎡ m ( T − ⎤ 

−1 ⎡ 

−1 

o, j M ) 

T 

T 

j 

( T − − = − − ⎤ 

o M) SYY 

( To M) Sp 

⎣ 

( To M)( To 

M) 

SYY 

⎦ 

= ⎢∑ 

⎥ 

⎢⎣j 

= 1 

Sj/ 

m− 

j ⎥⎦ 

umgeformt werden. Die Summanden dieser Summe sehen aus wie die einfachen Prozessfähigkeitsindizes 

mit den bedingten anstelle der einfachen Standardabweichungen. Für die einzelnen 

Produktvariablen kann die Formel 

( To, j − Tu, 

j) 

MCp() j = , ∀ j = 1, …, 

m 

6 ⋅ S 

j/ 

m− 

j 

als einfacher bedingter oder multivariater Prozessfähigkeitsindex für die j-te Produktvariable 

verwendet werden. Der Korrekturterm für die Messung der Abweichung des Mittelwertes vom 

Sollwert ist 

Mj − E( Yj / Ym− 

j) 

kj 

= 2 , ∀ j = 1, …, m. 

T − T 

o, j u, j 

Der korrigierte bedingte (oder multivariate) Prozessfähigkeitsindex für die j-te Produktvariable 

ist 

MC () j = [1 − k MC ()]. j 

pk 

j 

p 

Die bedingten Prozessfähigkeitsindizes hängen noch über die bedingte Varianz von der Kovarianzmatrix 

ab. Daher ist es sinnvoll, noch ein globales Maß für die multivariate Prozessfähigkeit 

auszurechnen. 

Multivariate Prozessfähigkeitsindizes 

Wir gehen wieder vom univariaten Prozessfähigkeitsindex C p aus und schreiben den in der 

Form 

To 

− Tu 

1 1 

Cp 

= ⋅ = σ* 

6 S S 

wobei 

T 

o 

− T 

6 

u 

= σ* 

die maximale Streuung für die Produktvariable ist, die garantiert, dass die Häufigkeitsverteilung 

für die Werte der Produktvariablen innerhalb des Toleranzintervalls liegt. Ist S > σ*, dann ist 

C p < 1. Diesen Ausdruck für C p wollen wir auf den multivariaten Fall verallgemeinern. 

Eine Möglichkeit der Verallgemeinerung wäre die Bildung des verallgemeinerten Varianzquotienten 

* −1 

( Σ S ). 

YY 

YY 

2


203 

Dieser Ausdruck oder gewisse Funktionale davon scheinen nicht geeignet zu sein. Daher wählen 

wir für den multivariaten Prozessfähigkeitsindex den Quotient zweier quadratischer Formen. 

Die quadratische Form im Zähler ist die schon betrachtete 

−1 

YY 

( T − M) S ( T − M). 

o 

T 

o 

Die im Nenner stehende zweite quadratische Form wird mit der so genannten „theoretischen“ 

* 

* 

Kovarianzmatrix Σ YY anstelle der Stichprobenkovarianzmatrix S YY gebildet. Σ YY wird aus der 

Korrelationsmatrix, den Toleranzgrenzen und Sollwerten für alle m Produktvariablen berechnet. 

Mit diesen Überlegungen erhält man für die Vektoren der oberen Toleranzgrenzen 

T 

o o,1 o, m 

T = ( T … T ) 

und der Sollwerte 

T 

den Ausdruck 

wobei 

M = ( M 1 … M m ) 

MC 

Σ 

T -1 

o − SYY o − 

p = 

T * −1 

o − ΣYY 

o 

( T M) ( T M) 

( T M) ( ) ( T − M) 

⎛ − ⎞ ⎛ − ⎞ 

= diag ⎜ T M ⎝ 

⎟ R diag 

⎠ 

⎜ T M 

YY 

⎝ 

⎟ 

3 3 ⎠ 

* o o 

YY 

die theoretische Kovarianzmatrix und R YY die Korrelationsmatrix des Vektors Y T = (Y 1 , …, Y m ) 

der m, m ≥ 1 Produktvariablen ist. 

Für schiefsymmetrische Toleranzgrenzen verwendet man 

MC 

T −1 

o o − SYY 

o − 

p = 

T * −1 

o − ΣYY 

o 

( T M) ( T M) 

( T M) ( ) ( T − M) 

MC 

T −1 

u ( M − Tu) SYY 

( M − Tu) 

p = 

T * −1 

M − Tu 

ΣYY 

M − Tu 

( ) ( ) ( ) 

Der Korrekturterm wird nach der Formel 

MC 

T −1 

u − u SYY 

p = 

T * −1 

− u ΣYY 

( M T ) ( M − Tu 

) 

( M T ) ( ) ( M − T ) 

berechnet. Damit wir der korrigierte multivariate Prozessfähigkeitsindex 

MCpk = MCp / K 

berechnet. 

Die Entscheidung wird entsprechend den Größen von MC p und MC pk vorgenommen. 

u


Daten 

T u 2 

T u 2 

T u 2 

M 2 

M 2 

M 2 

T l 2 

Y 2 

T l 1 M 1 T u 1 Y 1 

T l 2 

Y 2 

T l 1 M 1 T u 1 Y 1 

T l 2 

Y 2 

T l 1 M 1 T u 1 Y 1 

MC p < 1 MC p > 1 MC p > 1 

MC pk < 1 MC pk < 1 MC pk >1 


Kontrolle des Prozesses 

Reduktion der 

Variation 

Justierung des 

Prozesses 

Abb. 5.2.13: Entscheidungen aufgrund der multivariaten Prozessfähigkeitsindizes 

Gilt MC p < 1 (bzw. 1.33), dann ragt die multivariate Häufigkeitsverteilung der Produktvariablen 

an einer, mehreren oder allen Rändern über den Toleranzbereich hinaus. Ausschuss wird 

produziert. Der Prozess muss so verbessert werden, dass die Variabilität der Produktvariablen 

kleiner wird. Das kann nur über die Steuerung des Prozesses mit den Sollwerten und Toleranzgrenzen 

als Zielwerte für die Produktvariablen erreicht werden. In diesem Fall ist auch 

MC pk < 1, da K > 0 ist. 

Gilt MC p > 1 (bzw. 1.33) und MC pk < 1 (bzw. 1.33), dann weicht der Vektor der Mittelwerte 

zu stark vom Vektor der Sollwerte ab. Die multivariate Häufigkeitsverteilung der Produktvariablen 

kann über den Toleranzbereich hinausragen. Das bedeutet aber, dass trotz MC p > 1 

(bzw. > 1.33) Ausschuss produziert wird. Der Prozess muss verbessert werden, so dass die 

Mittel- und Sollwerte übereinstimmen. 

Gelten sowohl MC p > 1 und MC pk > 1 (bzw. > 1.33), dann ist der Prozess fähig, Produkte 

mit den durch Sollwerte und Toleranzgrenzen vorgegebenen Eigenschaften zu produzieren. 

In diesem Fall muss der Prozess mit den multivariaten Kontrollkarten des Kapitels 6 ständig 

überwacht werden. Die Entscheidungen werden durch die Abbildung 5.2.13 visualisiert. 

Was besagen die Begriffe Produktqualität, Lieferantenqualität und Prozessqualität? 

Die bedingten und multivariaten Prozessf ähigkeitsindizes sind auf die Produkte, die Inputoder 

Lieferantenprodukte und die Prozesse anwendbar. In jedem Falle müssen die Sollzustände, 

ausgedrückt durch Sollwerte und Toleranzgrenzen, für die nicht unabhängigen Variablen mit 

den Istzuständen, ausgedrückt durch die Schätzungen für die Mittelwertvektoren und Kovarianzmatrizen, 

verglichen werden. 

Für die Anwendung der multivariaten Prozessfähigkeitsindizes MC p und MC pk auf die Produkte, 

Prozesse und Lieferantenprodukte wollen wir die folgenden Bezeichnungen einführen.


205 

• 

• 

• 

• 

• 

PC p und PC pk werden für die Messung der simultanen Erfüllung aller relevanten Kundenanforderungen 

verwendet. Diese Fähigkeitsindices wollen wir Produktfähigkeiten nennen. 

Die Produktfähigkeit PC pk misst die Produktqualität. 

LC p und LC pk werden für die Beurteilung der Input- oder Lieferantenprodukte verwendet. 

Die Lieferantenfähigkeit LC pk misst die Lieferantenqualität. 

ProzC p und ProzC pk wollen wir für die Beurteilung der Prozesse verwenden. 

Die Prozessfähigkeit ProzC pk misst die Prozessqualität. 

Die Lieferanten- und Prozessqualität sind die notwendigen Voraussetzungen für die Produktqualität. 

Mitunter, wenn keine Verwechslungen möglich sind, werden aber die übergeordneten Bezeichnungen 

MC p und MC pk verwendet. 

An mehreren Beispielen wollen wir jetzt demonstrieren, wie die multivariaten Prozessfähigkeitsindizes 

zu interpretieren sind. 

Beispiel 5.2.10: Demonstrationsbeispiel. Multivariate Fähigkeiten 

Für fünf Produktvariable mit den Sollwerten und Toleranzgrenzen der folgenden Tabelle 

Tabelle 5.2.7: Sollzustand Demonstrationsbeispiel 

Produktvariable Sollwert untere 

Toleranzgrenze 

obere 

Toleranzgrenze 

Y 1 7,5 5,7 9,3 

Y 3 128 113 143 

Y 3 65 56 74 

Y 4 1,2 1,05 1,35 

Y 5 1,8 0,3 3,3 

und eine gegebene Korrelationsmatrix R YY wurden zwei Stichproben erzeugt. 

Die Stichprobenkovarianzmatrix der einen Stichprobe ist 

S YY 

und die der zweiten 

S YY 

⎛0,502067 3,042725 0,546106 0,0160155 0,147379 ⎞ 

⎜ 

29,794251 3,073832 0,140759 1,768678 ⎟ 

⎜ 

⎟ 

(1) = ⎜ 11,653298 0,127856 0,991572 ⎟ 

⎜ 

0,0021438 0,0153684⎟ 

⎜ 

⎟ 

⎝ 

0,185228 ⎠ 

⎛0,346178 2,356153 0,481964 0,014896 0,161749 ⎞ 

⎜ 

26,378731 3,025746 0,147258 2,095516⎟ 

⎜ 

⎟ 

(2) = ⎜ 9,128812 0,122732 1,047801⎟. 

⎜ 

0,0025146 0,020078⎟ 

⎜ 

⎟ 

⎝ 

0,268881⎠


Die theoretische Kovarianzmatrix ist 

* 

Σ YY 

⎛0,36 2,360133 0,40639 0,014645 0,144981 ⎞ 

⎜ 25 2,47446 0,139237 1,882212⎟ 

⎜ 

⎟ 

= ⎜ 9 0,121336 1,012367 ⎟. 

⎜ 

0,0025 0,01928 ⎟ 

⎜ 

⎟ 

⎝ 

0,25 ⎠ 

* 

Sie sehen, die Stichprobenkovarianzmatrix S YY (2) unterscheidet sich von Σ YY sehr viel 

weniger als S YY (1). Folglich müssen die multivariaten Prozessfähigkeitsindizes der zweiten 

Stichprobe in der Nähe von 1 liegen und die der 1. Stichprobe kleiner sein. Die Prozessfähigkeitsindizes 

der ersten Stichprobe sind 

Tabelle 5.2.8: Fähigkeiten der Stichprobe 1 

Univariate Capabilities: 

LSL USL Mean Stdv C p k C pk 

Y 1 5.70 9.30 7.8634 0.7086 0.8468 0.2019 0.6758 

Y 2 113.00 143.00 129.6605 5.4584 0.9160 0.1107 0.8146 

Y 3 56.00 74.00 64.8889 3.4137 0.8788 0.0123 0.8680 

Y 4 1.05 1.35 1.2015 0.0463 1.0799 0.0102 1.0689 

Y 5 0.30 3.30 1.8390 0.4304 1.1618 0.0260 1.1316 

Multivariate Capabilities: 

PC p : 0.658 

D: 1.2892 PC pm : 0.5104 

und die der zweiten 

Tabelle 5.2.9: Fähigkeiten der Stichprobe 2 

Univariate Capabilities: 

LSL USL Mean Stdv C p k C pk 

Y 1 5.70 9.30 7.5328 0.5884 1.0198 0.0182 1.0012 

Y 2 113.00 143.00 128.3841 5.1360 0.9735 0.0256 0.9486 

Y 3 56.00 74.00 64.9522 3.0214 0.9929 0.0053 0.9876 

Y 4 1.05 1.35 1.2009 0.0501 0.9971 0.0057 0.9914 

Y 5 0.30 3.30 1.8220 0.5185 0.9643 0.0147 0.9501 

Multivariate Capabilities: 

PC p : 0.9735 

K: 0.014 PC pk : 0.9599 

D: 1.0238 PC pm : 0.9509


207 

Der multivariate Prozessfähigkeitsindex MC p , der eine Aussage über das Streuverhalten 

gestattet, liegt bei der zweiten Stichprobe nahe an der 1 und bei der ersten Stichprobe ist 

er bedeutend kleiner als 1. 

1 

Der Mittelwert der Eigenwerte von ( Σ * SYY 

− ) als Test für die Gleichheit von Kovarianzmatrizen 

ist für die 1. Stichprobe 1,772 und für die 2. Stichprobe 0,989. Hieraus folgt, dass bei der 

1. Stichprobe die theoretische Kovarianzmatrix ungleich der Stichprobenkovarianzmatrix 

ist. Im zweiten Fall stimmen die Kovarianzmatrizen fast überein. 

Beispiel 5.2.11: Dämpfung der Motorvibration. Multivariate Fähigkeiten 

Das Hydrolager wurde durch die beiden Produktvariablen 

Y 1 = Phasenverschiebung [Φ] und 

Y 2 = dynamische Steifigkeit [N/mm] 

beschrieben. Die dreidimensionale Häufigkeitsverteilung und das Streudiagramm sind in 

Abbildung 5.1.2 und Abbildung 5.1.3 dargestellt. 

Die Sollvorgaben sind 

Tabelle 5.2.10: Sollvorgaben für die Produktvariable Phasenverschiebung und Steifigkeit 

Phasenverschiebung 

dyn. Steifigkeit 

Sollwert 43 185 

untere Toleranzgrenze 36 140 

obere Toleranzgrenze 48 230 

Die Kennzahlen für den Istzustand nach der Ausreißererkennung mit dem aerk-Kriterium 

und Elimination sind in der Tabelle 5.2.11 zusammengestellt. 

Tabelle 5.2.11: Istzustand 



Minimum 2.90 119.92 

Mittelwert 42.526 196.587 

Standardabweichung 2.83727 8.193489 

Maximum 60.00 272.79 

Tabelle 5.2.12: Univariate Prozessfähigkeitsindizes 



C p 0.7049 1.8307 

K 0.0877 0.2575 

C pk 06431 1.3593 

Hier hat man den Fall, dass eine Produktvariable eine univariate Prozessfähigkeit hat, die 

größer ist als 1.33 und eine, deren Fähigkeit kleiner als 1.33 ist.


Wie soll man entscheiden? 

Die multivariaten Prozessfähigkeitsindizes müssen berechnet werden. 

Wir erhalten die Werte 

MC p = 1.375 

MC pk = 1.057. 

Da der korrigierte multivariate Prozessfähigkeitsindex kleiner als 1.33 ist, muss der Prozess 

verbessert werden, sodass vor allem die Streuung der dynamische Steifigkeit Y 2 kleiner 

wird. 

Beispiel 5.2.12: Akkubohrschrauber. Prozessfähigkeiten 

Für das Plastikgehäuse des Akku-Bohrschraubers haben wir vorn die statistischen Toleranzgrenzen 

berechnet. Die statistischen Toleranzgrenzen unterscheiden sich von den gegebenen 

CAD Toleranzen. Mit den statistischen Toleranzgrenzen haben wir die Fähigkeiten berechnet 

und in der Tabelle 5.2.13 zusammengestellt. 

Tabelle 5.2.13: Univariate Prozessfähigkeitsindizes Beispiel Akkubohrschrauber 

Variable Toleranzgrenzen Mittelwert Stabw. C p k C pk 

untere obere 

Thermoschrumpf –0,52 2,72 1,5152 0,4743 1,138 0,256 0,847 

Axialität –0,7 0,7 0,0097 0,205 1,138 0,014 1,122 

Parallelität –1,4 1,4 0,0788 0,496 0,941 0,056 0,888 

Dicke 2,76 3,44 3,137 0,094 1,207 0,108 1,076 

Die multivariaten Prozessfähigkeitsindizes sind: 

MC p 1,0963 

D 1,4317 

MC pk 0,766 

Da MC pk < 1 ist, muss der Prozess so verbessert werden, dass die Streuungen für die Produktvariablen 

kleiner werden. 

Der Vektor der Produktvariablen kann aber auch der allgemeineren Klasse der elliptisch 

umrissenen Verteilung en zugeordnet werden, zu der natürlich auch die Normalverteilungen 

gehören. Diese Klasse ist durch die Verteilungsdichte charakterisiert 

1 

− 

⎡ 

T −1 

Y μΣ = ΣYY 2 − μY ⋅ΣYY ⋅ − μY 

f ( y; , ) g ⎤ 

⎣ 

( Y ) ( Y ) 

⎦ 

, 

wobei g eine nicht wachsende Funktion ist. Wählt man für g die Funktion 

m 1 

− − ⋅u 

2 2 

gu ( ) = (2 π) 

⋅e 

dann erhält man die Verteilungsdichte der m-dimensionale Normalverteilung. Der Exponent 

T −1 

Y YY Y Y 

( Y − μ ) ⋅Σ ⋅( − μ ) 

der multivariaten normalen oder elliptisch umrissenen Dichte spezifiziert die Gleichung 

eines Hyperellipsoides im m-dimensionalen Raum, wenn er gleich einer beliebigen positiven 

Konstante c gesetzt wird.


209 

Beispiel 5.2.13: Karosseriebau. Multivariate Fähigkeiten 

An einer Karosserie wurden nach dem Tür-, Heckklappen- und Motorhaubeneinbau m = 73 

Produktvariable, wie Spaltmaße, Symmetrien, Parallelitäten, Längen, Höhen, Distanzen 

usw. gemessen. Der Stichprobenumfang betrug N = 228. 

Der Grad der Multikollinearität war sehr hoch, d. h. die Determinante der Korrelationsmatrix 

der Produktvariablen nahm den überaus kleinen Wert Det(R YY ) = 2,2 10 –135 an. Aus 

der Analyse wurden über das Red-Auswahlverfahren und die multiple Korrelationsanalyse 

p = 59 Produktvariable gestrichen. 

Die übrig gebliebenen Produktvariablen wurden neu mit Y 1 , …, Y 14 nummeriert. 

Die gegebenen Toleranzen für alle Produktvariablen wurden nach der arithmetischen 

Tolerierung berechnet. Diese setzt aber die Unabhängigkeit der Produktvariablen, d. h. 

Det(R YY ) ≅ 1 voraus. Der tatsächliche Wert für die Determinante der Korrelationsmatrix 

liegt aber sehr viel näher an Null als an der Eins! Hieraus folgt, dass auf alle Fälle das Ergebnis 

der gegebenen Tolerierung infrage gestellt werden muss. 

Die statistischen Toleranzgrenzen wurden berechnet und in der Tabelle 5.2.14 zusammengestellt. 

Tabelle 5.2.14: Produktvariable mit den statistischen Maßzahlen und den Toleranzgrenzen 

Produktvar. Mittelwert Standardabw. T u T o Dimension 

Y 1 0,51 0,4435 –0,924 1,944 mm 

Y 2 –0,5144 0,1904 –1,172 0,142 mm 

Y 3 –0,3546 0,0512 –0,528 –0,182 mm 

Y 4 –0,211 0,5532 –0,638 0,216 mm 

Y 5 1,558 0,1154 1,016 2,1 mm 

Y 6 –0,1112 0,088 –0,576 0,353 mm 

Y 7 1,671 0,115 1,188 2,154 mm 

Y 8 –0,0916 0,1305 –0,802 0,62 mm 

Y 9 0,0171 0,0615 –0,208 0,242 mm 

Y 10 –0,1681 0,0841 –0,498 0,162 mm 

Y 11 –0,1603 0,0566 –0,464 0,143 mm 

Y 12 –0,5871 0,0814 –0,865 –0,309 mm 

Y 13 –0,0445 0,1017 –0,292 0,203 mm 

Y 14 –15,525 0,8507 –19,919 –11,131 mm 

Die berechneten statistischen Toleranzgrenzen wurden mit dem Vertragspartner abgestimmt 

und akzeptiert. 

Mit den berechneten Toleranzgrenzen wurde die uniund multivariaten Prozessfähigkeitsindizes 

berechnet und in Tabelle 5.2.15 zusammengestellt. 

Nur eine der univariaten, korrigierten Prozessfähigkeitsindizes ist kleiner als 1 und fünf 

sind kleiner als 1.33. Für die Entscheidung, ob der Prozess verbessert werden muss, ist die 

Berechnung der multivariaten Prozessfähigkeitsindizes unerlässlich.


Tabelle 5.2.15: Univariate Prozessfähigkeiten für die wesentlichen Produktvariablen 

Prod.Par. C p k C pk 

Y 1 1,0778 0,0003 1,0775 

Y 2 1,15 0,001 1,1489 

Y 3 1,1483 0,0023 1,1458 

Y 4 1,5436 0,0001 1,5436 

Y 5 1,5653 0,0001 1,5652 

Y 6 1,7585 0,0006 1,7573 

Y 7 1,3993 0,0001 1,3993 

Y 8 1,8158 0,0008 1,8143 

Y 9 1,2187 0,0004 1,2183 

Y 10 1,3081 0,0004 1,3076 

Y 11 1,7863 0,0006 1,7852 

Y 12 1,1382 0,0002 1,1377 

Y 13 0,8108 0,0002 0,8107 

Y 14 1,7216 0,0001 1,7215 

Die multivariaten Prozessfähigkeitsindizes sind 

PC p = 1,5518 

PC pk = 1,5517 

Die multivariaten Prozessfähigkeitsindizes besagen, der Prozess ist in Ordnung. Trotzdem 

muss der Prozess mit den multivariaten Kontrollkarten kontinuierlich überprüft werden. 

5.3 Vergleich verschiedener Tolerierungsverfahren 

an 6- und 5-dimensionalen Beispielen 

Für die Tolerierung gibt es, wie wir gesehen haben, verschiedene Herangehensweisen. Einmal 

die Art der Tolerierung, die von Technikern eingeführt wurde und den technischen Aspekt in 

den Vordergrund stellt. Mathematisch basiert diese Art der Tolerierung auf dem Fehlerfortpflanzungsgesetz 

und letztlich auf der Faltung voneinander unabhängiger Zufallsgrößen. 

Die andere von Jahn eingeführte multivariate statistische Tolerierung basiert auf den Tatsachen, 

dass 

• 

• 

• 

• 

• 

es nicht nur Montageprozesse gibt, 

das Produkt eines jeden (Herstellungs- oder Service-) Prozesses durch m, 

m ≥ 1 nicht unabhängige Produktvariable Y 1 , …, Y m beschrieben wird, 

die Produktvariablen Realisierungen von Zufallsgrößen sind und 

die Sollwerte und Toleranzgrenzen für jeden Prozess Zielwerte der Steuer- und Regelung 

sind.


211 

5.3.1 Charakteristische Zusammenhänge zwischen Funktionssicherheit 

und Toleranz aus Sicht der Techniker 

Hoffmann [1986] definiert einige bedeutende Grundlagen, wie z. B. 

• 

• 

• 

• 

• 

die Funktionssicherheit ist die Einhaltung der für ein Erzeugnis vorgegebenen Funk tionsfehlergrenzen 

für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen. 

Innerhalb der Funktionsfehlergrenzen ist das Erzeugnis funktionstüchtig. 

Funktionstoleranz ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten 

aller die Funktionstüchtigkeit beschreibenden Eigenschaften eines Erzeugnisses. 

Die Herstellungstoleranz ist Differenz zwischen dem oberen und unteren erreichten 

Grenzwert bei der Herstellung mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigerzeugnisse. 

Die Maßtoleranz ist die Differenz zwischen dem zulässigen Größt- und Kleinstmaß. 

Die Messtoleranz ist die Differenz zwischen der zulässigen oberen und unteren Abweichung 

des Messwertes von der Messgröße. (Fehlergrenze der Messung). 

Die Funktionstoleranz ist in der Regel größer als die Maßtoleranz. Die Herstellungstoleranz und 

die Messtoleranz sind bei beherrschter Produktion grundsätzlich kleines als die Maßtoleranz. 

Die verschiedenen Toleranzen müssen für ein Projekt optimiert werden, denn 

• 

• 

kleiner werdende Toleranzen führen zu höheren Fertigungs- und Prüfkosten, 

größer werdende Toleranzen führen zu höheren Kosten für Nacharbeit und zusätzlichen 

Leistungen bei der Montage (Siehe Beispiel Akku-Bohrschrauber – MOST: Maynard Operation 

Sequence Technic, Zeitmessungen bei der Montage). 

Grundsätzlich ist anzustreben, die Produktion zu „entfeinern“, d. h. die Herstellungstoleranzen 

so groß wie möglich zu machen. Andererseits ist erwiesen, dass die Verringerung des spezifischen 

Aufwandes an vergegenständlichter und lebendiger Arbeit nur durch eine Einengung vor allem 

der Herstellungs-, aber auch der Funktions- und Messtoleranzen möglich ist. Gründe für das 

Nichterreichen der Fertigungssollmaße können sein: 

• 

• 

• 

• 

• 

• 

Ungenauigkeiten der Maschinen, Werkzeuge, Vorrichtungen, 

Verschleiß der Maschinen, Werkzeuge und Vorrichtungen, 

Einstellfehler an Maschinen, Werkzeugen und Vorrichtungen, 

elastische Verformungen durch Spann- und Schnittkräfte, 

Verformungen durch Temperatureinfluss, 

zufällige Fehler. 

Was muss alles gemessen werden? 

Die Produktvariablen Y 1 , …, Y m , (nach Hoffmann [1986] die Werkstückabmessungen), die 

Input- und Prozessvariable (nach Hoffmann: Werkzeugeinstellung, Verschleiß, Schnittkräfte, 

Drehzahl, Drehmoment, Spannkräfte, Temperaturen, …) und die noise Variablen müssen 

gemessen werden, wenn eine vernünftige Tolerierung bewerkstelligt werden soll.


Wie werden Maß- und Toleranzketten aufgebaut? 

Wie üblich benötigen wir einige neue Definitionen, bevor wir mit dem Aufbau der Maßketten 

beginnen können. 

Maßkette 

Lehre von der funktionsgerechten Bemessung aneinander gereihter Maße, deren Werte sich 

summieren. Die Maßkette ist eine Aneinanderreihung von zusammenwirkenden Einzelmaßen 

und dem von ihnen abhängigen Schlussmaß. Die Maßkette bildet einen Linienzug, d. h. eine 

Masche. Die Einzelmaße sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette 

ist ihre Geschlossenheit. 

Bei der Berechnung der Maßketten ist zu beachten, dass die Einzelmaße aus unterschiedlichen 

Systemen stammen können, und zwar dem herzustellenden Gerät (Produkt), dem Werkstück 

(Input) oder der Werkzeugmaschine, Vorrichtung, Werkzeug (Prozess). Die in Klammern 

stehenden Bezeichnungen stellen die Verbindung zu meiner viel allgemeineren Theorie der 

Tolerierung dar. 

Zur Berechnung der Maßkette werden für die Einzelmaße M j , j = 1, …, m die Nennmaße N j , 

und die dazu gehörenden Toleranzmittenabmaße E Cj , oder Erwartungsabmaße E Ej bestimmt. 

Auftretende Spiele werden mit der halben Größe des Kleinstspiels ½ S kj wie Einzelmaße behandelt. 

Für das Schlussmaß M 0 bestimmt man das Nennmaß N 0 und die zugehörige Toleranz 

E C0 , oder das Erwartungsabmaß E E0 . Ist die Schlusstoleranz eine Passtoleranz oder ein Spiel, 

so wird das Toleranzmittenabmaß E C0 oder das Erwartungsabmaß E E0 durch das mittlere oder 

halbe Größtspiel ½ S g0 gebildet. 

Es werden die folgenden Bezeichnungen verwendet: 

Nennmaß 

= N ist das Maß auf das die Maßkette bezogen wird, 

Einzelmaß 

= M j (mitunter sind Einzel- und Nennmaße gleich), 

Istmaß 

= I ist das Maß des gefertigten Werkstücks, 

Größtmaß 

= G ist das zulässiges Maximum des Istmaßes, 

Kleinstmaß 

= K ist das zulässiges Minimum des Istmaßes, 

Toleranzmittenmaß = C ist der arithmetische Mittelwert aus Größt- und Kleinstmaß, 

Erwartungsmaß = E ist der arithmetische Mittelwert aus eine Serie von Istmaßen, 

Istabmaß 

= A j ist die Differenz zwischen Ist- und Nennmaß, 

Oberes Abmaß = ES ist die Differenz zwischen Größt- und Nennmaß, 

Unteres Abmaß = El ist die Differenz zwischen Kleinst- und Nennmaß, 

Toleranzmittenabmaß = E C ist die Differenz zwischen Toleranzmittenmaß und Nennmaß, 

Erwartungsabmaß = A E ist die Differenz zwischen Toleranzmitten- und Nennmaß, 

Maßtoleranz, Toleranz = T ist die Differenz zwischen Größt- und Kleinstmaß, 

Spiele 

= S ist die halbe Größe des Kleinstspiels = 1/2 S kj , sie werden wie 

Einzelmaße behandelt, 

Anzahl der Spiel- und Übergangspassungen = e 

Koeffizient der relativen c j = 2 s j / T j Standardabweichung, 

Koeffizient der relativen a j = (A Ej – E Cj ) / T j und die Asymmetrie.


213 

5.3.2 Berechnung von Maß- und Toleranzketten für vollständige 

Austauschbarkeit 

Maßketten 

Das Nennmaß N 0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen Maßkettengliedern 

additiv aus den Nennmaßen N j der j = 1, …, m Einzelmaße M j zusammen. 

N 

0 

m 

= ∑ kj 

Nj, 

j= 

1 

wobei k j den Richtungskoeffizient des j-ten Einzelmaßes auf das Schlussmaß bezeichnet. Dieser 

Koeffizient ist gleich +1, wenn der Einfluss des Einzelmaßes positiv ist. Positive Einzelmaße 

bewirken bei ihrer Vergrößerung oder Verkleinerung eine gleichsinnige Veränderung des 

Schlussmaßes. 

Ist das Nennmaß N 0 des Schlussmaßes bekannt und sind die Nennmaße N j der Einzelmaße 

unbekannt, so ergibt sich für das j-te Nennmaß die Berechnungsformel 

⎛ 

⎞ 

N N k N k N ⎟ 

⎠ 

j−1 

m 

1 

j = ⎜ 0 −∑ 

l j −∑ 

l j 

kj ⎝ l= 1 l= 

1 

wobei j = 1, …, m die Laufvariable und m die Anzahl der Einzelmaße ohne Schlussmaß ist. Sind 

die Toleranzmittenabmaße E Cj der Einzelmaße gegeben und soll aus denen das Toleranzmittenabmaß 

E C0 des Schlussmaßes berechnet werden, so ist unter Beachtung aller e Spiel- und 

Übergangspassungen die funktionell mindestens erforderliche Spiel- und Übergangspassung 

1 

E = k E − S , 

C0 

zu berechnen. 

m−e m 

∑ 

∑ 

j Cj kj 

j= 1 

2 

j= m−e−1 

Toleranzketten 

Sind die Einzeltoleranzen T j , j = 1, …, m der Einzelmaße und die Kleinstwerte der Spiel- und 

Übergangspassungen gegeben, so beträgt die Schlusstoleranz T 0 des Schlussmaßes 

T = T + S , 

0 

m−e 

m 

∑ j ∑ kj 

j= 1 j= m−e−1 

wobei e die Anzahl der Spiel- und Übergangspassungen ist. S kj bezeichnet das Kleinstspiel des 

Maßes j. Die Einzeltoleranz T j des j-ten Einzelmaßes resultiert aus 

j−1 

m−e m 

j = 0 −∑ l − ∑ l − ∑ kj 

l= 1 l= j+ 1 j= m− e+ 

1 

T T T T S 

Dieser Ausdruck ist für m > 1, e > 1 unbestimmt. Daher wird zunächst für jedes Einzelmaß 

eine durchschnittliche Einzeltoleranz 

⎛ 

m 

T 1 

= ⎜ T − ∑ 

m 

S 

⎞ 

⎟ 

0 

kj 

− e ⎝ j= m−e−1 

⎠ 

berechnet. Anschließend werden auf dieser Grundlage die Einzeltoleranzen berechnet.


Beispiel 5.3.1: Einfaches Getriebe. Maßketten 

Ein einfaches Getriebe wird durch die folgende Skizze beschrieben. 

M 5 M 1 M 2 

M 4 M 3 

M 0 

Abb. 5.3.1: Schematische Darstellung des einfachen Getriebes 

Die Maßkette für das einfache Getriebe besteht aus 6 Gliedern, die sich aus m = 5 Einzelmaßen 

und dem Schlussmaß zusammensetzt. Der Konstrukteur gab die Nennmaße N j , 

j = 1, …, 5 für die einzelnen Glieder vor. Die Richtungskoeffizienten resultieren aus dem 

Verlauf der Maßkette und sind k 1 = +1, k 2 = +1, k 3 = –1, k 4 = –1, k 5 = –1 und k 0 = –1. 

Die Werte für die Nennmaße N j , Toleranzen T j , Richtungskoeffizienten k j , Toleranzmittenabmaße 

E Cj und der Einzelmaße M j sind aus der folgenden Wertetabelle zu entnehmen. 

Tabelle 5.3.1: Wertetabelle für die Tolerierung in [mm] 

j N j T j k j E Cj M j + T j , – T j oder ±T j 

0 0 0,15 –1 0,105 0 0,18 

0,03 

1 25 0,033 1 0,035 25 0,0515 

0,0185 

2 40 0,04 1 0,04 40 0,06 

0,02 

3 2,5 0,015 –1 0 2,5 ±5700,0 

4 60 0,047 –1 –0,03 60 –0,0065 

–0,0535 

5 2,5 0,015 –1 0 2,5 ±5700,0


215 

Die M j bedeuten hierbei 

M 

j 

⎧⎪ E 

= Nj 

+ ⎨ 

⎪⎩ 

E 

Cj 

Cj 

+ 0.5 Tj 

. 

− 0.5 T 

j 

Das Nennmaß des Schlussgliedes ist N 0 = 25 + 40 –2.5 – 60 – 2.5 = 0 [mm]. Die Summe der 

Einzeltoleranzen T j ergibt die Schlusstoleranz 

T 0 = 0.033 + 0.04 + 0.015 + 0.047 + 0.015 = 0.15 [mm]. 

Um den freien Lauf der Getriebewelle im Gehäuse zu gewährleisten, soll das untere Abmaß 

mindestens ej u0 = 0.03 [mm] betragen. Das Toleranzmittenabmaß des Schlussmaßes muss 

dann mindestens E C0 = ej u + 0.5 T 0 = (0.03 + 0.075) [mm] = 0.105 [mm] sein. Das Toleranzmittenabmaß 

des Schlussmaßes ist 

E C0 = k 1 E C1 + k 2 E C2 +k 4 E C4 = (+1) 0.035 + (+1) 0.04 + (–1) – 0.03 = 0.105 [mm]. 

Mit der Schlusstoleranz T 0 0.15 [mm] und dem Toleranzmittenabmaß E C0 lassen sich schließlich 

die oberen und unteren Abmaße es o0 = 0.18 [mm] und es u0 = 0.03 [mm]berechnen. Das axiale 

größte Spiel beträgt S g = 180 [µm] und das axiale kleinste Spiel S k = 30 [µm]. 

Warum habe ich bisher die technische Tolerierung nicht verstanden? 

Warum fiel es mir schwer, diese Art der Tolerierung zu verallgemeinern? 

Weil: 

• drei- oder zweidimensionale Gebilde der Einfachheit wegen auf den R 1 (den eindimensionalen 

Vektorraum) reduziert wurden, obwohl das nicht unbedingt einzusehen ist und 

• daher die Metrik nicht verallgemeinerungsfähig ist. 

5.3.3 Verallgemeinerung der Tolerierung 

Für die Verallgemeinerung der Tolerierung wird der reelle Vektorraum benötigt, um z. B. dreidimensionale 

Gebilde auch dreidimensional behandeln zu können. Ein Getriebe z. B. ist nun 

einmal ein dreidimensionales Gebilde. Die Reduktion der Dimension des Raumes auf die Ebene 

oder wie bei der Tolerierung durch Maß- und Toleranzketten auf den R 1 hat offensichtlich nur 

den Zweck der Vereinfachung. 

Der reelle Vektorraum 

Für die Definition von Vektoren benötigt man den Vektorraum. Wir wollen hier den dreidimensionalen 

realen physikalischen Anschauungsraum R 3 , indem wir alle uns befinden, betrachten. 

Ein Element dieses Raumes, ein Punkt in diesem Raum wird durch ein dreier- Tupel (x 1 , x 2 , x 3 ) 

reeller Zahlen charakterisiert. Mit diesen reellen Zahlen kann man rechnen. 

Sind (x 1 , x 2 , x 3 ) und (y 1 , y 2 , y 3 ) solche drei-Tupel reeller Zahlen, so werde deren Summe durch 

(x 1 , x 2 , x 3 ) + (y 1 , y 2 , y 3 ) = (x 1 + y 1 , x 2 + y 2 , x 3 + y 3 ) erklärt. Die Summe ist wieder ein drei-Tupel 

reeller Zahlen. Ist λ ∈ R 1 und (x 1 , x 2 , x 3 ) ∈ R 3 , so ist λ (x 1 , x 2 , x 3 ) = (λ x 1 , λ x 2 , λ x 3 ) ∈ R 3 . 

Da die Rechenoperationen dadurch entstanden sind, dass einfach die Operationen des Rechnens 

mit reellen Zahlen auf die Komponenten (x 1 , x 2 , x 3 ) des R 3 übertragen wurden, so übertragen 

sich auch deren Rechenregeln. Wählt man einen Punkt 0 zum Nullpunkt, so kann man alle


Punkte als Ortsvektoren bezüglich null auffassen, kann sie mit reellen Zahlen multiplizieren 

und wie im Kräfteparallelogramm addieren. Dadurch erhält man einen Vektorraum. 

Definition: Ein Tripel (V, +, ⋅) bestehend aus einer Menge V, einer Addition und einer Multiplikation 

heißt ein reeller Vektorraum. 

Die Physiker verstehen unter Vektoren etwas anderes als die Mathematiker. Daher soll der 

Gesichtspunkt der Physiker in den Blickpunkt gerückt werden, denn die Tolerierung fällt im 

weitesten Sinne in das Gebiet der Physiker. Nach diesem Gesichtspunkt werden Vektoren durch 

ihre Größe (quantity), Richtung (direction) und ihren Betragt (magnitude) erklärt. Der Betrag 

eines Vektors, die Norm z. B. aus dem R 3 wird durch 

2 2 2 

1 2 3 

x = x + x + x 

definiert. (Das ist der Satz des Pythagoras.) Für zwei Vektoren x 1 , x 2 ∈ R 3 nennt man die Zahl 

〈x 1 , x 2 〉 = x 11 x 21 + x 12 x 22 + x 31 x 23 das Skalarprodukt v on x 1 und x 2 . Einen reellen Vektorraum 

mit einem Skalarprodukt nennt man einen euklidischen Vektorraum. 

Der Winkel zwischen den beiden Vektoren x 1 und x 2 wird durch 

x1, 

x2 

α ( x1, x2) = arccos 

für x 1 ≠ 0 und x 2 ≠ 0 

x1 x2 

, 

berechnet. 

Mit dieser Definition kann die Orthogonalität zw ischen Vektoren definiert werden. Ein r-Tupel 

von Vektoren (x 1 , …, x r ) ∈ R n heißt orthogonal, wenn x = 1, j = 1, … r und 〈x j , x k 〉 = δ jk . 

Beispiel 5.3.2: Einfaches Getriebe. Ortsvektoren 

Wir betrachten wieder das Getriebebeispiel. Es wird das Koordinatensystem x 1 , x 2 eingeführt 

und als Benchmark für alle Punkte betrachten wir die beiden Ortsvektoren, die wir 

mit m 1 und m 2 bezeichnen. 

j 

x 2 

M 6 

M 5 

M 1 M 2 

m 2 

m 1 

M 4 

0 

x 1 

M 3 

M 0 

Abb. 5.3.2: Getriebe mit zwei Ortsvektoren anstelle der üblichen Bemaßung


217 

Ortsvektoren ordnen jedem Punkt M j der Ebene (des Raumes) die Verschiebung 

m j = M j – 0, j = 1, …, n 

zu. 

Aus der Abbildung und der Wertetabelle kann man ablesen, das z. B. 

m 1 = (M 2 , M 6 ) T = (40, 40) T 

m 2 = (M 3 , M 6 ) T = (65, 40) T . 

Damit erhalten wir 

m 

⎛65⎞ ⎛40⎞ ⎛25⎞ 

− m = ⎜ ⎟ − ⎜ ⎟ = 

⎝40⎠ ⎝40⎠ ⎜ 

⎝ 0 ⎟ 

⎠ 

2 1 

Auf diese Art kann man alle Punkte einer Abbildung (einer Ebene oder eines Raumes) als 

Ortsvektoren darstellen und die Abstände durch Bildung der Differenzen von Vektoren ermitteln. 

Ein weiterer wesentlicher Begriff ist die Linearkombination von Vektoren. Sind x 1 , …, x r Vektoren 

aus dem n-dimensionalen Euklidischen Vektorraum R n , dann nennt man λ 1 x 1 + … + λ r 

x r = y eine Linearkombination, wobei λ j ∈ R 1 . Die Menge aller Linearkombinationen heißt 

lineare Hülle des r-Tupels von Vektoren. 

Ein r-Tupel x 1 , …, x r von Vektoren aus dem Euklidischen Vektorraum heißt linear abhängig, 

wenn einer dieser Vektoren aus den anderen linear kombiniert werden kann. Diesen linear 

kombinierten Vektor kann man dann ohne Schaden für die lineare Hülle weglassen. Mit dieser 

Definition kann man natürlich auch die lineare Unabhängigkeit definieren. V sei wieder ein Vektorraum, 

x 1 , …, x r ∈ V. Dieses r-Tupel heißt linear unabhängig, wenn eine Linearkombination 

von x 1 , …, x r nur dann null sein kann, wenn alle Koeffizienten verschwinden, d. h. wenn aus 

λ 1 x 1 + … + λ r x r = 0 

stets folgt, dass λ 1 = … = λ r = 0. Man kann auch sagen, (x 1 , …, x r ) ist genau dann linear unabhängig, 

wenn keiner dieser Vektoren Linearkombination der übrigen ist. 

Sei jetzt y = λ 1 x 1 + … + λ n x n eine Linearkombination von n Vektoren aus dem Euklidischen 

Vektorraum. Damit bilden wir das Skalarprodukt mit dem Vektor x, d. h. 

⎛y1 

⎞ 

n 

x, y = ( x … x ) ⎜… ⎟ = a x x + … + a x x = a x x 

1 n 1 1 1 

n n n j j j 

⎜ ⎟ 

j= 

1 

⎝yn 

⎠ 

⎛a1 … 0 ⎞ ⎛x1⎞ 

= ( x ⎜ ⎟ ⎜ ⎟ 

1 … xn) 0 … 0 … . 

⎜ ⎟ ⎜ ⎟ 

⎝ 0 … a ⎠ ⎝x 

⎠ 

n 

Eine solche Form nennt man quadratische Form und sc hreibt abkürzend dafür 

x T A x = Q A (x). 

n 

∑


Beispiel 5.3.3: Quadratische Form 

Betrachten wir (x 1 , x 2 ) ∈ R 2 , 

Fall 1: 

⎛1 0⎞ 

A = ⎜ 

⎝0 1 ⎟ , dann ist die quadratische Form 

⎠ 

⎛1 0⎞ ⎛x1⎞ ⎛x1⎞ 

2 2 

QA( x) = ( x1 x2) ⎜ = ( x1 x2) = x1 + x2. 

⎝0 1⎟ ⎠ 

⎜ 

⎝x 

⎟ 

⎠ 

⎜ 

⎝x 

⎟ 

⎠ 

2 2 

In diesem Falle gilt QA ( x ) = x . 

Betrachten wir den konkreten Vektor x T = (x 1 , x 2 ) = (0.8, 0.3), dann gilt 

⎛1 0⎞ ⎛0.8⎞ (0.8 0.3) ⎜ ⎟ ⎜ ⎟ = 0.73 und 0.73 = 0.854. 

⎝0 1⎠ ⎝0.3⎠ 

Fall 2: 

⎛1 

c ⎞ 

Es sei A = ⎜ ⎟, c ≤ 1, so dass A positiv definit ist. In diesem Fall gilt 

⎝c 

1⎠ 

⎛1 

c⎞ ⎛x1⎞ ⎛x1⎞ 

QA( x) = ( x1 x2) ⎜ ⎟ ⎜ ⎟ = ( x1 + c x2 c x1 + x2) 

⎝c 1⎠ ⎝x ⎠ 

⎜ 

⎝ 

⎟ 

2 x2⎠ 

2 2 

= x + 2 c x x + x . 

Hieraus folgt 

1 1 2 2 

2 2 

1 1 2 2 

x + 2 c x x + x 

ist die Länge des Vektors x, wenn die Komponenten von x nicht linear unabhängig voneinander 

sind. 

Betrachten wir anstelle der Einheitsmatrix die positiv definite Matrix 

⎛ 1 0.6⎞ 

A = ⎜ 

⎝0.6 1 ⎟ 

⎠ 

dann erhält man für die quadratische Form 

⎛ 1 0.6⎞ ⎛0.8⎞ ⎛0.8⎞ 

(0.8 0.3) ⎜ ⎟ ⎜ ⎟ = (0.8 + 0.18 0.18 + 0.3) 

⎝0.6 1 ⎠ ⎝0.3⎠ ⎜ 

⎝0.3⎟ 

⎠ 

= 0.928 und 0.928 = 0.9633. 

Die beiden Längen des Vektors x sind je nachdem, ob die Matrix eine Diagonal- oder vollständige 

Matrix ist, verschieden. 

Erinnern wir uns daran, dass bei der Konstruktion von Produkten, insbesondere Montageprodukten, 

Toleranzketten verwendet werden können, diese aber nicht auf alle Produkte, 

z. B. chemische Produkte und die Fertigung übertragen werden können, dann sind weitere 

Verallgemeinerungen notwendig.


219 

Insbesondere nach der Herstellung der Produkte können die Messwerte für die verschiedenen 

Produktvariablen nicht mehr als beliebige reelle Zahlen, sondern müssen als Realisierungen 

von Zufallsgrößen angesehen werden. 

5.3.3.1 Statistische Tolerierung 

Der Ausgangspunkt bei dieser Art der Tolerierung ist, dass die Einzelmaße Y 1 , …, Y m unabhängig 

und identisch nach F j (y j ) j = 1, …, m verteilt sind. Die Toleranzen T o,j und T u,j , j = 1, …, m 

sind entweder unbekannt oder sollen mit den Maßen, an gefertigten Produkten gemessen, 

überprüft werden. Sind die Zufallsgrößen außerdem normal verteilt mit den Erwartungswerten 

µ j und σ j 2 , dann gilt, die Summenvariable 

m 

Y = ∑ Yj 

j= 

1 

ist normal verteilt mit den beiden Momenten 

m 

m 

2 2 

∑ j ∑ j 

j= 1 j= 

1 

μ = μ und σ = σ . 

Sind die Einzelmaße nicht normal verteilt, dann folgt aus dem zentralen Grenzwertsatz der 

Wahrscheinlichkeitsrechnung, dass die Summenvariable approximativ normal verteilt ist, 

ebenfalls mit den Summenmomenten. 

Nach der 3 σ-Regel liegen mit der Wahrscheinlichkeit 1 – α = 1 – 0.0027 = 0.9973 fast alle 

Realisierungen einer normal verteilten Zufallsgröße im Intervall µ ± 3 σ. Hieraus folgt die 

Toleranzbreite T o – T u sollte 6 σ sein. 

Die Toleranzkette kann unter diesen Voraussetzungen nach der Formel 

m 

T = 6 ∑ S 

j= 

1 

j 

berechnet werden, wobei die S j die Stichprobenstandardabweichungen für die Einzelmaße M j , 

j = 1, …, m sind. 

Beispiel 5.3.4: Einfaches Getriebe. Tolerierung 

Fall 1: Wir nehmen an, dass Y 1 , …, Y 6 unabhängig voneinander sind. An N Getrieben 

wurden die obigen Maße gemessen. Die statistischen Maßzahlen sind 

Tabelle 5.3.2: Statistische Maßzahlen für die Maße des Getriebes 

Y 0 Y 1 Y 2 Y 3 Y 4 Y 5 

Min: –6,6976445 2498,2527947 3998,0283577 249,3489343 5997,5019191 249,4489296 

Mean: 0,1312104 2499,9594152 4000,0388603 250,0179791 5999,9552836 249,9896311 

Max: 6,3486367 2501,4088584 4002,4427941 250,5956959 6001,6589824 250,5393647 

Std.Dev.: 2,3978975 0,6064117 0,7160356 0,2388075 0,7569649 0,2253856 

Die Korrelationsmatrix zur Überprüfung der Voraussetzung der Unabhängigkeit ist in der 

Tabelle 5.3.3 zusammengestellt.


Tabelle 5.3.3: Korrelationsmatrix für die 6 Maße des Getriebes 

Y 0 Y 1 Y 2 Y 3 Y 4 Y 5 

Y 0 1 0,1388 0,0211 0,005 –0,0144 –0,0351 

Y 1 1 –0,1343 –0,065 –0,0746 0,028 

Y 2 1 0,0246 0,1598 –0,0264 

Y 3 1 –0,0264 –0,0899 

Y 4 1 0,0213 

Y 5 1 

Die Korrelationskoeffizienten für alle Paare von Maßen sind sehr klein. Das globale Maß 

für die Korreliertheit ist det (R) = 0.9150239. Die univariate statistische Tolerierung kann 

angewandt werden. Wir erhalten die Toleranzgrenzen in der Tabelle 5.3.4. 

Tabelle 5.3.4: Toleranzgrenzen nach der univariaten statistischen Tolerierung 

Variable Mittelwert 6* Stabw. Zielwert Toleranzgrenze 

untere 

obere 

Y 0 0,1312 14,3874 0 –10,6188 10,6188 

Y 1 2499,95 3,6385 2500 2497,35 2502,65 

Y 2 4000,04 4,2962 4000 3996,86 4003,14 

Y 3 250,02 1,4328 250 248,94 251,06 

Y 4 5999,95 4,5418 6000 5996,67 6003,33 

Y 5 249,9896 1,3523 250 248,996 251,004 

Für das Schließmaß T 0 erhalten wir nach der obigen Formel (6* Sigma) 

T 0 = 3.6385 + 4.2962 + 1.4328 + 4.5418 + 1.3523 = 15.2616, 

d. h. in etwa den mit CAD geplanten Wert von 15, bzw. nach Division durch 100 den Wert 

T 0 = 0.1526. Die Vergleiche der uniund multivariaten statistischen und CAD Tolerierung 

sind in der Tabelle 5.3.5 enthalten. Der Einfachheit halber wurden in diese Tabelle nur die 

Toleranzbreiten (nach Division durch 100) aufgenommen. 

Tabelle 5.3.5: Vergleich der der statistischen Toleranzbreiten und der CAD Toleranzbreiten 

Maß Statistische Tolerierung CAD Toleranzen 

univariat 

multivariat 

6* s j T o – T u T o – T u 

Y 0 0,1438 0,2123 0,15 

Y 1 0,0364 0,053 0,033 

Y 2 0,0429 0,0627 0,04 

Y 3 0,0143 0,0212 0,015 

Y 4 0,0454 0,0665 0,047


221 

Die Unterschiede resultieren aus den Standardabweichungen, die z. T. doch etwas größer 

sind als (T o – T u )/6 und den doch vorhandenen, wenn auch kleinen Korrelationskoeffizienten. 

Fall 2: Korrelierter Fall 

Für den korrelierten Fall erhalten wir die statistischen Maßzahlen der Tabelle: 

Tabelle 5.3.6: Statistische Maßzahlen für die Maße des Getriebes 

Y 0 Y 1 Y 2 Y 3 Y 4 Y 5 

Min: –6,5002924 2498,1719699 3998,1664578 249,402514 5998,1848565 249,3888472 

Mean: –0,1628116 2499,9900478 3999,9855229 249,989664 5999,9347344 250,0006535 

Max: 6,0165154 2501,5162199 4001,8814676 250,525068 6002,2974761 250,6449878 

Std.Dev.: 2,3576676 0,5884604 0,6832856 0,240879 0,8346444 0,2479773 

Die statistischen Maßzahlen unterscheiden sich nicht wesentlich von denen des Falles 1. 

In der Tabelle 5.3.7 steht die Korrelationsmatrix. 

Tabelle 5.3.7: Korrelationsmatrix 

Y 0 Y 1 Y 2 Y 3 Y 4 Y 5 

Y 0 1 0,4212 0,3697 0,856 0,5342 0,7047 

Y 1 1 0,1977 0,3841 0,2669 0,0732 

Y 2 1 0,1893 0,1479 0,2386 

Y 3 1 0,3767 0,5799 

Y 4 1 0,1817 

Y 5 1 

Die Korrelationsmatrix zeigt einige sehr große Korrelationskoeffizienten. Die Annahme 

der Unabhängigkeit ist nicht mehr gerechtfertigt. Das globale Maß der Korreliertheit ist 

det(R) = 0.04598723. 

Die statistische Tolerierung liefert die Werte der Tabelle 5.3.8. 

Tabelle 5.3.8: Uni- und multivariate statistische Toleranzen 

Variable Mittelwert Stabw. Zielwert Toleranzgrenzen 

untere 

obere 

Y 0 –0,1628 14,146 0 –3,522 3,522 

Y 1 2499,99 3,5308 2500 2497,766 2502,234 

Y 2 3999,986 4,0997 4000 3997,293 4002,707 

Y 3 249,9897 1,4453 250 249,4806 250,5194 

Y 4 5999,9347 5,0079 6000 5997,117 6002,883 

Y 5 250,0007 1,4879 250 249,3086 250,6914


Tabelle 5.3.9: Vergleich der statistischen und CAD Toleranzbreiten 

Maß Statistische Tolerierung CAD Toleranzen 

univariat 

multivariat 

6* s j T o – T u T o – T u 

Y 0 0,1415 0,0704 0,15 

Y 1 0,0353 0,0447 0,033 

Y 2 0,04099 0,0541 0,04 

Y 3 0,0144 0,0103 0,015 

Y 4 0,05 0,0577 0,047 

Y 5 0,0149 0,0138 0,015 

Die univariate statistische Toleranzkettenformel liefert für die Schließtoleranz den Wert 

T 0 = 0.1556. Die multivariate statistische Tolerierung liefert im korrelierten Fall schmalere 

Toleranzbreiten für die Einzelmaße. Die 6* S Toleranzen sind wiederum ähnlich denen im 

unkorrelierten Fall. Das ist nicht verwunderlich, wirken sich doch in der Regel die korrelativen 

Abhängigkeiten nicht auf die Standardabweichungen der Einzelmaße aus. 

Die multiplen Korrelationskoeffizienten für die Einzelmaße sind: 

R 2 0/1,2,3,4,5 = 0.8888, R2 1/0,2,3,4,5 = 0.28132, R2 2/0,1,3,4,5 = 0.21746, 

R 2 3/0,1,2,4,5 = 0.76823, R2 4/0,1,2,3,5 = 0.40528 und R2 5/0,1,2,3,4 = 0.61256. 

Aus diesen Korrelationskoeffizienten liest man ab, dass sich das Schließmaß T 0 am besten 

aus den anderen Maßen ableiten lässt, oder anders gesprochen, die anderen Maße haben 

einen großen Einfluss auf das Schließmaß. Folglich ist die Differenz zwischen der uniund 

multivariaten Berechnung für dieses Maß am größten. 

5.3.3.2 Übung 

Ein Produkt wird durch m nicht unabhängige Produktvariable Y 1 , …, Y m beschrieben. Der Vektor 

der Produktvariable Y T = (Y 1 , …, Y m ) ist ein zufälliger Vektor. Die Verteilung des zufälligen 

Vektors Y gehöre zur Klasse der m-dimensionalen Normalverteilungen Y ~ N m (µ, Σ YY ), wobei 

Σ YY positiv definit sein möge. Das von Ihnen zu untersuchende Produkt ist ein Tippgeber, der 

in automatischen Schaltgetrieben benötigt wird. 

Tabelle 5.3.10: Sollzustand für den Tippgeber 

Variable Sollwert Toleranzgrenzen 

Y 1 14,23 ±0,05 

Y 2 6,45 ±0,05 

Y 3 0,55 ±0,15 

Y 4 0,55 ±0,15 

Y 5 2,25 ±0,15 

Y 6 2,25 ±0,15


223 

Diese müssen verschiedene Funktionen, wie z. B. die automatische Rückstellung in die 

„=“ Position, geräuscharmes Schalten usw. realisieren. Die Tippgeber werden durch sechs 

Produkt variablen charakterisiert. Der Sollzustand wird durch die Werte der Tabelle 5.3.10 

beschrieben. 

Problem 

Der Kunde ist mit der Qualität der Tippgeber nicht zufrieden. 

Was müssen Sie tun? 

Sie müssen das Problem definieren. 

Wie definieren Sie das Problem? 

Dazu müssen Sie eine Stichprobe von Tippgebern zufällig der Fertigung entnehmen und die 

Werte für die Produktvariablen messen. 

Die Werte für den Tippgeber sind in der Datei Ü5.3 enthalten. 

Für Sie habe ich die Daten dieser Datei als Star Plots visualisiert (siehe auch Seite 282). 

46 

40 

30 

20 

10 

1 

Abb. 5.3.3: Star Plots für die Tippgeber


Y3 

. Y2 

Y4 

Y1 

Y5 Y6 

Abb. 5.3.4: Schlüssel für die Star Plots der Tippgeber 

In der Abbildung 5.3.5 habe ich für Sie noch die Korrelationsdiagramme dargestellt. 

Y2 

Y3 

Y4 

Y5 

Y6 

Y1 

Y2 Y3 Y4 Y5 

Abb. 5.3.5: Korrelationsdiagramme für die Tippgeber 

Welche Schlüsse ziehen Sie aus den beiden Abbildungen? 

Definieren Sie bitte das Problem und überprüfen Sie die gegebene Tolerierung mit den beigefügten 

Programmen. 

Was müssen Sie tun, um das Problem zu lösen? 

5.4 Warum sollen Sie die Prozessdarstellung wählen? 

Sie haben anerkannt, dass jede Tätigkeit und jedes (materielle und/oder immaterielle) Produkt 

das Ergebnis eines Prozesses ist. Jetzt müssen Sie mir weiter folgen und den zugehörigen Prozess 

strukturieren. Die Produktvariablen sind Funktionen der Input-, Prozess- und Störvariablen 

und können nach dem Ursache-Wirkungs-Prinzip nur über diese Variablen verändert werden.

5.4 Warum sollen Sie die Prozessdarstellung wählen? 

225 

äußere Variable (Störvariable) 

Inputs Prozess Produkt 

Inputvariable Prozessvariable Produktvariable 

Ursachen 

Wirkungen 

Abb. 5.4.1: Prozessdarstellung 

Die Inputvariablen, wie Material, Maschinen, Anlagen, Zusatzstoffe und auch die Fähigkeiten 

der Mitarbeiter fließen mit ihren Eigenschaften in den Prozess hinein. 

Die Produktvariablen müssen die spezifizierten Kundenanforderungen erfüllen. Über die Veränderung 

der Prozessvariablen muss aus den gegebenen Inputvariablen das Produkt mit seinen 

geforderten Eigenschaften entstehen. Damit dieses spannende Zusammenspiel zwischen den 

Variablen klappt, müssen die Inputvariablen, die ja Produktvariablen von Vorläuferprozessen 

sind, ebenfalls die spezifizierten Anforderungen des Prozesses erfüllen. Die spezifizierten Anforderungen 

kann man beim Eintreffen der Inputs überprüfen (Wareneingangsprüfung) oder 

man vereinbart in einem Dialog mit den Lieferanten, dass die Inputs mit ihren entsprechenden 

uniund multivariaten Fähigkeitsnachweisen geliefert werden. 

Die Werte für die Prozessvariablen kann man auch nicht beliebig einstellen, da auf dieser Basis 

bestimmt nicht das Produkt mit den geforderten Eigenschaften entsteht. Der Prozess muss mit 

einer Prozessgleichung so gesteuert werden, dass bei Kenntnis der Inputvariablen das geforderte 

Produkt herauskommt. 

Beispiel 5.4.1: Drehen einer Welle. Prozessdarstellung 

Aus einem Rundstahl soll eine Welle gedreht werden. Die Welle soll Kundenanforderungen 

erfüllen. Zu diesen gehören die Maßhaltigkeit, die Rundheit, die Konizität und gewisse 

Festigkeitseigenschaften. 

Die Inputs sind der Rundstahlrohling, die Eigenschaften der Drehmaschine, der Kühlmittelstand 

usw. Zu den Prozessvariablen zählen die Drehgeschwindigkeit, die Kühlmitteltemperatur, 

die Standzeit der Schneidwerkzeuge usw. Die Menge der Produktvariablen umfasst 

die Maßhaltigkeit, die Rundheit der Welle, d. h. die Differenz zweier Durchmesser vorn 

und hinten an der Welle gemessen usw. Die Prozessdarstellung ist in der Abbildung 5.4.2 

enthalten. 

Fordert der Kunde vom Lieferanten (Dreherei) eine Welle z. B. mit einem spezifizierten 

Elastizitätsmodul [N/m 2 ], so muss der Wellenhersteller bei seinem Lieferanten für die 

Rohlinge diese Eigenschaft anfordern, denn beim Drehen wird der Elastizitätsmodul kaum 

verändert.


äußere Variable (Störvariable) 

Rundstahl, 

Kühlflüssigkeit, Drehen einer Welle Welle 

Schneidwerkzeug, .. 


Drehgeschwindigkeit 

Rundheit 

Standzeit 

Rundheit 

Konizität 

Temp. Kühlflüssigkeit 

Konizität 

Stahleigenschaften Temp. Werkzeug 

Maßhaltigkeit 

Stand der Kühlflüssigkeit, 

Ursachen 

... 

Wirkungen 

Abb. 5.4.2: Drehen einer Welle 

Dieses Beispiel zeigt schon, dass zwischen den Kunden und Lieferanten ein Dialog stattfinden 

muss. 

Wie kann man den Dialog zwischen Kunden und Lieferanten führen? 

Bevor wir diesen Dialog aufbauen, wollen wir ein Netzwerk von Prozessen betrachten. 

5.5 Warum müssen Sie Ihr Unternehmen als Netzwerk von 

Dienstleistungs- und Fertigungsprozessen darstellen? 

Ein Unternehmen muss durch Fertigungs- und Dienstleistungsprozesse strukturiert werden. 

Ziele der Steuerung und Regelung des gesamten Unternehmens sind Erfüllung aller (Markt-) 

Kundenanforderungen, Erwirtschaftung der notwendigen Gelder zur erweiterten Reproduktion, 

das Bestehen im internationalen Wettbewerb, die Steigerung der betriebswirtschaftlichen 

Kennziffern und damit die Existenzsicherung. Die Strukturierung dient ebenfalls der Veränderung 

der Organisationsstruktur, nach der die Aufgaben und Verantwortlichkeiten eindeutig 

festlegt und die Mitarbeiter dadurch motiviert werden, an der Realisierung der betrieblichen 

Ziele mitzuwirken. Nicht zuletzt ist die Strukturierung auch die Grundlage für eine verbesserte 

Kostenrechnung auf der Basis des notwendigen Verbrauchs an allen Ressourcen, die z. B. 

gewährleistet, dass die stetig steigenden, nicht aufschlüsselbaren Gemeinkostenzuschläge der 

Vergangenheit angehören werden.

5.5 Warum müssen Sie Ihr Unternehmen als Netzwerk darstellen? 

227 

Wir betrachten zunächst zwei Prozesse, um daran die Vernetzung zu demonstrieren. Diese beiden 

Prozesse mögen einfach A und B heißen. Der eine Prozess, nehmen wir an, es sei der Prozess 

B, soll der Vorläufer- oder Lieferantenprozess vom Prozess A sein. Der Prozess A verarbeitet die 

Produkte von Prozess B, d. h. die Produkte B werden zu Inputs von A. Der Prozess A ist damit 

der Kundenprozess von B. Folglich muss A formulieren, was er von B verlangt. A muss also 

sein (Kunden-) Anforderungsprofil an B formulieren. B muss die Kundenanforderungen durch 

Sollwerte und Toleranzgrenzen für alle Produktvariablen des Produktes B spezifizieren. B muss 

dann seinen Prozess mit den Sollwerten für alle relevanten Produktvariablen als Zielwerte so 

steuern und regeln, dass alle Anforderungen erfüllt werden. B muss außerdem den Nachweis 

führen, dass die in B produzierten Produkte alle Kundenanforderungen erfüllen. 

Die Produkte von A werden von einem weiteren (externen oder internen) Kunden benötigt. 

Dieser Kunde stellt natürlich seine Anforderungen an die Produkte von A. Hieraus wird deutlich, 

dass jeder Prozess Kunden- und Lieferantenprozess zugleich ist. 

Dieses Zusammenspiel ist in der Abbildung 5.5.1 schematisch dargestellt. Dieses Zusammenspiel 

zwischen zwei Prozessen ist in der Literatur unter dem Begriff „internes Kunden-Lieferanten-Verhältnis“ 

(KLV) bekannt geworden und charakterisiert in unserem Verständnis die 

Schnittstelle zwischen zwei Prozessen. In der Literatur wird das KLV nur beschrieben, es kommt 

aber darauf an, das KLV zu modellieren und zu realisieren. 

Anforderungen 

Inputs Prozess B Produkt B 

Input für A 

Prozess A 

Produkt A 

Inputvariable Prozessvariable Produktvariable Prozessvariable Produktvariable 

Nachweis der 

Erfüllung aller 

Anforderungen 

Vorläuferprozess 

Nachfolgerprozess 

= Lieferant = Kunde 

Abb. 5.5.1: Kunden-Lieferanten-Verhältnis 

Beispiel 5.5.1: Papierfeeder. Prozessnetzwerk 

Wir betrachten in der Abbildung 5.5.2 die Herstellung eines Papierfeeders als ein Netzwerk 

von Prozessen, in denen mechanische Teile, elektronische Komponenten und Kunststoffteile 

hergestellt werden. 

Das Netzwerk sieht recht einfach aus. Aber wir haben das Netzwerk ohne Kommunikation 

dargestellt. So kann das Netzwerk nicht funktionieren.


Input 

Kunststoffherst. 

Plastikteile 


Input 

Metallherstellung. 

Metallteile 

Montage Feeder Funktionen 


Prozessvariable 

Produktvariable Funktionen Par. 

Input 

Elektroteileherst . 

Elektroteile 


Abb. 5.5.2: Netzwerk von Herstellungsprozessen 

5.6 Kommunikation zwischen Prozessen 

Im Vorangegangenen haben wir alles Tun in einem Unternehmen durch Prozesse modelliert. 

Wie haben des weiteren gesehen, dass die Prozesse nicht unabhängig voneinander sind, schon 

allein deswegen, weil jeder Prozess Kunden- und Lieferantenprozess zugleich ist. Eine Kommunikation 

zwischen den Prozessen ist somit notwendig. Ohne diese beobachten wir das 

tägliche Chaos. 

Jede Kommunikation braucht eine Sprache. Die für die Kommunikation zwischen Prozessen 

benötigte Sprache haben wir schon bereit gestellt. Diese Sprache hat die Worte bzw. Phrasen 

(Teilsätze) oder Elemente 

• 

• 

• 

• 

• 

Zusammenstellung des externes und/oder internen Kundenanforderungsprofils (KAP), 

Parametrisierung der gewünschten Eigenschaften, 

Datengewinnung für die Produktvariablen, 

Spezifizierung des KAP durch Sollwerte und Toleranzgrenzen, mit der CAD oder statistischer 

Tolerierung, 

Nachweis der simultanen Erfüllung aller (ex- oder internen) Kundenanforderungen mit 

uniund multivariaten Prozessfähigkeitsindizes, 

Treffen einer Entscheidung auf der Grundlage der uniund multivariaten Prozessfähigkeitsindizes 

für die statistische Prozessanalyse, falls die Fähigkeiten kleines als 1 sind, 

– mit anschließender Prozessverbesserung durch die Steuerung der Prozesse mit der Prozessgleichung 

und den Sollwerten und Toleranzgrenzen als Zielwerte bzw. Zielgebiet,

5.6 Kommunikation zwischen Prozessen 

229 

– Justierung der Prozesse, falls die einfachen uniund multivariaten Prozessfähigkeitsindizes 

größer und die korrigierten Indizes kleines als 1 sind, 

• laufende Kontrolle der Prozesse mit den uniund vor allem multivariaten Kontrollkarten, 

falls die einfachen und korrigierten Fähigkeiten größer als eins sind, 

• neue Tolerierung, falls die Abhängigkeiten zwischen den Produktvariablen bei der Tolerierung 

vernachlässigt wurden, 

• Investitionen, falls das vorherige Ausreizen aller Möglichkeiten nicht ausreichte, Produkte 

zu produzieren, die alle Kundenanforderungen erfüllen und trotz der vorgegebenen Marktpreise 

durch den Verkauf einen Gewinn erzielen. 

Wie man sehen kann, ist diese technische Sprache recht einfach. Die Schwierigkeit liegt in der 

Bereitstellung der Elemente, die für Sprache benötigt werden, wie der Definition des Problems, 

der Berechnung der Sollwerte und Toleranzgrenzen für alle, nicht unabhängigen Produktvariablen 

mit Hilfe CAD oder multivariaten statistischen Tolerierung, der Berechnung der uniund 

multivariaten Prozessfähigkeitsindizes, des Treffens einer Entscheidung, der Kontrolle der 

Prozesse mit uniund multivariaten Kontrollkarten und der Datenerfassung. 

Diese Schwierigkeiten traten in der Vergangenheit auf, weil viele der genannten Elemente bisher, 

aus mir nicht bekannten Gründen, nicht zur Verfügung standen. Im Abschnitt 5.3. habe ich 

Ihnen die von mir entwickelten neuen Methoden für die Durchführung eines modernen Audits 

zur Definition eines Problems und Entscheidungsfindung zur Verfügung gestellt. 

Beispiel 5.6.1: Papierfeeder. Prozessnetzwerk mit Kommunikation 

Wir betrachten jetzt, nachdem wir die Elemente der technischen Sprache genannt und im 

Abschnitt 5.3 zur Verfügung gestellt haben, dasselbe Netzwerk mit Kommunikation in der 

Abbildung 5.6.1. 

KAP 

KAP 

KAP 

Input Kunststoffherst. Plastikteile 

Inputvariable 

Prozessvariable Produktvariable 

MC PK 

KAP 

KAP 

KAP 

KAP 

KAP 

Input 

Metallherstellg. 

Metallteile 

MC PK 

Montage Feeder Funktionen 

Input 

MC PK 



Funktionenvariable 

KAP 

KAP 

KAP 

Input Elektroteileherst. Elektroteile 

MC PK 


MC PK 

Abb. 5.6.1: Netzwerk für die Feederherstellung mit Kommunikation


Die Abbildung zeigt, dass dieses Netzwerk mit Kommunikation auf den ersten Blick kompliziert 

aussieht. Aber die Kommunikation ist notwendig, um das tägliches Chaos zu ordnen, 

die Prozesse zu verbessern, Produkte mit geforderten Eigenschaften zu produzieren, die 

Qualität der Produkte nachzuweisen und zu quantifizieren. 

Es gilt die alte Weisheit: „… je flacher die Fertigungstiefe wird, desto intensiver muss die Kommunikation 

geführt werden …“. 

Die Antwort auf die Frage: 

„Wie wird in Ihrem Unternehmen die Kommunikation zwischen Prozessen geführt?“ 

wird entweder nicht verstanden oder aber lapidar damit beantwortet, dass man sagt, „… wir 

regeln die Angelegenheit mit unseren Lieferanten durch Lasten- oder Pflichtenhefte …“ 

Ich habe mir in vielen Unternehmen Lasten und/oder Pflichtenhefte angeschaut und daher 

die neuen Methoden entwickelt. 

5.7 Was heißt Prozessverbesserung und was müssen Sie 

tun? 

Nach dem Entscheidungsgraphen in Abbildung 5.16 beim Produktaudit im Abschnitt 5.3 muss 

im Fall MC pk < 1 entschieden werden, dass der Prozess zu verbessern ist, denn der Prozess ist 

nicht fähig, Produkte (materielle oder immaterielle) mit geforderten Eigenschaften zu produzieren. 

Ausschuss ist die Folge und der kostet Geld. Außerdem führt er zur Nichteinhaltung 

der versprochenen Liefertermine. 

Die Ursachen hierfür können sein: 

• 

• 

• 

• 

• 

• 

die Prozesse werden heuristisch ohne Zielwerte gesteuert, das Methodenniveau ist zu 

niedrig, 

daher können die Streuungen der Produktvariablen zu groß sein oder 

die Mittelwerte von den Sollwerten abweichen, 

die Tolerierung wurde unter Missachtung der Abhängigkeiten zwischen den Produktvariablen 

vorgenommen und ist daher nicht korrekt, 

die Anlagen und Maschinen sind zu alt und nicht mehr fähig, 

die Mitarbeiter sind nicht genügend qualifiziert und vieles mehr. 

Gilt ebenfalls MC p < 1, dann bedeutet das, die Streuung mindestens einer Produktvariablen 

ist zu groß. Die Reduktion der Variabilität – man nennt diesen Sachverhalt schlicht Prozessverbesserung 

– mindestens einer Produktvariablen ist notwendig. 

Gilt MC p > 1 und MC pk < 1, dann ist das Streuverhalten der Produktvariablen in Ordnung, aber 

der Vektor der Mittelwerte weicht vom Vektor der Sollwerte an. Der Prozess ist zu justieren. 

Die verschiedenen Zielstellungen, die man aufgrund der Größen für die uniund multivariaten 

Prozessfähigkeitsindizes zu verfolgen hat, sind unterschiedlich aufwendig und kosten 

daher unterschiedlich viel. Daher ist ja die Entscheidung für den einen oder anderen Weg so 

vorteilhaft für die Qualitätsverbesserungsprojekte.

5.7 Was heißt Prozessverbesserung und was müssen Sie tun? 

231 

Beispiel 5.7.1: Chemischer Prozess. Prozessverbesserung 

Das Produkt eines chemischen Prozesses wird durch m = 6 Produktvariable erklärt, von 

denen die Variable Y 1 den Anteil einer unerwünschten Substanz beschreibt, die für viel Geld 

aus dem Produkt herausgefiltert werden muss. Die Frage lautet, kann der Prozess so gesteuert 

werden, dass der Anteil der unerwünschte Substanz so klein wird, dass die unerwünschte 

Substanz dem Verbraucher keinen Schaden mehr zufügen kann? 

Die Ausgangssituation bzgl. der Produktvariablen Y 1 , d. h. der ungesteuerte Prozess und 

der verbesserte Prozess sind in Abbildung 5.7.1 und Abbildung 5.7.2 dargestellt. 

Y 

ungesteuerter 

Prozess 

Y 

gesteuerter 

Prozess 

40 

40 

30 

30 

20 

20 

10 

10 

0 

0 20 40 60 80 100 

t 

0 

0 20 40 60 80 100 

t 

Abb. 5.7.1: Vergleich der Ergebnisse des ungesteuerten und gesteuerten Prozesses 

Beim heuristisch oder ungesteuerten Prozess sieht man, dass die unerwünschte Substanz 

mal häufiger und mal seltener vorkommt und ein Trend beobachtet wird. Daraus kann 

man aber bereits ableiten, dass zumindest ein Teil der Ursachen für das Vorkommen der 

unerwünschten Substanz im Prozess oder den Inputs liegt. 

Der gesteuerte Prozess zeigt, dass die unerwünschte Substanz durch die Steuerung des 

Prozesses mit einer Prozessgleichung nahezu vollständig vermieden werden kann. Genau 

das ist das zu erreichende Ziel, mit Hilfe der geistigen Investition, oder anders formuliert, 

der Anwendung multivariater statistischer Methoden, Prozesse wesentlich zu verbessern. 

Das spricht nicht gegen das hohe Expertenwissen der Mitarbeiter, die aufgrund ihrer Erfahrung 

das heutige hohe Niveau der „heuristischen“ Steuerung erreicht haben. Ich habe 

großen Respekt vor diesen Leistungen. Allerdings müssen wir uns heute dem Diktat der 

Globalisierung und des internationalen Marktes beugen und jeden möglichen Euro für 

die Sicherung der Existenz deutscher Unternehmen herausfiltern. Und das ist nur mit den 

modernen Methoden der multivariaten Statistik möglich. 

Die Verteilung der Produktvariablen Y 1 (unerwünschtes Nebenprodukt) des ungesteuerten 

Prozesses lässt sich in der Abbildung 5.7.2, links, darstellen. 

Diese Abbildung repräsentiert die univariate Betrachtung. Es wird ausschließlich die 

Produktvariable Y 1 betrachtet, ohne die anderen vorhandenen Informationen zu berücksichtigen. 

Können wir uns das noch leisten? 

Schon die linke Darstellung in Abbildung 5.7.2 zeigt, dass außer den Werten für die Produktvariable 

Y 1 weitere Informationen in Form wenigstens einer Input- und/oder Prozessvariablen, 

hier mit t bezeichnet, vorliegt. Betrachten Sie nach dem Ursache-Wirkungs-Prinzip 

Y 1 als Funktion von den Input- und Prozessvariablen, dann erhalten Sie als Ergebnis die


Y 

40 

30 

20 

10 

Ausgangssituation 

Was haben wir? 

Ohne die Anwendung der multivariaten statistischen 

Methoden eine breite Verteilung von Y 1 

Y 

40 

30 

20 

10 


Was müssen wir tun? 

Die Prozessgleichung berechnen und die 

Verteilung von Y 1 

um die Gleichung 

betrachten 

Y 

40 

30 

20 

10 

0 

0 20 40 60 80 100 

t 

0 

0 20 40 60 80 100 

t 

0 

0 20 40 60 80 100 

t 

Abb. 5.7.2: Schritte der Prozessverbesserung 

Prozessgleichung, die hier in der rechten Abbildung durch die Gerade markiert ist. Uns 

interessiert nun die Streuung der Werte von Y 1 um die Prozessgleichung. Diese Verteilung ist 

auch im rechten Bild der Abbildung 5.7.2 zu sehen. Die Breite der Verteilung ist wesentlich 

kleiner als die Breite der Verteilung von Y 1 . Das ist nach der Shannon Theorie auf den Informationsgewinn 

durch die Betrachtung der zusätzlichen Variablen zurück zuführen. Die 

Verkleinerung der Breite der ursprünglichen Verteilung durch die Betrachtung zusätzlicher 

Variabler messen wir mit dem Maß der Beherrschbarkeit des Prozesses. Der Informationsgewinn 

ist aber bereits eine Prozessverbesserung ohne materielle Investitionen. Wir 

können die Prozessverbesserung steigern, indem wir den Prozess mit der Prozessgleichung 

steuern. Das Ergebnis ist das Bild 3 in der Abbildung 5.7.2. Die unerwünschte Substanz 

kommt kaum noch vor, die Verteilung der Messwerte für Y 1 des gesteuerten Prozesses ist 

sehr schmal, d. h. deren Streuung ist sehr klein. 

5.8 Wie können wir das Ergebnis erreichen? 

Der Prozess wurde eingeführt, da sich damit zeigen lässt, dass die Produktvariablen nach dem 

Ursache-Wirkungs-Prinzips nur verändert werden können, wenn sowohl die Input- als auch 

die Prozessvariablen verändert werden. Die Folge daraus ist, dass die Variation der Produktvariablen 

nur dann reduziert werden kann, wenn sowohl die Input- als auch die Prozessvariablen 

verändert werden. Nichts anderes tun die Prozessexperten aufgrund „ihrer“ Erfahrung. 

Wir müssen die Erfahrung durch Wissen ersetzen. Das können wir nur dann tun, wenn wir 

dem Prozess sein Wissen abluchsen. Dazu müssen wir mit den Prozessen kommunizieren und 

das ist nach dem Grundsatz des Galilei: „messe alles, und das nicht Messbare mache messbar“ 

nur über die Daten für alle Produkt-, Input-, Prozess- und Störvariablen möglich. Mit diesen 

Daten kann 

• die Abhängigkeitsstruktur zwischen den Input-, Prozess- und Produktvariablen quantifiziert 

und analysiert und 

• eine Prozessgleichung berechnet werden, die über die Input- und Prozessvariablen die 

Steuerung der Produktvariablen so ermöglicht, dass simultan alle Kundenanforderungen 

durch die produzierten Produkte erfüllt werden.

5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses? 

233 

An dieser Stelle sei noch einmal daran erinnert, dass wir mit dieser Methodik sowohl Herstellungs- 

als auch Dienstleistungsprozesse behandeln müssen, um betriebswirtschaftliche 

Verbesserungen zu erzielen. 

Die Verfahren der univariaten Statistik können dieses Anliegen nicht erfüllen. Daher ist die 

multivariate Statistik die geeignete Methodik. Multivariat heißt nichts anderes als mehrdimensional. 

Und mehrdimensional müssen die statistischen Methoden schon sein, denn es gibt ja 

im trivialsten Fall wenigstens eine Prozess- und eine Produktvariable. 

Für die Prozessverbesserung benötigt man multivariate statistische Methoden zur 

• 

• 

• 

• 

• 

Analyse der Abhängigkeitsstruktur, 

Klassifikation einer heterogenen Stichprobe in homogene Teilstichproben, 

Auswahl der wesentlichen Input- und Prozessvariablen und Berechnung der Prozessgleichung, 

Optimierung und Steuerung des Prozesses, 

Kontrolle des verbesserten Prozesses mit uniund multivariaten Kontrollkarten. 

5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses ? 

Ein Prozess wird durch die Input-, Prozess-, noise- und Produktvariablen beschrieben. Diese 

Variablen werden in dem Vektor der Zufallsgrößen 

(Z 1 , …, Z l , X 1 , …, X n , U 1 , …, U p , Y 1 , …, Y m ) T = (Z T , X T , U T , Y T ) T 

zusammengefasst. 

Die Zufallsgrößen sind nicht unabhängig voneinander, sondern durch eine Abhängigkeitsstruktur 

miteinander verbunden. Das soll die Abbildung 5.9.1 verdeutlichen. 

Inputs Prozess Produkt 

X 1 

X 2 

Y 1 

Y 2 

X 3 

Abb. 5.9.1: Abhängigkeitsstruktur zwischen Input-, Prozess- und Produktvariablen


Der Einfachheit halber wurden die Input- und Prozessvariablen mit dem Buchstaben X 

bezeichnet. Diese Abbildung zeigt, dass selbst bei einer geringen Anzahl von Variablen die 

Abhängigkeitsstruktur schon recht kompliziert werden kann. Stellt man sich noch vor, dass 

die Abhängigkeiten sowohl positiv als auch negativ sein können, dann kann man sich vorstellen, 

dass selbst für die logische Analyse der kleiner Abhängigkeitsstrukturen der menschliche 

Verstand nicht mehr ausreicht und an dessen Stelle statistische Modelle eingesetzt werden 

müssen. 

Diese Abhängigkeitsstruktur muss quantifiziert werden. Dazu dienen die Korrelations-, die 

Hauptkomponenten- und Faktoranalysen. 

5.9.1 Wie führt man eine Korrelationsanalyse (KA) durch und was 

besagen die Ergebnisse? 

Unter der Korrelationsanalyse verstehen wir die Berechnung der Abhängigkeiten 

• zwischen jeweils zwei Zufallsgrößen – in unserem Sprachgebrauch zwischen jeweils zwei 

(Input-, Prozess- und/oder Produkt-) Variablen mit dem einfachen Korrelationskoeffizienten. 

Die Berechnung der paarweisen Abhängigkeiten zwischen allen ⎜ 

⎛n + p + m⎞ 

⎝ 2 ⎟ 

⎠ 

Variablen liefert ebenso viele Korrelationskoeffizienten, die in der Korrelationsmatrix R 

zusammengefasst werden. 

• Häufig müssen Korrelationskoeffizienten zwischen jeweils zwei Zufallsgrößen unter der 

Bedingung, dass andere Zufallsgrößen konstant gehalten werden, berechnet werden. Diese 

Korrelationskoeffizienten heißen partielle Korrelationskoeffizienten. So wird häufig die 

Frage gestellt, wie ist die lineare Abhängigkeit zwischen zwei Prozessvariablen, wenn die 

Inputvariablen konstant gehalten werden müssen, oder anders formuliert, wenn die Werte 

für die Inputvariablen gegeben sind? Das bedeutet, es sind die Korrelationskoeffizienten für 

die Zufallsgrößen einer bedingten Verteilung, im vorliegenden Fall der bedingten Verteilung 

der Prozessvariablen unter der Bedingung der gegebenen Inputvariablen zu berechnen. 

• Zur Korrelationsanalyse zählen wir auch die Berechnung der Abhängigkeit einer Zufallsgröße, 

z. B. einer Produktvariablen Y j , j = 1, …, m von einer Linearkombination aller 

Input- und Prozessvariablen. Diese Korrelationskoeffizienten nennt man multiple Korrelationskoeffizienten 

und bezeichnet sie mit R 2 Y j / allen Input- und Prozessvariablen . 

• Außer diesen Abhängigkeiten ist häufig die Abhängigkeit zwischen einer Zufallsgröße, z. B. 

der Produktvariablen Y und einer Linearkombination der wesentlichen Prozessvariablen 

X unter der Bedingung der wesentlichen Inputvariablen Z zu quantifizieren. Ein solches 

Maß der Abhängigkeit nennt man partiell multipler Korrelationskoeffizient. 

• Da ein Produkt durch mehrere, z. B. m, m ≥ 1 Produktvariable beschrieben wird und die 

Kenntnis der Abhängigkeit der Gesamtheit der Produktvariablen von allen Input- und 

Prozessvariablen als verallgemeinertes Maß der Beherrschbarkeit eines Prozesses notwendig 

ist, wird auch der multivariate, multiple Korrelationskoeffizient berechnet. 

• Für weiterführende Analysen werden noch die multivariat partiell-multiplen und die 

multivariat semipartiell-multiplen Korrelationskoeffizienten eingeführt. 

Es versteht sich von selbst, dass die Analyse einer Abhängigkeitsstruktur mit der Berechnung 

der einfachen Korrelationskoeffizienten beginnt.


235 

Was sind einfache Korrelationskoeffizienten? 

Die einfachen Korrelationskoeffizienten messen die lineare Abhängigkeit zwischen zwei zufälligen 

Variablen. 

Beispiel 5.9.1: Bremsweg eines PKW. Korrelationskoeffizienten 

Fährt man mit einem PKW durch eine Stadt und muss vor einem auftretenden Hindernis 

plötzlich bremsen, dann können der Bremsweg und die gefahrene Geschwindigkeit 

gemes sen werden. Für die Rekapitulation von Unfallgeschehen möchte die Polizei wissen, 

wie streng die Länge des Bremsweges von der gefahrenen Geschwindigkeit des PKW abhängt. 

Lässt man z. B. N PKW’s fahren, dann erhält man N Wertepaare. Die Wertepaare können 

als Punkte in einer Ebene gedeutet und aufgezeichnet werden. Für das Experiment erhält 

man die Abbildung 5.9.2. 

51 

46 

Bremsweg 

41 

36 

31 

26 

21 

53 58 63 68 

Geschwindigkeit 

Abb. 5.9.2: Länge des Bremsweges in Abhängigkeit von der Geschwindigkeit 

Die Punktwolke der Wertepaare ergeben eine elliptisch umrissene Punktwolke. Intuitiv 

würde man sagen, der Zusammenhang zwischen der Geschwindigkeit und dem Bremsweg 

ist eng. Aber diese Aussage muss quantifiziert werden, denn eine qualitative Einschätzung 

sagt sehr wenig aus und man kann nicht für alle möglichen Abhängigkeiten erst eine 

Abbildung zeichnen und dann eine subjektive Einschätzung vornehmen. Der berechnete 

Korrelationskoeffizient r Bremweg, Geschwindigkeit = 0.88. 

Was besagt dieser Koeffizient und wie kann man den Korrelationskoeffizienten berechnen? 

Der Korrelationskoeffizient ist eine dimensionslose Zahl, die zwischen –1 und +1 liegt. Ist der 

Korrelationskoeffizient groß gegen 1, dann nähert sich das Aussehen der Punktwolke immer 

stärker dem Aussehen einer Zigarre an, d. h. die eine Hauptachse der Ellipse wird immer 

länger, die andere immer kürzer. Ist der Korrelationskoeffizient gleich 1, dann wird aus der 

Ellipse eine Gerade. Der Anstieg der Gerade kann positiv oder negativ sein. Entsprechend 

dem Anstieg ist der Korrelationskoeffizient positiv oder negativ. Gibt es zwischen den beiden


Variablen keine Abhängigkeit, d. h. sind die beiden Variablen unabhängig voneinander, dann 

ist der Korrelationskoeffizient null. 

Für den einfachen Korrelationskoeffizienten 

ρ 

12 

σ12 

= = 

σ ⋅ σ 

1 2 

Kovarianz 

Produkt der Streuungen 

erhält man nach der Maximum Likelihood Methode die Schätzung 

wobei 

r 

12 

S12 

= . 

S ⋅ S 

1 2 

N 

∑ 

S = ( Y − Y )( Y − Y ) 

12 i,1 1 i,2 2 

i= 

1 

die Stichprobenkovarianz zwischen Y 1 und Y 2 ist. Zur Begründung des eben gesagten betrachten 

wir zunächst nur zwei Produktvariable Y 1 und Y 2 und nehmen an, dass der Vektor dieser beiden 

Variablen Y T = (Y 1 , Y 2 ) normalverteilt ist mit dem Vektor der Erwartungswerte (Mittelwerte 

der Grundgesamtheit) 

µ T = (µ 1 , µ 2 ) 

und der Kovarianzmatrix 

Σ 

YY 

⎛ 

2 

σ ⎞ 

1 σ12 

= ⎜ 

2 

⎟ 

⎝ σ ⎠ 

2 

in der σ 2 1 die Varianz von Y 1 (Quadrat der Standardabweichung von Y 1 in der Grundge samtheit), 

σ 2 2 die Varianz von Y 2 und σ 12 die Kovarianz zwischen Y 1 und Y 2 ist. Die Kovarianz von Y 1 und 

Y 2 ist als Produkt der Abweichungen der Y 1 Werte vom Erwartungswert µ 1 und der Y 2 Werte 

von µ 2 durch 

E [(Y 1 – µ 1 ) (Y 2 – µ 2 )] = σ 12 

definiert. Die Kovarianz ist ein Abhängigkeitsmaß zwischen Y 1 und Y 2 , d. h. diese gibt an, wie 

sich z. B. Y 1 in Abhängigkeit von Veränderungen von Y 2 verändert. Die Kovarianz ist aber von 

den Dimensionen der beiden Zufallsgrößen Y 1 und Y 2 abhängig. Das ist unschön und soll 

durch Standardisierung der beiden Zufallsgrößen Y 1 und Y 2 aufgehoben werden. 

Unter Standardisierung versteht man dabei den Übergang von Y j zu Z j über die Beziehung 

Z 

j 

Yj 

− μ j 

= , j = 1,2. 

σ 

j 

Für die standardisierten Zufallsgrößen Z 1 und Z 2 ist die Kovarianz E [Z 1 Z 2 ] durch 

E[( Y1 − μ1) ⋅( Y2 − μ2)] 

E[ Z1 ⋅ Z2] 

= 

σ ⋅ σ 

1 2 

gegeben. Die Kovarianz zwischen den standardisierten Zufallsgrößen Y 1 und Y 2 nennt man 

Korrelationskoeffizient ρ 12


237 

Y 2 

Y 1 

ρ 12 = 1 

Y 2 + ΔY 2 

Y 2 

Y 1 Y 1 + ΔY 1 

Abb. 5.9.3: Lineare Abhängigkeit zwischen Y 1 und Y 2 

Für diesen gilt: 

• 1 ≤ ρ 12 ≤ 1, 

wobei ρ 12 = 1 genau dann gilt, wenn Y 1 und Y 2 mit der Wahrscheinlichkeit eins linear abhängig 

sind, wie das in der Abbildung 5.9.3 dargestellt ist. Linear abhängig heißt in diesem 

Zusammenhang, wenn mit der Wahrscheinlichkeit 1 eine Veränderung von z. B. Y 1 zu einer 

determinierten Veränderung von Y 2 führt und umgekehrt, d. h. wenn P (Y 2 = β 0 + β Y.1 Y 1 ) 

= 1, wobei β 0 und β Y.1 die unbekannten Koeffizienten der Geradengleichung sind. 

Man kann diesen Sachverhalt auch in der folgenden Art beschreiben: die Punkte (Y 1 , Y 2 ) 

liegen auf der Geraden, die den funktionalen Zusammenhang zwischen Y 1 und Y 2 beschreibt, 

d. h. Y 1 und Y 2 haben keine Streuungen. Das wiederum heißt aber, dass der Zusammenhang 

zwischen Y 1 und Y 2 determiniert ist. Diesen Sachverhalt verdeutlicht die Abbildung 5.9.3. 

• ρ 12 = 0 gilt nur dann, wenn Y 1 und Y 2 linear unabhängig sind. In diesem Falle liegen die 

Realisierungen von Y 1 und Y 2 , d. h. die Wertepaare von Y 1 und Y 2 in einem kreisförmigen 

Gebiet. 

• Für alle anderen Werte des Korrelationskoeffizienten liegen die Wertepaare in elliptisch 

umrissenen Gebieten. Diese Ellipsen können steigend oder fallend sein, je nachdem wie 

das Vorzeichen des Korrelationskoeffizienten ist. 

• Von ρ 12 = 0 bzw. r 12 = 0 kann man nicht auf die Unabhängigkeit von Y 1 und Y 2 schließen. 

• Der Korrelationskoeffizient der Grundgesamtheit ρ 12 wird mit der Formel 

r 

12 

= 

N 

∑ 

i= 

1 

( Y − Y ) ⋅( Y − Y ) 

1, i 1 2, i 2 

N 

N 

2 2 

∑ ( Y1, i − Y1 ) ⋅∑ 

( Y2, i − Y2 

) 

i= 1 i= 

1 

und den Wertepaaren (Y 11 , Y 21 ), …, (Y 1,N , Y 2,N ), d. h. der Stichprobe geschätzt. 

Die Korrelationskoeffizienten für alle möglichen ⎛ m ⎞ 

⎜ 

⎝2 

⎟ Paare von Produktvariablen werden 

⎠ 

in der Korrelationsmatrix


R 

YY 

⎛1 r12 ... r1 

m ⎞ 

⎜ 1 ... r ⎟ 

2m 

= ⎜ 

⎟ 

⎜ ... ⎟ 

⎜ 

⎝ 

1 ⎟ 

⎠ 


Die Korrelationsmatrix ist symmetrisch, denn es gilt r jk = r kj für alle 

j, k = 1, … (j – 1) j (j + 1), …, (k – 1), k, (k + 1), …, m, j ≠ k. Für j = k ist ρ jj = ρ kk = 1. 

Die Korrelationsmatrix ist für reguläre m-dimensionale Verteilungen positiv definit, wenn 

das Produkt widerspruchsfrei durch die Produktvariablen beschrieben wird. 

Wie kann geprüft werden, ob ein berechneter Korrelationskoeffizient eine Abhängigkeit 

ausdrückt, die statistisch gesichert von null verschieden ist? 

Zu diesem Sachverhalt sagt man kurz, die Abhängigkeit zwischen zwei Zufallsgrößen ist „signifikant 

von null verschieden“. 

Da der Korrelationskoeffizient mit den Werten einer Stichprobe geschätzt wurde, hängt er 

einmal vom Stichprobenumfang und von der „Zufälligkeit“ der beteiligten Variablen, d. h. 

der Größe der Streuungen ab. Aus diesem Grund muss beim Korrelationskoeffizienten stets 

gefragt werden, wie groß kann r 12 von null abweichen, ohne dass die Unabhängigkeit von Y 1 

und Y 2 verletzt ist? 

Zur Beantwortung dieser Frage müssen Hypothesen über ρ 12 formuliert werden, die mit r 12 

zu beantworten sind, d. h. man benötigt einen Test. Die Hypothesen lauten: 

H 0 : ρ 12 = 0 (d. h. die Zufallsgrößen Y 1 und Y 2 sind nicht miteinander korreliert) und 

H 1 : ρ 12 ≠ 0 (d. h. die Zufallsgrößen sind linear nicht unabhängig voneinander) 

Die Prüfung der H 0 gegen die Alternativhypothese H 1 wird mit dem t-Test 

ˆ 

r12 

t = ⋅ N − 2 

2 

1 − r 

12 

geprüft. Ist tˆ 

< t α , N −2, dann kann die H 0 nicht verworfen werden. Aufgrund der Stichprobe 

d. h. der Größe von r 12 kann dann gesagt werden, dass Y 1 und Y 2 nicht linear abhängig voneinander 

sind. 

Beispiel 5.9.2: Bremsweg eines PKW. Abhängigkeit des Bremsweges 

Das erweiterte Bremswegbeispiel enthält die Produktvariable 

Y Länge des Bremsweges in [m] 

und die Input- und Prozessvariablen 

X 1 Geschwindigkeit des PKW in einer Ortschaft [km/h] 

X 2 mittlere Profiltiefe der Reifen aller 4 Räder [mm] 

X 3 Reaktionszeit des Fahrers in [sec]. 

Die statistischen Maßzahlen sind in der folgenden Tabelle 5.9.1 zusammengestellt.


239 

Tabelle 5.9.1: Statistische Maßzahlen für das Bremswegbeispiel 

Bremsweg Geschwindigkeit Profiltiefe Reaktionszeit 

Mittelwert 29,96 49,74 3,47 1,24 

Varianz 33,5398 95,4792 0,59036 0,14773 

S 5,791 9,771 0,768 0,384 

Min 13,65 19,3 1,44 0,064 

Max 46,41 76,5 5,26 2,076 

R 32,7 57,2 3,8 2,01 

V 19 19 22 31 

Für dieses Beispiel ist die Korrelationsmatrix in der Tabelle 5.9.2 enthalten. 

Tabelle 5.9.2: Korrelationsmatrix Beispiel Bremsweg 

Bremsweg Geschwindigkeit Profiltiefe Reaktionszeit 

Bremsweg 1 0,837 –0,373 0,457 

Geschw 1 –0,207 0,168 

Profil 1 0,098 

Reaktion 1 

Der Abhängigkeitsgraph für diese vier Variablen ist in der Abbildung 5.9.4 dargestellt. 

X 1 

r Y1 = 0.84 

r 12 = - 0.20 

X 2 

Y 

r Y2 = - 0.37 

r 13 = 0.1 

X 3 

r Y3 =0.45 

r 23 = 0.17 

Abb. 5.9.4: Abhängigkeitsgraph für das Bremswegbeispiel 

Zur Demonstration der Anwendung des t-Tests überprüfen wir die Nullhypothese H 0 des 

Korrelationskoeffizienten r 23 , die lautet H 0 : ρ 23 = 0 gegen H 1 : ρ 23 ≠ 0 

Der t-Test liefert 

0.1 

tˆ = ⋅ 28 = 0.532 

2 

1− 

0.1


Der zugehörige Tafelwert für die einseitige Fragestellung ist t 0.05; 28 = 2.048. Der berechnete 

t-Wert ist kleiner als der Tafelwert. Folglich kann die Nullhypothese nicht verworfen werden, 

d. h. der aus der Stichprobe vom Umfang N = 30 berechnete Korrelationskoeffizient r 23 = 0.1 

unterscheidet sich nicht statistisch gesichert von null. Der Stichprobenkorrelationskoeffizient 

r 23 weicht nur zufällig von null ab, d. h. X 2 und X 3 sind nicht miteinander korreliert. 

Es ist an dieser Stelle notwendig darauf hinzuweisen, dass man im Fall der Ablehnung der H 0 

nicht einfach sagen kann, X j und X k sind linear abhängig, denn der Korrelationskoeffizient 

ist ein Maß für den Grad der linearen Abhängigkeit zwischen den beiden Zufallsgrößen. 

Man kann in diesem Fall nur sagen, X j und X k sind korreliert. 

Die Hypothesen H 0 bzgl. aller anderen Korrelationskoeffizienten müssen analog geprüft 

werden. Am stärksten ist die Abhängigkeit zwischen der Reaktionszeit X 3 und der Alkoholkonzentration 

X 5 gefolgt von der Korrelation zwischen dem Bremsweg und der 

Geschwindigkeit. 

Die Korrelationsmatrix ist der Ausdruck für die Abhängigkeitsstruktur der Produkt- und 

Prozessvariablen (oder nur der Produkt-, oder nur der Prozessvariable), die in der nebenstehenden 

Abbildung für die Produktvariable und die ersten drei Input- und Prozessvariablen 

symbolisiert ist. Aus dieser Abbildung wird deutlich, dass die Abhängigkeit zwischen zwei 

Parametern natürlich durch die anderen Parameter beeinflusst wird. 

Der Zusammenhang zwischen der Kovarianz- und Korrelationsmatrix wird matriziell durch 

die Beziehung 

⎛ ⎞ ⎛ ⎞ 

R = D⎜ 1 ⎟ ⋅Σ 

⋅ D⎜ 1 ⎟ ⎝σj 

⎠ ⎝σj 

⎠ 

j = … n , bzw. 

Σ = D( σ ) ⋅ R ⋅ D( σ ) 

j 

j 

ausgedrückt. 

Außerdem gilt für die Determinanten der Korrelations-R XX und Kovarianzmatrix Σ XX der oft 

nützliche Zusammenhang 

wobei 

n 

Σ = ∏ σ 2 R 

XX j XX 

j= 

1 

R 

XX 

⎧⎪ 1, falls ρjk 

= 0, ∀ jk , = 1, …, nj , ≠ k 

= ⎨ 

⎪⎩ 

0, falls wenigstens ein ρjk 

= 1, für j ≠ k. 

Das Modell der Korrelationskoeffizienten ist – wie jedes Modell – von den Voraussetzungen 

abhängig. Hier bei diesem Modell handelt es sich um die Voraussetzungen der Normalverteiltheit, 

Linearität der Abhängigkeiten und der Unabhängigkeit der Elemente der Stichprobe. 

Gibt es ein globales Maß für die Straffheit der Abhängigkeitsstruktur? 

⎛n + m⎞ 

In einer Korrelationsmatrix gibt es aufgrund der Symmetrie der Matrix ⎜ 

⎝ 2 ⎟ verschiedene 

Korrelationskoeffizienten. Diese können groß oder klein, positiv oder negativ sein. 

⎠ 

Diese


241 

Verhältnisse erschweren die Interpretation der Abhängigkeitsstruktur. Daher suchen wir ein 

globales Maß für die Abhängigkeitsstruktur. Dieses Maß ist die Determinante det(R) der 

Korrelationsmatrix. 

Der maximale Wert der Determinante ist det(R) = 1. Dieser Wert wird erreicht, wenn alle 

Korrelationskoeffizienten gleich null sind. (Zur Erinnerung sei wiederholt, dass im Falle der 

Unabhängigkeit alle Korrelationskoeffizienten gleich null sind.) Die Determinante ist null, 

wenn wenigstens ein Korrelationskoeffizient außerhalb der Hauptdiagonalen gleich 1 ist. 

Beispiel 5.9.3: Bremsweg eines PKW. Determinante der Korrelationsmatrix 

Die Determinante der Korrelationsmatrix für die Input-, Prozess- und Produktvariablen 

ist det(R) = 0.12163. Interessanter ist die Determinante der Input- und Prozessvariablen, 

denn diese bestimmt den Grad der Multikollinearität. Hierfür berechnen wir den Wert 

det(R XX ) = 0.9124. Der Grad der Multikollinearität ist sehr gering und beeinflusst später 

folgende Resultate, wie z. B. die Berechnung der Prozessgleichung nicht. 

Was passiert, wenn eine oder beide Voraussetzungen verletzt sind? 

In diesem Fall können die verteilungsfreien Korrelationskoeffizienten bere chnet werden. 

5.9.2 Verteilungsfreie Korrelationskoeffizienten 

Verteilungsfreie Korrelationskoeffizienten benötigen keine Annahme über die zugrunde liegende 

Verteilung der Zufallsgrößen. Diese Koeffizienten sind daher robuster als die anderen. 

5.9.2.1 Was ist ein Vierfelder Korrelationskoeffizient? 

Es seien X, Y zwei Zufallsgrößen mit diskreter Verteilung, die nur qualitativ gemessen werden 

können, d. h. die Messwerte sind die Häufigkeiten einer Alternative, wie z. B. Raucher und 

Nichtraucher, Produkt in Ordnung und Produkt defekt usw. Eine Stichprobe eines zweidimensionalen 

Vektors alternativ verteilter Zufallsgrößen, wie z. B. die Zufallsgröße X besteht 

im Vorhandensein oder Nichtvorhandensein einer Eigenschaft A und Y bezieht sich analog 

auf eine Eigenschaft B, liefert vier verschiedene Häufigkeiten, die in einer Vierfeldertafel, siehe 

Tabelle 5.9.3 aufgeschrieben und mit dem Vierfelder Korrelationskoeffizienten ausgewertet 

werden müssen. 

Tabelle 5.9.3: Vierfeldertafel 

Eigenschaft A 

Zeilensumme 

vorhanden 

nicht vorhanden 

Eigenschaft B 

vorhanden 

nicht vorhanden 

a 

c 

b 

d 

a + b 

c + d 

Spaltensumme a + c b + d = a + b + c + d


In dieser Tafel bezeichnen 

a die Häufigkeit des Vorkommens von A und B 

a + c die Häufigkeit des Vorkommens von A 

a + b die Häufigkeit des Vorkommens von B 

d die Häufigkeit der Alternative von A und B, 

d. h. des Nichtvorkommens von A und B 

b + d die Häufigkeit des Nichtvorkommens von A 

c + d die Häufigkeit des Nichtvorkommens von B. 

Die zu prüfende Nullhypothese lautet 

H 0 : „die beiden Alternativen verteilen sich unabhängig voneinander“ 

Zur Prüfung dieser Hypothese verwendet man den χ 2 -Test 

V 

2 

χ 

a ⋅d − b ⋅c 

= = 

N [( a + b) ⋅ ( a + c) ⋅ ( b + d) ⋅ ( c + d)] 

Für diesen Koeffizienten gilt –1 ≤ V ≤ 1. 

Beispiel 5.9.4: Stillstandszeiten 

Es soll überprüft werden, ob es zwischen den Stillständen einer Anlage und den Ausschussteilen, 

einen Zusammenhang gibt. Die Anlage arbeitet in 3 Schichten. Pro Stunde werden 2 

Produkte auf der Anlage hergestellt. Die Produkte werden beurteilt ob sie i. O. oder defekt 

sind. Über eine längere Zeitspanne wurden die kurzfristigen Ausfälle der Anlage notiert. 

Man erhielt das Ergebnis in der Tabelle 5.9.4. 

Tabelle 5.9.4: Stillstandszeiten und defekte Produkte 

Produkt 

Zeilensumme 

i. O. defekt 

Anlage 

kein Stillstand 

Stillstand 

91 

8 

39 

18 

130 

26 

Spaltensumme 99 57 156 

Damit können wir den Vierfelderkorrelationskoeffizienten 

2 156 ⋅(91 ⋅18 − 39 ⋅8) 

χ = = 14.38 

130 ⋅26 ⋅99 ⋅57 

und 

V 

14.38 

= = 

156 

0.3 

ausrechnen. Dieser Wert besagt aufgrund des zugehörigen χ 2 -Wertes, dass ein Zusammenhang 

zwischen den Stillständen und den defekten Produkten vorhanden ist, oder anders 

formuliert, dass die Stillstandszeiten der Anlage die Qualität beeinflussen.


243 

5.9.2.2 Was für ein Abhängigkeitsmaß können wir berechnen, 

wenn die Variablen über eine Rangskala quantifiziert wurden? 

Beispiel 5.9.5: Lieferterminüberschreitung. Rangkorrelationskoeffizienten 

Bei 14 Kunden wurden die Lieferfristenüberschreitungen Y in Tagen gemessen. Gleichzeitig 

wurden für die Partien, aus denen die Kundenlieferungen stammten, die univariaten 

Prozessfähigkeiten für eine sehr wichtige Produktvariable ermittelt. Da weder die 

Lieferfristenüberschreitungen noch die korrigierten univariaten Prozessfähigkeitsindizes 

normal verteilt sind, wurde entschieden, anstelle des einfachen Korrelationskoeffizienten 

den Rangkorrelationskoeffizienten nach Spearman zu berechnen. 

Die Rangkorrelationskoeffizienten s ind aus dem Konzept entstanden, eine Rangskala als eine 

Intervallskala aufzufassen und die Rangwerte als Messwerte zu behandeln. Das Ergebnis dieses 

Konzeptes sind die Rangkorrelationen von Spearman and Kendall (siehe Kandall [1952]). 

Der Spearman’scher Rangkorrelationskoeffizient 

F ür die beiden Variablen X und Y kann man aus den Beobachtungsreihen X i , Y i , i = 1, …, N die 

beiden Rangreihen x [i] und y [i] , i = 1, …, N bilden und als neue als Messwerte auffassen. 

Haben Sie z. B. die Messwerte 5, 2, 7, 4 vorliegen, dann können Sie diese der Größe nach in 

2, 4, 5, 7 ordnen. Der Wert x 1 = 5 wird in den Rangreihe zu x [3] . Mit der Gauß’schen Summe 

erhält man 

und 

N 

∑ 

x 

N ⋅ ( N + 1) 

= = 

∑ 

i 

i= 1 

2 

i= 

1 

N 

⋅ + ⋅ + 

∑ 

2 N 

N ( N 1) 2N 

1 

x = = ∑ 

2 

i 

yi 

i= 1 

6 

i= 

1 

Außerdem gilt 

N 

N 

2 2 

∑( xi 

x) 

∑xi 

i= 1 i= 

1 

N 

y 

i 

2 

⎛ 

N 

⎞ 2 

⎡ ⋅ + ⎤ 

⎜∑ 

x 

N ( N 1) 

i 

⎝ 

⎟ ⎢ ⎥ 

i= 

1 ⎠ N ⋅ ( N + 1) ⋅ (2N 

+ 1) ⎣ 2 ⎦ 

− = − = − 

N 

6 

N 

2 

N ⋅( N −1) 

= 

12 

Für die Summe der quadratischen Abweichungen der y i Werte von ihrem Mittelwert erhält 

man denselben Ausdruck. Es sind nun noch die Differenzen der Rangpaare 

zu bilden. 

d i = X [i] – y [i] , i = 1, …, N,


Setzt man all diese Umformungen in die Formel 

r 

xy 

= 

N 

∑ 

i= 

1 

( x − x) ⋅( y − y) 

i 

N 

N 

2 2 

∑( xi 

− x) ⋅∑( yi 

− y) 

i= 1 i= 

1 

i 

. 

r 

s 

N 

∑d 

2 

i 

i= 

1 

2 

6 ⋅ 

= 1 − 

. 

N ⋅( N −1) 

Signifikanzprüfung für den Spearman’schen Rangkorrelationskoeffizient 

Die H 0 : X und Y sind unabhängig. 

Gegen die Alternativhypothese wird mit dem t-Test 

tˆ = 

rs 

⋅ N − 2 

1 − r 

2 

s 

geprüft. Falls ˆt > t α; N – 2 dann muss die H 0 verworfen werden, d. h. in diesem Falle sagen wir 

die beiden Parameter X und Y sind korreliert. 

Beispiel 5.9.6: Lieferfristenüberschreitung. Spearmanscher 

Rangkorrelationskoeffizient 

Die Daten für dieses Beispiel sind in der Matrix der Tabelle 5.9.5 zusammengestellt. 

Tabelle 5.9.5: Daten für Lieferfristenüberschreitung und Prozessfähigkeiten, Rangreihen und deren 

Differenzen 

der einfachen Korrelationskoeffizienten ein, dann erhält man für den Spearman’schen Korrelationskoeffizienten 

Lieferfristenüberschreitung 

Prozessfähigkeiten 

Rangreihe 

X [i] 

Rangreihe 

Y [i] 

13 1,30 1 14 –13 

14 1,05 2 5 –3 

15 1,65 3 13 –10 

16 1,19 4 11 –7 

17 1,11 5 7 –2 

19 1,13 6 8 –2 

20 1,17 7 10 –3 

21 1,15 8 9 –1 

24 0,95 9 4 5 

25 1,20 10 12 –2 

30 1,10 11 6 5 

31 0,92 12 2 10 

36 0,94 13 3 10 

40 0,81 14 1 13 

d i


245 

Für den Spearman’schen Rangkorrelationskoeffizienten erhält man den Wert 

r s 

6⋅ 

768 

= 1 − = −0.69. 

2 

14 ⋅(14 −1) 

Der zugehörige t-Wert ist 

0.69 

tˆ = ⋅ 12 = 3.3. 

2 

1− 

0.69 

Der t-Wert aus der Tafel ist t 0.05; 12 = 1.78. Da der berechnete t-Wert größer als der Tafelwert 

ist, muss die H 0 verworfen werden, d. h. die beiden Parameter sind nicht unabhängig 

voneinander. Die Lieferfristenüberschreitung ist von den Prozessfähigkeiten abhängig. 

Je kleiner die Prozessfähigkeiten für eine wesentliche Produktvariable sind, desto größer 

sind die Lieferfristenüberschreitungen. Die berechnete Irrtumswahrscheinlichkeit für die 

Ablehnung der H 0 ist α = 0.0059. 

In der Abbildung 5.9.5 ist das Korrelationsdiagramm für diese beiden Variablen enthalten. 

Man erkennt deutlich die fallende Tendenz, d. h. je größer die Prozessfähigkeiten sind, desto 

kleiner sind die Lieferfristenüberschreitungen. 

40 

35 

LTU 

30 

25 

20 

15 

10 

0.8 1.0 1.2 1.4 1.6 

Cpk 

Abb. 5.9.5: Lieferterminüberschreitung und Prozessfähigkeit 

Was ist der Kendall’scher Rangkorrelationskoeffizient? 

Es seien wieder zwei Rangfolgen für N Objekte gegeben, d. h. für die nicht normal verteilten 

oder skalierten Messwerte zweier Parameter liegen zwei Rangfolgen [i] und [j], i, j = 1, …, N 

vor. Als Beispiel stellen wir uns das Lieferfristenbeispiel vor. Für jedes Paar ([i],[j]) von Objekten 

(Messwerten) schreiben wir einen Beitrag +1 auf, wenn die Ränge [i] und [j] in der gleichen 

aufsteigenden Reihenfolge vorkommen, sonst –1. Konkret bedeutet das, wir definieren für die 

erste Rangfolge eine Zufallsgröße V ik , die den Wert +1 annimmt, wenn X i < X k , den Wert 0, wenn 

X i = X k und den Wert –1, wenn X i > X k . Analog verfahren wir für den zweiten Parameter Y.


Die Summe der Beiträge aller Paare ist dann 

N 

∑ ij 

ij , = 1 

S = x ⋅ y . 

Der Maximalwert dieser Summe ist 

Setzt man 

⎛N 

⎞ 1 

⎜ ⎟ = ⋅ N ⋅ ( N − 1). 

⎝ 2 ⎠ 2 

T = 

ij 

S 

1 

⋅ N ⋅( N −1) 

2 

so nimmt T nur Werte zwischen –1 und +1 an. T = +1 gilt nur dann, wenn die beiden Rangfolgen 

übereinstimmen. T = –1 erhält man nur dann, wenn die beiden Rangfolgen entgegengesetzt 

sind. Für die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ordnet man 

die erste Rangfolge der Größe nach von 1 bis N. Darunter schreibt man die zugeordneten Ränge 

der zweiten Rangfolge, also 

für X: 1 2 3 … N 

für Y: Y 1 = Y [1] Y 2 = Y [N] Y 3 = Y [3] … Y N = Y [2] . 

Damit kann man S wie folgt berechnen: man zählt, wie viele der Y’s größer als Y 1 rechts von 

Y 1 stehen, dann zählt man wie viele der Y’s größer als Y 2 rechts von Y 2 stehen usw. Die Summe 

aller dieser Anzahlen sei P. Damit kann S umgeschrieben werden. Es gilt S ist die Summe von 

P Beiträgen +1 und ⎛ N ⎞ 

⎜ ⎟ − P Beiträgen –1, d. h. 

⎝ 2 ⎠ 

bzw. 

1 

S = 2 ⋅ P − ⋅ N ⋅( N −1), 

2 

2 ⋅ P 

T = −1. 

1 

⋅ N ⋅( N −1) 

2 

Beispiel 5.9.7: Lieferfristenüberschreitung. Kendallscher Rangkorrelationskoeffizient 

Die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ergibt für das Beispiel 

der Lieferterminüberschreitung den Wert T = –0.538. T ist asymptotisch normal verteilt 

mit dem Erwartungswert 0 und der Varianz 

2 ⋅ ⋅ + 

= 

2 (2 N 

σ 

5) , 

T 

9 ⋅ N ⋅( N −1) 

siehe z. B. van der Waerden [1957]. Damit kann man die Hypothese der Unabhängigkeit 

von X und Y verwerfen, wenn T größer ist als T α = σT 

⋅Φ(1 − α ) , wobei Φ die Verteilungsfunktion 

der standardisierten Normalverteilung ist.


247 

Die H 0 der Unabhängigkeit der beiden Zufallsgrößen muss aufgrund des Ergebnisses 

T = –0.538 verworfen werden. Die berechnete Irrtumswahrscheinlichkeit ist α′ = 0.0073. 

Zum Vergleich wurde der einfache Korrelationskoeffizient berechnet. Man erhält hierfür 

den Wert r XY = –0.795. Die berechnete Irrtumswahrscheinlichkeit für die Ablehnung der 

H 0 ist α′ = 0.0007. 

Neben den einfachen und Rangkorrelationskoeffizienten gibt es weitere Abhängigkeitsmaße. 

Diese sind vor allem die 

• 

• 

• 

partiellen oder bedingten Korrelationskoeffizienten, 

die multiplen Korrelationskoeffizienten und 

die multivariaten multiplen Korrelationskoeffizienten. 

5.9.3 Was sind partielle Korrelationskoeffizienten 

Wozu werden die bedingten (partielle) Korrelationskoeffizienten gebraucht? 

Wie werden die bedingten Korrelationskoeffizienten berechnet? 

Bisher haben wir die Abhängigkeitsstruktur für die Input-, Prozess- und Produktvariablen 

durch die einfachen (paarweisen) Korrelationskoeffizienten beschrieben. Wir haben aber auch 

gesehen, dass mitunter Antworten auf praktisch relevante Fragen, wie z. B. die Frage nach den 

Abhängigkeiten zwischen den Produkt- und Prozessvariablen ohne den Einfluss der Inputvariablen 

erforderlich sind. Diese Frage kann man auch so formulieren, 

Wie groß sind die bedingten Abhängigkeitsmaße zwischen den Produkt- und 

Prozessvariablen unter der Bedingung der Inputvariablen? 

Zur Vereinfachung der Lösung auf die Frage betrachten wir ein triviales Beispiel. 

Beispiel 5.9.8: Einfluss von zwei Prozess- auf eine Produktvariable. Abhängigkeiten 

In dem Graphen der Abbildung 5.9.6 ist der Einfluss zweier korrelierter Prozessvariablen 

auf eine Produktvariable dargestellt. 

r Y1 = 0.84 

X 1 

r 12 = 0.95 

Y 

r Y2 = 0.86 

X 2 

Abb. 5.9.6: Einfluss von zwei Prozess- auf eine Produktvariable


Die Korrelationsmatrix für dieses Beispiel ist 

⎛1 0.84 0.86⎞ 

R = ⎜ 

⎜ 

1 0.95⎟ 

⎟ 

⎝ 

1 ⎠ 

Die beiden Prozessvariablen haben den Korrelationskoeffizient r 12 = 0,95. Für die Steuerung 

des Prozessen müssen wir aber wissen, wie z. B. X 1 auf Y wirkt, ohne dass dieser Einfluss 

durch das Wirken der zweiten Prozessvariablen „verfälscht“ wird. Der Einfluss von X 2 auf 

X 1 soll eliminiert oder konstant gehalten werden. Das ist nur in einem Modell möglich, 

denn in der Natur lässt sich dieser Einfluss nicht eliminieren oder konstant halten. 

Ein Korrelationskoeffizient dieser Art wird als partieller Korrelationskoeffizient bezeichnet. 

Dieser misst den partiellen Einfluss von X 1 auf Y, oder anders ausgedrückt den Einfluss von 

X 1 auf Y unter der Bedingung, dass X 2 konstant gehalten wird. Wir können auch sagen, der zu 

findende Korrelationskoeffizient ist ein Korrelationskoeffizient der bedingten Verteilung von 

Y und X 1 unter der Bedingung von X 2 . 

Für diesen Fall wollen wir im Folgenden die Formel zur Berechnung der partiellen Korrelationskoeffizienten 

betrachten . Es gilt 

rY1 − rY2 ⋅r12 

rY 

1/2 = 

2 2 

(1 − r ) ⋅(1 − r ) 

Y 2 12 

wobei r Y1/2 die symbolische Darstellung für die Abhängigkeit zwischen Y und X 1 unter der 

Bedingung ist. 

Beispiel 5.9.9: Einfluss von zwei Prozess- auf eine Produktvariable. 

Partieller Korrelationskoeffizient 

Für das Demonstrationsbeispiel gilt 

r Y 1/2 

0.84 − 0.86 ⋅0.95 

= = 0.146. 

2 2 

(1 − 0.86 ) ⋅(1 − 0.95 ) 

Das Ergebnis der einfachen- und partiellen Korrelationsanalyse besagt, dass die paarweise 

(oder auch totale) Abhängigkeit zwischen Y und X 1 sehr straff ist (r YX1 = 0.84). Es besagt 

aber auch, dass diese Abhängigkeit sehr stark durch X 2 beeinflusst wird, denn X 2 wirkt 

sehr stark auf X 1 (r 12 = 0.95) und sehr stark auf Y (r Y2 = 0.86). Hält man diesen Einfluss 

konstant, oder eliminiert man diesen Einfluss, dann ist die verbleibende Abhängigkeit nur 

noch gering (r Y1/2 = 0.146). 

Was können Sie aus den Unterschieden zwischen den einfachen und partiellen 

Korrelationskoeffizienten ablesen? 

Beispiel 5.9.10: Einfluss von zwei Prozess- auf eine Produktvariable. 

Maß der Beherrschbarkeit 

Y kann einzeln sowohl durch X 1 oder X 2 und gemeinsam durch X 1 und X 2 zusammen 

dargestellt werden. Die Genauigkeit der unterschiedlichen Darstellungen wird durch das 

Maß der Beherrschbarkeit und durch die Streuungen um die Regressionsgleichung (Reststreuung) 

ausgedrückt.


249 

Die Darstellungen von Y durch X 1 oder X 2 liefern die beiden Gleichungen 

Y = b Y1 X 1 = 0.84 X 1 

mit dem Maß der Beherrschbarkeit R 2 Y1 = 0.7056 und der Reststreuung 

S Y/1 = 0.5425 bzw. 

Y = b Y2 X 2 = 0.86 X 2 

mit dem Maß der Beherrschbarkeit R 2 Y/2 = 0.7396 und der Reststreuung 

S Y/2 = 0.5203. 

Wird Y durch beide X gemeinsam dargestellt, dann erhält man die Gleichung 

Y = b Y.1/2 X 1 + b Y.2/1 X 2 = 0.2359 X 1 + 0.6359 X 2 

mit dem Maß der Beherrschbarkeit R 2 Y/1, 2 = 0.7450 und der Reststreuung 

S Y/1, 2 = 0.5049. 

Hieraus können Sie ablesen, dass 

• 

• 

• 

die Varianz von Y durch X 1 oder X 2 zu ca. 70 % erklärt wird, 

durch den gemeinsamen Ansatz mit beiden Einflussvariablen X 1 und X 2 wird das Maß 

der Beherrschbarkeit nicht wesentlich kleiner. Die Ursache hierfür ist der große Korrelationskoeffizient 

für X 1 und X 2 . 

Man nennt diesen Effekt Einfluss der Multikollinearität zwischen den Einflussgrößen 

auf die Regressionsgleichung und nennt eine der beiden Variablen redundant. 

Berechnung der partiellen Korrelationskoeffizienten über die bedingte Verteilung 

Für die allgemeine Ableitung setzen wir voraus, dass der zufällige Vektor (Y T , X T ) normal verteilt 

ist. Gesucht sind die partiellen Korrelationskoeffizienten zwischen den Produktvariablen, d. h. 

die bedingten Korrelationskoeffizienten der Produktvariablen Y unter der Bedingung, dass die 

Input- und Prozessvariablen X konstant gehalten werden, d. h. gegeben sind. 

Die bedingte Verteilung von Y unter der Bedingung X ist eine m-dimensionale Normalverteilung 

ist mit den bedingten Momenten E[Y/X] und v ar(Y/X). Für diesen verallgemeinerten 

Fall erhält man den Vektor bedingter Erwartungswerte 

−1 

T 

Y YX XX X Y / X X 

E[ Y/ X] = μ + Σ ⋅ Σ ⋅( X− μ ) = μ + β ⋅( X− 

μ ) 

und die be dingte Kovarianzmatrix 

−1 

YY YX XX XY YY / X 

var [ Y/ X] = Σ − Σ ⋅ Σ ⋅ Σ = Σ . 

Die Elemente σ kl/1, … n , k, l = 1, …, m der bedingten Kovarianzmatrix Σ YY/X „messen“ in der 

Hauptdiagonalen die Variabilität der Produktvariablen und in den Nebendiagonalen die Abhängigkeiten 

zwischen den Produktvariablen unter der Bedingung X, d. h. unter der Bedingung, 

dass die Input- und Prozessvariable gegeben sind. 

Die partiellen Korrelationskoeffizienten zwischen den Produktvariablen unter der Bedingung, 

dass die Input- und Prozessvariable realisiert sind, werden analog den gewöhnlichen Korrelationskoeffizienten, 

nur mit den Elementen der bedingten Kovarianmatrix Σ YY/X berechnet. 

Wir erhalten die Formel


ρ 

kl /1,…, 

n 

σkl /1,…, n σkl / X 

= = 

σ ⋅σ σ ⋅σ 

kk /1,…, n kk /1,…, n kk / X ll / X 

. 

Für σ kk/X kann man natürlich auch σ 2 k/X schreiben. Die Matrizenformel zur Berechnung der 

Korrelationskoeffizienten aus der Kovarianzmatrix kann natürlich auch für die bedingte Kovarianzmatrix 

aufgeschrieben werden. Wir erhalten 

D 

und damit 

2 

σ1/ 

X 

⎜ 

⎟ 

= Diag ( ΣYY 

/ X ) = Diag 

⎜ … ⎟ 

⎜ 

2 

⎝ σ ⎟ 

m / X⎠ 

− 

1 − 

1 

2 ⋅Σ 

⋅ 2 

YY / X = YY / X , 

D D P 

⎛ 

wobei P YY/X die Matrix der partiellen Korrelationskoeffizienten bezeichnet. 

⎞ 

Beispiel 5.9.11: Bremsweg eines PKW. Partielle Korrelationskoeffizienten 

Die partiellen Korrelationskoeffizienten für das Bremswegbeispiel sind in der Tabelle zusammen 

gestellt. 

Tabelle 5.4.5: Matrix der partiellen Korrelationskoeffizienten 

R 

partiell 

⎛1 0.885 −0.566 0.695⎞ 

⎜ 1 0.413 −0.55⎟ 

= ⎜ 

⎟ 

⎜ 1 0.475 ⎟ 

⎜ 

⎝ 

1 ⎟ 

⎠ 

Vergleicht man die Matrix der bedingten mit der Matrix der einfachen Korrelationskoeffizienten 

für dieses Beispiel, dann sieht man, dass 

• sich die bedingten wesentlich von den einfachen Korrelationskoeffizienten unterscheiden 

können und 

• die bedingten auch wesentlich größer als die einfachen Korrelationskoeffizienten werden 

können. 

Die Vergrößerung oder Verkleinerung hängt im wesentlichen von den Vorzeichen der 

einfachen Korrelationskoeffizienten ab. 

5.9.4 Was sind multiple Korrelationskoeffizienten und wozu benötigt 

man diese? 

Der multiple Korrelationskoeffizient ist ein immens wichtiges Abhängigkeitsmaß zwischen 

der Produktvariablen Y und der Prozessgleichung, oder anders formuliert dem bedingten Erwartungswert 

einer Produktvariablen unter der Bedingung der Input- und Prozessvariablen, 

dem ja die Prozessgleichung entspricht.


251 

T −1 

Y Y. 

X XX X X 

EY [ / X] = μ + σ Σ ( − μ ) 

mit der bedingten Varianz 

2 T −1 

YX Y. X XX Y. 

X 

var( Y/ X) = σ − σ Σ σ . 

Die Bezeichnungen liefern uns die Zerlegung der positiv definiten Kovarianzmatrix Σ entsprechend 

der Zerlegung des zufälligen Vektors in die Produktvariable Y und den Vektor X der 

Prozess- und Inputvariablen Z T = (Y, X T ) in 

⎛ 

2 T 

σ ⎞ 

Y σY. 

X 

Σ = ⎜ ⎟ . 

⎝ Σ ⎠ 

XX 

Warum ist der multiple Korrelationskoeffizient für die Anwendungen so wichtig? 

Mit dem multiplen Korrelationskoeffizienten können Sie beurteilen, 

• 

• 

wie gut die Menge der Input- und Prozessvariablen die Produktvariable beeinflusst und 

wie gut die Varianz einer Produktvariablen durch die Input- und Prozessvariablen erklärt 

wird. 

Aus diesem Grunde nennen wir den multiplen Korrelationskoeffizienten das Maß der Beherrschbarkeit 

eines Prozesses. Je größer der multiple Korrelationskoeffizient ist, desto besser 

wird die Varianz der Produktvariablen durch die Input- und Prozessvariablen aufgeklärt, d. h. 

umso sicherer wird der Prozess beherrscht. 

Das bedeutet aber auch, dass Sie beurteilen können, wie gut Sie den Prozess nach der Steuerung 

mit der Prozessgleichung beherrschen. Streuen die Werte der Produktvariablen nach 

der Steuerung nur noch gering um die Prozessgleichung, dann werden die Werte auch nur 

noch sehr wenig um den Zielwert streuen. Der Zielwert für die Steuerung ist aber der Sollwert 

für die Produktvariable. Damit wird erreicht, dass die Kundenanforderungen überaus präzise 

erfüllt werden können. 

Für die Definition des multiplen Korrelationskoeffizienten betrachten wir wieder den zufälligen 

Vektor (Y, X T ) = Z T und nehmen an, dass Z ~ N n + 1 (µ, Σ) und μ und Σ entsprechend dem Z 

partitioniert sind. 

Definition des multiplen Korrelationskoeffizienten: 

ρ 

T −1 

2 

2 σY. X⋅ΣXX⋅σY. 

X σY 

/ X 

Y / X= = 1 − 

2 2 

σY 

σY 

Es gilt 0 ≤ ρ 2 Y/X ≤ 1. 

Wenn Y unabhängig von X ist, dann ist ρ 2 Y/X = 0. Wenn Y mit Wahrscheinlichkeit 1 eine Linearkombination 

der Komponenten von X ist, dann ist ρ 2 Y/X = 1. 

Wenn der zufällige Vektor X nur eine Komponente hat, dann ist ρ 2 Y/X = ρ2 Y.X , d. h. dem Quadrat 

des einfachen Korrelationskoeffizienten. 

Im standardisierten Fall wird aus der Kovarianzmatrix Σ die Korrelationsmatrix R. R wird 

genauso zerlegt wie Σ, d. h. 

⎛ 

T 

1 ρ ⎞ 

Y. 

X 

R = ⎜ ⎟ . 

⎝ R ⎠ 

XX


Damit erhält man als Formel zur Berechnung des multiplen Korrelationskoeffizienten 

2 T −1 

Y / X= Y. X⋅ RXX⋅ 

Y. X. 

ρ ρ ρ 

Die Maximum Likelihood Schätzung ist 

2 T −1 

Y / X = Y. XR 

XX Y. X, 

R R R 

wobei die einzelnen Terme in dieser Formel aus der partitionierten Korrelationsmatrix 

R 

⎛ 

T 

1 R ⎞ 

Y. 

X 

= ⎜ ⎟ 

⎝ R ⎠ 

XX 

kommen, bzw. mit der Zerlegung der Matrix A in 

A 

⎛ 

2 T 

a ⎞ 

Y aY. 

X 

= ⎜ ⎟ 

⎝ A ⎠ 

XX 

R 

T −1 

2 aY. XA 

XXaY. 

X 

Y / X= 

2 

aY 

. 

Wie kann eine Hypothese über den multiplen Korrelationskoeffizienten geprüft werden? 

Unter den sehr allgemeinen Voraussetzungen, dass der N-dimensionale Stichprobenvektor der 

Produktvariablen Y sphärisch mit P (Y = 0) = 0 und die Stichprobenmatrix X unabhängig von 

Y ist und mit Wahrscheinlichkeit 1 den Rang n hat, ist der multiple Stichprobenkorrelationskoeffizient 

R 2 Y/X nach Muirhead [1982] Beta verteilt, bzw. 

N − n −1 

R ⋅ 

Y 

n 1 − R 

2 

/ X 

2 

Y / X 

ist F n, N – n – 1 verteilt. Zur Prüfung der H 0 : ρ 2 Y/X = 0 gegen die allgemeine Alternative H 1 : ρ2 Y/X ≠ 0 

wird der F-Test 

2 

/ 

2 

Y / X 

N − n −1 R ⋅ 

Y X = Fˆ 

n 1 − R 

verwendet. ˆF ist bei Gültigkeit der H 0 F n, N – n – 1 verteilt mit n und N – n – 1 FG. Der Test zum 

Niveau α lehnt die H 0 ab, wenn F ˆ > Fn, N−n−1 

( α ) , wobei Fn, N−n−1 ( α ) den oberen 100 α % Punkt 

der F n, N – n – 1 Verteilung bezeichnet. 

Beispiel 5.9.12: Bremsweg eines PKW. Multipler Korrelationskoeffizient 

Zur Demonstration des Rechenweges betrachten wir die Abhängigkeit des Bremsweges 

Y von der Geschwindigkeit X 1 , der Profiltiefe X 2 und der Reaktionszeit X 3 . Aus der Stichproben 

Kovarianzmatrix S der Tabelle 5.9.6 lesen wir die Werte ab, die in die Formel zur 

Berechnung des multiplen Korrelationskoeffizienten einfließen.


253 

Tabelle 5.9.6: Stichprobenkovarianzmatrix für das Bremswegbeispiel 

Bremsweg Geschwindigkeit Profil Reaktion 

Bremsweg 31,5056 22,5578 –1,393 1,2417 

Geschwindigkeit 22,5578 23,0575 –0,6619 0,3899 

Profil –1,393 –0,6619 0,4417 0,0314 

Reaktion 1,2417 0,3899 0,0314 0,234 

⎛23.0575 −0.6619 0.3899⎞ ⎛22.5578⎞ 

(22.5578 −1.393 1.2417) ⋅ ⎜ 0.4417 0.0314⎟ ⋅ ⎜ −1.393 

⎟ 

⎜ ⎟ ⎜ ⎟ 

2 ⎝ 0.234 ⎠ ⎝ 1.2417 ⎠ 

/1,2,3 = 

31.5056 

= 0.867. 

R Y 

Das Ergebnis bedeutet, dass die Varianz des Bremsweges zu 87 % durch die Input- und 

Prozessvariablen wie Geschwindigkeit, Profiltiefe und Reaktionszeit erklärt wird. Betrachten 

wir die Abhängigkeit des Bremsweges nur von der Geschwindigkeit, dann ist der multiple 

Korrelationskoeffizient – das Quadrat des einfachen Korrelationskoeffizienten – gleich 

R 2 Y/X = r2 Y.1 = 0.83692 = 0.700, 

also kleiner als vorher bei der Betrachtung von 3 Prozessvariablen. Hieraus liest man ab, 

dass die multiplen Korrelationskoeffizienten bei Vergrößerung der Anzahl der Input- und 

Prozessvariablen nie kleiner werden können, sondern, wenn die Produktvariable Y und die 

hinzugenommenen Input- und Prozessvariable nicht unabhängig voneinander sind, stets 

größer werden. Das ist logisch, denn durch die Hinzunahme neuer Information kann die 

Varianz des Produktvariables immer besser erklärt werden. 

Zur Prüfung der H 0 : ρ 2 Y/X = 0 verwenden wir den F-Test 

0.867 30 − 3 −1 

F ˆ = ⋅ = 

1 − 0.867 3 

56.49 

Aus der Tafel für die F-Verteilung findet man den Wert F 3,140 – 3 = 2.60. Da ˆF > F 3, ∞ , , (0.05) 

muss die H 0 verworfen werden, d. h. Y hängt statistisch gesichert von den drei Parametern 

Geschwindigkeit, Profiltiefe und Reaktionszeit ab, oder anders ausgedrückt, die Varianz des 

Bremsweges wird zu mehr als 86 % durch die drei Prozessvariablen erklärt. 

−1 

5.9.5 Was sind partiell multiple Korrelationskoeffizienten 

und wozu benötigt man diese? 

Neben den einfachen, den partiellen und den multiplen Korrelationskoeffizienten muss ich 

noch den partiell multiplen Korrelationskoeffizienten ei nführen. Dieser ist für den Nachweis 

erforderlich, dass nach der Zerlegung des Vektors X in die Teilvektoren X(k) und X(h) die 

Komponenten von X(h) unwesentlich sind. Hierzu muss gezeigt werden, dass die Menge der 

unwesentlichen (Input- und Prozess-) Variablen, in X(h) zusammengefasst, tatsächlich unab-


hängig von der Menge der wesentlichen Variablen und von Y ist und damit aus einer statistischen 

Prozessanalyse gestrichen werden kann, oder anders formuliert, ob die Variablen aus X(h) nach 

ihrer Streichung die bedingte Varianz von Y unter der Bedingung X(k) kaum vergrößern. 

Diesen Sachverhalt kann man auch durch die folgende Frage ausdrücken. 

Wie verändern sich der Grad der linearen Abhängigkeit und die Beziehung zwischen Y und X, 

wenn der Einfluss von X(h) auf Y und X(k) eliminiert wurde? 

Multipel bedeutet in diesem Sprachgebrauch die Messung des Grades der linearen Abhängigkeit 

zwischen einer Zufallsgröße – der Produktvariablen Y – und einer Linearkombination von 

Zufallsgrößen – der Prozessgleichung in X(k) und partiell bedeutet die Messung des Grades 

zwischen zwei „bedingten“ zufälligen Größen, nämlich zwischen den beiden bedingten Erwartungswerten 

Y unter X(h) und X(k) unter X(h). 

Ausgangspunkt für die Darstellung dieses Korrelationskoeffizienten ist die obige Zerlegung, 

in der Y eine Produktvariable bezeichnet, X(k) p und X(h) n – p Parameter enthält, und der 

Zerlegungssatz für die bedingten Erwartungswerte und Varianzen. 

Mit der analogen Zerlegung des Vektors der Erwartungswerte µ T = (µ Y , µ(k) T , µ(h) T ) und der 

Kovarianzmatrix 

⎛ 

2 T T 

σ ⎞ 

Y σY. k σY. 

h 

⎜ 

⎟ 

Σ = ⎜ 

Σkk 

Σkh 

⎟ 

⎜ 

⎝ 

Σ ⎟ 

hh ⎠ 

erhält man die Momente der bedingten Verteilung von (Y, X(k) T ) unter der Bedingung X(h) 

und 

⎛ ⎞ 

E{[ Y, Xk ( ) )/ Xh ( )] } = ( μ μ ) − ⋅Σ ⋅[ Xh ( ) − μ( h)] 

T 

T T T σYh 

. −1 

Y k ⎜ ⎟ hh 

⎝Σkh 

⎠ 

⎛ ⎞ ⎛ ⎞ 

var[( Y X( k) )/ ( ) ] ( ) 

2 T 

T 

T T σY σY. k σY. 

h −1 

T 

X h = ⎜ ⎟ − ⎜ ⎟ ⋅Σhh ⋅ σY . h Σhk 

⎝ Σkk 

⎠ ⎝Σkh 

⎠ 

⎛ 

2 

σ ⎛ 

⎞ 

Y σ 

= ⎜ − ⎜ ⎟ 

⎝ Σ ⎠ ⎝Σ Σ σ Σ Σ Σ ⎠ 

⎛ 

2 T 

σ ⎞ 

Y 

= / h σY . k / h 

⎜ ⎟ . 

⎝ Σ ⎠ 

T 

T −1 T −1 

⎞ σ 

. Yh . ΣhhσYh . σYh . ΣhhΣ 

Y k 

hk 

⎟ 

−1 −1 

kk kh hh Y . h kh hh hk 

kk / h 

Die Linearkombination zwischen E[X(k)/X(h)] und E[Y/X(h)] hat die Koeffizienten 

T 

T −1 

Yk . / h = Yk . / h kk/ 

h 

β σ Σ 

und die maximale Korrelation 

ρ 

T −1 

2 σYk . / hΣkk/ hσYk . / h 

Yk . / h = 

. 

2 

σY / h 

Dieser Korrelationskoeffizient wird partiell multipler Korrelationskoeffizient genannt.


255 

Für die Interpretation dieses Korrelationskoeffizienten betrachten wir die folgenden Beziehungen 

oder 

T −1 2 

2 σYk . / hΣkk/ hσYk . / h σY/ 

X 

Yk . / h 

2 2 

σY / h σY / h 

1 − ρ = = 

ρ 

2 

2 / 

Yk . / h 

2 

Y / h 

σY 

X 

= 1 − . 

σ 

Es gilt 0 ≤ ρ 2 Y.k/h ≤ 1. 

Damit wird deutlich, dass der partiell multiple Korrelationskoeffizient ein Maß für die Reduktion 

der bedingten Varianz von Y unter der Bedingung X(k) ist, wenn man den Vektor X(h) 

zu X(k) hinzu nimmt. 

Sind σ 2 Y/X und σ2 Y/h nahezu gleich groß, dann wird der Quotient nahezu gleich 1, d. h. ρ2 Y.k/h 

wird sehr klein sein. Andererseits, wenn σ 2 Y/X im Vergleich zu σ2 Y/h sehr klein ist, dann wird 

ρ 2 Y.k/h groß sein. 

Kleine Werte von ρ 2 Y.k/h bedeuten eine kleine Reduktion der bedingten Varianz von Y unter 

X(k) durch Hinzunahme von X(h). 

Weitere nützliche Beziehungen in Bezug auf den partiell multiplen Korrelationskoeffizienten 

1. Mit var[Y/X(h)] = σ 2 Y (1 – ρ2 Y/h ) und 

var[Y/X(k), X(h)] = σ 2 Y (1 – ρ2 Y/X ) erhält man 

ρ 

2 

ρY 

= 

1 − ρ 

2 / X 

Yk . / h 

. 

2 

Y / h 

2 2 2 

Yk . / h Y/ X Y/ 

h 

ρ ρ − ρ 

= 

2 2 

1− 

ρ 1− 

ρ 

Yk . / h Y/ 

X 

2. Den Zusammenhang zwischen den partiellen und multiplen Korrelationskoeffizienten 

erkennt man sofort, wenn X (k) und X(h) als einfache Zufallsgrößen angesehen werden. 

In diesem Falle wird aus der Matrix Σ kk/h die skalare Größe σ 2 kh und damit 

ρ 

T −2 2 

2 σYk . / h σk/ hσYk . / h σYh . / k 

Yk . / h = = 

2 2 2 

σY / h σY / h⋅ 

σY / k 

. 

Wie können Hypothesen bzgl. des partiell multiplen Korrelationskoeffizienten geprüft 

werden? 

Es soll die Hypothese H 0 : ρ 2 Y.h/k = 0 gegen die Alternative H 1 : ρ 2 Y.h/k ≠ 0 geprüft werden. Hierzu 

ist der F-Test anwendbar. Es gilt 

2 

. / 

ˆ RYk h N − p − ( n − p) 

F = ⋅ 

2 

1 − R . / 

n − p 

Yk h 

ist F n – p, N – n verteilt.


Beispiel 5.9.13: Bremsweg eines PKW. Partiell multipler Korrelationskoeffizient 

Wir betrachten die Prozessgleichung 

Y = 17.1505 + 0.2935 Geschwindigkeit – 3.5605 Profiltiefe 

+ 8.516 Reaktionszeit. 

Das Maß der Beherrschbarkeit (Quadrat des multiplen Korrelationskoeffizienten) ist 

R 2 Y/1, 2, 3 = 0.867 und die Streuung um die Prozessgleichung (bedingte Standardabweichung) 

ist s Y/1, 2, 3 = 2.164 (S 2 Y/1, 2, 3 = 4.6828). 

Die Frage ist, ob zwei weitere Variable, wie z. B. Rauheit der Straße und Alkoholkonzentration 

den multiplen Korrelationskoeffizienten wesentlich vergrößern können. Die Kovarianzmatrix 

bei Einbeziehung der zusätzlichen Variablen und mit einer neuen Stichprobe ist 

⎛33.540 34.581 −1.878 1.300 −7.441 0.474 ⎞ 

⎜ 95.479 −0.367 0.617 −6.665 0.863 ⎟ 

⎜ 

⎟ 

⎜ 

0.5904 0.0389 0.203 0.0127 ⎟ 

S = ⎜ 0.1477 0.0313 0.04026 ⎟ 

⎜ 

⎟ 

⎜ 

5.0646 0.0367 ⎟ 

⎜ 

⎟ 

⎝ 

0.0217 ⎠ 

Zur Beantwortung der Frage wird der partiell multiple Korrelationskoeffizient berechnet. 

Man erhält 

⎛S 

⎜ 

⎝S 

und damit 

T 

Yh . 

hh 

⎛23.935114 32.237561 −0.021682 0.94003 ⎞ 

⎞ 

⎜ 

⎟ 

−1 

47.516117 0.210268 1.660873 

⎟ ⋅Shh ⋅ ( Sy. 

h Shk 

) = ⎜ 

⎟ 

⎠ 

⎜ 

0.014019 0.022227⎟ 

⎜ 

⎝ 

0.074965⎟ 

⎠ 

⎛9.6048 2.3434 −1.8563 0.35997⎞ 

⎛ 

2 T 

S ⎞ ⎜ 47.9629 −0.5773 −1.0439 

⎟ 

Y / h SY. k/ 

h 

⎜ 

⎟ = ⎜ 

⎟ 

⎝ S / ⎠ ⎜ 

0.5764 0.01667 

kk h 

⎟ 

⎜ 

⎝ 

0.07273⎟ 

⎠ 

Mit diesen Werten erhält man die Maximum Likelihood Schätzung für den partiell multiplen 

Korrelationskoeffizienten 

T −1 

2 SYk . / h⋅ 

Skk/ h⋅SYk . / h 

Yk h 

SY h 

9.583 

R . / = = = 0.997. 

2 

/ 

9.605 

Für die Prüfung der Hypothese H 0 : ρ 2 Y.k/h = 0 gegen die Alternative H 1 : ρ2 Y.k/h ≠ 0 wird der 

F-Test verwendet. Man berechnet 

2 

. / 

ˆ ρYk h N − p − ( n − p) 0.997 140 − 3 − 2 

F = ⋅ = ⋅ = 2243 

2 

1 − ρ . / 

n − p 1 − 0.997 2 

Yk h


257 

Hieraus folgt schon – auch ohne den Tafelwert nach zu schlagen –, dass dieser Wert statistisch 

gesichert von null verschieden ist, d. h. dass die beiden Parameter Rauheit der Strasse und 

Alkoholkonzentration im Blut das Maß der Beherrschbarkeit wesentlich vergrößern. 

Die vollständige Prozessgleichung ist 

Y = 27.362 + 0.1939 Geschwindigkeit – 3.272 Profiltiefe 

+ 8.4829 Reaktionszeit – 1.151 Rauheit + 2.265 Alkoholkonzentration 

Das Maß der Beherrschbarkeit ist R 2 Y/X = 0.999 und die Streuung um die Prozessgleichung 

ist S Y/X = 0.11677 (S 2 Y/X = 0.01363). 

Welche Aussagen sind mit dem multivariaten, multiplen Korrelationskoeffizient möglich? 

Häufig wird eine Maßzahl zur Bewertung der Abhängigkeit zwischen zwei zufälligen Vektoren 

gesucht, wie z. B. bei der multivariaten, multiplen Regressionsanalyse mit stochastischen Input- 

und Prozessvariablen. 

Der multivariate, multiple Korrelationskoeffizient wird über die Formel 

τ 

2 

Y/ X 1 

= − 

Σ 

YY / X 

Σ 

XX 

definiert. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit z. B. zwischen dem zufälligen 

Vektor Y und E(Y/X). 

Für m = 1 ist τ 2 Y/X identisch mit dem multiplen Korrelationskoeffizienten ρ2 Y/X . 

Bemerkungen 

1. Ein weiteres Maß für die lineare Abhängigkeit zwischen zwei zufälligen Vektoren ist die 

Spurkorrelation nach Anderson [1984] und Höschel [1974, 1976], die über 

V 

durch 

−1 −1 

YX = ΣYY ⋅ΣY . X ⋅ΣXX ⋅ΣX. 

Y 

−1 

= m − Sp ( Σyy 

⋅Σyy / x ) 

Sp ( ) 

2 VYX 

ηY 

/ X= 

min( mn , ) 

definiert wird. 

2. Zusammenhang zwischen den multivariaten, multiplen und kanonischen Korrelationskoeffizienten 

κ. Es gilt 

2 2 2 

Y / X 1 min( m, n) 

1 − τ = (1 − κ ) ⋅… 

⋅[1 − κ ]. 

Die kanonischen Korrelationskoeffizienten werden am einfachsten aus den nicht negativen 

−1 −1 

Eigenwerten von Σ ⋅Σ ⋅Σ ⋅Σ berechnet. 

YY Y . X XX X. 

Y


5.9.6 Was besagen der multivariat partiell-multiple und der multivariat 

semipartiell-multiple Korrelationskoeffizient? 

Die Berechnung von Pro zessgleichungen im Rahmen des multivariaten, multiplen linearen 

Modells wird mit der Auswahl der wesentlichen Input- und Prozessvariablen gekoppelt. 

Hieraus folgt aber, dass wir Korrelationskoeffizienten für die Beurteilung der 

Abhängigkeiten nach der Zerlegung des zufälligen Vektors der Produkt- und Input- und 

Prozessvariablen in Z T = (Y T , X(k) T , X(h) T ) für die bedingten Erwartungswerte E[X(h)/X(k)] 

−1 

T 

= Σhk . ⋅Σkk ⋅ Xk () = : β Y/ 

X ⋅ Xk () mit var[X(h)/X(k)] = Σ hh/k benötigen. Bezeichnen wir die 

Fehlermatrizen mit 

und 

E [ F ⋅ F ] = Σ 

Y / k h/ k Y. h/ 

k 

−1 

Y / k h/ k = ΣY. h/ k⋅Σhh⋅ 

h/ 

k 

E [ F / F ] 

F 

T −1 

Y / k Fh/ k = ΣYY / k− 

ΣY. h/ kΣhh/ kΣY. h/ 

k 

var [ F / ] 

dann können wir den multivariaten partiell-multiplen Korrelationskoeffizienten in der folgenden 

Form 

Σ 

2 = − /( , ) Σ 

τ 

= − 

/ 

Yh 1 1 

. / k 

ΣYY / k Σ / 

YY k h YY X 

YY k 

definieren. 

Dieser Korrelationskoeffizient misst den Grad der linearen Abhängigkeit zwischen den bedingten 

Erwartungswerten E[Y/X] und E[Y/X(k)]. 

Für jede Produktvariable Y r , r = 1, …, m kann man aufgrund der Darstellung für τ 2 Y.h/k die 

Beziehung 

τ 

σ 2 2 − 

2 Red , ( ) 

Y X σr k σ 

rph 

r X 

= ρr h k= 1 − = = 

σ σ σ 

2 2 / / / 

Yr 

. h/ k . / 2 2 2 

Y / k r/ k r/ 

k 

aufschreiben, die besagt, dass Hypothesen über die Red p (h) bzw. Red r, p (h) des Abschnittes 5.9.2 

mit den partiell-multiplen Korrelationskoeffizienten geprüft werden können. 

Aus ρ 2 r.h/k = 0 folgt mit Wahrscheinlichkeit 1, dass die Streichung der Input- und Prozessvariablen 

in X(h) keine Vergrößerung der bedingten Varianz σ 2 Y/X zur Folge hat. In diesem Fall 

muss gelten, sowohl Σ hk = 0 als auch σ r.h = 0. 

Aus ρ 2 r.h/k = 1 folgt mit Wahrscheinlichkeit 1, dass X(h) eine lineare Funktion von X(k) ist. 

Für die Zerlegung des Vektors der Input- und Prozessvariablen in X(k) und X(h) gilt für den 

partiell-multiplen Korrelationskoeffizienten 

2 2 2 2 2 2 

r/ X r/ k rh . / k r r/ k rh . / k 

σ = σ ⋅(1 − ρ ) = σ ⋅(1 − ρ ) ⋅(1 − ρ ). 

Dieser interessante Zusammenhang lässt sich auf den multivariaten Fall übertragen. 

Für die Zerlegung des Vektors der Produktvariablen Y in Y(s) und Y(t) mit 

s = (s 1 , …, s q ), s 1 < … < s q und 

t = (t 1 , …, t m – q ), t 1 < … < t m – q gilt

5.10 Was ist eine Prozessgleichung und wozu benötigt man diese? 

259 

2 2 2 

Y / X s/ X t. X/ 

s 

1 − τ = (1 − τ ) ⋅(1 − τ ) 

und für die Zerlegung von X in X(k) und X(h) gilt 

2 2 2 

Y / X Y. h/ k Y / k 

1 − τ = (1 − τ ) ⋅(1 − τ ). 

In analoger Weise kann der multivariate semi partielle Korrelationskoeffizient 

τ 

2 

Y .( h / k ) 1 

gebildet werden. 

= − 

Σ 

YY /( k, h) 

Σ 

YY 

5.10 Was ist eine Prozessgleichung und wozu benötigt man 

diese? 

Wie wir schon wiederholt feststellten, ist jedes Produkt (materielles Produkt oder Dienstleistung) 

das Ergebnis eines (Herstellungs- oder Dienstleistungs-) Prozesses. Jedes Produkt wird 

durch m, m ≥ 1 nicht unabhängige Produktvariable beschrieben. Der Kunde, der ein Produkt 

kaufen möchte, stellt seine Anforderungen an das Produkt. Diese Anforderungen werden in 

einem Kundenanforderungsprofil (KAP) zusammen gestellt. Das KAP wird parametrisiert und 

durch Sollwerte und Toleranzgrenzen für alle relevanten Produktvariable spezifiziert. 

Ein Prozess wird durch die Input-, Prozessvariablen X als Ursachen und die Produktvariablen 

Y als Wirkungen beschrieben. Eine Veränderung der Produktvariablen kann nach dem Ursache-Wirkungs-Prinzip 

nur durch die Veränderung der Input- und/oder Prozessvariablen 

erreicht werden. Die Veränderungen durch die Störvariablen (noise variables) sind zufällig 

und nicht steuerbar, müssen aber trotz alledem berücksichtigt werden, denn deren Einfluss 

kann erheblich sein. 

Damit die Kundenanforderungen durch die gefertigten Produkte auch wirklich erfüllt werden, 

muss der Prozess gesteuert werden. Dazu benötigen wir die Prozessgleichung. In die können 

wir Werte für die Input- und Prozessvariable einsetzen und damit die Werte für die Produktvariable 

(oder Produktvariablen) berechnen. 

Definition der Prozessgleichung 

Die Prozessgleichung ist eine Funktion, die den Input- Z und Prozessvariablen X die Produktvariablen 

Y zuordnet, sodass eine Steuerung des Prozesses möglich ist. 

Die Funktion ist in der Regel unbekannt. Es sind kaum Gesetze bekannt, nach denen die Prozessgleichung 

gefunden werden kann. Daher muss die Funktion statistisch bestimmt werden. 

Dazu benötigt man möglichst fehlerfreie, vollständige, zuordenbare Messwertsätze in ausreichender 

Anzahl für die Input-, Prozess- und Produktvariablen. 

Die Input- und Produktvariablen sind dabei in der Regel zufällige Vektoren, denn die Inputvariablen 

sind nach Abschnitt 5.5 die Produktvariablen der Produkte von Vorläuferprozessen. 

Produktvariable sind zufällige Vektoren, da in jedem Prozess zufällige Komponenten wirken, 

deren Beitrag sich auf die Werte der Produktvariablen auswirkt.


Die Prozessvariablen können zufällig oder determiniert sein. Häufig wirken aber auch die determinierten 

Einstellvariablen zufällig auf das Produkt. Diese Voraussetzung bedingt, dass für 

die Berechnung der Prozessgleichung gewisse Verteilungsvoraussetzungen benötigt werden. 

Beispiel 5.10.1: Brennen von Porzellan. Technologie 

Porzellan wird aus Kaolin, Quarz und Feldspat hergestellt. Die aus der Porzellanmasse 

geformten Gegenstände werden zuerst in einem Glühbrand von 900 [°C] gesintert, wobei 

der Scherben entsteht. Nach dem Verglühen wird der Scherben glasiert und dem Gar- oder 

Glattbrennen von 1400 – 1500 [°C] unterworfen. Der Quarz und Feldspat geraten bei der 

hohen Temperatur in Fluss und füllen das Gerippe von Kaolin vollständig aus. 

Der Brennofen wird auf 900 [°C] oder 1400 [°C] hoch geheizt. Dass Brenngut wird in 

Regale einsortiert und eingeschoben. An jeder Stelle des Regals wirkt eine klein wenig 

unterschiedliche Temperatur, d. h. trotz der festen Einstellung des Ofens wirken auf die zu 

brennenden Gegenstände verschiedene Temperaturen. 

Wie kann man eine Prozessgleichung gewinnen? 

In der Antwort zu dieser Frage werden Methoden zur Prüfung der Homogenität und zur 

Klassifikation der inhomogenen Stichprobe in homogene Teilstichproben, zur Berechnung 

der Prozessgleichung und zur Auswahl der wesentlichen Input- und Prozessvariablen bereit 

gestellt. 

Um die Verbindung zur klassischen Literatur über die Regressionsanalyse herzustellen, betrachten 

wir zunächst den klassischen Fall, bei dem angenommen wird, dass nur Y eine Zufallsgröße 

oder ein zufälligen Vektor ist und erweitern diesen dann auf den praktikablen Fall, in dem 

sowohl die Input-, Prozess- und Produktvariable zufällige Vektoren sind. 

5.11 Modelle für die Prozessgleichung 

5.11.1 Nur die Produktvariable Y ist zufällig 

Wir wollen annehmen, dass Y ~ N m (µ Y , Σ YY ). Die Input- und Prozessvariablen, wir fassen diese 

zu dem Vektor x zusammen, sind determiniert. Die funktionale Darstellung der Produktvariable 

Y durch die determinierten Input- und Prozessvariablen 

Y = f (x) + ε 

bezeichnen wir als Prozessgleichung. Wir können dafür auch schreiben, 

Y ~ N m (f (x), Σ YY ). 

Da x ein Vektor fester Einstellgrößen für die Input- und Prozessvariablen ist, wird das Modell 

multivariates lineares Modell mit festen Input- und Prozessvariablen genannt. Ist X ein zufälliger 

Vektor von Input- und Prozessvariablen und sind Y und X gemeinsam nach einer n + m 

dimensionalen Normalverteilung verteilt, dann wird das Modell multivariates lineares multiples 

Modell mit stochastischen Input- und Prozessvariablen genannt. Wir beginnen mit dem Modell 

mit determinierten Input- und Prozessvariablen, da dieses aus der Literatur bek annt ist.


261 

Den Vektor der Input- und Prozessvariablen bezeichnen wir mit x, den Vektor der Produktvariablen 

mit Y. Um das Ursache-Wirkungs-Prinzip auch in diesem Falle zu betonen, schreiben 

wir anstelle der Y auch Y = Y(x 1 , …, x n ). 

Das multivariate lineare Modell mit festen Input- und Prozessvariablen wird wie folgt geschrieben 

Y(x 1 , …, x n ) = f (x 1 , …, x n ) + ε, 

wobei 

f (x 1 , …, x n ) ist eine lineare Funktion, 

E[Y(x 1 , …, x n )] = f (x 1 , …, x n ), 

ε ∼ N μ (0, Σ), Σ ist positiv definit und 

f (x 1 , …, x n ) und ε sind unabhängig voneinander. Die Kovarianzmatrix Σ, kann zwei grundsätzliche 

verschiedene Strukturen haben. Beim klassischen linearen Modell gilt 

var(ε) = σ 2 I N , d. h. var(ε i ) = σ 2 und cov(ε i , ε k ) = 0 für i ≠ k. 

Für das allgemeine lineare Modell gilt 

var(ε) = σ 2 Σ YY . 

Σ YY wird manchmal als bekannt vorausgesetzt, kann aber auch unbekannte Modellparameter 

enthalten. σ 2 ist in jedem Fall ein unbekannter Modellparameter. Die Eigenschaft gleicher 

Varianz σ 2 der Fehlervariablen ε i , i = 1, …, N wird als Homoskedastizität bezeichnet. 

Manchmal ist Σ diago nal, aber ≠ I N , so nennt man diesen Fakt Heteroskedastizität. Im Fall von 

Zeitreihendaten ist die Voraussetzung cov(ε i , ε k ) = 0 für i ≠ k, d. h. der Unkorreliertheit der Fehlervariablen 

verletzt. In Kurzschrift können wir hierfür auch schreiben Y ~ N m (f (x 1 , …, x n ), Σ) 

mit den Eigenschaften der positiven Definitheit von Σ und der Unabhängigkeit von Fehler 

und linearer Funktion. 

Die statistischen Aufgaben sind in diesem Fall die 

• 

• 

• 

Bestimmung der linearen Funktion f (x 1 , …, x n ), 

Berechnung des Maßes der Beherrschbarkeit des Prozesses durch die ausgewählten Inputund 

Prozessvariablen, 

Beantwortung der Frage, ob das berechnete Maß der Beherrschbarkeit auch mit weniger Input- 

und Prozessvariablen erreicht werden kann, d. h. Auswahl der optimalen Teilmenge von 

wesentlichen Input- und Prozessvariablen und Streichung der redundanten Variablen. 

Das lineare Modell mit festen Input- und Prozessvariablen kann nun durch 

• 

• 

Varianzanalysen oder 

Regressionsanalysen 

realisiert werden. Das Unterscheidungskriterium zwischen diesen beiden Modelltypen ist die 

Messbarkeit der Input- und Prozessvariablen. Sind x 1 , …, x n nur qualitativ messbar, d. h. lassen 

sich hierfür Abstufungen angeben, dann ist die Varianzanalyse der passende Modelltyp. 

Die Input- und Prozessvariablen sind feste Einstellgrößen, d. h. x 1 , x 2 , …, x n ∈ R n . Die m, m ≥ 1 

Produktvariablen Y 1 , Y 2 , …, Y m sind Zufallsgrößen und Funktionen der determinierten Inputund 

Prozessvariablen. Auch dieser Sachverhalt wird in Verbindung mit einer Verteilungsannahme


Y ∼ N ( B x, Σ ), 

m 

Yx . 

YY 

dargestellt, wobei B Y.x die Matrix der unbekannten Koeffizienten der Prozessgleichungen ist, 

die den Vektor der Produktvariablen Y T = (Y 1 … Y m ) als Linearkombination von den Inputund 

Prozessvariablen x T = (x 1 … x n ) darstellt. Σ YY ist die Kovarianzmatrix des Vektors der 

Produktvariablen. 

Die Normalverteilungsannahme ist oft gerechtfertigt und wird genau so oft, zumindest von 

Kritikern infrage gestellt. Unter den hier formulierten Voraussetzungen ist sowohl der lineare 

als auch nichtlineare Modellansatz möglich. 

Bei all diesen höher dimensionalen Problemen sollte die statistische Prozessanalyse zunächst 

mit linearen Modellen begonnen werden. Sind die Maße der Beherrschbarkeit niedrig und 

können nicht durch zusätzliche Input- und/oder Prozessvariable vergrößert werden, dann 

kann man zu den nichtlinearen Modellen übergehen. 

Die Stichprobe 

T T 

1 = 11 … 1n 

Y Y ( x , , x ) 

… 

T T 

N = N1 

… Nn 

Y Y ( x , , x ) 

an den N Messwertstellen für die Input- und Prozessvariablen 

⎛ x 

⎜ 

⎜ 

⎝x 

… 

… 

… 

11 1n 

N1 

x 

x 

Nn 

und die Darstellung 

Y = f( x ,…, x ) + ε , ∀ i = 1, …, 

N 

⎞ 

⎟ 

⎟ 

⎠ 

i i1 

in i 

sind Grundlagen für die Berechnung der Prozessgleichung mit festen Input- und Prozessvariablen. 

Es wird noch vorausgesetzt, dass 

E [ εi] = 0 

var ( ε ) = Σ 

i 

Des weiteren wird angenommen, daß f (x 1 , …, x n ) von den unbekannten Modellparametern 

β Y.1 , …, β Y.n abhängen möge. Es gibt folglich eine Funktionenschar 

̃ nm ⋅ 

f ( x ,…, x ; β ,…, β ), mit ( β ,…, β ) ∈ R , 

1 n Y.1 Y. n Y.1 Y. 

n 

die die unbekannte Funktion enthält. Für die Ableitung von Schätzfunktionen für die unbekannten 

Modellparameter wollen wir voraussetzen, daß die Funktion ̃f nur linear von den 

unbekannten Koeffizienten abhängt, d. h. 

f̃ ( x , … , x ; β , … , β ) = β ⋅ g ( x , … , x ) + … + β ⋅ g ( x , … , x ) 

1 n Y.1 Y. n Y.1 1 n Y. 

n 1 n 

wobei g(x 1 , …, x n ) bekannte linear unabhängige Funktionen sind. Diese Gleichung nennen 

wir Prozessgleichung, wenn x T = (x 1 , …, x n ) der Vektor der determinierten Input- und Prozessvariablen 

ist.


263 

5.11.1.1 Was versteht man unter einem univariaten, linearen, multiplen Modell 

mit festen Input- und Prozessvariablen ? 

Dieses Modell besitzt die Darstellung 

T 

Yx . . 

Y = β ⋅ x + ε 

In diesem Modell ist Y eine nach Y ~ N 1 (β T Y…x x, σ2 ) verteilte Zufallsgröße, x T = (x 1 , …, x n ) 

der Vektor der festen Input- und Prozessvariablen und ε der Anpassungsfehler Y – β T Y…x x mit 

der Verteilung ε ~ N 1 (0, σ 2 ). Y und ε sind unabhängig voneinander verteilt. Das dazugehörige 

statistische univariate, lineare, multiple Modell mit festen Input- und Prozessvariablen ist 

wobei 

Y 

Y 

T 

Yx . 

= β ⋅ x + ε 

⎛Y1 ⎞ ⎛ x11 … x1N 

⎞ 

= ⎜… 

⎟ und x = ⎜ … ⎟ 

⎜ ⎟ ⎜ ⎟ 

⎝Y ⎠ ⎝x … x ⎠ 

N N1 

Nn 

die Stichproben vom Umfang N für die Produktvariable Y und den Vektor der determinierten 

Input- und Prozessvariablen sind. In der Schreibweise mit der Verteilung gilt für dieses Modell 

T 

2 2 

N Y. 

x N N N 

Y ∼ N ( β ⋅ x, σ ⋅ I ) und ε ~ N (0, σ ⋅ I ) 

wobei I N die N dimensionale Einheitsmatrix ist. 

Was müssen wir weiter tun? 

Wir müssen mit der Stichprobe für Y und x die unbekannten Modellparameter für das multivariate, 

lineare, multiple Modell mit festen Input- und Prozessvariablen schätzen. Hierzu verwenden 

wir die bekannte Methode der kleinsten Quadrate, die von Gauß eingeführt wurde. Diese 

Methode wollen wir an dem vereinfachten Beispiel 5.11.1 demonstrieren. Vereinfacht bedeutet, 

dass wir nur die eine Prozessvariable Geschwindigkeit betrachten und hierfür annehmen, dass 

diese Variable fest ist. Die Festlegung kann realisiert werden, idem wir die Geschwindigkeiten 

vorgeben und nach dem plötzlichen Bremsen die Länge des Bremsweges messen. 

Beispiel 5.11.1: Bremsweg. Einfache Prozessgleichung 

Wir betrachten nur die Abhängigkeit des Bremsweges Y [m] von der vorgegebenen Geschwindigkeit 

x [km/h]. In diesem einfachsten Fall erhalten wir das einfache lineare Modell 

mit einer festen Prozessvariablen 

Y = β Y. x x + ε. 

Wir wollen annehmen, dass ε ~ N (0, σ 2 ). Die beiden Modellparameter β Y.x und σ 2 sind 

unbekannt. Für deren Bestimmung wird eine Stichprobe für die beiden Produkt- und Prozessvariablen 

vom Umfang N benötigt. Um das Nachrechnen zu ermöglichen, betrachten 

wir nur die kleine Stichprobe in der Tabelle 5.11.1, die auch in der Datei 052Bremsweg03 

auf der beiliegenden CD enthalten ist.


Tabelle 5.11.1: Messwerte für das Bremswegbeispiel 

Nr. Y x 

1 35,1 58,0 

2 34,1 55,6 

3 39,5 60,4 

4 36,9 59,8 

5 34,1 58,4 

6 34,4 58,7 

7 30,7 56,3 

8 30,3 52,5 

9 33,9 54,4 

10 49,7 70,5 

Zuerst werden die statistischen Maßzahlen berechnet. Man erhält die Werte: 

Tabelle 5.11.2: Statistische Maßzahlen für das Bremswegbeispiel 

Statistische Maßzahl Y X 

Mittelwert 35,87 58,46 

Standardabweichung 5,539 4,895 

Minimum 30,3 52,5 

Maximum 49,7 70,5 

Spannweite 19,4 18 

Variationskoeffizient 15,4 8,4 

Die statistischen Maßzahlen verraten nichts über die Abhängigkeit des Bremsweges von der 

Geschwindigkeit, obwohl die natürlich gegeben ist. Das lehrt die Erfahrung und zeigt die 

Abbildung 5.11.1. Diese Abbildung zeigt uns auch, dass die Abhängigkeit zwischen diesen 

beiden Variablen linear ist. 

Für das Bremswegbeispiel erhalten wir die Punktwolke der Abbildung 5.11.1. 

Plot Bremsweg über der Geschwindigkeit 

50 

Bremsweg 

46 

42 

38 

34 

30 

52 56 60 64 68 72 


Abb. 5.11.1: Punktwolke für das Bremswegbeispiel 

Was ist in dieser Situation zu tun? Wir denken uns eine Gerade Y = b 0 + b Y.x x durch die 

„Punktwolke“ gelegt und fragen, wie die unbekannten Koeffizienten der Gleichung aus den 

Messwertepaaren für die beiden Variablen bestimmen werden können.


265 

Das plausibelste Prinzip hierfür ist, den Abstand der einzelnen Punkte von der gedachten 

Gerade zu minimieren. Hierbei ist darauf zu achten, dass die Summe der Abstände oberhalb 

der Geraden genauso groß ist, wie die Summe der Abstände unterhalb der Geraden. 

Für diese Lösung betrachten wir die Quadrate der Abstände der Punkte von der Geraden. 

Der quadratische Abstand eines Punktes i mit den Koordinaten (x i , y i ), i = 1, …, N von 

der gedachten Geraden 

yˆ 

= b + b x 

0 yx . 

2 

i 

ist ( yˆ 

− y ) . Die Summe der quadratischen Abstände aller Punkte von der gedachten 

Ausgleichsgeraden ist 

N 

N 

2 2 

∑ yi − yˆ 

= ∑ yi − b0 + by. 

xx 

i= 1 i= 

1 

( ) [ ( )] . 

Diese Summe soll minimiert werden. Für diese Aufgabe sind die Methoden der Differentialrechnung 

zu verwenden. Es müssen zunächst die partiellen Ableitungen der Summe der 

quadratischen Abweichungen gebildet und dann null gesetzt werden. Das so entstehende 

Gleichungssystem ist zu lösen. Formelmäßig erhält man 

N 

N 

2 2 

∑ i 

ˆ ∑ i 0 y. 

x 

i= 1 i= 

1 

QS = ( y − y) = ( y − b − b x) ⇒ Min! 

N 

∂QS 

=−2 ⋅∑ ( yi 

−b0 −by. 

x x) 

∂b 

0 i= 

1 

N 

∂QS 

=−2 ⋅∑ ( yi 

−b0 −by. 

x x) 

⋅x 

∂b 

yx . i = 1 

d. h. man muss das Gleichungssystem 

N 

∑ i 0 y. 

x 

i= 

1 

( y − b − b x) = 0 

N 

∑ i 0 y. 

x 

i= 

1 

( y − b − b x) ⋅ x = 0 

lösen. 

Das Gleichungssystem kann man umformen zu 

N 

∑ 

∑ 

y = N ⋅ b + b ⋅ x 

i 0 y. 

x i 

i= 1 i= 

1 

N N N 

∑x ⋅ y = b ⋅ ∑x + b ⋅∑x 

2 

i i 0 i y. 

x i 

i= 1 i= 1 i= 

1 

N 

Dieses Gleichungssystem nennt man Normal Gleichungs System (NGS) für die unbekannten 

Koeffizienten b 0 und b y.x der linearen Gleichung und die bekannten Ausdrücke


N 

N 

∑x 

∑x 

2 

i 

und . 

i 

i= 1 i= 

1 

Dieses einfache NGS löst man am schnellsten mit der Kramer’schen Regel (siehe Bronstein 

[1960]). 

Die Koeffizientendeterminante des NGS ist 

D = 

N 

N 

∑ 

x 

N 

∑ 

i 

i= 

1 

N 

∑ 

i 

i= 1 i= 

1 

x 

x 

2 

i 

D 0 ist die Determinante, die sich aus D ergibt, wenn man in dieser die Spalte der Koeffizienten 

für das unbekannte b 0 durch die Spalte der Absolutglieder 

ersetzt, d. h. 

N 

∑ 

i= 

1 

y und 

i 

N 

∑ 

i 

i= 

1 

x ⋅ y 

i 

D 

0 

= 

N 

∑ 

y 

N 

∑ 

x 

i 

i 

i= 1 i= 

1 

N 

N 

2 

∑xi ⋅ yi ∑xi 

i= 1 i= 

1 

Analog erhält man 

D 

N 

∑ 

i= 

1 

yx . = 

N N 

∑ 

∑ 

N 

y 

x x ⋅ y 

i i i 

i= 1 i= 

1 

i 

. 

Damit erhält man für b y.x den Ausdruck 

b 

N N N 

∑ ∑ ∑ 

N ⋅ x ⋅ y − y ⋅ x 

i i i i 

Dyx 

. A 

i= 1 i= 1 i= 

1 

xy . 

yx . = = = 

2 

D ⎛ 

N 

⎞ A ⋅ 

2 

x Ay 

N ⋅∑xi 

− ⎜ ∑xi 

⎝ ⎟ 

i= 

1 ⎠ 

Mit den Daten aus obiger Tabelle erhält man die Matrix 

. 

A 

⎛2156.44 2324.68⎞ 

= ⎜ 

⎝ 2761.61 ⎟ 

⎠ 

und damit 

b yx . 

2324.68 

= = 1.078. 

2156.44


267 

b 0 kann man wie folgt berechnen: 

b0 = y − byx 

. ⋅ x = 35.87 −1.078 ⋅ 58.46 = −27.15 

. 

Damit lautet die Prozessgleichung für die Länge des Bremsweges in Abhängigkeit von der 


yˆ =− 27.15 + 1.078 ⋅x. 

Für den Korrelationskoeffizienten erhält man den Wert 

r xy 

2324.68 

= = 0.952. 

2156.44 ⋅ 2761.61 

Zur Prüfung der Hypothese, ob der Bremsweg unabhängig von der gefahrenen Geschwindigkeit 

ist, muss der t-Test berechnet werden. Man erhält 

0.95 

tˆ = 8 = 8.6. 

2 

1− 

0.95 

Der Tafelwert t α, FG für die Irrtumswahrscheinlichkeit α = 0.05 und 8 FG ist 1.859, d. h. 

die aufgestellte Hypothese der Unabhängigkeit muss verworfen werden. Die Länge des 

Bremsweges ist abhängig von der gefahrenen Geschwindigkeit. 

Die Stichprobenvarianz der einzelnen Messwerte um die Prozessgleichung, d. h. die Restvarianz 

kann man wie folgt berechnen: 

2 

N 

= ⋅ ∑ − 2 N 

1 

− 

= 1 

/ ⋅ ∑ − 0 − . ⋅ 2 

y x i 

î i y x 

N 2 

i= 1 

N − 2 

i= 

1 

s ( y y ) ( y b b x ) . 

Diese Art der Berechnung ist sehr aufwendig. Daher rechnet man die obige Formel um 

und erhält 

2 2 2 

Y / x y y/ 

x 

s = s ⋅(1 − r ), 

wobei r Y/x der einfache Korrelationskoeffizient zwischen der Produktvariable Y und der 

Prozessvariable x ist. Nach dieser Formel erhält man die bedingte Stichprobenvarianz 

s 2 Y/x = 2.99 bzw. die bedingte Standardabweichung s Y/x = 1.73. 

5.11.1.2 Multivariates, multiples lineares Modell mit determinierten Input- und 

Prozessvariablen; Y ist ein zufälliger Vektor 

Anstelle der einen Produk tvariablen Y müssen wir dem Vektor der m, m ≥ 1 nicht unabhängigen 

Produktvariablen Y T = (Y 1 , …, Y m ) betrachten. Mit den Abkürzungen 

⎛Y 

⎞ ⎛ ⎞ 

⎛ ⎞ 

⎛ ⎞ 

Y = ⎜… ⎟ = ⎜ … ⎟ = … ∈ = ⎜ … ⎟ 

⎜ ⎟ ⎜ ⎟ ⎜ ⎟ 

⎝Y 

⎠ ⎝ ⎠ ⎝ ⎠ 

lautet dieses Modell 

T 

1 βY1.1 … β β 

Y1. n Y1. 

x 

εY1 

⎜ ⎟ 

m× 

n 

, ΒYx 

. 

⎜ ⎟ Μ und ε 

T 

m βYm.1 … β ⎜ ⎟ 

Ym. 

n β 

ε 

⎝ 

Ym 

Ym. 

x ⎠ 

Y 

T 

Yx . 

= Β ⋅ x + ε


wobei 

Y ~ N m (Β T Y.x x, Σ εε ) 

ε ~ N m (0, Σ εε ), 

Σ 

εε 

2 

⎛ var( ε1) … cov( ε1, εm) 

⎞ ⎛ σ1 … σ ⎞ 

1m 

⎜ 

⎟ 

= ⎜ 

… 

⎟ = ⎜ 

… . 

⎜ 

⎟ 

⎟ 

⎝cov( ε , ε ) … var( ε ) ⎠ ⎜ 

⎝σ σ ⎟ 

⎠ 

2 

m 1 m m1 

… m 

Y und ε sind unabhängig voneinander. In diesem Modell sind die Modellparameter Β Y.x und 

Σ εε unbekannt und müssen mit den Werten einer Stichprobe geschätzt werden. 

Das statistische Modell ist gegeben durch 

wobei gilt 

Y = Β T Y.x x + ε, 

⎛Y11 … Y1 N ⎞ ⎛ x11 … x1n 

⎞ 

Y = ⎜ … ⎟, x = ⎜ … ⎟ die Stichprobe und 

⎜ ⎟ ⎜ ⎟ 

⎝Ym1 … YmN ⎠ ⎝xN1 

… xNn⎠ 

⎛ ε11 … ε1N 

⎞ 

ε = ⎜ … ⎟ 

⎜ ⎟ 

⎝η 

… ε ⎠ 

m1 

In diesem Modell ist 

mN 

Y ~ N N (Β Y.x T x, Σ YY ⊗ I N ), 

wobei ⊗ das Kronecker Produkt der beiden Matrizen Σ YY und I N bezeichnet. Dieses Produkt 

ist in diesem Spezialfall 

Σ 

YY 

⎛ΣYY 

0 … 0 ⎞ 

⎜ 0 Σ 

⎟ 

YY … 0 

⊗ IN 

= ⎜ 

⎟ 

⎜ … 

⎟ 

⎜ 

⎝ 0 0 … Σ ⎟ 

⎠ 

YY 

eine Block-Diagonalmatrix, die N mal die Kovarianzmatrix der Produktvariable Y enthält. 

5.11.2 Lineare Modelle mit stochastischen Input- und Prozessvariablen 

Diese Modelle haben formal das selbe Aussehen wie die Modelle mit determinierten Inputund 

Prozessvariablen. Trotzdem unterscheiden sich die Modelle wesentlich, vorallem bzgl. der 

Verteilungen für die Schätz- und Teststatistiken. 

Warum müssen wir Modelle mit stochastischen Input- und Prozessvariablen betrachten? 

Sehr häufig ist die Voraussetzung, dass die Input- und Prozessvariablen feste Einstellgrößen 

sind, in der Praxis verletzt. Betrachtet man z. B. die Prozessvariable Temperatur bei der Her-


269 

stellung von Hochbrand Porzellan, dann wird diese zwar auf 1400 °C eingestellt, aber an den 

verschiedenen Stellen des Ofens und damit für verschiedene Teile des zu brennenden Gutes 

im Ofen sind die Temperaturen zufällig unterschiedlich. Der fest eingestellte Parameter wirkt 

somit auf das Produkt stochastisch. Daraus folgt, dass neben den bisher genannten Modellen 

die Modelle mit stochastischen Input- und Prozessvariablen betrachtet werden müssen. 

Es gibt einen weiteren Grund für die Verwendung dieses Modells. Die Inputvariablen sind 

Produktvariable eines Vorläuferprozesses und damit natürlich stochastisch. 

5.11.2.1 Wie sieht das multiple lineare Modell mit stochastischen Input- und 

Prozessvariablen aus und wodurch unterscheidet es sich von dem Modell 

mit festen Input- und Prozessvariablen? 

Die Ableitung des Modells für diesen praktisch relevanten Fall basiert auf der gemeinsamen, 

multivariaten Verteilung für die Input- (Z 1 , …, Z l ), Prozess- (X 1 , …, X n ) und Produktvariablen 

(Y 1 , …, Y m ). Im univariaten, multiplen, linearen Modell wird nur eine Produktvariable Y 

betrachtet. X und Z können Vektoren von Input- und Prozessvariablen sein. 

Wir wollen hier annehmen, dass die gemeinsame Verteilung des Vektors 

(Z T , X T , Y) = (X T , Y) ~ N n + 1 (µ, Σ), 

wobei die Input- und Prozessvariablen der Einfachheit halber zu dem Vektor X zusammengefasst 

werden und Σ als positiv definit vorausgesetzt wird. Mit der Zerlegung des zufälligen 

Vektors (Y, X T ) in den Teilvektor der Input- und Prozessvariablen X, d. h. die Ursachen und 

die Wirkung Y, erhält man für die Momente µ T = (µ Y , µ T X ) und 

⎛ 

2 T 

σ ⎞ 

Y σY. 

X 

Σ = ⎜ ⎟ 

⎝ Σ ⎠ 

XX 

den bedingten Erwartungswert 

T −1 

T 

Y Y. X XX X 0 Y / X 

EY [ / X] = μ + σ Σ ( X− μ ) = β + β X 

und die bedingte Varianz 

2 T −1 

Y Y. X XX Y. 

X 

var[ Y/ X] = σ − σ Σ σ . 

In diesen Formeln haben die ei nzelnen Symbole die folgenden Bedeutungen: 

σ 2 Y 

ist die Varianz der Produktvariablen Y, 

σ Y.X ist der Vektor der Kovarianzen zwischen der Produktvariablen und dem Vektor der Inputund 

Prozessvariablen X und 

Σ XX ist die Kovarianzmatrix für die Input- und Prozessvariable. 

Der bedingte Erwartungswert wird auch Regressionsfunktion genannt. Sie sehen erstens den 

Unterschied zur Regressionsanalyse mit festen Input- und Prozessvariablen und zweitens die 

Möglichkeit der anderen Darstellung in Form der Prozessgleichung 

Y = β 0 + β Y/X X + F Y/X , 

wobei β Y/X = σ Y.X Σ –1 

YY , β 0 = µ Y – β Y/X µ X und F Y/X = Y – E [Y/X] ~ N 1 (0, σ2 Y/X ) ist der normalverteilte 

Anpassungsfehler. Y und F Y/X sind unabhängig voneinander.


Beispiel 5.11.2: Bremsweg. Prozessgleichung mit mehreren Prozessvariablen 

Neben der Produktvariable Y werden die Prozessvariablen 

X 1 = Geschwindigkeit [km/h] 

X 2 = Profiltiefe [mm] 

X 3 = Reaktionszeit [sec] 

betrachtet. Die Prozessvariablen sind Zufallsgrößen. 

Die Kovarianzmatrix ist 

⎛ 

2 

σ ⎞ 

Y σY.1 σY.2 σY.3 

⎜ 

2 

⎟ 

⎜ σ ⎟ ⎛ 

2 T 

x1 σx1. x2 σx1. x3 σ ⎞ 

Y σY. 

X 

Σ = ⎜ ⎟ 

= 

2 ⎜ ⎟ 

⎝ ⎠ 

⎜ 

σx 2 σx 2. x 3 

Σ 

⎟ 

XX 

⎜ 

⎝ 

σ ⎟ 

⎠ 

. 

2 

x 2 

Das Modell lautet 

Y = β 0 + β Y.1/2, 3 X 1 + β Y.2/1, 3 X 2 + β Y.3/1, 2 X 3 

und 

var[Y/X] = σ 2 Y/X = σ2 Y – σT Y.X Σ–1 XX σ Y.X , 

wobei 

β0 = β T 

Y / X ( μY− 

μX) 

und 

T T −1 

Y / X= 

Y. 

X XX 

β σ Σ 

2 

/ 

bedeuten. Die beiden Modellparameter σ Y X und β Y / X sind unbekannt und müssen mit 

einer Stichprobe geschätzt werden. 

Die Unterschiede zum Modell mit festen Input- und Prozessvariablen bestehen hauptsächlich 

darin, dass 

• 

• 

• 

die Modellparameter im Modell mit stochastischen Input- und Prozessvariablen die Parameter 

einer bedingten Verteilung sind, 

in den Verteilungen der Schätzungen für die unbekannten Modellparameter und 

in den Verteilungen der Teststatistiken. 

Was ist das Maß der Beherrschbarkeit? 

Das Quadrat des multiplen Korrelationskoeffizienten ρ 2 Y/X zwischen Y und der linearen Prozessgleichung 

wird Maß der Beherrschbarkeit des Prozesses genannt, denn dieses Maß gibt an, wie 

gut die Varianz der Produktvariablen Y durch die Input- und Prozessvariablen erklärt wird. 

Der Sprachgebrauch „Maß der Beherrschbarkeit“ wird durch die Beziehung 

2 2 2 

σ = σ ⋅(1 − ρ ) 

Y / X Y Y / X 

deutlich, in der σ 2 Y die Varianz von Y und ρ2 Y/X den multiplen Korrelationskoeffizienten zwischen 

Y und der Prozessgleichung bezeichnen. Man kann von der bedingten Varianz ausgehen und 

daraus das Maß der Beherrschbarkeit über die Beziehung


271 

ρ 

2 T −1 

T 

2 σY / X σY. X⋅ΣXX⋅σY. 

X βY / X⋅ΣXX⋅βY / X 

Y / X= 1 − = = 

2 2 2 

σY σY σY 

ausrechnen. 

Sind Y und X unabhängig voneinander, dann ist ρ 2 Y/X = 0 und daraus folgt σ2 Y/X = σ2 Y , d. h. der 

Vektor der Input- und Prozessvariable trägt nicht zur Erklärung der Varianz der Produktvariablen 

bei. 

Sind Y und X mit Wahrscheinlichkeit 1 voneinander linear abhängig, dann ist ρ 2 Y/X = 1 und 

somit ist σ 2 Y/X = 0, d. h. alle Punkte Ŷ liegen auf der Ausgleichshyperebene. Die bedingte Varianz 

der Produktvariablen unter der Wirkung der Input- und Prozessvariablen ist null, d. h. 

die Varianz von Y wird durch die Input- und Prozessvariablen vollständig erklärt. 

Beispiel 5.11.3: Bremsweg. Mehrere Prozessvariable 

Der Prozess ist das Bremsen eines PKW’s vor einem plötzlich auftauchenden Hindernis. 

Die Produktvariable Y ist der Bremsweg in [m]. Die Prozessvariablen sind 

X 1 = Geschwindigkeit in [km/h], 

X 2 = Gewicht des PKW [kg] und 

X 3 = Profiltiefe des Reifens in [mm]. 

Ein PKW vom selben Typ wurde von ein und denselben Fahrer auf ein und derselben Strasse 

unter den gleichen Wetterbedingungen mit verschiedenen Reifen auf unterschiedliche 

Geschwindigkeiten beschleunigt und vor dem Hindernis abgebremst. Die Daten dieses 

Versuches sind im Internet unter dem Namen 05.11.3 Bremsweg enthalten. 

Die statistischen Maßzahlen sind in der Tabelle 5.11.3 enthalten. 

Tabelle 5.11.3: Statistische Maßzahlen 

Statistische Maßzahlen Y X 1 X 2 X 3 

Mittelwert 25,907 49,862 1440,23 3,549 

Standardabweichung 0,832 3,276 168,0 0,496 

Minimum 23,98 42,60 1040,4 2,165 

Maximum 28,11 57,45 1832,8 5,18 

Die statistischen Maßzahlen sagen nichts aus über die Abhängigkeitsstruktur zwischen den 

Variablen. Man kann aus ihnen nicht ablesen, ob die Vergrößerung der Geschwindigkeit 

des PKW zu einem längeren Bremsweg führt. 

Um das ablesen zu können müssen wir zunächst die Korrelationsmatrix für diese Variablen 

berechnen. Die Werrte stehen in der Tabelle 5.11.4. 

Tabelle 5.11.4: Korrelationsmatrix 

Korr.Matrix Y X 1 X 2 X 3 

Y 1 0,828 0,748 –0,677 

X 1 1 0,425 –0,275 

X 2 1 –0,437 

X 3 1


Die Korrelationsmatrix sagt uns, dass die Länge des Bremsweges und die Geschwindigkeit 

hoch miteinander korreliert sind. Die Länge des Bremsweges hängt aber außerdem von 

dem Gewicht und der Profiltiefe ab, wobei die Länge des Bremsweges und die Profiltiefe 

negativ korreliert sind, d. h. je tiefer die Profile sind, desto kürzer ist der Bremsweg, oder 

anders ausgedrückt, je abgefahrener die Reifen sind, desto länger wird der Bremsweg. 

Die Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen unter den 

Bedingungen, dass alle anderen Variablen konstant gehalten werden, sind in der Tabelle 

5.11.5 enthalten. 

Tabelle 5.11.5: Matrix der partiellen Korrelationskoeffizienten 

Part.Korr.Matrix Y X 1 X 2 X 3 

Y 0,976 0,926 –0,943 

X 1 –0,875 0,913 

X 2 0,827 

X 3 

Der partielle Korrelationskoeffizient 

r Y.1/2, 3 = 0,976 

zwischen der Länge des Bremsweges Y und der Geschwindigkeit X 1 unter der Bedingung, 

dass sowohl das Gewicht X 2 als auch die Profiltiefe X 3 konstant gehalten werden, ist größer als 

der ursprüngliche einfache Korrelationskoeffizient. Der partielle Korrelationskoeffizient 

r 1.2/X, 3 = –0,875 

zwischen X 1 und X 2 unter der Bedingung Y und X 3 wird sogar negativ. Das zeigt, dass die 

Variablen sehr stark voneinander abhängen. Die partiellen Korrelationskoeffizienten für 

die Produktvariable Y mit allen Prozessvariablen liefert eine Rangfolge für den Einfluss der 

Prozessvariablen auf die Produktvariable. Den stärksten Einfluss hat die Prozessvariable X 1 , 

gefolgt von der Prozessvariablen X 3 und X 2 . Da alle diese partiellen Korrelationskoeffizienten 

groß sind, folgt, dass alle Prozessvariablen einen starken Einfluss auf die Produktvariable 

Y haben. 

Die Determinante der Korrelationsmatrix R als globales Maß für die Abhängigkeitsstruktur 

besitzt den Wert det(R) = 0,00885. Die Kleinheit dieses Wertes zeigt die Straffheit der 

Abhängigkeitsstruktur. 

Der Grad der Multikollinearität ist der Kehrwert der Determinante der Korrelationsmatrix 

nur für die Prozessvariablen. Die Determinante det(R XX ) = 0,655 ist erfreulich groß, d. h. 

die Schätzungen für die Koeffizienten der Prozessgleichung werden nicht wesentlich durch 

den Grad der Multikollinearität beeinflusst. 

Die Folge der Prozessgleichungen für die Produktvariable, in der Tabelle 5.11.6 zusammengestellt, 

nacheinander für die Abhängigkeit nur von X 1 , dann in Abhängigkeit von X 1 

und X 2 und dann von X 1 , X 2 und X 3 zeigen , dass die multiplen Korrelationskoeffizienten 

für die Produktvariable Y in Abhängigkeit von den Prozessvariablen mit zunehmender 

Information durch die größer werdende Anzahl von Prozessvariablen größer werden und 

die bedingten Standardabweichungen die gegensätzliche Tendenz aufweisen.


273 

Tabelle 5.11.6: Folge der Prozessgleichungen für die zunehmende Anzahl von Prozessvariablen 

Absolutglied 

X 1 X 2 X 3 R 2 Y/X S Y/X F-Wert 

Koeffizienten 15,41 0,2105 – – 0,6861 0,4683 292,9 

t-Test 25,07 17,11 

Koeffizienten 14,56 0,1583 0,0024 – 0,8774 0,2938 475,9 

t-Test 37,3 18,6 14,4 

Koeffizienten 18,30 0,1481 0,0017 –0,6198 0,9865 0,09788 3213 

t-Test 105,7 51,84 28,2 32,6 

Betrachten wir die Prozessgleichung für Y in Abhängigkeit von X 1 allein, dann ist das 

Maß der Beherrschbarkeit 0,686 und die bedingte Standardabweichung ist s Y/X = 0,468. 

Betrachten wir Y in Abhängigkeit von X 1 , X 2 und X 3 dann ist das Maß der Beherrschbarkeit 

R 2 Y/X = 0,986 und die bedingte Standardabweichung ist s Y/X = 0,09788. 

Für die Prozessgleichungen in der Anwendung bedeutet die Anforderung, dass das Maß 

der Beherrschbarkeit größer als 0,9 sein soll keine Utopie, sondern lediglich die verschärfte 

Suche nach Input- und Prozessvariablen, die einen Einfluss auf den oder die Produktvariablen 

haben. 

Als Prozessverbesserung definierten wir 

• 

• 

die Reduktion der Variabilität der Produktvariablen und 

die Steuerung des Prozesses mit der Prozessgleichung, so dass simultan alle relevanten 

Kundenanforderungen erfüllt werden. 

Diese beiden Anliegen werden durch die Abbildung 5.11.2 und Abbildung 5.11.3 verdeutlicht. 

28 

27 

26 

Y 

25 

24 

24.5 25.0 25.5 26.0 26.5 27.0 27.5 

Fitted : X1 

Abb. 5.11.2: Streuung der Messwerte für Y um die Prozessgleichung mit einer Prozessvariablen


28 

27 

26 

Y 

25 

24 

24 25 26 27 28 

Fitted : X1 + X2 + X3 

Abb. 5.11.3: Messwerte für Y um die Prozessgleichung mit drei Prozessvariablen 

Diese beiden Abbildungen zeigen deutlich, dass sich die Suche nach der erschöpfenden 

Anzahl von Input- und Prozessvariablen lohnt. 

5.11.2.2 Das multivariate, multiple, lineare Modell mit stochastischen Input- und 

Prozessvariablen 

Jedes Produkt wird durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben. Folglich 

benötigen wir ein Modell, in dem Y ein Vektor von Produktvariablen ist, der durch Linearkombinationen 

in den Input- und Prozessvariablen erklärt werden soll. In diesem Fall betrachten 

wir die Zerlegung der Kovarianzmatrix 

⎛ΣYY 

ΣYX 

⎞ 

Σ = ⎜ 

⎝Σ 

Σ ⎟ 

⎠ 

XY 

und damit das Modell 

XX 

Y = β 0 + β T Y/X X + F Y/X , 

wobei 

F Y/X ~ N (0, Σ YY/X ) der Vektor der Fehler, β T Y/X = Σ YX Σ–1 XX die Matrix der unbekannten Koeffizienten 

des Systems der Prozessgleichungen und 

F Y/X = Y – β T Y/X X ~ Σ YY/X 

ist. Die bedingte Kovarianzmatrix Σ YY/X wird nach der Beziehung 

berechnet. 

−1 

YY / X = YX ⋅ XX ⋅ XY 

Σ Σ Σ Σ


275 

Beispiel 5.11.4: Multivariates multiples Modell mit zwei Produkt- und zwei 

stochastischen Prozessvariablen. Bedingte Kovarianz und bedingte Erwartungswerte 

Für zwei Produkt- und zwei Input- und Prozessvariablen soll das multivariate multiple 

lineare Modell mit stochastischen Input- und Prozessvariablen ausführlich aufgeschrieben 

werden. Mit der Zerlegung der Kovarianzmatrix in die Elemente 

⎛ 

2 

σ ⎞ 

Y σ 

1 Y1Y σ 

2 Y1.1 σY 

1.2 

⎜ 

⎟ 

2 

⎛ΣYY ΣYx ⎞ ⎜ σY σ ⎟ 

2 Y2.1 σY 

2.2 

Σ = ⎜ ⎟ = ⎜ ⎟ 

⎝ Σ XX ⎠ 

2 

⎜ 

σ1 σ12 

⎟ 

⎜ 

2 ⎟ 

⎝ 

σ ⎠ 

erhalten wir die Matrix der bedingten Erwartungswerte und die bedingte Kovarianzmatrix 

2 

und 

−1 

Y. X XX X Y / X X 

E [ Y/ X] = Σ Σ ( X − μ ) = : Β ( X − μ ) 

−1 

. . / 

var( Y/ X) = ΣYY − ΣY X ΣXX ΣX Y = ΣYY X 

Schreiben wir diese Ausdrücke ausführlich auf, dann erhalten wir 

2 

⎛σY 

1.1 σY 

1.2 ⎞ 1 ⎛ σ2 −σ ⎞ 

12 ⎛X1 − μ1⎞ 

E [ Y/ X] 

= ⎜ 2 2 2 

σ 2 

Y2.1 σ 

⎟ ⎜ 

⎟ ⋅ 

Y2.2 σ1 σ2 (1 ρ12) 

⎜X 

12 1 2 μ ⎟ 

⎝ ⎠ ⋅ − ⎝−σ σ ⎠ ⎝ − 2 ⎠ 

⎛ 

2 2 

σY 1.1 σ2 − σY 1.2σ12 − σY 1.2σ12 + σ1 σ ⎞ 

Y1.2 

⎜ 2 2 2 2 2 2 ⎟ 

σ1 ⋅σ2 (1 − ρ12) σ1 ⋅σ2 (1 − ρ12) 

= 

⎜ ⎟ ⎛X1 − μ1⎞ 

⋅ 

⎜ 2 2 2 

σY 2.1 σ2 − σY 2.1 σ2 σY 2.2σ1 − σY 

2.1 σ 

⎟ ⎜ 

⎝X 

12 

2 − μ ⎟ 

2⎠ 

⎜ 2 2 2 

2 2 2 

⎝ σ1 ⋅σ2 (1 − ρ12) 

σ1 ⋅σ2 (1 − ρ12) 

⎟ 

⎠ 

⎛βY 

1.1/ 2 βY 

1.2 /1 ⎞ ⎛X1 − μ1⎞ 

= ⎜ 

βY 

.1/ 2 β 

⎟ ⋅ ⎜ 

Y .2 /1 X2 μ ⎟ 

⎝ 

⎠ ⎝ − 2 ⎠ 

2 2 

Formt man einen Regressionskoeffizienten, z. B. den ersten aus der Matrix der Regressionskoeffizienten 

unter Verwendung der Korrelationskoeffizienten um, dann erhält man 

β 

2 

ρY − 

1.1 σY σ 

1 2 ρY 1.2 σY σ 

1 2 ρ12 σ1 σ2 ρY 1.1/2 

σY 

1 

= = 

σ ⋅σ (1 − ρ ) σ ⋅(1 − ρ ) 

Y1 

.1/2 2 2 2 2 

1 2 12 1 12 

einen Quotienten mit dem partiellen Korrelationskoeffizienten im Zähler. Hieraus erklärt 

sich der Sprachgebrauch partieller Regressionskoeffizient. Ähnliche Umformungen der 

bedingten Kovarianzmatrix liefern 

⎛ 

2 

σ 

⎞ 

Y1 / X σY 1Y2 

/ X 

var( Y/ X) = . 

⎜ 

2 

⎝ σ / 

⎟ 

Y X ⎠ 

2


Gibt es auch für das multivariate multiple Modell ein Maß der Beherrschbarkeit? 

Ja, für das multivariate multiple Modell zur Berechnung des Systems der Prozessgleichungen 

benötigen wir ein verallgemeinertes Maß der Beherrschbarkeit. Diese i st der multivariate, 

multiple Korrelationskoeffizient 

wobei 

2 

ΣYY 

/ X 

τY 

/ X= 1 − , 

Σ 

Σ 

und 

Σ 

YY 

YY / X 

YY 

die Determinanten der bedingten bzw. unbedingten Kovarianzmatrix der Produktvariable 

sind. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit zwischen dem Vektor der 

Produktvariablen und dem System der Prozessgleichungen. 

Beispiel 5.11.5: Multivariates multiples Modell mit zwei Produkt- und zwei 

stochastischen Prozessvariablen. Multivariater multipler Korrelationskoeffizient 

Für das Beispiel 16 kann man den multivariaten, multiplen Korrelationskoeffizienten 

umformen. Man erhält: 

τ 

2 

σY σ 

1 Y1Y2/ 

X 

2 

Y / X= 1− 2 2 2 2 

Σ 

σ 

/ 

YY − 

1 2/ X σ 

YY X 

Y2/ X σY 1/ X σY 2/ X σY 1Y2/ 

X 

= 1− = 1− 

Σ 

2 

YY σ 

2 2 − 

Y σ 

1 Y1Y 

σ 

2 

Y σ 

1 Y σ 

2 Y1Y2 

2 

σY 

2 

2 2 

(1 − ρY − 

1/ X) (1 ρY 1Y2/ 

X) 

= 1 − 

2 

(1 − ρ ) 

YY 1 2 

Für m = 1 ist τ 2 Y/X gleich ρ2 Y/X . 

τ 2 Y/X gibt also auch an, wie gut die verallgemeinerte Varianz des Vektors der Produktvariable 

durch die Kovarianzmatrix der Input- und Prozessvariable erklärt wird. 

5.11.3 Statistische Modelle mit stochastischen Input- und 


Die statist ischen Modelle sehen sehr ähnlich wie die theoretischen Modelle aus. Der Unterschied 

besteht darin, dass anstelle der Zufallsgrößen zufällige Stichprobenvektoren, anstelle der 

zufälligen Vektoren zufällige Stichprobenmatrizen stehen und anstelle der Modellparameter 

die statistischen Schätzungen stehen. 

Aus den verschiedenen Modellen erkennt man, dass das lineare Modell mit festen Input- und 

Prozessvariablen das bedingte Modell des entsprechenden Modells mit stochastischen Inputund 

Prozessvariablen ist. Diese Feststellung ist bedeutsam für die Ableitung der Schätzfunktionen.


277 

Welche Ziele können mit den linearen Modellen erreicht we rden? 

Das statistische lineare Modell mit stochastischen Input- und Prozessvariablen liefert uns 

• die notwendige Prozessgleichung. Damit können die Produktvariablen zielgerichtet über 

die Input- und Prozessvariablen so gesteuert werden, dass 

– 

– 

simultan alle Kundenanforderungen erfüll und 

die Varianzen der Produktvariablen reduziert werden können. 

• An die Stelle der Streuung der Produktvariablen tritt die bedingten Streuung der Produktvariablen 

unter der Bedingung, dass die Input- und Prozessvariablen realisiert sind, d. h. 

als Messwerte vorliegen. 

Die Bedeutung dieses zweiten Faktes zeigt uns noch einmal die Abbildung 5.11.4. Diese Bedingung 

ist Ausdruck der Wirkungsweise des Ursache-Wirkungs-Prinzipes und bezieht die 

Informationsmenge ein, die durch die Wirkung der Input- und Prozessvariablen gegeben ist. 

Die bedingte Varianz σ 2 Y/X ist stets kleiner oder gleich der unbedingten Varianz σ2 Y für die 

Produktvariable Y. Das folgt sofort aus der Formel 

2 2 2 

Y / x Y Y / x 

σ = σ ⋅(1 − Ρ ) 

in der P 2 Y/x der multiple Korrelationskoeffizient zwischen einer Produktvariablen Y und der 

Prozessgleichung ist. 

Produktvariable Y 

obere Toleranz 

Sollwert 

untere Toleranz 

Prozessvariable X 

Abb. 5.11.4: Vergleich der Breiten der Verteilung der Produktvariablen Y und der bedingten Verteilung 

von Y unter X


5.11.4 Wie kann man die Schätzungen für die unbekannten 

Modellparameter für die Modelle mit stochastischen Input- und 

Prozessvariablen gewinnen? 

Das Modell mit stochastischen Input- und Prozessvariablen wurde aus der gemeinsamen multivariaten 

Verteilung für die Produkt-, Prozess- und Inputvariablen abgeleitet. Zu diesem Zweck 

haben wir angenommen, dass der Vektor mit allen Komponenten multivariat normalverteilt 

ist, oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Das bedeutet aber, dass die 

analytische Form der Verteilungsdichte bekannt ist. Andererseits haben wir immer wieder darauf 

hingewiesen, dass die unbekannten Modellparameter nur mit Hilfe einer Stichprobe geschätzt 

werden können. Eine Stichprobe besteht aus N unabhängigen „Beobachtungsvektoren“ für den 

Vektor der Produkt-, Prozess- und Inputvariablen. 

Damit können wir die sogenannte Likelihood Funktion als Produkt der Verteilungsdichten 

N 

2 2 

Y / X Y / X = ∏ i i Y / X Y / X 

i= 

1 

L( β , σ ) f [( y , x ); β , σ ] 

an den Stellen der Beobachtungsvektoren aufschreiben und diesen Ausdruck mit den bekannten 

Werten für die Input-, Prozess- und Produktvariablen als Funktion der unbekannten Modellparameter 

auffassen. Die Maximierung der Likelihood Funktion liefert Schätzungen für die 

unbekannten Modellparameter. 

Auch das ist ein heuristisches Prinzip. Es liefert aber praktisch vernünftige Schätzfunktionen 

für die unbekannten Modellparameter. 

Wir haben die Stichprobe 

⎛ X11 … X1n 

Y11 … Y1 

m ⎞ 

⎜ X ⎟ 

21 … X2n 

Y21 … Y2m 

⎜ 

⎟ 

⎜ … 

… 

⎟ 

( XY , ) = ⎜ ⎟ 

⎜ 

⎟ 

⎜XN−1.1 … XN−1. n YN−1.1 … YN−1. 

m⎟ 

⎜ 

⎟ 

⎝ X … X Y … Y ⎠ 

N1 Nn N1 

Nm 

für den multivariaten, multiplen Fall. Die Maximum Likelihood Methode liefert uns die 

Schätzfunktionen 

⎛ 

( X , Y ) 

X Y 

N 

N 

T T 1 T 1 T 

= ⎜ ⋅∑ 

i ⋅∑ 

i 

⎝N 

i= 1 

N 

i= 

1 

für den Mitt elwertvektor. Für die Schätzfunktion gilt 

⎛X 

⎞ ⎡⎛μ ⎞ ⎛ ⎞⎤ 

X 1 ΣXX ΣXY 

⎜ ⎟ ∼ Nn+ 

m⎢⎜ ⎟, 

⋅ ⎜ ⎟⎥ 

⎝Y 

⎠ ⎢⎝μ 

⎠ N ⎝ Σ ⎠ 

⎣ Y 

YY ⎥⎦ 

Außerdem erhalten wir die Schätzfunktion 

N 

∑ 

A = ( V − V) ( V − V), 

i= 1 

i 

T 

i 

⎞ 

⎟ 

⎠


279 

für die Kovarianzmatrix, wobei wir der Einfachheit halber die Input-, Prozess- und Produktvariablen 

in V zusammengefasst haben. Die Schätzfunktion A für die Kovarianzmatrix ist Wishart 

verteilt, mit N – 1 FG und dem Verteilungsparameter Σ. Hierfür schreiben wir abkürzend 

A ~ W n + m (N – 1, Σ). 

Die Schätzfunktionen für den Vektor der Erwartungswerte und die Kovarianzmatrix sind 

unabhängig voneinander. Die Stichprobenmatrix A wird analog zu Σ in 

⎛ 

2 T 

A ⎞ 

Y AY. 

X 

A = ⎜ ⎟ 

⎝ A ⎠ 

XX 

zerlegt. 

Mit diesen Größen können wir die Schätzfunktionen für die unbekannten Koeffizienten in den 

Prozessgleichungen und die unbekannten bedingten Varianzen (Restvarianzen) aufschreiben. 

Wir erhalten 

B 

T −1 

Y/X = Axx 

⋅ AY . x 

B 

T 

0 = Y − BY/X 

x 

1 −1 

1 T 

1 

SYY / X = ( AYY − AYX ⋅AXX ⋅ AXY) = ( AYY 

− BY/X ⋅AXX ⋅ BY / X) = ⋅AYY / X. 

N N N 

Am Beispiel des Plastikgehäuses für den Akku-Bohrschrauber wollen wir alle Schritte ausführlich 

demonstrieren. 

Beispiel 5.11.6: Akkubohrschrauber. Statistische Prozessanalysen 

Das Problem 

Bei der M ontage des Akku-Bohrschraubers treten Probleme auf. Diese wurden erstmals 

bei der Durchführung einer Montagezeitstudie mit MOST (Maynards Operation Sequence 

Technique) deutlich. Als Ursachen hierfür wurden Qualitätsmängel an den Plastikschalen 

für den Bohrschrauber erkannt. Einige Schalen ließen sich gut, andere weniger gut montieren. 

Für das Plastikgehäuse eines Akku-Bohrschraubers in der Abbildung 5.11.1 wurde 

daraufhin ein Produktaudit durchgeführt. Die Daten für die Prozess- und Produktvariablen 

sind in der Datei 05.11.6 Akkubohrschrauber im Internet enthalten. 

Zu diesem Zweck werden das Plastikschalen durch die Produktvariablen 

Y 1 = Thermoschrumpf in [%] 

Y 2 = Abweichung in axialer Richtung [mm] 

Y 3 = Abweichung von der Parallelität [mm] 

Y 4 = Dicke [mm] 

parametrisiert. Das ist eine Auswahl und diese erhebt nicht den Anspruch auf Vollständigkeit. 

Die gegebenen Toleranzen der Tabelle 5.2.1 wurden mit der statistischen Tolerierung überprüft. 

Die statistischen Toleranzen sind in der Tabelle 5.2.4 zusammengestellt.


Abb. 5.11.5: Akku-Bohrschrauber 

Problemdefinition 

Das Problem wird mit den uniund multivariaten Prozessfähigkeitsindizes aus dem Abschnitt 

5.2. definiert. Es gilt MC pk = 0,73 mit den berechneten statistischen Toleranzen. Da 

dieser Wert kleiner als eins ist, muss der Prozess verbessert werden. 

Problemlösung 

Die Verbesserung der Produktqualität ist nur durch die Steuerung des Herstellungsprozesses 

mit einer Prozessgleichung möglich. Daher müssen wir eine umfassende statistische 

Prozessanalyse durchführen, die wesentlichen Input- und Prozessvariablen auswählen und 

die Prozessgleichungen für die Produktvariablen berechnen. 

Statistische Prozessanalyse 

Der Herstellungsprozess für die Plastikgehäuse wird durch die Input- und Prozessvariablen 

X 1 = Friktion im Extruder (Reibungszahl µ, dimensionslos) 

X 2 = Heiztemperatur [°C] 

X 3 = Masse – Volumen – Index (mvi) 

X 4 = Dichte 

X 5 = Massetemperatur [°C] 

beschrieben. Auch das ist nur eine Auswahl. 

Modellierung 

Das multivariate multiple lineare Modell hat das Aussehen 

Y 1 = β 0.1 + β Y1.1/2, 3, 4, 5 X 1 + β Y1.2/1, 3, 4, 5 X 2 + β Y1.3/1, 2, 4, 5 X 3 + β Y1.4/1, 2, 3, 5 X 4 + β Y1.5/1, 2, 3, 4 X 5 



Y 4 = β 0.4 + β Y4.1/2, 3, 4, 5 X 1 + β Y4.2/1, 3, 4, 5 X 2 + β Y4.3/1, 2, 4, 5 X 3 + β Y4.4/1, 2, 3, 5 X 4 + β Y4.5/1, 2, 3, 4 X 5 .


281 

Die Matrix der Prozessgleichungskoeffizienten wurde nach der Beziehung 

−1 

Y / X= 

Y. 

X XX 

Β Σ Σ 

erhalten, wobei diese Matrizen aus der Zerlegung 

⎛σ σ σ σ σ σ σ σ σ 

⎜ σ σ σ σ σ σ σ σ 

⎜ 

⎜ 

σ σ σ σ σ σ σ 

⎜ 

σ σ σ σ σ σ 

⎛ΣYY 

ΣYX 

⎞ ⎜ 

Σ = ⎜ ⎟ = ⎜ 

σ σ σ σ σ 

⎝ Σ XX ⎠ ⎜ 

⎜ 

σX2X2 

σX 

σ σ 

⎜ 

σ σ σ 

⎜ 

⎜ 

σ σ 

⎜ 

⎝ 

σ 

Y1Y1 Y1Y2 Y1Y3 Y1Y4 Y1X1 Y1X2 Y1X3 Y1X4 Y1X5 

Y2Y2 Y2Y3 Y2Y4 Y2X1 Y2X2 Y2X3 Y2X4 Y2X5 

Y3Y3 Y3Y4 Y3X1 Y3X2 Y3X3 Y3X4 Y3X5 

stammen. Die bedingte Kovarianzmatrix wird nach der Gleichung 

−1 

YY / X = YY − YY . X XX X. 

YY 

Σ Σ Σ Σ Σ 

Y4Y4 Y4X1 Y4X2 Y4X3 Y4X4 Y4X5 

X1X1 X1X2 X1X3 X1X4 X1X5 

2X3 X2X4 X2X5 

X3X3 X3X4 X3X5 

X4X4 X4X5 

X5X5 

berechnet. In den linearen Modellen sind die Modellparameter B Y/X und Σ YY/X unbekannt. 

Diese müssen aufgrund einer Stichprobe geschätzt werden. 

Die Korrelationsmatrix hierfür ist 

⎞ 

⎟ 

⎟ 

⎟ 

⎟ 

⎟ 

⎟ 

⎟ 

⎟ 

⎟ 

⎟ 

⎟ 

⎟ 

⎠ 

Tabelle 5.11.7: Korrelationsmatrix für den Akku-Bohrschrauber 

Y 1 Y 2 Y 3 Y 4 X 1 X 2 X 3 X 4 X 5 

Y 1 1 0,036 –0,457 –0,102 –0,136 0,414 0,275 –0,41 0,224 

Y 2 1 0,417 –0,042 –0,113 0,081 –0,332 0,108 –0,132 

Y 3 1 0,355 –0,133 –0,151 –0,236 0,2 –0,285 

Y 4 1 0,387 0,272 0,045 0,257 0,032 

X 1 1 0,561 0,346 –0,108 0,319 

X 2 1 0,447 –0,371 0,547 

X 3 1 –0,878 0,838 

X 4 1 –0,782 

X 5 1 

Diese Korrelationsmatrix entspricht der Zerlegung der Gesamtkorrelationsmatrix R in 

die Blöcke 

⎛RYY 

RYX 

⎞ 

R = ⎜ 

⎝R 

R ⎟ 

⎠ 

XY 

XX


R YY = Korrelationsmatrix der Produktvariablen, 

R YX = Korrelationsmatrix zwischen den Produkt- und Prozessvariablen, 

R XX = Korrelationsmatrix der Prozessvariablen. 

Aus der Korrelationsmatrix R YY lesen wir ab, dass die Korrelationskoeffizienten der Produktvariablen 

Y 1 mit Y 3 und der Produktvariablen Y 2 mit Y 3 statistisch gesichert von null 

verschieden sind. 

Aus der Matrix R YX lesen wir ab, dass X 2 mit Y 1 und X 4 mit Y 1 korreliert ist. 

Aus R XX lesen wir ab, dass X 3 mit X 4 , X 3 mit X 5 und X 4 mit X 5 hoch korreliert sind und X 1 

mit X 2 , X 2 mit X 3 , und X 2 mit X 5 korreliert sind. Die Größen der Korrelationskoeffizienten 

entsprechen den Erwartungen der Experten. 

Das globale Maß für die Abhängigkeitsstruktur des Plastikgehäuses ist 

det(R) = 0.0007809236. 

Dieser Wert ist sehr klein, d. h. die Abhängigkeitsstruktur ist eng. 

Für später ist es notwendig zu wissen, ob die Produktvariablen, die Prozessvariablen oder 

die Produkt- mit den Prozessvariablen stark miteinander korreliert sind. Zu diesem Zweck 

berechnen wir die entsprechenden Determinanten der Korrelationsmatrizen. Es gilt 

det(R YY ) = 0.4894116, 

d. h. das globale Maß für die Straffheit der Abhängigkeitsstruktur der Produktvariablen ist 

groß, d. h. die Produktvariablen hängen nur gering voneinander ab. 

det(R XX ) = 0.02383498, d. h. die Prozessvariablen hängen stark voneinander ab. 

Grafische Abbildungen für das Gehäusebeispiel: 

Star Plots für die Produktvariablen in Abbildung 5.11.6 

Ein Star Plot ist eine ideale Darstellung für einen multivariaten Datensatz, z. B. für ein Produkt, 

aber auch für ein Produkt in Abhängigkeit von seinen Input- und Prozessvariablen. 

Jeder Stern visualisiert z. B. ein Produkt. 

Jeder Stern besteht aus einer Anzahl von Strahlen, die vom Mittelpunkt aus gezeichnet 

werden. Jeder Strahl repräsentiert eine Variable. Auf jeden Strahl wir ein spezieller „Relativwert“ 

für den entsprechenden Wert der Variablen aufgetragen. Werden z. B. die Gehäuse 

durch star plots visualisiert, dann entspricht der Strahl in der 3 00 Position der 1. Produktvariablen 

Y 1 = Thermoschrumpf. Der 2. Strahl entgegen dem Uhrzeigersinn entspricht 

der 2. Produktvariablen usw. Der kürzeste Strahl entspricht dem kleinsten Wert einer 

Produktvariable, der größte dem größten. 

Die Achsen der Star Plots sind in den Schlüssel der Abbildung 5.11.7 bezeichnet. 

Die N = 113 Star Plots sind sehr verschieden. Betrachtet man z. B. die Stars für die Produkte 

2 und 19, dann kann man sich kaum vorstellen, dass diese Produkte gleich sein sollen. Auf 

diese Art findet man viele sehr Paare von verschiedenen Stars. Pauschal kann man sagen, 

dass die Produkte, beschrieben durch die vier Produktvariablen hinsichtlich eines jeden 

Parameters stark streuen. 

Eine andere ganz wichtige Abbildung ist das Korrelationsdiagramm. Die Zusammenfassung 

mehrerer Korrelationsdiagramme nennt man Draftsman Plots. Diese Darstellungen sind 

sehr wichtig, da die paarweisen Abhängigkeit visualisiert werden.


283 

111 112 113 

100 101 102 103 104 105 106 107 108 109 110 

89 90 91 92 93 94 95 96 97 98 99 

78 79 80 81 82 83 84 85 86 87 88 

67 68 69 70 71 72 73 74 75 76 77 

56 57 58 59 60 61 62 63 64 65 66 

45 46 47 48 49 50 51 52 53 54 55 

34 35 36 37 38 39 40 41 42 43 44 

23 24 25 26 27 28 29 30 31 32 33 

12 13 14 15 16 17 18 19 20 21 22 

1 2 3 4 5 6 7 8 9 10 11 

Abb. 5.11.6 : Star Plots für die Produktvariablen 

AXIALITY 

PARALLEL 

THERMOSHR 

THICKNESS 

Abb. 5.11.7: Schlüssel für die Star Plots 

Draftsman Plots 

Die draftsman Plots (Abbildung 5.11.8) zeigen, dass die vier Produktvariablen nicht unabhängig 

voneinander sind. Die stärkste Abhängigkeit finden wir zwischen den Produktvariablen 

Parallelität und Thermoschrumpf. Diese Abhängigkeit ist negativ. 

Jedes Korrelationsdiagramm wird durch einen Korrelationskoeffizienten quantifiziert.


AXIALITY 

PARALLEL 

THICKNESS 

THERMOSHR 

AXIALITY 

PARALLEL 

Abb. 5.11.8: Draftman Plots für die Produktvariable des Gehäuses 

Häufigkeitsverteilungen 

Eine Häufigkeitsverteilung ist die grafische Darstellung der Verteilung der Werte einer 

Stichprobe für eine Variable. Diese Darstellung wird gern verwendet, um Hypothesen 

bzgl. der Verteilung einer Variablen aufzustellen, sofern diese nicht durch irgendwelche 

theoretischen Annahmen gefunden werden können. Die Häufigkeitsverteilungen liefern 

des weiteren eine erste Information darüber, ob der Stichprobenumfang ausreichend ist 

und ob die Anzahl der Klassen in Anhängigkeit davon klein genug gewählt wurde, über den 

mittleren Wert, die Streuung und über mögliche Ausreißer. Die Häufigkeitsverteilungen 

für das Gehäusebeispiel sind in der Abbildung 5.11.9 dargestellt. 

40 

Histogram for THERMOSHR 

40 

Histogram for AXIALITY 

frequency 

30 

20 

10 

frequency 

30 

20 

10 

0 

0 0,5 1 1,5 2 2,5 3 

THERMOSHR 

0 

-0,7 -0,3 0,1 0,5 0,9 

AXIALITY 

frequency 

40 

30 

20 

10 

Histogram for PARALLEL 

frequency 

40 

30 

20 

10 

Histogram for THICKNESS 

0 

-1,5 -0,5 0,5 1,5 2,5 

PARALLEL 

0 

2,8 2,9 3 3,1 3,2 3,3 3,4 

THICKNESS 

Abb. 5.11.9: Häufigkeitsverteilungen für die Produktvariablen


285 

Diese vier Häufigkeitsverteilungen zeigen, dass bzgl. aller vier Produktvariablen die Verteilungshypothese 

H 0 : „die Produktvariable sind normalverteilt“ formuliert werden kann. 

Die H 0 kann mit verschiedenen Tests geprüft werden. 

Hier wurden der χ 2 -Test, der Test von Shapiro-Wilks (W) und der Kolmogorov-Smirnov- 

Test (DN) angewandt. 

Die berechneten Teststatistiken und Irrtumswahrscheinlichkeiten p dieser Anpassungstests 

sind in der Tabelle 5.4.4 zusammen gefasst: 

Tabelle 5.11.8: Ergebnisse der Anpassungstests 

χ 2 p W p DN p 

Thermoschrumpf 22.62 0.42 0.98 0.5 0.052 0.92 

Axialität 27.92 0.18 0.98 0.716 0.042 0.985 

Parallelität 13.76 0.909 0.983 0.668 0.0488 0.95 

Dicke 13.32 0.923 0.981 0.565 0.038 0.996 

Die Entscheidung über die Ablehnung oder Annahme der H 0 wird aufgrund der p-Werte 

getroffen. Da der kleinste p-Wert > 0.1 ist, können die H 0 mit Wahrscheinlichkeiten, die 

größer als 0.9 sind, nicht verworfen werden, d. h. die einzelnen Produktvariable sind, jeder 

für sich betrachtet, normal verteilt. 

3D Häufigkeitsverteilung 

Die 3D (3 dimensionale) Häufigkeitsverteilung fasst die Informationen der Häufigkeitsverteilungen 

für zwei Variable und des zugehörigen Korrelationsdiagramms zusammen. 

Eine 3D-Häufigkeitsverteilung ist demzufolge eine Häufigkeitsverteilung über einem 

Korrelationsdiagramm. In der Abbildung 5.11.10 ist die 3D Häufigkeitsverteilung für den 

Thermoschrumpf und die Dicke enthalten. 

Frequency 

10 

6 

2 

0 

0 

1 

2 

3 

2.8 

3 

3.2 

3.4 

Dicke 

Thermoschrumpf 

Abb. 5.11.10: 3D Häufigkeitsverteilung für den Akku-Bohrschrauber


Man erkennt aus dieser Darstellung, dass die Werte in der Ebene mit den Achsen Thermoschrumpf 

und Dicke in einem elliptisch umrissenen Gebiet liegen und das „Gebirge“ 

durch eine 2-dimensionale Normalverteilung angepasst werden kann. Man sieht aber auch, 

dass man für eine 3D Häufigkeitsverteilung mehr als die vorliegenden N = 113 Wertesätze 

benötigt, um ein klares Bild zu erhalten. 

Stichprobenkovarianzmatrix 

Die gesamte Stichprobenkovarianzmatrix für alle Variablen wurde in der Tabelle 5.11.9 


Tabelle 5.11.9: Stichprobenkovarianzmatrix für den Akku-Bohrschrauber 

Thermo Axialit Parallel Dicke Friktion Heiztemp. MVI Dichte Massetemp. 

Thermo 0,2249 0,00353 –0,10751 –0,00455 –0,0365 0,97655 0,4792 –0,005321 0,1211 

Axialit 0,04206 0,04239 –0,000809 –0,01316 0,08313 –0,2507 0,000605 –0,0309 

Parallel 0,24587 0,01653 –0,037465 –0,3723 –0,4309 0,002714 –0,16129 

Dicke 0,00882 0,020592 0,12701 0,01546 0,000659 0,003443 

Friktion 0,3215 1,584 0,72217 –0,001669 0,206865 

Heiztemp. 24,7719 8,19388 –0,05056 3,10952 

MVI 13,5408 –0,088371 3,523025 

Dichte 0,0007485 –0,024429 

Massetemp. 1,304455 

Die Berechnung der Schätzungen für B Y/X und Σ YY/X nach den obigen Formeln ergeben 

die Resultate: 

B 

⎛−0.38891 0.068 0.008913 −8.6534 −0.19371 

⎞ 

⎜ 0.02941 0.009073 −0.07755 −6.3397 0.04074 ⎟ 

= ⋅ = ⎜ 

⎟ 

⎜ − 0.04865 0.004145 − 0.001863 − 0.93452 − 0.13828 ⎟ 

⎜ 

⎝ 0.003045 0.0050539 0.02557 4.29743 0.001544⎟ 

⎠ 

T −1 

Y/X Axx 

AY . x 

T 

B0 = (29.022 1.602 22.272 − 3.927) 

und 

S 

YY / X 

⎛0.117493 −0.005757 −0.100668 0.001048 ⎞ 

⎜ 

0.027342 0.037235 0.00267 ⎟ 

= ⎜ 

⎟ 

⎜ 0.22503 0.018135 ⎟ 

⎜ 

⎝ 

0.00488349⎟ 

⎠ 

Aus diesen Ergebnissen kann man die Prozessgleichungen für die verschiedenen Produktvariablen 

zusammenstellen, so z. B. für Y 1 : 

Y 1 = 29.022 – 0.38891 X 1 + 0.068 X 2 + 0.008913 X 3 – 8.6534 X 4 – 0.19371 X 5


287 

Die Reststreuung ist die Quadratwurzel aus dem 1. Diagonalelement von S YY/X , d. h. 

0.117493 = 0.3428. 

Diese Resultate erhält man auch, wenn man die Prozessgleichung für jede Produktvariable 

einzeln berechnet. 

Das multivariate Maß der Beherrschbarkeit hatten wir bei der Betrachtung der Korrelationsanalyse 

berechnet. Es galt 

τ 

2 

Y / X 

ΣYY 

/ X 6.737213333 10^-7 

= 1 − = 1 − = 0.9329 

Σ 

1.004384604 10^-5 

XX 

d. h. die Variabilität der Produktvariablen wird zu ca. 93 % durch die Prozessvariablen 

erklärt. 

Prozessgleichungen für die einzelnen Produktvariablen im multivariaten, multiplen 

Modell 

Im multivariaten, multiplen Modell mit stochastischen Input- und Prozessvariablen erhält 

man einen Vektor von Prozessgleichungen, für jede Produktvariable eine. Das Problem 

besteht nun aber darin, dass der Prozess nur mit einer optimalen Teilmenge von Inputund 

Prozessvariablen gefahren werden kann. Das bedeutet, dass die globale Teilmenge an 

wesentlichen Input- und Prozessvariablen für die Vorhersagen gesucht werden muss. 

Tabelle 5.11.10: Prozessgleichungen für die einzelnen Produktvariablen 

Prozessgleichung f. Y1 

----------------------------------------------------------------------------- 

Dependent variable: Thermo 

----------------------------------------------------------------------------- 

Standard 

T 

Parameter Estimate Error Statistic P-Value 

----------------------------------------------------------------------------- 

CONSTANT 27,9028 10,1695 2,74377 0,0071 

Friktion -0,388912 0,0808537 -4,81007 0,0000 

Heiztemp 0,0679991 0,00925225 7,34947 0,0000 

MVI 0,00891195 0,0244504 0,36449 0,7162 

Dichte -8,65339 2,90976 -2,97392 0,0036 

Massetemp -0,193712 0,0581907 -3,32893 0,0012 

----------------------------------------------------------------------------- 

Analysis of Variance 

----------------------------------------------------------------------------- 

Source Sum of Squares Df Mean Square F-Ratio P-Value 

----------------------------------------------------------------------------- 

Model 12,0353 5 2,40707 19,57 0,0000 

Residual 13,159 107 0,122981 

----------------------------------------------------------------------------- 

Total (Corr.) 25,1944 112 

R-squared = 47,77 percent 

R-squared (adjusted for d.f.) = 45,3294 percent 

Standard Error of Est. = 0,350687 

Mean absolute error = 0,265689 

Durbin-Watson statistic = 2,22739



----------------------------------------------------------------------------- 

Dependent variable: Axialit 

----------------------------------------------------------------------------- 

Standard 

T 


----------------------------------------------------------------------------- 

CONSTANT 0,763646 4,90555 0,15567 0,8766 

Friktion 0,0294221 0,0390021 0,754373 0,4523 

Heiztemp 0,00907345 0,00446308 2,033 0,0445 

MVI -0,0775608 0,0117944 -6,57609 0,0000 

Dichte -6,34085 1,4036 -4,51755 0,0000 

Massetemp 0,0407386 0,0280699 1,45133 0,1496 

----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 

Model 1,64909 5 0,329818 11,53 0,0000 

Residual 3,06195 107 0,0286164 

----------------------------------------------------------------------------- 

Total (Corr.) 4,71104 112 





Durbin-Watson statistic = 1,83917 


----------------------------------------------------------------------------- 

Dependent variable: Parallel 

----------------------------------------------------------------------------- 

Standard 

T 


----------------------------------------------------------------------------- 

CONSTANT 21,7397 14,074 1,54467 0,1254 

Friktion -0,0486358 0,111897 -0,434649 0,6647 

Heiztemp 0,00414507 0,0128046 0,323719 0,7468 

MVI -0,00187052 0,033838 -0,0552787 0,9560 

Dichte -0,935801 4,02693 -0,232386 0,8167 

Massetemp -0,138288 0,0805324 -1,71717 0,0888 

----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 

Model 2,33505 5 0,46701 1,98 0,0870 

Residual 25,2033 107 0,235545 

----------------------------------------------------------------------------- 

Total (Corr.) 27,5384 112 







289 


----------------------------------------------------------------------------- 

Dependent variable: Dicke 

----------------------------------------------------------------------------- 

Standard 

T 


----------------------------------------------------------------------------- 

CONSTANT -3,48103 2,07271 -1,67946 0,0960 

Friktion 0,00302197 0,0164793 0,18338 0,8548 

Heiztemp 0,00505451 0,00188576 2,68036 0,0085 

MVI 0,0255782 0,0049834 5,13268 0,0000 

Dichte 4,29957 0,593056 7,24985 0,0000 

Massetemp 0,00155342 0,0118602 0,130978 0,8960 

----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 

Model 0,441305 5 0,088261 17,28 0,0000 

Residual 0,54664 107 0,00510878 

----------------------------------------------------------------------------- 

Total (Corr.) 0,987945 112 






Gewisse Unterschiede in den Ergebnissen resultieren z. T. aus Rundungsfehlern und insbesondere 

bei den Reststreuungen aus der Tatsache, dass ich S YY/X aus 1/N A YY/X berechnet 

habe. Diese Schätzung ist nicht erwartungstreu. Die erwartungstreue Schätzung verwendet 

anstelle des Faktors 1/N den Faktor 1/(N – m). 

Die Güte des Ausgleichs kann aus 

• 

• 

der bedingten Standardabweichung (Reststreuung) und 

dem Maß der Beherrschbarkeit (multipler Korrelationskoeffizient R 2 Yj/X 

abgelesen werden. 

Für die Produktvariable Y 1 (Thermoschrumpf) liest man ab: 

s Y1/X = 0,3506 und R 2 Y1/X = 0.4532. Es gibt hier einen 2. Wert, der „R squared adjusted” 

genannt wird. Dieser Wert verwendet die erwartungstreue Schätzung für S 2 Y/X . 

Die Programme zur Berechnung der Prozessgleichungen gestatten noch das Zeichnen verschiedener 

Sachverhalte. Hier wollen wir nur schauen, wie gut die Residuen ε ˆ 

1 = ( 1 − ˆ 

i Yi Yi1) 

, 

i = 1, … N (Abweichungen der Messwerte von den berechneten Werten) durch eine Normalverteilung 

angepasst werden können. 

Die Abbildung 5.11.11 zeigt, dass die Residuen sehr gut durch eine Normalverteilung 

approximiert werden können.


49 

8 

Residuals 

-0.5 0.0 0.5 

60 

-2 -1 0 1 2 

Quantiles of Standard Normal 

Abb. 5.11.11: Residuen ε i1 für die Anpassung von Y 1 durch die Prozessgleichung über den 

Quantilen der Normalverteilung 

Es bleibt noch die Frage zu klären, wie die Auswahl der wesentlichen Input- und Prozessvariablen 

im multivariaten, multiplen Fall zu realisieren ist, denn Fakt ist ja, dass der Prozess nur 

mit einer optimalen Teilmenge von Input- und Prozessvariablen für alle Produktvariablen 

gesteuert werden kann. Die Antwort auf diese Frage wird bei der Lösung des Problems nach 

der Auswahl der wesentlichen Input- und Prozessvariablen gegeben. 

5.12 Welche Eigenschaften haben die Schätzungen für die 

unbekannten Modellparameter? 

Die Eigenschaften für diese Schätzfunktionen werden ste llvertretend für das multivariate, 

multiple Modell mit stochastischen Input- und Prozessvariablen aufgeschrieben. 

• 

• 

• 

• 

• 

• 

Sie sind: 

E[B Y/X /X] = E[B Y/X ] = β Y/X , 

d. h. die Schätzfunktion für die Matrix (Vektor) der unbekannten Koeffizienten der Prozessgleichung 

ist erwartungstreu. 

E[A YY/X /X] = E[A YY/X ] = Σ YY/X (N – n –1) 

cov(B Y/X /X) = A –1 

XX ⊗ Σ YY/X 

und cov(B Y/X ) = (N – n –1) –1 Σ –1 

XX ⊗ Σ YY/X 

{B (N) 

Y/X } N→∞ ist konsistent 

B Y/X und S YY/X sind unabhängig 

V(B Y/X /X) = N(B Y/X , A –1 

XX ⊗ Σ YY/X ) 

und die unbedingte Verteilung ist eine multivariate t-Verteilung.

5.12 Welche Eigenschaften haben die Schätzungen? 

291 

Die Beweise für diese Behauptungen findet man in Jahn [1991a]. 

Vorhersagen für die Werte der Produktvariablen 

Die Prozes sgleichung wird für die Steuerung des Prozesses gebraucht. Für die Input- und Prozessvariablen 

werden Werte eingesetzt und der oder die Werte für den oder die Produktvariablen 

werden ausgerechnet. Diesen Vorgang bezeichnen wir im linearen Modell als „Vorhersage“. 

Die vorhergesagten Werte für den oder die Produktvariablen streuen natürlich auch. Daher 

müssen wir den Vorhersagefehler berechnen. 

Wie kann man den Vorhersagefehler berechnen und wie groß ist der Fehler für diese 

Vorhersagen? 

Vorhersagen sind hier im Sinne der Extra- oder Interpolation des oder der Produktvariablen 

Y aufgrund der Kenntnis der Input- und Prozessvariablen gemeint. Wir betrachten die 

Vorhersage gleich für den Vektor von Produktvariablen Y. Für eine Produktvariable gelten 

dieselben Formeln. 

Den Vektor der Input- und Prozessvariablen, für den wir die „Vorhersage“ berechnen wollen, 

bezeichnen wir mit X E . Es muss selbstverständlich gelten, dass 

X E ~ N n (µ, Σ XX ) und X E ist unabhängig von X, d. h. von X 1 , …, X N . 

Mit diesem Vektor wird ̃ = ̃ 

T 

Y( XE) 

YE = B0 + BY / X ⋅ X E . 

Die Beurteilung der „Vorhersage“ erfolgt mit den bedingten und unbedingten Vorhersagefehlern. 

Der bedingte Vorhersagefehler ist 

und 

M E[( ̃ ) ( ̃ ) / , X ] MSEP ( ̃ /, ) 

U 

T 

Nn , = YE − YE ⋅ YE − YE X E = YE XE 

T −1 

= ΣYY / X ⋅ (1 + XE ⋅ AXX ⋅ XE) 

⎛ 

⎞ 

= − ̃ ⋅ − ̃ T 

= ̃ 

n 

E[( Y Y ) ( Y Y ) ] MSEP ( Y ) = Σ ⋅ ⎜1 + 

⎝ 

⎟. 

N − n −1⎠ 

N, n E E E E E YY / X 

Den Beweis kann man in Jahn [1991b] nachlesen. 

Der unbedingte Vorhersagefehler des linearen Modells mit stochastischen Input- und 

Prozessvariablen stimmt mit dem Vorhersagefehler des Modells mit festen Input- und 

Prozessvariablen überein. 

Beispiel 5.12.1: Bremsweg. Vorhersagen 

1. Beispiel zum Nachrechnen (05.11.3 Bremsweg) 

Die berechnete Prozessgleichung war 

Yˆ =− 27.151 + 1.078 ⋅x 

Fasst man auch die gefahrene Geschwindigkeit als Zufallsgröße auf, dann erhält man für 

dieses Demonstrationsbeispiel den unbedingten „Vorhersagefehler“ 

U 10,1 = 2.991 (1 + 1/8) = 3.3648


und damit die „Vorhersagestandardabweichung“ 

U 10,1 = 3.3648 = 1.83 

Wählt man für x E die Werte 45, 50 und 55, dann erhält man hierfür die „vorhergesagten“ 

Bremswege: 

Tabelle 5.12.1: „Vorhersagewerte“ für den Bremsweg bei einer Prozessvariablen und dem 

Stichprobenumfang N = 10. 

x E 

Vorhersage 

Konfidenzintervall 

ỸE 

unten 

oben 

45 21,3 17,7 24,9 

50 26,7 23,1 30,3 

55 32,1 28,5 35,7 

2. Beispiel aus dem Kapitel 1 (Datei 01.3.6 Bremsweg) 

Mit dem Programm Statgraphics Plus 7.0 oder SPLUSWIN erhält man die Prozessgleichung 

Y ˆ = − 10.0798 + 0.84465 ⋅ X − 2.18613 ⋅ X + 4.1934 ⋅ X 

1 2 3 

wobei 

X 1 = Geschwindigkeit [km/h] 

X 2 = Profiltiefe [mm] 

X 3 = Reaktionszeit [sec], anstelle des PKW-Gewichtes 

und die bedingte Varianz bzw. die bedingte Standardabweichung 

S 2 Y/X = 4.68432 und S Y/X = 2.1643. 

Der unbedingte Vorhersagefehler ist 

U 33,3 = 4.68432 [1 + 3 / (30 – 3 – 1)] = 5.2248 

und die unbedingte Vorhersage-Standardabweichung ist 

U 33,3 = 2.2858 . 

Das Maß der Beherrschbarkeit des Prozesses „Bremsen vor einem Hindernis“ ist R 2 Y/X 

= 0.8667, bzw. nach der Korrektur mit den Freiheitsgraden R′ 2 Y/x = 0.851318, wobei die 

Korrektur mit der Formel 

R′ 

N − 1 

= 1 − (1 − RY x), 

N − n −1 

2 2 

Y / x 

/ 

vorgenommen wird. Das Maß der Beherrschbarkeit besagt, ca. 86 % der Varianz des Bremsweges 

werden durch die drei Prozessvariablen X 1 (Geschwindigkeit), X 2 (Profiltiefe) und 

X 3 (Reaktionszeit) erklärt. Verwendet man das Maß der Beherrschbarkeit zur Berechnung 

der bedingten Varianz, dann erhält man 

S 2 Y/X = 31.50563 (1 – 0.851318) = 4.68432 und damit s Y/x = 2.1643. 

also denselben Wert für die bedingte Standardabweichung wie oben.


293 

Wie können Sie Hypothesen über die unbekannten Modellparameter prüfen? 

Die unbekannten Modellparameter sind im univariaten multiplen Modell mit stochastischen 

Input- und Prozessvariablen 

• 

• 

der Vektor der Koeffizienten der Prozessgleichung β Y/X und 

die bedingte Varianz σ 2 Y/X . 

Wir wollen Antworten auf die Fragen 

1. Welche Input- und Prozessvariable hat einen statistisch gesicherten Einfluss auf die Produktvariable? 

2. ist die bedingte Varianz statistisch gesichert kleiner als die Varianz der Produktvariablen 

Y? 

3. ist das Maß der Beherrschbarkeit statistisch gesichert größer als Null? 

Prüfung von Hypothesen über den Vektor der Koeffizienten der Prozessgleichung 

Di e Prüfung der Hypothese über den Vektor der Regressionskoeffizienten 

H 0 : β Y/X = 0 gegen die alternative Hypothese H 1 : β Y/X ≠ 0 mit dem F-Test 

T 

ˆ BY / X SXX BY / X N − n −1 

F = 

2 

S / ( n + 1) 

Y 

X 

und P ( Fˆ 

≤ F α /H 0) = 1− α , wobei Fˆ ∼ Fn+ 1, N−m−1( α ) wird durch das bekannte „finite 

intersection“ Prinzip auf die Prüfung der Einzelhypothesen H 0,j : β Y.j/n – j = β * Y.j/n – j gegen H 1 : 

β Y.j/n – j ≠ β * Y.j/n – j zurückgeführt, wobei β* Y.j/n – j gegeben sein möge. Die Teststatistik für eine 

bestimmte Input- oder Prozessvariable X j ist 

( β − B ) 

t = ⋅S ⋅ N − n − 1, j = 1, …, n. 

Y. j/ n−j Y. j/ n−j 

2 

j j / n− 

j 

sY 

/ X 

Oft wird einfach angenommen, dass β * Y.j/n – j = 0. 

Die t-Prüfstatistik kann auch mit der F-Statistik geschrieben werden. Es gilt 

2 2 2 

Y. j/ n−j Y / X Y / n−j 

2 jj 

SY / X S 

2 

1 − RY / X 

B ( N − n) ( R − R )( N − n) 

Fˆ = = 

, 

j 

wobei S jj die Diagonalelemente von S –1 

XX sind. Für diese gilt aber 

S 

−1 

XX 

⎧ 

2 2 −1 

j − j/ 

n− 

j 

= 

[ S (1 R )] , für alle j 1, …, 

n 

⎪ 

= ⎨ −Rjk / n- { j, 

k} 

⎪ 

, für jk , = 1, …, nj , ≠ k 

2 2 

⎪⎩ 

Sj Sk (1 − Rj/ n−j) (1 − Rk/ 

n−k) 

und 

2 2 2 

j − j/ n−j = j/ n−1 

[ S (1 R )] S .


Varianzanalyse für die berechnete Prozessgleichung 

Für die P rüfung der linearen Prozessgleichung, d. h. für die Prüfung der Hypothese, ob wenigstens 

eine Input- und/oder Prozessvariable einen statistisch gesicherten Einfluss auf die 

Produktvariable hat, wird die Varianzanalyse der 

Tabelle 5.12.2 durchgeführt. Diese Analyse basiert auf der Identität 

Y − Y = Y − Yˆ 

+ Yˆ 

− Y 

i i i i 

nach der die Abweichung einer Beobachtung der Produktvariablen Y i vom Mittelwert Y zerlegt 

wird in die Abweichung der Beobachtung Y i von dem mit der Prozessgleichung berechneten 

Wert Y 

î und die Abweichung Yî 

− Y der berechneten Werte vom Mittelwert. Werden die 

Abweichungen quadriert und über alle Beobachtungen summiert, so erhält man die Zerlegung 

der Summe der Abweichungsquadrate der Einzelwerte vom Mittelwert 

SAQ = ( Y − Y) 

gesamt 

N 

∑ 

i= 

1 

in die beiden Summanden 

i 

2 

1. Summe der Abweichungsquadrate der berechneten Werte vom Mittelwert, SAQ Modell = 

N 

ˆ 2 

( Y − Y ) und 

∑ 

i= 

1 

i 

2. die Summe der Abweichungsquadrate der einzelnen Beobachtungswerte von den berechneten 

Werten SAQ = ( Y − Y ˆ ) 

N 

2 

. 

Fehler 

∑ 

i= 

1 

i 

i 

Die Summen der Abweichungsquadrate werden in Varianztabelle Tabelle 5.11.1 zusammen 

gestellt. 

Tabelle 5.12.2: Varianztabelle für die „Güte“ der Prozessgleichung 

Variationsursache 

Summe 

der quadratischen 

Abweichungen 

FG 

Mittlere Summe 


Abweichungen 

F-Quotient 

Gesamt 

Modell 

N 

∑ 

i= 

1 

N 

∑ 

i= 

1 

2 

( Y − Y) 

N – 1 

i 

2 

( Yˆ 

− Y) 

m 

i 

N 

1 

∑ 2 

( Yi 

− Y) 

N − 1 

i= 

1 

Fehler 

N 

N 

2 2 

∑ ( Y − − ˆ 

i Y) ∑ ( Yi 

− Y) 

i= 1 i= 

1 

N 

2 

= ∑ ( Y − ˆ 

i Yi) 

i= 

1 

N – m – 1 

N 

∑ 

i= 

1 

N 

∑ 

i= 

1 

( Yˆ 

− Y) 

i 

2 

( Y − Yˆ 

) 

i 

2 

i 

= F 

Mit der Varianzanalyse kann man auch noch einmal die Bedeutung des Maßes der Beherrschbarkeit 

sehr klar erkennen.


295 

Beispiel 5.12.2: Bremsweg. Varianzanalyse 

Für das Beispiel erhalten wir mit den Daten aus der Datei 03.5.1 Bremsweg (im Internet) 

die Tabelle 5.12.3. 

Tabelle 5.12.3: Varianzanalyse für die Prozessgleichung 

Variationsursache 

Summe 


Abweichungen 

FG 

Mittlere Summe 


Abweichungen 

F-Quotient 

Gesamt 913,663 29 

Modell 791,871 3 263,957 

Fehler 121,7934 26 4,6843 56,35 

Der berechnete Wert des F-Testes ist sehr viel größer als der entsprechende Tafelwert 

F 0.05; 29,3 = 2.93, d. h. die Hypothese, dass die Varianz der Produktvariablen Y durch die 

Input- und Prozessvariablen nicht reduziert wird, muss mit sehr kleiner Irrtumswahrscheinlichkeit 

verworfen werden. 

Die Modellvarianz kann weiter zerlegt werden. Man erhält die weiterführende Tabelle 

5.12.4. 

Tabelle 5.12.4: Weiterführende Varianzanalyse 

Variationsursache Summe der quadratischen F-Quotient Wahrscheinlichkeit 

Abweichungen 

Modell 791,871 136,63 0,0000 

Geschwindigkeit 639,997 8,14 0,0084 

Profiltiefe 38,1208 24,28 0,0000 

Reaktionszeit 113,752 

Residuum 121,7927 

Aus dieser Varianztabelle kann man die Bedeutungen der einzelnen Input- und Prozessvariablen 

ablesen. Die Geschwindigkeit ist die wichtigste Prozessvariable. Dieser Parameter 

hat den größten F-Wert und die kleinste Irrtumswahrscheinlichkeit. 

Die „Vorhersagen“ mit diesem statistischen Modell sind in der Tabelle 5.2.15 enthalten 

Tabelle 5.12.5: Vorhersagewerte und Vorhersageintervalle für den Bremsweg 

Werte X E für Input- und Prozessvariable Vorhersage V.-Intervall 

die Input- 

X E,1 X E,2 X E,3 ỸE 

45 2 1 27,7 [23,0; 32,5] 

50 2 2 32,0 [27,3: 36,6] 

55 2 1 36,2 [31,5; 40,8] 

Die Vorhersagen mit dem ausführlicheren Modell unterscheiden sich von denen, die mit 

dem einfachen Modell gewonnen wurden. Das ist aber klar, denn in dem ausführlicheren 

Modell steckt sehr viel mehr Information.


5.13 Einfluss der Multikollinearität auf die Schätzfunktionen 

In vielen Arbeiten, so z. B. in Johnston [1963], Mason [1975], Harvey [1981], Gunst [1983], 

Sen and Srivastava [1990] usw. wird der Einfluss der Multikollinearität auf die Schätzfunktionen 

im linearen Modell studiert. Dabei begnügen sich die Autoren häufig mit einer intuitiven 

Darstellung des Einflusses der Multikollinearität. Wir wollen hier speziell den Einfluss auf die 

Prozessgleichung studieren und ein quantitatives Maß für die Multikollinearität verwenden, 

um zu erkennen, wie groß der Einfluss der Multikollinearität ist. 

Was ist die Multikollinearität? 

Wie können wir die Multikollinearität messen? 

Nach Anderson [1984] wird die Variabilität eines zufälligen Vektors X durch die verallgemeinerte 

Varianz Σ XX beurteilt. Gleichzeitig gilt aber Σ XX = 0 , wenn mit der Wahrscheinlichkeit 1 

lineare Abhängigkeiten zwischen den Input- und/oder Prozessvariablen vorkommen. Hieraus 

folgt schon, dass der Begriff verallgemeinerte Varianz viel zu eng gefasst ist, wenn es um den 

Grad der Multikollinearität geht, denn durch die Determinante werden sowohl die Varianzen 

als auch die Abhängigkeitsstruktur erfasst. 

Definition der Multikollinearität: Die Straffheit der Abhängigkeitsstruktur zwischen den 

Input- und Prozessvariablen wird Multikollinearität genannt und durch die Determinante der 

Korrelationsmatrix beurteilt. Für die Determinante der Korrelationsmatrix R XX gilt 

und 

Σ 

= R ⋅∏σ 

2 

XX XX j 

j= 

1 

n 

R 

XX 

⎧⎪ 1, falls ρjk 

= 0, für alle jk , = 1, …, nj , ≠ k 

= ⎨ 

⎪⎩ 

0, falls wenigstens ein ρjk 

= 1, für j ≠ k, j, k = 1, …, 

n 

Als Maß für die Multikollinearität verwenden wir daher 

δ = 

1 

R 

XX 

. 

Welchen Einfluss hat die Multikollinearität auf die Prozessgleichung und auf das Maß der 

Beherrschbarkeit? 

Im Netzwerk von betrieblichen Prozessen wurde deutlich ersichtlich, dass die Inputvariablen 

eines Prozesses die Produktvariablen eines Vorläuferprozesses sind. Ein Produkt wurde aber 

durch mehrere, nicht unabhängige Produktvariable charakterisiert. Der Vektor der Produktvariablen 

ist ein zufälliger Vektor. Der Vektor der Prozessvariablen ist in sehr vielen Fällen 

ebenfalls ein zufälliger Vektor. Hieraus folgte ja, dass zur Berechnung der Prozessgleichung das 

lineare Modell mit stochastischen Input- und Prozessvariablen zu verwenden ist. D. h. aber 

auch, dass die Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen, ausgedrückt 

durch deren Korrelations- oder Kovarianzmatrix, die Schätzfunktionen für die unbekannten 

Koeffizienten in den Gleichungen beeinflusst. Die Abhängigkeitsstruktur zwischen den Input- 

und Prozessvariablen kann sehr unterschiedlich sein. Einerseits kann diese durch einen


297 

großen Korrelationskoeffizienten zwischen zwei Parametern oder andererseits durch mäßig 

große Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen und deren 

unterschiedliche Vorzeichen geprägt sein. 

Diese Feststellungen führen auf drei Probleme, die im Rahmen der Multikollinearitätsproblematik 

beantwortet werden müssen. 

• 

• 

• 

Wie beeinflusst die Abhängigkeitsstruktur und damit die Multikollinearität die Schätzfunktionen 

für die unbekannten Koeffizienten und die bedingte Varianz? 

Wie kann die Abhängigkeitsstruktur beurteilt werden? 

Wie kann ein großer Grad der Multikollinearität korrigiert werden? 

In den meisten Schätzfunktionen für die unbekannten Modellparameter kommt die Inverse 

der Kovarianzmatrix vor. Folglich schreiben wir die Inverse elementeweise auf und erhalten 

die Darstellung 

A 

−1 

XX 

⎧ 

−2 2 −1 

Aj (1 − Rj/ 

n− 

j) , für alle j = 1, …, 

n 

⎪ 

−R 

j k n j k 

= ⎨ jk / m− 

j, 

k 

, für , 1, , , 

1 

= … 

⎪ ≠ 

⎡ 

2 2 2 2 

A (1 2 

j Ak − Rj/ n−j) ⋅(1 − Rk/ 

n−k) 

⎤ 

⎪ ⎩⎣ 

⎦ 

wobei R jk / n−( j, k) 

die Korrelationskoeffizienten der bedingten Verteilung von (X j , X k ) unter 

der Bedingung der restlichen Variablen (X 1 , …, X j – 1 , X j + 1 , …, X k – 1 , X k + 1 , …, X n ) d. h. die 

partiellen Korrelationskoeffizienten bezeichnen. [n – (j, k)] bezeichnet die Indexmenge der 

restlichen Variablen. 

Diese zeigt, dass mit zunehmender Strenge der Abhängigkeit innerhalb des Vektors der Inputund 

Prozessvariablen der multiple Korrelationskoeffizient zwischen einem beliebigen X j und 

einer Linearkombination in den restlichen Input- und Prozessvariablen R 2 j/n – j stets größer wird. 

Dadurch wird 1 – R 2 j/n – j immer kleiner und somit das Diagonalelement − − 

Aj 2 ⋅(1 − R 

2 j/ 

n− 

j) 

1 

von A –1 

XX immer größer. 

Für die globale Beurteilung der Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen 

benötigt man ein Maß. Zur Ableitung eines solchen betrachtet man den bekannten 

Zusammenhang (Muirehead [1982]) 

T 

−1 2 

XX X n 

P[ X ⋅Σ ⋅ ≤ χ ( α)] = 1 − α, 

d. h. mit der Wahrscheinlichkeit 1 – α fällt X in das Innere des Konzentrationsellipsoides 

T −1 X ⋅Σ ⋅ X = χ 2 ( α ) mit dem Volumen 

XX 

n 

V 

= 

1 n 

⋅ 

⋅ 

⋅ ⋅ ⋅ ( 

⋅ 

∏ 

1 

2 2 2 

π 

n 

R 

2 n 

XX σj χn 

α 

j= 

1 

(2 ) [ )] 

⎛ 1 ⎞ 

Γ ⎜ ⎟ ⋅ n 

⎝2 

⋅ n ⎠ 

, 

falls X ∼ N n (0, Σ XX ). Das Volumen ist nur von R XX abhängig, denn die anderen Variablen 

bleiben für diese Betrachtung konstant. Somit sollte sich ein Maß für die Multikollinearität 

auf die Determinante beziehen.


Beispiel 5.13.1: Multikollinearität 

Der Einfluss der Multikollinearität auf die Parameter des linearen Modells wird durch ein 

Beispiel transparent. Es sei Z ~ N 3 (0, R ZZ ), R ZZ sei positiv definit und 

R 

ZZ 

⎛1 

ρY1 ρY2⎞ 

⎜ 

⎟ ⎛1 

ρY. 

X⎞ 

= 1 ρ12 

= 

⎜ ⎟ ⎜ 

⎝ ⎟ . 

R XX ⎠ 

⎝ 1 ⎠ 

Für diesen einfachen Fall sagt man X T = (X 1 , X 2 ) habe den Grad der Multikollinearität 

R 

1 

− 1 

XX = δ = 

2 

1 − ρ 12 

, 

wenn 

ρ 

2 

12 

= 

δ − 1 . 

δ 

In diesem Fall gilt 

⎧ 

2 2 

2 2 ⎪1 − ( ρY1 + ρY2) δ + 2 ⋅ρY1 ⋅ρY2 ⋅ ( δ −1) ⋅δ, falls ρ12 

≥ 0 

σY / X= σY / X () δ = ⎨ 

⎪ ⎩ − 

2 + 

2 

1 ( ρY1 ρY2) δ − 2 ⋅ ρY1 ⋅ ρY2 ⋅ ( δ − 1) ⋅ δ, falls ρ12 

< 0 

Da R ZZ positiv definit vorausgesetzt wurde, gilt 

mit 

2 2 

Y1 Y2 12 

ρ < 1, ρ < 1 und ρ ∈( ab , ) 

2 2 2 2 

Y1 Y2 Y1 Y2 Y1 Y2 

ab , = ρ ⋅ ρ ± 1 − ρ − ρ + ρ ⋅ρ 

. 

Nur für ρ Y1 = ρ Y2 erhält man b = 1. Setzt man 

⎧ 1 

⎪ , füra 

≥ 0 

A = 

2 

⎨1 

− a 

⎪ 

⎩ 0, für a < 0 

und 

⎧ 1 

⎪ , fürρ 

≠ 

= 

2 

Y ρ 

B ⎨1 

− b 

⎪∞ ⎩ , fürρY 

= ρ 

dann ist δ ∈ [A, B] und 

bzw. 

σ 

1 Y2 

1 Y2 

⎧⎪ 0 füra 

≥ 0 

( A + 0) = ⎨ ⎪ ⎩1 − ( ρY1 + ρY2) füra 

< 0 

2 

Y / X 

2 2


299 

σ 

⎧⎪ 0 fürρY 

≠ ρY 

( B − 0) = ⎨ ⎪ ⎩1 − ρY fürρY = ρY 

2 1 2 

Y / X 

2 

2 1 2 

Aus Symmetriegründen ist nur der Fall a < 0 

2 

Es gilt σ / () δ ist monoton wachsend in (A, δ 0 ] und monoton fallend in [δ 0 , B), wobei 

Y 

X 

⎧ 

2 2 

max( ρY1, ρY2) 

⎪ 

für ρ ≠ 

2 2 

Y ρ 

δ0 = ⎨ ρY1 − ρY2 

⎪ 

⎩ ∞ für ρY 

= ρ 

2 

/ () 

1 Y2 

1 Y2 

2 2 

Die Funktion σY 

Xδ erreicht ihr Maximum 1− 

max( ρY1, ρ Y2) 

an der Stelle δ 0 . 

Zum Beweis für ρ Y1 ≠ ρ Y2 wird − ( ρY1 + ρY2) δ + 2 ρY1ρY2 ( δ −1) ⋅ δ = : g1( δ ) untersucht. 

Zur Abkürzung wird ρ Y12 + ρ Y22 =: c und ρ Y1 ρ Y2 =: d gesetzt. Mit diesen Abkür zungen 

gilt 

d ⋅(2 δ −1) 

g1′ 

() δ =− c + 

. 

( δ −1) 

⋅δ 

2 2 2 2 

2 2 2 2 2 

Aus g′ 

() δ = c ⋅( δ − δ) − d (4⋅δ − 4⋅ δ + 1) = 0und c = 4 ⋅ d + ( ρY1 − ρ Y2) 

erhält 

man 

δ 

2 

d 

− δ − = 0 

2 2 2 

( ρ − ρ ) 

2 

Y1 Y2 

und somit 

δ 

2 2 2 2 

ρY1 − ρY2 ± ( ρY1 + ρY2) = 

. 

ρ − ρ 

1/2 2 2 

Y1 Y2 

Für ρ Y1 = ρ Y2 wird 

g = ⋅ ⋅ ⎡ − ⋅ − ⎤ 

2() δ 2 ρY 

1 ⎣ 

( δ 1) δ δ 

⎦ 

untersucht. Da 

2 

⎡ 2⋅δ 

−1 

⎤ 

g2′ () δ = 2⋅ρY 

1 ⎢ −1⎥ 

⎣ ( δ −1) 

⋅δ 

⎦ 

folgt aus g ′2 () δ = 0 , dass keine reelle Lösung existiert. 

Zur Demonstration dieser Resultate betrachten wir die Korrelationsmatrix 

⎛1 0. 9 0. 

6⎞ 

R = ⎜ 

⎜ 

1 ρ ⎟ 

12 ⎟ 

⎝ 1 ⎠ 

für den Vektor (Y, X 1 , X 2 ).


Die Grenzen des Variationsintervalls für den Korrelationskoeffizienten ρ 12 sind 

2 2 2 2 

Y1 Y2 Y1 Y2 Y1 Y2 

ab , = ρ ⋅ ρ ± 1− ρ − ρ + ρ ⋅ρ 

2 2 

= 0.9 ⋅ 0.6 ± 1 − 0.9 − 0.6 + 0.81 ⋅ 0.36 = 0.54 ± 0.348 

⎧ 

−4 

a R = ⋅ δ a = 

⎪0.192, für , mit ′ 4.96 10 und ( ) 1.038 

= ⎨ 

−4 

⎪⎩ 0.888, für b, mit R′′ 

= 4.96 ⋅ 10 und δ( b) = 4.729 

Der Grad der Multikollinearität bis zu dem σ 2 Y/X 

monoton wächst ist 

δ 

2 2 

ρY1 ρY2 

0 2 2 

ρY1 − ρY2 

max ( , ) 0.81 

= = = 1.8. 

0.45 

Die bedingte Varianz im standardisierten Modell wird nach der Beziehung 

−1 

2 

1 ρ12 ρY 

1 

Y / X = 1 − ( Y 1 Y 2 ) ⋅ ⋅ 

1 ρY 

2 

⎛ ⎞ ⎛ ⎞ 

σ ρ ρ ⎜ 

⎝ 

⎟ 

⎠ 

⎜ 

⎝ 

⎟ 

⎠ 

1 ⎛1 

−ρ 

⎞ ⎛ρ 

⎞ 

= 1 − ( ρ ) ⋅ ⋅ ⎜ ⋅ 

⎝ 

⎟ 

⎠ 

⎜ 

⎝ 

⎟ 

⎠ 

ρ ρ ρ ρ ρ 

= 1 − 

12 Y1 

Y1 ρY2 2 

1 − ρ12 

1 ρY 

2 

2 2 

Y1 + Y2 − 2 ⋅ Y1 ⋅ Y2 ⋅ 12 

2 

1 − ρ12 

berechnet. 

Für a, b, δ 0 und einige weitere Zwischenstellen für den Grad der Multikollinearität erhält 

man die folgenden Werte für die bedingte Varianz bzw. bedingte Standardabweichung: 

2 

Y / X( a) = 0.000515, σ Y/X ( a) = 0.0227, 

2 

Y / X( 1 = 1.19) = 0.1214, Y/X ( 1 ) = 0.3484, 

2 

Y / X( 2 = 1.312) = 0.1561, Y/X ( 2 ) = 0.395, 

2 

Y / X( 3 = 1.33) = 0.16, Y/X ( 3 ) = 0.4, 

2 2 2 

Y / X 0 = Y/X 0 = Y/X = − Y1 

2 

Y / X( 4 = 2.5) = 0.1776, Y/X ( 4 ) = 0.4083, 

2 

Y / X( 5 = 3.249) = 0.118, Y/X ( 5 ) = 0.3435, 

2 

Y / X( 6 = 4) = 0.0611, Y/X ( 6 ) = 0.2472, 

) 0.19, 

Y/X 

σ 

σ δ σ δ 

σ δ σ δ 

σ δ σ δ 

2 

σ ( δ ) 0.18999, σ ( δ ) 0.4359, max σ ( δ) 1 max ( ρ , ρY 

2 = 

2 

σY / X( b ) = 0.002346, σ ( ) = 0.0484. 

σ δ σ δ 

σ δ σ δ 

σ δ σ δ 

Die Abbildung 5.13.1 zeigt die Werte für die bedingte Standardabweichung über den verschiedenen 

Graden der Multikollinearität. Wie berechnet, steigen die Werte der bedingten 

Standardabweichung vom kleinst möglichen Grad a bis zum Grad δ 0 der Multikollinearität an 

und fallen dann wieder bis zum maximal möglichen Grad b der Multikollinearität.


301 

0.4 

0.3 

bedStreuung 

0.2 

0.1 

0.0 

0 1 2 3 4 5 

Det 

Abb. 5.13.1: Bedingte Standardabweichung über dem Grad der Multikollinearität 

Für höher dimensionale Vektoren (n ≥ 3) von Input- und Prozessvariablen kann man die Abhängigkeit 

der bedingten Varianz (Standardabweichung) vom Grad der Multikollinearität δ 

nicht mehr analytisch darstellen. Es bleibt hier nur die Möglichkeit, mit Beispielen die Vermutung, 

dass bei den höher dimensionalen Fällen die gleiche Tendenz gilt, zu untermauern. 

Gibt es einen Zusammenhang zwischen dem Grad der Multikollinearität und der 

Konditionszahl? 

Um die Auswirkung eines großen δ auf d ie Schätzfunktionen für die unbekannten Parameter 

in der Prozessgleichung zu untersuchen, bietet sich die Berechnung der Fehler E an, die bei 

der Lösung des Normalgleichungssystems 

T 

Y / X XX Y. 

X 

B R = R 

entstehen. Um diesen Fehler berechnen zu können, führen wir die Konditionszahl 

k 

E 

= 

⎛ 

⎜ 

⎝ 

R 

R 

XX 

XX 

n 

⎞ 

⎟ 

⎠ 

n 

mit 

⎛ 

RXX 

= ⎜n + 2∑r 

⎝ 

2 

jk 

j< 

k 

⎞ 

⎟ 

⎠ 

1 

2 

ein. Damit gilt nach Focke [1962] 

E 

≤ 

3 ⋅ n a 

, 

k R 

E 

XX


wobei a der Vektor der Abweichungen ist, die man erhält, wenn man die Lösung B Y/X in das 

Normalgleichungssystem BY T 

/ X RXX = RY. 

X einsetzt, d. h. a = BY T 

/ X RXX − RY. 

X . 

Je größer der Grad der Multikollinearität ist, desto größer werden die Fehler. Unter den genannten 

Voraussetzungen, dass der zufällige Vektor Z = (Y T , X T ) aus den m Produkt- und n 

Input- und Prozessvariablen m + n dimensional normal- oder elliptisch umrissen verteilt und 

die gemeinsame Kovarianzmatrix positiv definit ist, gilt für eine Stichprobe 

(Y i , X i ), i = 1, …, N 

von unabhängigen und identisch nach Z verteilten zufälligen Vektoren mit der Schätzfunktion 

N 

∑ 

A = ( Z − Z) ⋅( Z − Z) 

ZZ i i 

i= 1 

für die Kovarianzmatrix und deren Zerlegung 

A 

ZZ 

⎛AYY 

AYX 

⎞ 

= ⎜ 

⎝ A ⎟ 

⎠ , 

XX 

T 

die Maximum Likelihood Schätzfunktion MLSF) für die Matrix der Regressionskoeffizienten 

wird nach der Beziehung 

T T −1 

Y / X= YX⋅ 

XX 

B A A 

berechnet. 

Der Vektor der Absolutglieder besitzt die Darstellung 

T 

0 = − Y / X ⋅ . 

B Y B X 

Die MLSF für die bedingte Kovarianzmatrix 

−1 

YY / X = YY − YX ⋅ XX ⋅ XY 

Σ Σ Σ Σ Σ ist 

−1 

YY / X = YY − XX ⋅ XY 

A A A A 

bzw. mit der MLSF 

S 

ZZ 

1 

= ⋅ A 

N − 1 

ZZ 

−1 

YY / X = YY − YX ⋅ XX ⋅ XY. 

S S S S S 

Für die MLSF haben wir schon gezeigt, dass 

E[ BY/ X / X] = E[ BY/ X] = ΒY/ 

X, 

E[ AYY / X / X] = ( N − n −1) ΣYY / X , 

−1 −1 

cov [ B / X] = A ⊗ Σ und cov [ B ] = ( N − n −1) ⋅Σ ⋅Σ 

. 

Y/ X XX YY/ X Y/ X XX YY/ 

X 

Aus diesen Eigenschaften können Sie schon ablesen, dass die Varianzen der MLSF für die 

Regressionskoeffizienten immer größer werden, je größer der Grad der Multikollinearität ist, 

denn überall dort wo die Inverse Kovarianzmatrix ins Spiel kommt, wirkt der Grad der Multikollinearität. 

Das gilt auch für die folgenden Eigenschaften.


303 

• 

• 

• 

die bedingte Verteilung von B Y/X ist N ( ΒY / X, A XX ⊗ ΣYY / X) 

, 

die unbedingte Verteilung von B Y/X ist eine multivariate t-Verteilung, 

( N −1) ⋅ S YY / X ist Wishart verteilt, d. h. Wm ( N − m −1, ΣYY / X). 

Außerdem gelten für die bedingten und unbedingten Vorhersagefehler die folgenden Beziehungen. 

Der bedingte Vorhersagefehler wird nach der Beziehung 

M 

−1 

Nm = ΣYY X ⋅ + XE ⋅ AXX ⋅ XE 

, / (1 ) 

und der unbedingte nach 

U 

⎛ n ⎞ 

= Σ ⋅ ⎜ + 

⎝ 

⎟ 

N − n −1⎠ 

Nm , YY/ X 1 

berechnet. Aus den Modellparametern bzw. den MLSF und deren Eigenschaften liest man die 

Abhängigkeit von A –1 

XX und damit vom Grad der Multikollinearität ab. 

−1 

Beispiel 5.13.2: Einfluss der Multikollinearität. Einfluss auf die Modellparameter 

Für n = 4 wird ein Beispiel nach faktoranalytisch folgender Vorschrift konstruiert: 

X 1 = ½ (X 2 + X 3 + X 4 ) 

X 2 = 2 A + U 2 

X 3 = –A + 2 U 3 

X 4 = A + U 4 

wobei A einen gemeinsamen Faktor und U j , j = 2, 3, 4 spezielle Faktoren bezeichnen. Durch 

das Einsetzen der falktoranalytischen Annahmen erhält man 

X 1 = ½ (U 2 + 2 U 3 + U 4 ) + A. 

Die Voraussetzungen an die gemeinsamen und speziellen Faktoren der Faktoranalyse, 

E(A) = E(U j ) = 0, und var(A) = var(U j ) = 1, j = 1, 2, 3, 4 ermöglichen die Berechnung der 

Varianzen und Kovarianzen zwischen den vier Prozessvariablen X 1 bis X 4 . Man erhält 

var(X 1 ) = E [1/4 (U 2 + 2 U 3 + U 4 ) 2 + A 2 + (U 2 + 2 U 3 + U 4 ) A] 

= ¼ (1 + 4 + 1) + σ 2 A = 6/4 + 1 = 5/2, 

var(X 2 ) = E (2 A + U 2 ) 2 = 5, 

var(X 3 ) = E (–A + 2 U 3 ) 2 = 5, 

var(X 4 ) = E (A – U 4 ) 2 = 2 

cov(X 1 X 2 ) = E (X 1 X 2 ) = E [(1/2 (U 2 + 2 U 3 + U 4 ) + A) (2 A + U 2 )] = 5/2, 

cov(X 1 X 3 ) = E (X 1 X 3 ) = E [(1/2 (U 2 + 2 U 3 + U 4 ) + A) (–A + 2 U 3 )] = 1 

cov(X 1 X 4 ) = E (X 1 X 4 ) = E [(1/2 (U 2 + 2 U 3 + U 4 ) + A) (A + U 4 )] = 3/2, 

cov(X 2 X 3 ) = E (X 2 X 3 ) = E [(2 A + U 2 ) (–A + 2 U 3 )] = – 2, 

cov(X 2 X 4 ) = E (X 2 X 4 ) = E [(2 A + U 2 ) (A + U 4 )] = 2, 

cov(X 3 X 4 ) = E (X 3 X 4 ) = E [(–A + 2 U 3 ) (A + U 4 )] = – 1.


Mit den Varianzen und Kovarianzen können die Korrelationskoeffizienten 

cov( Xj, Xk) 

ρ jk = , j, k= 1, …,4, 

j≠ 

k 

1/2 

[var( X ) ⋅ var( X )] 

j 

berechnet werden. Man erhält die Korrelationsmatrix 

k 

R 

XX 

⎛ 1 2 2/3 ⎞ 

⎜1 

2 5 5 

⎟ 

⎜ ⎟ ⎛1 0.707 0.282 0.670 ⎞ 

⎜ −2 2 ⎟ 

1 

⎜ 1 −0.400 0.632 ⎟ 

= ⎜ ⎟ 

5 5 = ⎜ ⎟, 

⎜ ⎟ ⎜ 

1 −0.316⎟ 

⎜ 

−1 

⎟ 

1 

⎜ 1 ⎟ 

⎜ 

⎟ ⎝ 

⎠ 

⎜ 

10 

⎟ 

⎝ 

1 ⎠ 

wobei die Dezimalbrüche durch die Berechnungen von 3 Stellen nach dem Komma zustande 

kommen. Das Wesen dieser Korrelationsmatrix besteht darin, dass der Rang der Korrelationsmatrix 

durch das aufgeprägte weiße Rauschen 4 beträgt; ansonsten nur 3! und der 

Einfluss des weißen Rauschens mit zunehmender Anzahl von Stellen für die Dezimalbrüche 

immer kleiner wird. Aus der zweiten Eigenschaft folgt, dass der Grad der Multikollinearität 

durch die Anzahl der Dezimalstellen verändert werden kann. Die Determinante für die 

Korrelationsmatrix mit drei Dezimalstellen ist det(R XX ) = 9.66 10 –4 . 

Für 4 Stellen nach dem Komma erhält man det(R XX ) = 3.53 10 –5 . Für 6 Dezimalstellen erhält 

man den Wert det (R XX ) = 1.306 10 –6 usw. Erweitert man die Korrelationsmatrix R XX mit 

3 Dezimalstellen um den Vektor der Korrelationskoeffizienten 

ρ T Y.X = (1 0.3 0.3 –0.3 0.65), 

dann erhält man eine Korrelationsmatrix für den gemeinsamen Vektor (Y, X T ) von einem 

Produkt- und vier Prozessvariablen. 

Die inverse Korrelationsmatrix hat die Elemente 

⎡ 518.00409761864935308 −366.52374300262834013 −365.67403717048603733 −230.972735572707543 

⎤ 

⎢ 

−366.52374300262834013 261.13943712283653603 259.13986870735832069 162.4189820616535264 

⎥ 

⎢ 

⎥ 

⎢−365.67403717048603733 259.13986870735832069 259.33982968888505582 163.1765940628628639⎥ 

⎢ 

⎥ 

⎣−230.9727355727075434 162.41898206165352646 163.17659406286286398 104.6667398946136903⎦ 

Mit den Elementen der inversen Korrelationsmatrix kann man die Koeffizienten der Regressionsfunktion 

(bedingten Erwartungswertes) berechnen. Man erhält die Funktion 

E[Y/X] = 5.014039 X 1 – 3.784914 X 2 – 3.697413 X 3 – 1.485723 X 4 


σ 2 Y/X = 1 – 0.512241 = 0.487759. 

Berechnet man 4 Dezimalstellen der Korrelationsmatrix und rundet auf 3 Stellen, dann 

erhält man die inverse Korrelationsmatrix

5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen? 

305 

⎡ 3903.7774652061360842 −2759.4607872664600142 −2759.9198281797504894 −1744.8306665184492782 

⎤ 

⎢ 

−1 

−2759.4607872664600142 1952.3805292153284385 1951.3032020137744162 1232.3531250988444835 

⎥ 

R XX = ⎢ 

⎥ , 

⎢ − 2759.9198281797504894 1951.3032020137744162 1952.4272516129524397 1233.6982893435863439 ⎥ 

⎢ 

⎥ 

⎣−1744.8306665184492782 1232.3531250988444835 1233.6982893435863439 781.55050847888419224⎦ 

die Determinante der Korrelationsmatrix der Prozessvariable det(R XX ) = 1.279 10 –4 , den 

bedingten Erwartungswert 

E[Y/X] = 37.131019 X 1 – 26.485507X 2 – 26.409275 X 3 – 15.844919 X 4 


σ 2 Y/X = 1 – 0.817239 = 0.182761. 

Die geringfügige Veränderung der einzelnen Elemente der Korrelationsmatrix führt zu 

starken Veränderungen der Ergebnisse (Elemente der inversen Korrelationsmatrix und 

damit der multiplen Korrelationskoeffizienten, Koeffizienten des bedingten Erwartungswertes, 

bedingte Varianz). 

Aus dieser Darstellung erkennt man, dass die Fehler mit kleiner werdender Determinante 

der Korrelationsmatrix für die Input- und Prozessvariable und damit mit kleiner werdenden 

Konditionszahlen größer werden. 

5.14 Wie können wir die wesentlichen Input- und 

Prozessvariablen auswählen? 

In den Regressionsansätzen mit festen oder stochastischen Input- und Prozessvariablen wird 

der Zusammenhang zwischen einem (oder mehreren) Produktvariablen Y und den n Inputund 

Prozessvariablen X T = (X′, Z) gesucht. Da zu Beginn der Analyse nicht bekannt ist, welche 

Input- und Prozessvariablen den (oder die) Produktvariable wesentlich beeinflussen, misst 

man nach dem Grundsatz des 

Galilei: „Messe alles, und das nicht Messbare mache messbar“, 

so viel wie möglich Input- und Prozessvariablen und hofft, dass unter den gemessenen diejenigen 

sind, die Y gut erklären. Hinter dieser Formulierung steht die Frage nach der Adäquatheit 

des Modells. Hierfür verwenden wir das Maß der Beherrschbarkeit, den F-Test, die t-Tests und 

Residualanalysen. Diese Analysen reichen aber nicht aus, den optimalen Ansatz zu finden. 

5.14.1 Warum müssen aber nun wieder Input- und/oder Prozessvariablen 

aus dem Ansatz gestrichen werden? 

Es ist doch offensichtlich, dass mit zunehmender Anzahl von Input- und Prozessvariablen die 

Information über Y nicht geringer werden kann. Das ist der Inhalt der Wiener Shannon’sche 

Theorie, wonach die Entropie als Maß der Unbestimmtheit einer oder mehrerer Produktvariablen 

mit zunehmender Anzahl von Input- und Prozessvariablen desselben Prozesses stets 

kleiner wird.


Trotzdem gibt es verschiedene Gründe für die Notwendigkeit der Auswahl der wesentlichen 

Input- und Prozessvariablen . Zwei dieser Gründe sind: 

Der Grad der Multikollinearität nimmt mit wachsender Anzahl n von Input- und Prozessvariablen 

zu. Daraus folgt aber sofort, dass die Anzahl der redundanten oder unwesentlichen 

Input- und Prozessvariablen ebenfalls zunimmt und aufgrund des zunehmenden Grades 

der Multikollinearität die numerischen Fehler bei der Lösung des Normalgleichungssystems 

größer werden. 

Die beiden Terme des unbedingten Vorhersagefehlers (das ist auch der Vorhersagefehler im 

2 ⎛ n ⎞ 

linearen Modell mit festen Input- und Prozessvariablen) UNn , = σY / X ⎜1 

+ ⎟ zeigen 

⎝ N − n −1⎠ 

2 

unterschiedliches Verhalten. Die Folge { σY / X ( n ) }, n → ∞ ist antiton (monoton nicht wachsend, 

wenn die Anzahl der Input- und Prozessvariablen größer wird) und 

⎛ n ⎞ 

⎜1 + , n → ∞ 

⎝ 

⎟ 

N − n −1⎠ 

ist streng isoton (monoton wachsend). Die Abbildung 5.14.1 zeigt, dass ein p* = p*(N) mit 

p* ∈ {0, 1, …, n} gefunden werden kann, für dass p < p* und p > p* U N.p > U N,p* ist. Das p* 

wollen wir optimale Anzahl nennen. 

Mit den Auswahlverfahren sollen sowohl das p* wie auch die wesentlichen Input- und Prozessvariablen 

gefunden werden. 

Dabei beinhaltet die Teilmenge der unwesentlichen Input- und Prozessvariablen diejenigen 

Variablen, die 

• 

• 

entweder mit den Produktvariablen nicht oder nur sehr gering korreliert 

oder aber redundant sind. 

Neben der „Vorhersage“ der Produktvariablen aufgrund von Werten für die Input- und 

Prozessvariablen ist somit die Auswahl der wesentlichen Input- und Prozessvariablen ein 

vorrangiges Ziel der Anwendung der Regressionsanalyse sowohl mit bekannten, festen (nicht 

stochastischen) als auch stochastischen Input- und Prozessvariablen. 

σ Y/X 

 

→ ∞ 

 

+ n 

1 , 

N − n −1 

n 

σ Y/X 

optimale Anzahl 

n 

Abb. 5.14.1: Optimale Anzahl p*


307 

Es ist notwendig an dieser Stelle noch einmal darauf hinzuweisen, dass es zwischen den beiden 

Modellen grundsätzliche Unterschiede gibt. Diese sind: 

Wird in dem Modell mit festen Input- und Prozessvariablen z. B. X n gestrichen, dann 

• verändert sich das Modell 

n 

T 

Yx . , mit 

Yj . j 

j = 1 

Y = β ⋅ x + ε ε = Y −∑ β x 

in das Modell 

Y 

n−1 

∑ 

= β x + ε *, 

Y. 

j 

j = 1 

j 

in dem E(ε*) verschieden von null ist. 

• Im Modell mit stochastischen Input- und Prozessvariablen 

Y = β 0 + β Y/X X + F Y/X , 

mit 

β T Y/X = σ Y.X Σ–1 YY , β 0 = µ Y – β Y/X μ X und F Y/X = Y – E[Y/X] ~ N 1 (0, σ2 Y/X ) 

und 

Y und F Y/X sind unabhängig voneinander, 

gilt auch nach der Streichung des Input- oder Prozessvariables X n , dass 

F Y/X = Y – E[Y/X] ~ N 1 (0, σ 2 Y/X ) ist. 

Es ist aber klar, in diesem Modell wird σ 2 Y/X größer. 

Alle Verfahren zur Auswahl der wesentlichen Input- und Prozessvariablen werden unter der 

Bezeichnung Teilmengenregression subl imiert. Die meisten Verfahren entstanden unter der 

Annahme, dass die Input- und Prozessvariablen feste Einstellgrößen sind. Diese Annahme 

ist – zumindest für die Anwendung der Verfahren zur statistischen Analyse von Prozessen 

– nicht gerechtfertigt, denn zumindest die Inputvariablen sind Zufallsgrößen, da sie als 

Produktvariablen von Vorläuferprozessen aufgefasst werden müssen. Diese Verfahren, siehe 

z. B. Hocking [1972, 1976], Hocking and Leslie [1967], Thompson [1978], Kinal and Lahiri 

[1983], Mallows [1966, 1977]Miller [1990] und viele andere, werden nicht im Detail beschrieben, 

sondern nur für die Einschätzung des universellen Red-Verfahrens von Jahn [1984, 

1991] verwendet. 

5.14.2 Welche Verfahren können für die Auswahl optimaler Teilmengen 

von „fixen“ Input- und Prozessvariablen verwendet werden? 

Für das Modell mit festen Input- und Prozessvariablen (feste Einstellgrößen) wurden in den 

letzten Jahren zahlreiche Auswahlverfahren entwickelt. Diese Verfahren lassen sich in drei 

Gruppen einteilen.


1. Berechnungsalgorithmen zum Auffinden der besten Anpassungsteilmengen. 

Die se Verfahren basieren entweder auf dem „Kleinst Quadrat Anpassungskriterium“, der 

Minimax Anpassung oder der L 1 bzw. L ∞ Anpassung. Bei all diesen Verfahren müssen die 

Restsummen der Abweichungsquadrate für alle 2 n – 1 Teilmengen berechnet werden. Das ist 

ein Riesenaufwand, vgl. z. B. Edwards and Havra’nek [1987]. 

2. Vorhersagefehler Minimierungsverfahren. 

Der Vorhersagefehler für das Modell mit festen Input- und Prozessvariablen wird genauso 

berechnet wie der unbedingte Vorhersagefehler im Modell mit stochastischen Input- und 

Prozessvariablen. Auswahlverfahren, die darauf basieren, sind das C p -Verfahren von Mallows 

[1973], das PSS von Allen [1971] und das BIC von Schwarz [1978]. Informationstheoretische 

Betrachtungen im Zusammenhang mit dem Vorhersagefehler führen auf das AIC von Akaike 

[1973, 1976]. 

An dieser Stelle soll nur das C p Kriterium von Mallows für das lineare Modell mit festen Input- 

und Prozessvariablen etwas ausführlicher skizziert werden. Nach obigen Grundanliegen 

soll der Vektor x der festen Input- und Prozessvariablen in zwei Teilvektoren zerlegt werden. 

Dabei beinhaltet der Teilvektor x(k) die wesentlichen und x(h) die unwesentlichen Input- und 

Prozessvariablen, wobei k = (k 1 , …, k p ), mit 

mit 

k 1 < … < k p die Teilmenge der Indices für die wesentlichen und h = (h 1 , …, h n – p ), 

h 1 < … < h n – p die Teilmenge der Indices der unwesentlichen Variablen bezeichnen. 

Das Teilmengenregressionsmodell lautet dann 

Y = β T Y.k x (k) + ε(k). 

Der Vorhersagefehler für dieses Modell ist 

N = E[ Y − Yˆ( k)] = + var[ Yˆ( k)] + { E[ Yˆ( k) − Y]} 

. 

N. 

p 

2 2 2 

σR 

Eine Mittelung über die Zeilen der Design Matrix x liefert 

N N N N 

2 2 2 

U ˆ ˆ ˆ 

Npi , , = E[ Yi − Yi( k)] = N σR + var[ Yi( k)] + { E[ Yi( k) − Yi]} 

i= 1 i= 1 i= 1 i= 

1 

∑ ∑ ∑ ∑ . 

Mallows betrachtet nun das folgende Kriterium 

1 ⎛ 

N 

N 

ˆ ˆ 

2 

⎞ 

Γ p = var [ Y 

2 

i( k)] { E[ Yi( k) Yi]} 

σ 

⎜∑ 

+ ∑ − 

R ⎝ 

⎟ 

i= 1 i= 

1 

⎠ 

1 

[ ˆ T T 

( ) ˆ T 

= E Y k − β 

2 

Yxk . ( ) x( k)] E[ Y( k) − βYxk 

. ( ) x( k)] 

+ p . 

σR 

Den Bias 

ˆ T T 

[ ( ) ( )] [ ˆ T 

E Y k − β x k E Y( k) − β x( k) = SSB] 

Yxk . ( ) Yxk . ( )


309 

kann man ausdrücken durch 

xkT ( ) 

T 

xkT ( ) 

Yxk . ( ) Yxk . ( ) 

SSE = ⎡Y B ⎤ ⎡Y B ⎤ 

⎣ 

− 

⎦ ⎣ 

− 

⎦ 

= RSE (Bezeichnung in manchen Programmen). 

Der Erwartungswert von SSE ist E (SSE) = ( N − p) σ R + SSB . 

Für die Schätzung von Γ p verwendet Mallows die Statistik 

2 

( N − p) 

σˆ 

R 

Cp = + 2 p − N ≈ p. 

ˆ 

2 

σ 

R 

3. Testverfahren 

Zu diesen V erfahren gehören die stufenweisen oder schrittweisen Verfahren (Vorwärts- und 

Rückwärtsauswahl) von Draper, Smith [1981], Miller [1990] als die bekanntesten. Außerdem 

gehören der overall F-Test und der finite intersection Test von Krishnaiah [1982] zu dieser 

Gruppe. 

Die stufenweisen Verfahren verwenden die F-Statistik 

Fˆ 

T T −1 

T 

Y ⋅ Xj ⋅ Xj ⋅ Xj ⋅ Xj 

⋅Y ⋅ N − 

j = 

T T −1 

T 

Y ⋅[ I − Xj ⋅( Xj ⋅ Xj ) ⋅ Xj] 

⋅Y 

( ) ( 1) 

zur Prüfung der Einzelhypothese H 0,j : β Y/j = 0, für j = 1, …, n, wobei β Y/j aus dem Modell 

E[Y] = β Y/j X j kommt. Unter der Normalverteilungsannahme ist F ˆj ∼ F1, N− 

1 verteilt. 

Wird die H 0, j nicht verworfen, dann wird x j als unwesentlich angesehen. Werden die H 0, j 

j = 1, …, n verworfen, dann wird die Input- oder Prozessvariable als wesentlich deklariert, der 

max ( Fˆ 

ˆ 

1, …, Fn 

) > F α entspricht. Diese Variable ist dann x [1] . Gilt z. B. max ( F ˆ ˆ 

1, …, Fn 

) = F1, 

dann wird x 1 zur wichtigsten Prozessvariablen erklärt. Ist max ( F ˆ ˆ 1, …, Fn 

) ≤ F α , dann wird 

keine der Input- und Prozessvariablen als wichtig erkannt und die Analyse ist beendet. 

Nach dem Auffinden von x 1 wird die zweitwichtigste Input- oder Prozessvariable gesucht. 

Hierzu werden die F-Statistiken 

mit 

T 

Y ⋅ M0. ( 2) 

ˆ jk ⋅Y ⋅ N − 

Fjk 

= , j = 1, …, 

n 

T 

Y ⋅ M Y 

jk 

T T −1 T T T T −1 T −1 

0, jk = [ − k ⋅( k ⋅ k ) ⋅ k] ⋅ j [ j ⋅ j − j ⋅ k ⋅( k ⋅ k ) ⋅ k ⋅ j ] ⋅ j 

−1 

⎡ X 

T T 

⎛ k⎞ ⎤ X 

T T 

⎛ k⎞ 

= I − ( Xj , Xk ) ⋅ ⎢⎜ ( xk Xj 

) 

X ⎟ ⋅ ⎥ ⎜ 

j 

X ⎟ 

j 

M I X X X X X X X X X X X X X X 

⎢⎣⎝ ⎠ ⎥⎦ 

⎝ ⎠ 

berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen, d. h. ist 

max ( Fˆ 

ˆ 

12, …, F1 n) 

≤ F1 

α , dann ist keine der Prozessvariablen X 2 , …, X n wesentlich und wir sind 

fertig. F 1α ist der obere 100α % Punkt der zentralen F-Verteilung. Wenn max ( F ˆ ˆ 

12, …, F1 n) 

> F1 

α , 

dann ist die zu dem Maximum gehörende Variable die zweit wich tigste Input- oder Prozessvariable. 

In dieser Weise wird das Verfahren fortgesetzt. 

Die F-Statistik ist nichts anderes als der Test zur Prüfung der Hypothese 

2


H 0 : β Y.j = 0 für das klassische Modell E[Y] = β Y.j X j , für j = 1, …, n. Für dieses Modell ist F j 

zentral F-verteilt mit (1, N – 1) FG. Wenn H 0 „wahr“ ist, dann ist x j unwichtig. Wenn H 0 nicht 

„wahr“ ist, dann bedeutet das jedoch nicht, dass x j im 1. Schritt in die Prozessgleichung einbezogen 

wird. In der 1. Stufe, wenn alle Prozessvariablen nicht unwesentlich sind, picken wir 

nur die wesentlichste heraus und formulieren keine Aussage über die Auswahl der anderen 

Prozessvariablen, die als nicht unwichtig deklariert werden. Das Vorgehen führt somit in einen 

Bereich, in dem keine Entscheidung getroffen wird. 

Bei diesem Verfahren werden die n Einzelhypothesen individuell und nicht simultan geprüft, 

denn der Fehler 1. Art wird in jeder Stufe separat gewählt unter der Bedingung, dass 

P[F j ≤ F α/H0,j ] = 1 – α. Nehmen wir nun an, dass für ein beliebiges j das Modell E[Y] = β Y.j X j 

nicht korrekt ist, dann ist F nicht zentral F-verteilt mit 

(1, N – 1) FG. 

Betrachten wir nur einmal in der r-te Stufe das Modell 

E[Y] = β Y.1 X 1 + … + β Y.r X r + β Y.j X j für j = r + 1, …, n. Dann gilt auch hier, dass die F-Statistik 

diejenige Statistik ist, die zur Prüfung der H 0 unter diesem Modell ist. Damit wird deutlich, 

dass auf der (j + 1)-ten Stufe der kritische F j, α Wert gewählt wird, ohne Beachtung der Entscheidungen 

in den vorangegangenen Stufen. Nimmt man z. B. die 2. Stufe, dann sollte man die 

bedingten Wahrscheinlichkeiten P[F 1j ≤ F 1α /H 0 ; max(F 1 , …, F n ) ≥ F α ] für j = 2, …, n berechnen, 

um den Fehler 1. Art für die Prüfung der H 0 für ein gegebenes j anstelle der P[F 1j ≤ F α /H 0 ] zu 

bestimmen, denn wir wollen ja zur 2. Stufe übergehen, nur wenn max ( Fˆ 

ˆ 

12, …, F1 

n) 

> F α . 

Beispiel 5.14.1: Chemischer Prozess. Teilmengenregressionen 

Auswahl der wesentlichen Input- und Prozessvariablen nach dem C p -Kriterium von Mallows. 

Die Auswahl wird mit dem Datensatz 05.7.1 chem. Prozess demonstriert. 

Die Produktvariable ist Y 1 , als Prozessvariablen habe ich aus der Gesamtmenge der Inputund 

Prozessvariablen die folgende Teilmenge der Prozessvariablen ausgewählt und mit 

den Buchstaben A bis L bezeichnet, da das Programm von Mallows Buchstaben anstelle 

von Symbolen erwartet. 

X 3 = A 

X 4 = B 

X 5 = C 

X 6 = D 

X 7 = E 

X 9 = F 

X 16 = G 

X 17 = H 

X 18 = I 

X 19 = J 

X 20 = K 

X 21 = L 

Der Stichprobenumfang umfasst N = 107 Beobachtungsvektoren. 

Die Anzahl der möglichen Modellansätze ist 2 12 = 4096. 

Es ist vollkommen klar, dass ich nicht alle 4096 Detailergebnisse hier darstellen kann. Daher 

wähle ich nur eine Teilmenge von Resultaten aus.


311 

Die Teilmengen mit einer Prozessvariablen sind 

Model Results 

-------------------------------------------------------------------- 

Adjusted 

Included 

MSE R-Squared R-Squared Cp Variables 

-------------------------------------------------------------------- 

47,5433 0,0 0,0 207,759 

44,5049 7,27389 6,39078 187,01 A 

46,4821 3,15448 2,23214 199,893 B 

47,5433 0,943396 0,0 209,731 C 

38,1133 20,5909 19,8346 145,359 D 

47,5433 0,943396 0,0 207,453 E 

30,7136 36,008 35,3986 97,1408 F 

45,6049 4,98194 4,07701 194,178 G 

26,0692 45,6846 45,1673 66,8763 H 

25,4059 47,0667 46,5626 62,5538 I 

44,7453 6,77295 5,88507 188,576 J 

45,6593 4,86876 3,96275 194,532 K 

44,1012 8,11493 7,23983 184,379 L 

Teilmengen mit zwei Prozessvariablen 

44,9072 7,32686 5,54468 188,844 AB 

44,8954 7,35104 5,56933 188,768 AC 

36,7184 24,2257 22,7685 135,991 AD 

44,9241 7,29186 5,50901 188,953 AE 

24,8555 48,7066 47,7202 59,4249 AF 

42,5661 12,1581 10,4688 173,734 AG 

26,258 45,8124 44,7704 68,4767 AH 

25,5116 47,3528 46,3403 63,659 AI 

Teilmengen mit drei Prozessvariablen 

45,3041 7,40662 4,70972 190,594 ABC 

36,8847 24,6144 22,4187 136,776 ABD 

45,289 7,43763 4,74164 190,497 ABE 

25,0909 48,7188 47,2252 61,3867 ABF 

42,9776 12,1617 9,60326 175,723 ABG 

26,5118 45,8148 44,2366 70,4692 ABH 

25,7582 47,355 45,8216 65,6522 ABI 

43,0642 11,9846 9,42104 176,276 ABJ 

43,9621 10,1495 7,53251 182,016 ABK 

45,3041 7,40662 4,70972 190,594 ABC 

36,8847 24,6144 22,4187 136,776 ABD 

45,289 7,43763 4,74164 190,497 ABE 

25,0909 48,7188 47,2252 61,3867 ABF 

42,9776 12,1617 9,60326 175,723 ABG 

26,5118 45,8148 44,2366 70,4692 ABH 

25,7582 47,355 45,8216 65,6522 ABI 

43,0642 11,9846 9,42104 176,276 ABJ 

43,9621 10,1495 7,53251 182,016 ABK


44,1848 9,69442 7,06416 183,439 EKL 

22,5179 53,9776 52,6371 44,9394 FGH 

21,9735 55,0902 53,7821 41,4596 FGI 

28,8272 41,0824 39,3664 85,2701 FGJ 

29,5788 39,5463 37,7855 90,0747 FGK 

28,2781 42,2048 40,5215 81,7598 FGL 

20,0571 59,007 57,813 29,2095 FHI 

Teilmengen mit vier Prozessvariablen 

31,5516 36,1403 33,636 102,727 ABCD 

45,7117 7,48072 3,85251 192,363 ABCE 

25,3001 48,7932 46,7851 63,154 ABCF 

43,3714 12,2174 8,77489 177,548 ABCG 

26,1166 47,1406 45,0677 68,3227 ABCH 

25,3429 48,7066 46,6951 63,4247 ABCI 

43,4204 12,1182 8,67186 177,858 ABCJ 

44,3193 10,2989 6,78124 183,548 ABCK 

44,3107 10,3163 6,79932 183,494 ABCL 

34,7803 29,6056 26,8451 123,165 ABDE 

25,0574 49,2845 47,2957 61,6174 ABDF 

35,457 28,2359 25,4216 127,449 ABDG 

26,7585 45,8414 43,7175 72,386 ABDH 

26,0094 47,3576 45,2932 67,6439 ABDI 

36,4121 26,3029 23,4128 133,494 ABDJ 

37,1576 24,794 21,8447 138,214 ABDK 

Teilmengen mit 5 Prozessvariablen 

36,7797 26,2887 22,6396 135,539 ACEGJ 

42,5645 14,6951 10,4721 171,799 ACEGK 

42,2385 15,3485 11,1578 169,755 ACEGL 

22,3575 55,1926 52,9744 45,1393 ACEHI 

25,2319 49,432 46,9286 63,1561 ACEHJ 

26,149 47,594 44,9996 68,9047 ACEHK 

25,6355 48,6232 46,0798 65,6858 ACEHL 

24,4621 50,9747 48,5477 58,3311 ACEIJ 

25,4623 48,9702 46,444 64,6003 ACEIK 

24,7337 50,4303 47,9764 60,0338 ACEIL 

42,6308 14,5622 10,3326 172,215 ACEJK 


26,1567 48,0976 44,9835 69,3295 DEFGKL 

17,8856 64,5098 62,3804 17,9989 DEFHIJ 

18,375 63,5388 61,3511 21,0359 DEFHIK 

16,7221 66,8186 64,8277 10,7779 DEFHIL 

21,9859 56,3736 53,756 43,4456 DEFHJK 

21,5517 57,2352 54,6693 40,7509 DEFHJL 

23,7889 52,7959 49,9637 54,6351 DEFHKL


313 


27,39 46,1938 42,3893 77,284 BCEFGKL 

18,0465 64,5487 62,042 19,8774 BCEFHIJ 

18,5408 63,5777 61,0023 22,9143 BCEFHIK 

16,742 67,1113 64,7858 11,8625 BCEFHIL 

22,0387 56,7062 53,645 44,4055 BCEFHJK 

21,3412 58,0764 55,1121 40,12 BCEFHJL 

23,1807 54,4627 51,2429 51,422 BCEFHKL 


23,9941 53,341 49,5321 56,9304 ACEFGJKL 

17,5608 65,8513 63,0636 17,8034 ACEFHIJK 

15,7099 69,4505 66,9566 6,54646 ACEFHIJL 

16,7391 67,4492 64,7919 12,8058 ACEFHIKL 

20,589 59,9625 56,6942 36,2209 ACEFHJKL 

19,9684 61,1693 57,9995 32,4466 ACEFIJKL 


20,8595 59,8505 56,1253 38,5712 BCEFGIJKL 

15,6886 69,8033 67,0015 7,44312 BCEFHIJKL 

21,1712 59,2505 55,4696 40,448 BCEGHIJKL 

17,1917 66,9102 63,84 16,4915 BCFGHIJKL 

17,5588 66,2036 63,0678 18,7015 BDEFGHIJK 

15,8758 69,4428 66,6076 8,5704 BDEFGHIJL 

16,4236 68,3885 65,4555 11,8678 BDEFGHIKL 

21,9824 57,6892 53,7634 45,3311 BDEFGHJKL 

21,139 59,3125 55,5374 40,2539 BDEFGIJKL 

15,6909 69,7989 66,9967 7,45684 BDEFHIJKL 


16,5797 68,4171 65,1272 13,7785 BCDEFGHIKL 

21,5669 58,9168 54,6373 43,4915 BCDEFGHJKL 

20,8591 60,2652 56,1262 39,2742 BCDEFGIJKL 

15,8501 69,8069 66,6617 9,43186 BCDEFHIJKL 

20,9867 60,022 55,8577 40,0348 BCDEGHIJKL 

17,1039 67,4185 64,0246 16,9016 BCDFGHIJKL 

15,8428 69,8207 66,6771 9,38847 BCEFGHIJKL 

15,8457 69,8152 66,671 9,40572 BDEFGHIJKL 


15,9586 69,9168 66,4334 11,0881 ABCDEFHIJKL 

20,524 61,3108 56,831 38,004 ABCDEGHIJKL 

17,2566 67,47 63,7034 18,7405 ABCDFGHIJKL 

15,9447 69,9431 66,4628 11,0057 ABCEFGHIJKL 

15,9527 69,9279 66,4459 11,0533 ABDEFGHIJKL 

15,9463 69,94 66,4594 11,0153 ACDEFGHIJKL 

16,0081 69,8236 66,3294 11,3796 BCDEFGHIJKL 

Teilmenge mit allen 12 Prozessvariablen 

16,1133 69,9449 66,1081 13,0 ABCDEFGHIJKL


Tabelle 5.14.1: Kleinste C p innerhalb der Teilmengen gleicher Mächtigkeit 

Models with Smallest Cp 

Model Results 

---------------------------------------------------------------- 

Adjusted 

Included 

MSE R-Squared R-Squared Cp Variables 

---------------------------------------------------------------- 

15,4953 69,2528 67,408 3,16473 EFHIJL 

15,4133 69,7215 67,5806 3,69893 EFHIJKL 

15,5857 69,3828 67,218 4,75808 AEFHIJL 

15,6116 69,3319 67,1634 4,91743 DEFHIJL 

15,6167 69,3218 67,1526 4,94894 BEFHIJL 

15,6168 69,3217 67,1526 4,94916 EFGHIJL 

15,4847 69,8885 67,4304 5,17655 AEFHIJKL 

15,548 69,7653 67,2972 5,5618 BEFHIJKL 

15,5531 69,7555 67,2865 5,59256 EFGHIJKL 

15,556 69,7497 67,2803 5,61057 DEFHIJKL 

15,5592 69,7435 67,2736 5,62989 CEFHIJKL 

15,6304 69,9152 67,1238 7,09298 ACEFHIJKL 

15,6324 69,9114 67,1197 7,10487 AEFGHIJKL 

15,6387 69,8992 67,1063 7,14302 ADEFHIJKL 

15,6422 69,8925 67,0991 7,16386 ABEFHIJKL 

15,6886 69,8033 67,0015 7,44312 BCEFHIJKL 

16,3819 67,4935 65,5431 8,667 EFGHIL 

15,7809 69,9388 66,8074 9,01932 ACEFGHIJKL 

16,5957 66,7401 65,0935 9,02353 EFHIL 

15,7896 69,922 66,7889 9,07166 ABEFGHIJKL 

15,7901 69,9212 66,788 9,07414 ADEFGHIJKL 

15,7928 69,9159 66,7822 9,09072 ACDEFHIJKL 

15,7929 69,9159 66,7822 9,09076 ABCEFHIJKL 

16,5026 67,2541 65,2894 9,41573 EFHIKL 

16,6609 66,94 64,9564 10,3981 BEFHIL 

16,7079 66,8466 64,8574 10,6902 CEFHIL 

15,9447 69,9431 66,4628 11,0057 ABCEFGHIJKL 

15,9463 69,94 66,4594 11,0153 ACDEFGHIJKL 

15,9527 69,9279 66,4459 11,0533 ABDEFGHIJKL 

15,9586 69,9168 66,4334 11,0881 ABCDEFHIJKL 

16,0081 69,8236 66,3294 11,3796 BCDEFGHIJKL 

16,1133 69,9449 66,1081 13,0 ABCDEFGHIJKL 

17,6875 64,552 62,7971 15,867 BFHIL 

17,8372 64,2519 62,4822 16,8056 EFHIJ 

17,848 64,2303 62,4595 16,8731 DFHIL 

18,2284 63,4679 61,6594 19,2575 EFHIK 

18,6575 62,2376 60,7567 21,1054 FHIL 

18,8727 61,8022 60,3042 22,4673 EFHI 

19,3647 60,8064 59,2694 25,5817 DFHI 

19,3769 60,7817 59,2438 25,6587 FGHI 

19,6796 60,1689 58,6069 27,5753 FHIK 

20,0571 59,007 57,813 29,2095 FHI 

21,5712 55,9124 54,6283 38,8881 FIJ 

21,7327 55,5824 54,2887 39,9202 HIL 

21,9735 55,0902 53,7821 41,4596 FGI 

22,1304 54,7696 53,4522 42,4623 FHJ 

22,7717 53,0069 52,1032 45,9754 FI 

23,3479 51,818 50,8914 49,6938 FH 

23,6865 51,1191 50,1791 51,8795 HI 

24,6811 49,0666 48,0871 58,299 GI 

24,7316 48,9625 47,981 58,6246 IJ 

25,4059 47,0667 46,5626 62,5538 I 

26,0692 45,6846 45,1673 66,8763 H 

30,7136 36,008 35,3986 97,1408 F 

38,1133 20,5909 19,8346 145,359 D 

44,1012 8,11493 7,23983 184,379 L 

47,5433 0,0 0,0 207,759 

----------------------------------------------------------------


315 

Cp 

240 

200 

160 

120 

80 

40 

0 

Mallows' Cp Plot for y1 

0 3 6 9 12 15 

Number of Coefficients 

Abb. 5.14.2: C p -Kriterium von Mallows 

Die Darstellung des besten (kleinsten) C p innerhalb jeder Teilmenge von Prozessvariablen 

gleichen Umfangs ist in der Abbildung 5.14.2 enthalten. 

Diese Abbildung zeigt, dass die Mächtigkeit der Teilmenge mit dem kleinsten C p zwischen 

n = 6 und n = 8 zu liegen scheint. 

Für eine genauere Bestimmung sucht der Computer innerhalb jeder Mächtigkeit der Teilmengen 

das kleinste C p . Die Werte sind in der Tabelle 5.14.1 angegeben. 

Das Gesamtmodell (das Modell mit allen 12 Prozessvariablen) ist in der Tabelle 5.14.2 

enthalten. 

Tabelle 5.14.2: Prozessgleichung mit allen Prozessvariablen 

Prozessgleichung 

----------------------------------------------------------------------------- 

Produktvariable: y1 

----------------------------------------------------------------------------- 

Standard 

T 


----------------------------------------------------------------------------- 

CONSTANT -408,705 214,545 -1,90499 0,0598 

x3 -0,63914 0,852096 -0,750079 0,4551 

x4 0,201308 0,523085 0,384847 0,7012 

x5 1,92428 18,9108 0,101756 0,9192 

x6 1,27445 17,1746 0,0742055 0,9410 

x7 -11,723 3,98068 -2,94496 0,0041 

x9 0,322213 0,0597561 5,39213 0,0000 

x16 -0,0941571 0,845685 -0,111338 0,9116 

x17 89,7031 18,5206 4,84342 0,0000 

x18 -91,06 17,9793 -5,06472 0,0000 

x19 1,07786 0,47749 2,25734 0,0263 

x20 3,53736 2,78535 1,26999 0,2072 

x21 0,802039 0,23722 3,381 0,0010 

----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 

Model 3537,88 12 294,824 18,48 0,0000 

Residual 1515,41 95 15,9517 

----------------------------------------------------------------------------- 

Total (Corr.) 5053,3 107 







Das Maß der Beherrschbarkeit für diesen Ansatz ist R 2 Y.X = 0.700 und die Reststandardabweichung 

ist s = 3.9939. 

Diese Gleichung kann auch in der üblichen Form 

y1 = -408,705 - 0,63914*x3 + 0,201308*x4 + 1,92428*x5 + 1,27445*x6 - 

11,723*x7 + 0,322213*x9 - 0,0941571*x16 + 89,7031*x17 - 91,06*x18 + 

1,07786*x19 + 3,53736*x20 + 0,802039*x21 

geschrieben werden. 

Verwendet man die optimale Teilmenge {X 7 , X 9 , X 17 , X 18 , X 19 , X 21 } die man nach dem C p 

Kriterium von Mallows über alle möglichen Teilmengen von Prozessvariablen aufgefunden 

hat, dann erhält man die Prozessgleichung in folgender Tabelle. 

Tabelle 5.14.3: Prozessgleichung für die C p optimale Teilmenge von Prozessvariablen 

Optimale Prozessgleichung 

----------------------------------------------------------------------------- 

Produktvariable: Produktvariablee: y1 

----------------------------------------------------------------------------- 

Standard 

T 


----------------------------------------------------------------------------- 

CONSTANT -229,092 48,0022 -4,77254 0,0000 

x7 -10,9841 2,41239 -4,5532 0,0000 

x9 0,278296 0,043022 6,4687 0,0000 

x17 90,2917 15,5109 5,82117 0,0000 

x18 -92,135 14,6712 -6,28001 0,0000 

x19 0,973529 0,332094 2,93148 0,0042 

x21 0,824957 0,203737 4,04912 0,0001 

----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 

Model 3501,64 6 583,607 37,99 0,0000 

Residual 1551,65 101 15,3629 

----------------------------------------------------------------------------- 

Total (Corr.) 5053,3 107 






Bemerkung zur Tabelle 5.14.3 

Die 1. Spalte der beiden Tabellen beinhaltet die Parameterbezeichnung, die 2. Spalte die 

Koeffizienten der Prozessgleichung. Die Prozessgleichung kann auch in der Form 

y1 = -229,092 - 10,9841*x7 + 0,278296*x9 + 90,2917*x17 - 92,135*x18 + 

0,973529*x19 + 0,824957*x21 

geschrieben werden. In der 3. Spalte stehen die Standardabweichungen für die Koeffizienten 

der Prozessgleichung. Die 4. Spalte ist für die Werte der t-Statistik


317 

t 

j 

BY. 

j N − n 

= ⋅ 

jj 

S A 

R 

mit A jj als einem Diagonalelement von A –1 

xx reserviert. Die letzte Spalte beinhaltet die berechneten 

Irrtumswahrscheinlichkeiten für den t-Test. Sind diese Werte < 0.05, dann ist 

der zugehörige Regressionskoeffizient statistisch gesichert von null verschieden, d. h. dann 

hat x j einen wesentlichen Einfluss auf Y. 

Das Maß der Beherrschbarkeit des vollständigen Ansatzes sinkt durch den Übergang zum 

C p -optimalen Ansatz. Die Reststandardabweichung wird geringfügig kleiner. Das liegt aber 

offensichtlich an der Anzahl der FG. 

Schrittweise Auswahl der unwesentlichen Prozessvariablen nach dem Verfahren von Draper, 

Smith 

Das schrittweise Verfahren von Draper Smi th wurde von Miller [1984] beschrieben und vorn 

in diesem Abschnitt diskutiert. 

Beispiel 5.14.2: Chemischer Prozess. Schrittweise Auswahl der unwesentlichen 


Das Verfahren liefert die Prozessgleichung 

Tabelle 5.14.4: Ergebnis für die Prozessgleichung nach der schrittweisen Auswahl 


----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 

Standard 

T 


----------------------------------------------------------------------------- 

CONSTANT -224,444 49,8182 -4,50527 0,0000 

x7 -10,9184 2,42925 -4,49457 0,0000 

x9 0,273991 0,0447462 6,12322 0,0000 

x17 90,3134 15,5777 5,7976 0,0000 

x18 -92,2535 14,7377 -6,25969 0,0000 

x19 0,959545 0,335657 2,85871 0,0052 

x21 0,838724 0,207968 4,03294 0,0001 

----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 

Model 3490,06 6 581,676 37,54 0,0000 

Residual 1549,53 100 15,4953 

----------------------------------------------------------------------------- 

Total (Corr.) 5039,59 106 







oder wird in der üblichen Weise geschrieben: 

y1 = -224,444 - 10,9184*x7 + 0,273991*x9 + 90,3134*x17 - 92,2535*x18 + 

0,959545*x19 + 0,838724*x21 

Diese Gleichung stimmt mit der C p -optimalen Gleichung überein. Die geringfügigen Abweichungen 

sind numerischer Art. 

5.14.3 Red-Auswahlverfahren von Jahn 

Für das Modell mit stochastischen Input- un d Prozessvariablen wurde von Jahn [1991] das Red 

Auswahlverfahren entwickelt. Dieses Verfahren basiert auf der Reduktion der bedingten Varianz 

2 

σ Y / X durch Hinzunahme weiterer Input- und Prozessvariablen bzw. auf der Reduzierung dieser 

Varianz durch Streichen von Input- und Prozessvariablen und realisiert die Anforderungen an 

das optimale p* und die dazu gehörende Teilmenge von wesentlichen Input- und Prozessvariablen. 

Außerdem liefert dieses Verfahren die „wahre“ Rangfolge der Input- und Prozessvariable 

bzgl. ihres Einflusses auf den (die) Produktvariablen. 

Zur Untersuchung der durch die Streichung eines Teilvektors bedingten Veränderungen auf die 

Modellparameter Regressionskoeffizienten, bedingte Varianz (Restvarianz),„Vorhersagefehler“, 

Maß der Beherrschbarkeit des Prozesses und die Teststatistiken, wird von einer beliebigen, 

disjunk ten Zerlegung des Vektors X der Input- und Prozessvariable in X T = [X(k) T , X(h) T ], 

mit 

k = (k 1 , …, k p ), k 1 < k 2 < … < k p und h = (h 1 , …, h n – p ), h 1 < h 2 < … < h n – p 

ausgegangen. Damit erhält man die Zerlegung (siehe Glossar) der positiv definiten Kovarianzmatrix 

⎛ΣYY ΣYk ΣYh 

⎞ 

Σ = ⎜ Σkk 

Σ ⎟ 

kh , 

⎜ ⎟ 

⎝ 

Σ ⎠ 

hh 

wobei die Teilmatrizen die Ordnungen Σ YY : m × m, Σ kk : p × p, Σ hh : (n – p) × (n – p), Σ Yk : m × p, 

Σ Yh : m × (n – p) und Σ kh : p × (n – p) haben. 

Entsprechend der Kovarianzmatrix kann man die Momente der bedingten Verteilung, den 

bedingten Erwartungswert (Regressionsfunktion) und die bedingte Kovarianzmatrix zerlegen. 

Man erhält das folgende Ergebnis. 

Zerlegungssatz für die Momente einer bedingten Verteilung: 

Es sei Z ~ N m + n (0, Σ), Σ > 0 (positiv defi nit). 

und 

T 

T 

Yk . / h βYh . / k 

E[ Y/ X( k), X( h)] = β ⋅ X( k) + ⋅ X( h) 

T 

YY / k Y . h / k hh / k Y . h / k YY / X 

var [ Y/ X( k), X( 

h)] = Σ − β ⋅ Σ ⋅ β : = Σ ,


319 

wobei 

T 

Yk . / h = Yk . / h⋅ 

−1 

kk/ 

h, 

T 

−1 

Yh . / k = Yh . / k⋅ 

hh/ 

k, 

−1 

Yk . / h Yk Yh 

−1 

hh hk 

Yh . / k 

hh / k = 

Yh 

hh − 

Yk 

hk ⋅ 

kk 

−1 

kk ⋅ 

kh 

kh 

kk/ 

h = kk − kh ⋅ 

−1 

hh ⋅ hk 

β Σ Σ 

β Σ Σ 

Σ 

Σ 

= Σ 

= Σ 

− Σ 

− Σ 

⋅ Σ 

⋅ Σ 

⋅ Σ 

⋅ Σ 

= cov{[ Y, X( k)]/ X( h)}, 

= cov{[ Y, X( h)]/ X( k)}, 

Σ 

Σ 

Σ 

Σ 

Σ 

Σ 

Σ 

Σ 

Σ 

Σ 

, 

. 

Beweis: Jahn [1991]. 

Dieser Satz besagt, dass eine Regressionsfunktion als Summe zweier bedingter Regressionsfunktionen 

darstellbar ist; einmal zwischen Y und X(k) unter der Bedingung X(h) und zum 

anderen zwischen Y und X(h) unter der Bedingung X(k). Analog zerfällt die bedingte Kovarianzmatrix 

ebenfalls in zwei Bestandteile; einmal die bedingte Kovarianzmatrix des Vektors 

der Produktvariable Y unter der Bedingung X(k) und zum anderen in die quadratische Form 

T 

βYh . / k⋅Σhh/ k⋅β Yh . / k. 

Diese Form ist der Anteil, um den die bedingten Varianzen und Kovarianzen von Y unter 

der Bedingung X(k) verringert werden, wenn der Teilvektor der Input- und Prozessvariable 

X(h) zu dem Teilvektor X(k) hinzu genommen wird. Daher wird die quadratische Form 

T 

Yh . / k hh/ k Yh . / k 

β ⋅Σ ⋅β RED p (h) genannt. Die Umkehr dieser Interpretation ist, Red p (h) ist die 

proportionale Vergrößerung der bedingten Varianz z. B. der Produktvariablen Y r , r = 1, …, m 

unter der Bedingung X, wenn die Input- und Prozessvariablen X(h) gemeinsam gestrichen 

werden. 

Was bedeutet die Teilmengenregression? 

Die Zerlegung des bedingten Erwartungswertes und der bedingten Varianz dienen dem Auffinden 

eines Auswahlverfahrens für eine optimale Teilmenge von Input- und Prozessvariablen 

im Sinne der Minimierung des unbedingten Vorhersagefehlers und der Auseinandersetzung 

mit der Hocking’schen Teilmengenregression, die z. B. in Hocking and Lesie [1967], Hocking 

[1972, 1976], beschrieben wurde. 

T 

Y / k () Y / k 

Y = β ⋅ X k + F 

T 

1 

mit F Y/k ∼ N p (0, Σ YY/k ) und ist unabhängig von X(k), wobei βY / k = ΣY. 

k Σkk 

− . Der Vergleich der 

Teilmengenregression mit dem Zerlegungssatz zeigt eine Übereinstimmung des vollständigen 

Ansatzes mit der Teilmengenregression nur für den Fall Σ Yh = 0 und Σ kh = 0. Ist nur Σ kh = 0, 

dann gilt 

mit 

T 

T 

Y / k () βY / h () Y / X 

Y = β ⋅ X k + ⋅ X h + F 

Y / X = YY T 

/ k − Y / h ⋅ YY / h ⋅ Y / h 

var ( F ) Σ β Σ β . 

Da diese Fälle bei praktischen Anwendungen erkannt würden, besitzen sie nur theoretisches 

Interesse. Über die Auswirkung der Streichung von X(h) aus dem Ansatz gibt der folgende 

Satz Auskunf t.


Satz: Unter den bisherigen Voraussetzungen gilt 

und damit 

T T T 

−1 

Y / k = Y. k/ h + Y. h/ 

k ⋅ hk ⋅ kk, 

T 

−1 

Y / k = Y / X + βY. h/ 

k ⋅ − Σhk ⋅ Σkk 

β β β Σ Σ 

F F [ X( h) ] 

T 

YY/ k = YY/ X + Yh . / k⋅ hh/ k⋅ 

Yh . / k. 

Σ Σ β Σ β 

Die Elemente der bedingten Kovarianzmatrix Σ YY/k sind größer als die von Σ YY/X und zwar um 

genau die Elemente von Red p (h). 

Die Vorhersagefehler der Teilmengenregression sind 

und 

T 

T −1 

N. k= ΣYY / k+ βY. h/ k⋅ Σhh/ k⋅βY. h/ 

k ⋅ + E ⋅ kk⋅ 

E 

M ( ) [1 X () k A X ()] k 

U 

⎛ p ⎞ 

= ( + ⋅ ⋅ ) ⋅ ⎜1+ 

⎝ N − p −1⎟ 

⎠ . 

T 

N. k ΣYY / k βY. h/ k Σhh/ k βY. h/ 

k 

Der Vergleich der beiden unbedingten Vorhersagefehler U N.n und U N.k liefert ein erstes Indiz 

für die Konstruktion des Auswahlverfahrens, denn die Diagonalelemente der Vorhersagefehlermatrizen 

sind die Vorhersagefehler für jede Produktvariable Y j , j = 1, …, m und für diese 

genügt es, wenn gilt 

mit 

n − p 

N − n −1 

T 

Yh . / k⋅ hh/ k⋅ Yh . / k ≤ YY/ X ⋅ . 

β Σ β Σ 

T 

Y ⋅ M0. ( 2) 

ˆ jk ⋅Y ⋅ N − 

Fjk 

= , j = 1, …, 

n 

T 

Y ⋅ M Y 

jk 

T T −1 T T T T −1 T −1 

0, jk = ( − k ⋅( k ⋅ k ) ⋅ k) ⋅ j [ j ⋅ j − j ⋅ k ⋅( k ⋅ k ) ⋅ k ⋅ j ] ⋅ j 

−1 

⎡ X 

T T 

⎛ k⎞ ⎤ X 

T T 

⎛ k⎞ 

= I − ( Xj , Xk ) ⋅ ⎢⎜ ( Xk Xj 

) 

X ⎟ ⋅ ⎥ ⎜ 

j 

X ⎟ 

j 

M I X X X X X X X X X X X X X X 

⎢⎣⎝ ⎠ ⎥⎦ 

⎝ ⎠ 

berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen. 

Die Vorhersagefehler sind unbekannt und müssen ebenfalls bestimmt werden. Die ML-Schätzfunktion 

für den Vorhersagefehler ist 

ˆ 2 ⎛ 

. / 1 n ⎞ 

UNn = SY X ⎜ + 

⎝ 

⎟ 

N − n −1⎠ 

. 

Der Vorhersagefehler kann nun mit der Stichprobenkovarianzmatrix und dem geschätzten 

Red nach der Formel 

ˆ ˆ 

2 ⎛ p ⎞ 

UNn ′ . = [Red p( h) + ( N − n − 1) SY/ 

X] ⎜1 

+ 

⎝ N − p −1⎟ 

⎠ 

bestimmt werden.


321 

Bei einem sehr hohen Grad der Multikollinearität δ können Sie anstelle der Stichprobenkovarianzmatrix 

besser die Stichprobenkorrelationsmatrix R 

ˆ ˆ 

2 ⎛ p ⎞ 

UNn ′′ . = [Red′ p( h) + ( N − n − 1) SY′ / X] ⎜1 

+ 

⎝ N − p −1⎟ 

⎠ 

verwenden, wobei ˆRed ′ p( h ) mit den Diagonalelementen der inversen Korrelationsmatrix −1 

R XX 

2 

gebildet wird. Analoges gilt für S′ Y / X . 

Die ML-Schätzfunktionen für den unbedingten Vorhersagefehler können umgeschrieben 

werden. Man erhält 

ˆ ˆ 

2 ⎛ p ⎞ 

UNn ′ . = [Red p( h) + ( N − n − 1) SY/ 

X] ⎜1 

+ 

⎝ N − p −1⎟ 

⎠ 

ˆ 

2 N − 1 

= [Red p( h) + ( N − n −1) SY / X] 

N − p −1 

ˆ ˆ 

2 ⎛ p ⎞ 

UNn ′′ . = [Red′ p( h) + ( N − n − 1) SY′ / X) ⎜1 

+ 

⎝ N − p −1⎟ 

⎠ 

ˆ 

2 N − 1 

= [Red′ p( h) + ( N − n − 1) SY′ 

/ X) 

. 

N − p −1 

N ist konstant, daher kann man die Vorhersage im Sinne des Kriterium von Mallows umschreiben, 

d. h. N – 1 weglassen. Damit erhält man 

S 

n 

2 ˆRed ( ) ( 1) 

ˆ p h + N − n − SY / X 

= UC, N. n = 

. 

2 

( N − p −1) 

p* wird dann geschätzt, indem man für alle möglichen Teilmengen das kleinste U ˆ CNn , . sucht. 

Das dazu gehörende p bezeichnet man mit ˆp und betrachtet es als Schätzung für p*. Da ˆp eine 

Schätzung für p* ist, die aus den Realisierungen der Produktvariablen Y und des Vektors der 

Input- und Prozessvariablen X ermittelt wurde, kann anstelle der Optimalität des Verfahrens 

nur die asymptotische Optimalität nachgewiesen werden, d. h. es gilt die Wahrscheinlichkeit, 

dass 

Uˆ 

N. pˆ 

( N) 

⎯⎯⎯⎯⎯→ 1. 

U 

N−n( N) 

→∞ 

N. 

pˆ 

( N) 

ˆRed ( ) ( ) ( ) 

2 2 2 2 T 

ph = AY / k− AY / X= N − p ⋅ SY / k− N − n ⋅ SY / X= BY. h/ k⋅ Ahh/ k⋅ 

BY. h/ 

k 

ist die Schätzfunktion für Red p (h). Die Minimierung des unbedingten Vorhersagefehlers beinhaltet 

zwei Teilaufgaben, nämlich 

• 

• 

die Bestimmung der optimalen Anzahl der Elemente der Teilmenge und 

die Auswahl der wesentlichen Input- und Prozessvariablen.


Das Red Auswahlverfahren 

Da der Term N – 1 in der Formel U ˆ N . p konstant ist, genügt es, den Ausdruck 

S 

p 

2 ˆ 

Y / X p 

( N − n −1) ⋅ S + Red ( h) 

= 

( N − p −1) ⋅( N − p −1) 

zu minimieren. 

Das Red Auswahlverfahren läuft in mehreren Schritten ab. 

Im ersten Schritt wird für jede Input- und Prozessvariable 

ˆRed ( ) 

2 2 

p j = BY. j/ n−j ⋅ Sj/ 

n−j 

berechnet, wobei die Indexmenge h nur das Element j und demzufolge die Indexmenge k die 

restlichen n – j Elementen beinhaltet. S 2 j/ 

n− jist die Maximum Likelihood Schätzfunktion 

für die bedingte Varianz der j ten Input- oder Prozessvariablen unter der Bedingung, dass die 

−1 

restlichen Input- und Prozessvariablen konstant gehalten werden. Aus der Matrix S XX kann 

2 

S − j/ 

n− j abgelesen werden. Analog kann man natürlich auch mit der Korrelationsmatrix R XX 

2 

rechnen. Durch die Kehrwertbildung erhält man sofort den Wert A j/ 

n− 

j . 

B Y.j/n – j ist folglich der j-te Regressionskoeffizient der j-ten Input- oder Prozessvariablen. Dieser 

Koeffizient kann nach dem Zerlegungssatz gemäß der Zerlegung 

T 

T 

Y / X = Y. j/ n−j Y. n−j/ 

j 

B ( B , B ) 

sofort aus dem vollständigen Ansatz abgelesen werden. 

Die Minimierung des unbedingten Vorhersagefehlers U ˆ N . p mit Red p (h) erfolgt über die Lösung 

der oben genannten zwei Probleme 

• 

• 

Bestimmung des optimalen p ˆ * und 

die Auswahl der Input- und Prozessvariablen, die in X(k) zusammengefasst werden und 

die U ˆ N . p minimieren. 

Weiter oben wurde bereits darauf verwiesen, dass es aufgrund der Konstanz von N ausreichend 

ist, S p (h n – p ) zu minimieren. Für den vollen Ansatz gilt 

2 

Y / X 

n −1 

S 

Sn 

= 

N − 

anstelle von U ˆ Nn . . 

Mit den berechneten ˆRed n− 

1 ( j ) , j = 1, …, n werden alle Input- und Prozessvariablen in eine 

Rangfolge X [1] , …, X [n – p – 1] , X [n – p] , X [n – p + 1] , …, X [n] geordnet, in der X [1] die unwichtigste 

Input- oder Prozessvariable ist, da diese beim Streichen den unbedingten Vorhersagefehler 

am geringsten vergrößert. 

Der Ansatz ohne die unwichtigste Input- oder Prozessvariable 

S 

( h ) = 

n−1 [1] 

wird mit S n verglichen. 

ˆRed ([1]) ( 1) 

( N − n) ⋅( N − n −1) 

2 

n−1 + N − n − ⋅ SY / X


323 

Gilt 

S 

n−1 ≤ Sn, 

dann wird X [1] d. h. h [1] = h 1 = ([1]) aus der Analyse entfernt. Im anderen Fall, d. h. falls 

Sn− 1 > Sn 

, kann der vollständige Ansatz nicht reduziert werden. 

Im ˆRed nächsten Schritt ist zu prüfen, ob mit X [1] auch X [2] gestrichen werden kann. Hierfür ist 

n− 2 ( h2 

) zu berechnen, wobei h 2 = ([1], [2]) die zweielementige Teilmenge der beiden 

unwichtigsten Input- und Prozessvariablen ist. 

Gilt nun 

Red ˆ ( h ) ≤ Red ˆ ([3]) 

und 

S 

n−2 2 n−1 

n−2 ≤ Sn−1 , 

dann kann die Teilmenge X(h 2 ) T = (X [1] , X [2] ) aus dem Ansatz gestrichen werden. 

Gilt dagegen 

aber 

Red ˆ ( h ) > Red ˆ ([3]), 

S 

n−2 2 n−1 

n−2 ≤ Sn−1 , 

muss man prüfen, ob alle möglichen Zweier-Teilmengen, die alle die 3. Input- oder Prozessvariable 

beinhalten, ein kleineres ˆRed n− 2 als ˆRed n− 1([3]) 

liefern und damit ein kleineres 

S ˆ 

p [Red n− 2( h2)] 

ergeben. In diesem Fall wird das Verfahren fortgesetzt. Andernfalls ist das 

Verfahren beendet. 

Es gilt 

ˆRed 1 

.[1]/ [1] 

2 ( 2 ) ( .[1]/ [1] , .[2]/ 2] ) − 

Y n− 

n− h = bY n− bY n− ⋅ S[1].[2]/ n−[1].[2] 

⋅ ⎜ 

⎝b 

⎟ , 

Y.[2]/ n−2] 

⎠ 

wobei wiederum die beiden Regressionskoeffizienten b Y.[1]/ n−[1] 

und b Y.[2]/ n−2] 

aus dem vollständigen 

Ansatz abgelesen werden und S [1].[2]/n – [1].[2] entweder aus der inversen Matrix SXX 

− 1 

abgelesen oder entsprechend durch Invertierung der zerlegten Matrizen gebildet wird. 

In dieser Weise wird das Verfahren so lange fortgesetzt, wie 

Red ˆ ( h ) ≤ Red ˆ ([ n − p + 1]) 

und 

p n−p n−1 

S ( h ) ≤ S ( h ) 

p n− p p+ 1 n−p−1 

gilt, wobei im (n – p)-ten Schritt h n – p = ([1], [2], …, [n – p]). Die Teilmenge h n – p kann in 

diesem Fall gestrichen und das Verfahren mit der Erweiterung der Teilmenge h n – p um die 

[n – p + 1]-te Input- oder Prozessvariable fortgesetzt werden. 

Sind beide Bedingungen nicht erfüllt, dann ist man am Ende des Auswahlprozesses angelangt. 

Gilt jedoch 

Red ˆ ( h ) > Red ˆ ([ n − p + 1]) 

p n−p n−1 

⎛b 

⎞


und 

S ( h ) ≤ S ( h ), 

p n− p p+ 1 n−p−1 

dann ist das Verfahren in der 2. Stufe fortzusetzen. 

Wie vorher wird die Teilmenge 

([1], …, [n – p], [n – p + 1]) 

betrachtet. Aus dieser werden alle Teilmengen mit (n – p) Input- und/oder Prozessvariablen, 

die alle die [n – p + 1]-te Input- oder Prozessvariable beinhalten, gebildet. Es sind dies die 

Teilmengen 

(1) 

n− 

p 

(2) 

n− 

p 

( n− 

p) 

n− 

p 

h = ([2],[3],…,[ n − p],[ n − p + 1]), 

h = ([1],[3],…,[ n − p],[ n − p + 1]), 

h = ([1],[2],…,[ n − p −1],[ n − p + 1]) 

Hierfür werden die ˆRed p( hn − p) 

berechnet. 

Ist das Kleinste aller bisher berechneten 

⎡ ⎛n − p⎞⎤ 

⎛n − p + 1⎞ 

⎢1 + ⎜ ⎥ = 

, d.h. 

⎝ 1 ⎟ 

⎠ 

⎜ 

⎝ 1 ⎟ 

⎣ ⎦ 

⎠ 

⎧ 

⎛n 

− p⎞ 

⎫ 

⎪ 

⎜ 1 ⎟ 

⎪ 

⎝ ⎠ 

⎪ Min Red ˆ ( ), Min [Red ˆ l ⎪ 

⎨ 

( )] Red ˆ 

p hn−p p hn−p ⎬ ≤ n−p([ n − p + 2]), 

⎪ 

l = 1 

⎪ 

⎪ 

⎪ 

⎪⎩ 

⎪⎭ 

dann ist die Auswahl beendet und die zugehörige Teilmenge wird gestrichen. 

Gilt dagegen 

⎧ 

⎛n 

− p⎞ 

⎫ 

⎪ 

⎜ 1 ⎟ 

⎪ 

⎝ ⎠ 

⎪ Min Red ˆ ( ), Min [Red ˆ l ⎪ 

⎨ 

( )] Red ˆ 

p hn−p p hn−p ⎬ > n−p([ n − p + 2]), 

⎪ 

l = 1 

⎪ 

⎪ 

⎪ 

⎪⎩ 

⎪⎭ 

dann wird das Verfahren fortgesetzt. Hierzu wird die Teilmenge 

hn− p+ 2 = ([1], …,[ n − p + 2]) 

gebildet. Aus dieser werden alle Teilmengen mit (n – p) Input- und Prozessvariablen, die alle 

die [n – p + 2]-te Input- oder Prozessvariable beinhalten, gebildet. Für all diese Teilmengen 

werden die Red’s berechnet. Ist das Kleinste aller bisher berechneten


325 

⎡ ⎛n − p⎞ ⎛n − p + 1⎞⎤ 

⎛n − p + 2⎞ 

⎢1 

+ ⎜ + ⎥ = 

⎝ 1 ⎟ 

⎠ 

⎜ 

⎝ 2 ⎟ 

⎠ 

⎜ 

⎝ 2 ⎟ 

⎣ 

⎦ 

⎠ 

ˆRed p( hn − p) 

kleiner oder gleich ˆRed n−1([ n − p + 3]) , dann hat man die optimale Teilmenge 

gefunden und das Verfahren ist beendet. 

Andernfalls ist das Verfahren wie bisher beschrieben fortzusetzen. In der q-ten Stufe müssten 

⎡ ⎛n − p⎞ ⎛n − p + q −1⎞⎤ 

⎛n − p + q⎞ 

⎢1 

+ ⎜ + + = 

1 ⎟ … 

⎥ 

⎝ ⎠ 

⎜ 

⎝ q ⎟ 

⎠ 

⎜ 

⎝ q ⎟ 

⎣ 

⎦ 

⎠ 

l ˆRed p( hn − p) 

berechnet und mit ˆRed n−1([ n − p + q]) 

verglichen werden. Da q = 1, …, n – p 

⎛n⎞ 

müssten im ungünstigsten Fall ⎜ 

⎝p⎟ 

solche Teilmengenuntersuchungen durchgeführt werden. 

⎠ 

Satz: Dieser Algorithmus liefert das Minimum des unbedingten Vorhersagefehlers. 

Beweis: siehe Jahn [1991b]. 

Empfehlungen 

Insbesondere im Falle hoch multikollinearer Kovarianzmatrizen sind alle Berechnungen 

im standardisierten Modell durchzuführen, d. h. auf der Basis der Korrelationsmatrix. Die 

Rechenzei ten werden kürzer und die Ergebnisse wesentlich genauer. 

Abbruch des Verfahrens: 

Gilt sowohl 

Red ˆ ( h ) > Red ˆ ([ n − p + 1]) 

als auch 

p n−p n−1 

S ( h ) > S ( h ), 

p n− p p+ 1 n−p−1 

dann ist das Verfahren beendet und h n – p ist die zu streichende Teilmenge, die U N.n minimiert. 

Gilt 

Red ˆ ( h ) > Red ˆ ([ n − p + 1]) 

aber 

p n−p n−1 

S ( h ) ≤ S ( h ), 

p n− p p+ 1 n−p−1 

dann ist das Verfahren in der 2. Stufe fortzusetzen. In dieser Stufe werden alle Teilmengen mit 

n – p Input- und Prozessvariablen, die alle die [n – p + 1]-te Variable beinhalten, gebildet. Das 

Verfahren kann nach der 2. Stufe abgebrochen werden, da der Rechenaufwand sehr hoch wird 

und die Verbesserung minimal ist. 

Bei sehr hoch multikollinearen Matrizen sollte das Verfahren eventuell nach der 1. Auswahl noch 

einmal mit den verbleibenden wesentlichen Input- und Prozessvariablen neu gestartet werden.


Beispiel 5.14.3: Chemischer Prozess. Red-Auswahlverfahren 

Das obige Beispiel ist ein Modell mit stochastischen Input- und Prozessvariablen. Der 

vollständige Ansatz mit n = 12 Prozessvariablen liefert das Ergebnis der Tabelle 5.14.5. 

Tabelle 5.14.5: Prozessgleichung mit allen Prozessvariablen 

Prozessvar. Koeff.Proz.Gleich. t-Wert Irrtumswahrsch. Red(j) 

b 0 –408,705 –1,905 0,0598 0 

X 3 –0,63914 –0,75 0,455 0,0838 

X 4 0,2013 0,385 0,701 0,02208 

X 5 1,92428 0,1017 0,919 0,00154 

X 6 1,2744 0,0742 0,941 0,00082 

X 7 –11,7229 –2,9449 0,00406 1,2929 

X 9 0,32221 5,3921 0 4,3345 

X 16 –0,094157 –0,1113 0,9116 0,001848 

X 17 89,703117 4,8434 0 3,49726 

X 18 –91,06 –5,0647 0 3,82416 

X 19 1,07785 2,2573 0,0263 0,75965 

X 20 3,53736 1,26999 0,20719 0,24045 

X 21 0,80203 3,38099 0,001 1,7041 

Das Modell mit den wesentlichen Prozessvariablen ist in der Tabelle 5.14.6 enthalten. 

Tabelle 5.14.6: Prozessgleichung mit den wesentlichen Prozessvariablen 

Prozessvar. Koeff.Proz.Gleich. t-Wert Irrtumswahrsch. Red(j) 

b 0 –367,637 –3,029 0,00312 0,0000 

X 20 3,14768 1,242 0,217 0,2404 

X 19 0,96515 2,913 0,0044 0,75965 

X 7 –11,1443 –4,6253 0,00001 1,2929 

X 21 0,75278 3,562 0,00057 1,7042 

X 17 95,681 5,9554 0,0000 3,4973 

X 18 –97,11326 –6,401 0,0000 3,8241 

X 9 0,29609 6,54563 0,0000 4,33456 

Die F-Statistik hat den Wert 32.956 mit der Irrtumswahrscheinlichkeit p = 2.662e–023. Das 

vollständige wird mit dem reduzierten Modell anhand des Maßes der Beherrschbarkeit, des 

Vorhersagefehlers und der bedingten Standardabweichung verglichen. 

Tabelle 5.14.7: Vergleich des vollständigen und reduzierten Modells 

Statistik Vollständiges Reduziertes 

Maß d. Beherrschbarkeit 0,7001 0,6976 

Vorhersagefehler 3,9939 3,909 

Bedingte Standardabw. 3,7633 3,779 

FG d. Residuen 95 100


327 

Der Vergleich mit den „klassischen“ Auswahlverfahren liefert uns die folgenden Resultate: 

• 

• 

• 

• 

• 

• 

• 

• 

• 

Nach dem Red-Auswahlverfahren verbleiben 7 Prozessvariablen im Ansatz. 

Die wesentlichen Prozessvariablen nach dem Red-Verfahren sind X 7 , X 9 , X 17 , X 18 , X 19 , 

X 20 und X 21 . Die Prozessvariablen X 3 , X 4 , X 5 , X 6 , X 16 werden als unwesentlich erkannt 

und gestrichen. 

Die Rangfolge der wichtigen Prozessvariablen nach dem Red-Verfahren ist X [1] = X 9 , 

X [2] = X 18 , X [3] = X 17 , X [4] = X 21 , X [5] = X 7 , X [6] = X 19 , X [7] = X 20 . 

Nach den „klassischen“ Verfahren verbleiben 5 Prozessvariablen im Ansatz. 

Die wesentlichen Prozessvariablen nach den „klassischen“ Verfahren sind X 7 , X 9 , X 17 , X 18 , 

X 19 und X 21 . Die Prozessvariablen X 3 , X 4 , X 5 , X 6 , X 16 und X 20 werden als unwesentlich 

erkannt und gestrichen. 

Die Rangfolge ist: X [1] = X 9 , X [2] = X 18 , X [3] = X 17 , X [4] = X 7 , X [5] = X 21 , X [6] = X 19 . 

Die Rangfolgen unterscheiden sich. 

2 

Die Maße der Beherrschbarkeit sind nach der klassischen Auswahl R Y / p = 0.6929 und 

nach der Red-Auswahl R 2 Y/p = 0.6976 unterscheiden sich. 

Die Reststandardabweichungen nach der klassisch Auswahl S Y/X = 3.919 und nach der 

Red-Auswahl s Y/X = 3.779 unterscheiden sich. 

Warum unterscheiden sich die „klassischen“ von dem Red-Auswahlverfahren? 

Die Ursachen für die Ungleichheit der verschiedenen Verfahren sind: 

• Bei den klassischen Verfahren werden alle n Einzelhypothesen des 1. Schrittes individuell, 

nacheinander und nicht simultan geprüft, d. h. der Fehler 1. Art wird separat für jede 

Einzelhypothese nach 

P ( Fˆ 

≤ F / H ) = 1− 

α 

j 

α 

0. j 

gewählt. Das ist nicht korrekt! 

• Die univariaten einfachen Modelle E[Y] = β Y/j X j müssen nicht unbedingt „wahr“ sein. In 

diesen Fällen ist F ˆj nichtzentral F verteilt mit 1 und (N – 1) FG. Die univariaten Modelle 

müssen auch nicht unter Gültigkeit der H 0.j richtig sein. Die Nichtzentralitätsparameter 

sind unbekannt. 

• Bei der k-ten Entscheidung werden bei den klassischen Verfahren die vorangegangenen 

Entscheidungen nicht beachtet. 

• Das Red-Auswahlverfahren basiert in natürlicher Weise auf der Verringerung der bedingten 

Varianz (Restvarianz) durch Hinzufügen einer neuen Prozessvariablen, oder alternativ, auf 

der Vergrößerung der bedingten Varianz durch Streichen einer Prozessvariablen. 

• Die bedingte Varianz und die Tests werden unterschiedlich vom Grad der Multikollinearität 

beeinflusst. 

Nimmt der Unterschied zwischen den beiden Verfahren mit zunehmender Anzahl von 

Variablen zu? 

Zur Beantwortung dieser Frage betrachten wir das Beispiel des chemischen Prozesses mit einer 

größeren Anzahl von Input- und Prozessvariablen.


Beispiel 5.14.4: Chemischer Prozess. Vergleich von Reduktionsverfahren 

Y 1 sei wieder der Anteil der unerwünschten Substanz. Gegeben sind des weiteren p = 11 

Input und n = 21 Prozessvariablen. Das Modell nach der schrittweisen Auswahl ist in der 

Tabelle 5.14.8 enthalten. 

Tabelle 5.14.8: Modell nach der schrittweisen Auswahl 


----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 

Standard 

T 


----------------------------------------------------------------------------- 

CONSTANT 32,7401 13,4005 2,4432 0,0164 

x7 -6,31507 1,49519 -4,22359 0,0001 

x11 -0,011167 0,00382231 -2,92152 0,0043 

x17 5,07868 1,34843 3,76636 0,0003 

x21 0,689957 0,12185 5,66233 0,0000 

z1 0,752165 0,143026 5,25895 0,0000 

z2 2,01531 0,631772 3,18994 0,0019 

z3 0,0160964 0,00763823 2,10735 0,0377 

z5 0,121066 0,0086293 14,0297 0,0000 

z9 -0,0037483 0,00126582 -2,96116 0,0039 

z11 0,000460799 0,000129713 3,55245 0,0006 

----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 


----------------------------------------------------------------------------- 

Model 4625,68 10 462,568 104,93 0,0000 

Residual 427,621 97 4,40846 

----------------------------------------------------------------------------- 

Total (Corr.) 5053,3 107 






Die Red-Auswahl liefert das Modell in der Tabelle 5.14.9. 

Der Vergleich des schrittweisen und des Red-Auswahlverfahrens liefert folgende Ergebnisse: 

Nach dem schrittweisen Verfahren werden die Variablen 

x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 8 , x 9 , x 10 , x 12 , x 13 , x 14 , x 15 , x 16 , x 18 , x 19 , x 20 , z 4 , z 6 , z 7 , z 10 

gestrichen, nach dem Red-Auswahlverfahren werden die Variablen 

x 4 , x 5 , x 8 , x 12 , x 13 , x 14 , x 15 , x 16 

gestrichen. Die Mengen der unwesentlichen, gestrichenen Variablen sind verschieden.


329 

Tabelle 5.14.9: Red-Auswahl 

Value Std.Error t-value Pr(>|t|) Redn1 

b 0 2.027252e+002 2.243049e+002 0.90379 0.36872 0.00000000 

z 10 –6.204065e–004 5.822072e–004 –1.06561 0.28969 0.01659399 

z 4 1.954888e–001 1.817600e–001 1.07553 0.28525 0.03508154 

x 11 –2.643214e–002 1.165562e–002 –2.26776 0.02594 0.03583230 

x 6 –7.249619e+000 6.719864e+000 –1.07883 0.28379 0.03744574 

v 18 –2.017283e+001 1.669251e+001 –1.20850 0.23029 0.04066924 

v 19 3.563528e–001 2.197435e–001 1.62168 0.10867 0.04790650 

x 17 2.299280e+001 1.575657e+001 1.45925 0.14827 0.05208574 

x 1 1.117445e+000 6.533908e–001 1.71022 0.09096 0.05374786 

z 6 –1.495682e–002 1.464805e–002 –1.02108 0.31018 0.05745906 

x 7 –7.100759e+000 2.046982e+000 –3.46889 0.00083 0.05826068 

z 8 –3.658574e–001 2.529059e–001 –1.44661 0.15177 0.06943185 

x 3 –6.214773e–001 5.310112e–001 –1.17037 0.24520 0.07239814 

z 7 –5.642632e+001 3.649344e+001 –1.54620 0.12586 0.09617223 

x 9 2.859829e–001 1.464424e–001 1.95287 0.05421 0.09727591 

x 20 4.399184e+000 2.540006e+000 1.73196 0.08700 0.14827725 

z 2 1.457339e+000 6.175290e–001 2.35995 0.02062 0.16755061 

z 3 1.739045e–002 7.359728e–003 2.36292 0.02047 0.17278911 

z 11 9.192015e–004 3.210841e–004 2.86281 0.00531 0.19585702 

x 10 3.788326e–002 1.252605e–002 3.02436 0.00332 0.20522901 

z 9 –4.191362e–003 1.502543e–003 –2.78951 0.00655 0.23452021 

x 2 –5.915323e+000 2.305041e+000 –2.56625 0.01208 0.26927001 

x 21 6.039320e–001 1.607141e–001 3.75780 0.00032 0.28263726 

z 1 1.586419 0.38234719 4.14916 8e–005 0.5332058 

z 5 0.103754 0.01126534 9.21002 0e+000 1.2338190 

F-Statistic: 51.6531840865295 with a p-value of: 3.16569470906557e–040 

Statistic Complete_Model Red_Reduction 

Rsquared 0.939247 0.9372484 

UNn/UNp 4.093372 3.8205083 

Sqrt_UNn/UNp 2.023208 1.9546121 

RSS 307.002919 317.1021928 

syx/syp 1.693867 1.7215028 

Residual_df 75 83


Die Rangfolge für das schrittweise Verfahren ist 

Z 5 , X 21 , Z 1 , X 7 , X 17 , Z 11 , Z 2 , Z 9 , X 11 , Z 3 

und für das Red-Auswahlverfahren 

Z 5 , Z 1 , X 21 , X 2 , Z 9 , X 10 , Z 11 , Z 3 , Z 2 , X 20 , X 9 , Z 7 , Z 6 , X 1 , X 17 , X 19 , X 18 , X 6 , X 11 , Z 4 und Z 10 . 

Die Rangfolgen sind verschieden. 

Die Maße der Beherrschbarkeit (klassisch R 2 = 0.915, Red R 2 Y/X = 0.937) sind verschieden. 

Die Reststreuungen (klassisch s = 2.099, Red s Y/X = 1.72) sind ebenfalls verschieden. 

Wir wollen noch ein zweites Beispiel mit einer großen Anzahl von Input- und Prozessvariablen 

betrachten, bevor ich meine Schlussfolgerungen ziehe. 

Beispiel 5.14.5: Mikroelektronik. Red-Verfahren 

Die Herstellung mikroelektronischer Schaltkreise ist kompliziert. Die Anzahl der verschiedenen 

Prozesse des Netzwerkes „Herstellung“ ist groß. Die Anzahl der Input- und 

Prozessvariablen ist sehr groß. 

Wir wollen hier die Ausbeute an mikroelektronischen Schaltkreisen für zwei Netzwerke 

betrachten. Im 1. Netzwerk ist die Anzahl der Input- und Prozessvariablen n = 52. Der 

Grad der Multikollinearität ist δ = 0.8 10 58 . Im 2. Netzwerk ist n = 45 und δ = 0.2 10 27 . Die 

Ergebnisse der schrittweisen Verfahren, des C p von Mollows und des Red Auswahlverfahrens 

sind in der folgenden Tabelle zusammengestellt. 

Tabelle 5.14.10: Ergebnisse der Auswahl nach dem schrittweisen und Red-Verfahren 

n S 2 Y/p R 2 Y/p U N, p p 

1. Netzwerk 

vollständig 52 0,0017 0,708 0,00404 

schrittweise 0,0051 0,12 0,0052 2 

Red 0,0022 0,62 0,00306 25 

2. Netzwerk 

vollständig 45 69,55 0,52 140,7 

schrittweise 112,6 0,22 116,5 3 

Red 78,9 0,45 94,9 15 

Diese Beispiele zeigen: 

• Die schrittweisen Auswahlverfahren tendieren zu mächtigeren Auswahlmengen unwesentlicher 

Input- und Prozessvariablen, d. h. die Anzahl der wesentlichen Input- und 

Prozessvariablen wird zu klein. 

• Mit zunehmender Anzahl von Input- und Prozessvariablen werden die klassischen Verfahren 

schlechter, da bei diesen die Maße der Beherrschbarkeit zu klein und demzufolge 

die Reststandardabweichungen zu groß werden. 

• Mit zunehmenden Grad der Multikollinearität werden die klassischen Verfahren 

schlechter, da die Reduktion der Dimension des Parameterraumes größer, ja sogar zu 

groß wird.


331 

Gibt es Tests zur Prüfung von Hypothesen über Red p (h)? 

Ja. Zur Prüfung von Hypothesen über Red p (h) kann man den overall-F-Test, Varianzanalysen 

oder Tests zur Prüfung der partiell multiplen Korrelationskoeffizienten verwenden. 

Wir wollen die Tests im Einzelnen betrachten. 

Test zur Prüfung der Hypothese über Red n – 1 (j) 

2 2 2 

Aus der Darstellung [Re dn−1 ( j)] 

= BY. j/ n−j ⋅S j/ 

n−j 

folgt, dass wir zur Prüfung der 

H 0 : Red n – 1 (j) = 0 gegen die Alternative H 1 : Red n – 1 (j) ≠ 0 den F-Test in der Form 

ˆ Red n−1( j) ( N − n) 

F = 

S 

2 

Y / X 

verwenden können. Ist F ˆ ≥ FnN 

, −n 

() a , dann muss die H 0 zugunsten der H 1 verworfen werden. 

Dieser Test ist identisch mit dem F-Test zur Prüfung einer Einzelhypothese über einen 

Koeffizienten B Y.j/n – j der Prozessgleichung. 

Tests zur Prüfung der Hypothese über Red p (h) 

Zur Prüfung dieser Hypothese kann ebenfalls der F-Test verwendet werden. 

Die Teststatistik ist 

Red ( ) ( ) 

2 2 

T 

p h ⋅ N − n ( R / / ) ( ) . / / . / ( ) 

ˆ( ) 

Y X − RY k ⋅ N − n BYh kShh kBYh k N − n 

Fh = = = 

2 2 2 

. 

( n − p) S (1 − R ) ⋅( n − p) S ( n − p) 

Y / X Y / X Y / X 

Ist Fh ˆ( ) ≥ F ( ) 

n−p, 

N−n 

α , dann muss die H 0 zugunsten der H 1 verworfen werden. 

Varianzanalytische Prüfung 

Ausgangspunkt für diese Prüfung ist die Teilmengenregression 

T 

Y = β ⋅ X() k + F . 

Y / k Y / k 

(1) 

Die zu prüfende Hypothese lautet H0 : β Y / k = 0 . 

Verlängert man den Vektor der Input- und Prozessvariablen X(k) durch Hinzufügen von 

Komponenten aus X(h), die im Vektor X(u) zusammengefasst werden, wobei u = (u 1 , …, u s ), 

u 1 < … 

um die Prozessgleichung durch Verlängerung des Vektors X(k) null ist. Dieser 

Umstand wird durch die Hypothese 

(2) 

0 β T 

Yu . / k ⋅ Σ uu/ k ⋅ β Yu . / k = = p h 

H : 0 Red ( ) 

abgebildet. Zur Prüfung dieser Hypothese wird die folgende Varianztabelle aufgebaut. 

In dieser Tabelle bedeuten 

T −1 

Akk 

−1 

ATT 

H = X() k ⋅ ⋅ X(), 

k 

p 

T 

Hs 

= T ⋅ ⋅T, 

T = X( u) ⋅( I − H ), 

A 

TT 

= T ⋅T 

T 

p


Tabelle 5.14.11: Varianztabelle für die Prüfung der H 0 über Red p (h) 

Variationsursache Summe der 

Abweichungsquadrate 

FG 

F-Test 


in X(k) 


in X(k) und X(u) 

T 

Y ⋅ H ⋅Y 

p 

p 

Y ⋅ H ( ) 

T 

Y ⋅ Hs 

⋅Y 

s ˆ 

p ⋅Y ⋅ N − p 

F1 

= 

T 

Y ⋅( I − H ) ⋅Y ⋅ p 

T 

p 

T 

Rest Y ⋅( I − Hp 

− Hs) 

⋅Y 

N – p – s 

(2) ˆF 

Gesamt 

T 

Y ⋅ Y 

und somit 

T 

⋅ T 

T 

= A 

uu / k , 

so dass 

T 

Y ⋅ Hs 

⋅ Y = ˆRed p( j). 

F ˆ ∼ F′ 

( δ ) 

mit 

1 pN , − p 1 

T 

βY / k⋅ 

Akk⋅βY / k 

δ1 = 

. 

2 

σ / 

Y k 

2 

Y / k 0 

Bei Gültigkeit der H 0 gilt σ Y.k = 0 und damit ρ = , δ 1 = 0 und folglich 

ˆ . 

F1 ∼ FpN 

, − p 

Bemerkungen 

1. Die Teststatistik F 1 kann man mit multiplen Korrelationskoeffizienten darstellen. Es gilt 

2 

2 

R ( 

/ 

1) ( ) 

Y k ⋅( N − p) 

χp 

δ ⋅ N − p 

1 = = ∼ F 

2 2 

pN ′, − p δ1 

(1 − RY / k) 

⋅ p χN− 

p ⋅ p 

Fˆ ( ). 

Für die Prüfung der zweiten Hypothese 

ˆ (2) X ⋅ Hs 

⋅Y ⋅( N − p − s) 

F = 

T 

Y ⋅( I − H − H ) ⋅Y ⋅ s 

verwendet, wobei 

T 

(2) 

F ˆ ∼ FsN , −p−s 

( δ2 

) 

p 

s 

(2) 

H 0 wird die Statistik

5.15 Unter welchen Umständen ist die Annahme der Linearität gerechtfertigt? 

333 

ist und 

T 

βYu . / k⋅ 

Auu/ k⋅βYu . / k 

δ2 = 

. 

2 

σ / , 

Y k u 

(2) 

Für die Gültigkeit der H 0 ist auch diese F-Statistik zentral F verteilt mit den angegebenen 

Freiheitsgraden. 

2. Wegen der Darstellung 

2 2 

p h = ρY. h/ k ⋅σY / k 

Red ( ) 

können zur Prüfung von Hypothesen über Red p (h) auch die Tests zur Prüfung von partiell 

multiplen Korrelationskoeffizienten verwendet werden. 

5.15 Unter welchen Umständen ist die Annahme der 

Linearität gerechtfertigt? 

Über die Voraussetzung der Linearität in den Modellen für die Proze ssgleichung wird oft und 

heftig gestritten. Wir wollen zur Schlichtung des Streits hier von dem Modell mit stochastischen 

Input- und Prozessvariablen ausgehen. Für dieses Modell hatten wir vorausgesetzt, dass der 

Vektor Z T = (X T , Y T ) der Input-, Prozess- und Produktvariablen entweder multivariat normalverteilt 

ist oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Beide Annahmen 

sind praktisch relevant. 

Im Glossar wurde die bedingte multivariate Normalverteilung mit dem bedingten Erwartungswert 

und der bedingten Varianz beschrieben. 

Für den Vektor Z gilt unter den beiden Voraussetzungen 

−1 

Y YX XX X X 

E[ Y/ X] = μ + Σ Σ ( − μ ). 

Das ist eine lineare Funktion in X. Diese Funktion wird Regressionsfunktion genannt. Für die 

bedingte Varianz gilt 

−1 

YY YX XX XY YY / X 

var [ Y/ X] = Σ − Σ Σ Σ = : Σ . 

Dieser Ausdruck hängt nicht von X ab. 

Damit kann man den für die Anwendungen wichtigen Charakterisierungsatz aufschreiben, 

der einen Zusammenhang zwischen der Verteilungsvoraussetzung und der Linearität der 

Regressionsfunktion präzisiert. 

Wenn der bedingte Erwartungswert eine lineare Funktion in den Variablen unter Bedingung und 

die bedingte Varianz unabhängig von X ist, dann ist die zugrunde liegende gemeinsame Verteilung 

eine Normalverteilung. Wenn die Verteilung von Z eine multivariate Normalverteilung ist, 

dann ist der bedingte Erwartungswert eine lineare Funktion der Variablen unter der Bedingung 

und die bedingte Kovarianz ist unabhängig von den Variablen unter der Bedingung. 

Aus diesem Satz wird deutlich, dass der Streit entweder auf der Basis des Modells mit festen 

Input- und Prozessvariablen oder akademisch geführt wird.


5.16 Warum muss ein Prozess gesteuert werden und wie 

können wir einen Prozess steuern? 

Jeder, der sich in sein Auto setzt und die Absicht hat, loszufahren, überlegt sich vorher, wohin 

er fahren und welche Strecke er benutzen will. Niemand startet sein Auto, macht die Augen 

zu und fährt los! Das Ziel der Autofahrt entspricht dem Sollwert und die zu fahrende Strecke 

– entweder über das Gebirge oder durch das flache Land – kann mit der Steuerung eines Prozesses 

verglichen werd en. Was jeder mit seinem privaten Fahrzeug macht, kann er auch mit 

den betrieblichen Prozessen tun. 

In einem heuristisch, d. h. durch Erfahrung gesteuerten oder ungesteuerten Prozess sind 

• 

• 

• 

• 

die Streuungen der Input-, Prozess- und Produktvariablen in der Regel sehr groß, 

die Zielwerte für die Steuerung in Form von Sollwerten und Toleranzgrenzen in der Regel 

nicht bekannt, 

der Ausschuss sehr hoch, die Kundenanforderungen werden nur mangelhaft erfüllt und 

die uniund multivariaten Prozessfähigkeitsindizes sind in der Regel kleiner als 1. 

Die Folge hiervon ist, der Prozess muss verbessert werden, um die Verluste durch mangelhafte 

Qualität zu reduzieren. Das ist nur durch die statistische Prozessanalyse mit anschließender 

Steuerung des Prozesses möglich. 

Die statistische Prozessanalyse liefert uns hierfür die Prozessgleichung mit den wesentlichen 

Input- und Prozessvariablen. Die Zielwerte und den Zielbereich für die Steuerung liefert uns 

die statistische Tolerierung. In diesem Zusammenhang müssen wir darüber sprechen, dass die 

Qualität des Prozesses notwendige Voraussetzung für die Qualität des Produktes ist. 

Was ist die Qualität des Prozesses? 

Die Qualität des Prozesses ist die Fähigke it des Prozesses, Produkte mit vorgegebenen Eigenschaften 

zu produzieren, wobei die vorgegebenen Eigenschaften eines Produktes durch die 

Sollwerte und Toleranzgrenzen für die Menge der nicht unabhängigen Produktvariablen spezifiziert 

werden. Die Produktion solcher Produkte (materielle Produkte oder Dienstleistungen) 

erfordert, dass der dazu gehörende Prozess mit der Prozessgleichung in Richtung der Zielwerte 

gesteuert wird, so dass die Werte für die Produktvariablen der produzierten Produkte in dem 

durch die Toleranzgrenzen vorgegebenen Zielgebiet liegen. 

Die Steuerung besteht nun im wesentlichen darin, solche Werte für die Input- und Prozessvariablen 

in die Prozessgleichung einzusetzen, die 

• garantieren, dass die Werte für die Produktvariablen in dem gegebenen Zielgebiet liegen 

und deren Mittelwerte mit den Sollwerten übereinstimmen, 

• zu einer Verringerung der Variation der Produktvariablen von bislang ungesteuerten 

Prozessen führen 

• und somit simultan alle Kundenanforderungen erfüllt werden. 

Die Frage ist nun nur noch, 

Wie können wir diese Werte für die wesentlichen Input- und Prozessvariablen finden? 

Für die Lösung stehen uns mindestens zwei Wege zur Verfügung.

5.16 Warum und wie muss ein Prozess gesteuert werden? 

335 

Der 1. Weg führt auf die Berechnung der statistischen Sollwerte und Toleranzgrenzen für die 

Input- und Prozessvariablen und der 2. Weg auf die Optimierung des gesamten Prozesses mit 

den Methoden der linearen und nichtlinearen Optimierung (vgl. Kapitel 12). 

Hauptsächlich befassen wir uns in diesem Kapitel mit dem 1. Weg, da uns dieser die Sollwerte 

und Toleranzgren zen für die Inputprodukte liefert. Und diese sind ja notwendige Voraussetzung 

für die Realisierung der Kommunikation zwischen den Kunden und Lieferanten. 

5.16.1 Statistische Tolerierung der Inputvariablen 

Zuerst berechne n wir nach dem bekannten Verfahren der statistischen Tolerierung aus dem 

Abschnitt 5.2 die statistischen Sollwerte und Toleranzgrenzen für die wesentlichen Inputvariablen 

unter der Bedingung, dass die Werte für die Produktvariablen vorgegeben sind. Danach 

berechnen wir die Sollwerte und statistischen Toleranzgrenzen für die Prozessvariablen unter 

der Bedingung, dass die Produkt- und Inputvariablen gegeben sind. 

Mit einer vorliegenden Stichprobe berechnen wir die Inputgleichungen. Das sind Gleichungen, 

in denen die Inputvariablen die abhängigen Zielvariablen sind und die Produktvariablen 

als unabhängige Variablen fungieren. In diese Gleichungen setzen wir die Sollwerte und die 

Toleranzgrenzen für die Produktvariablen ein, um die Sollwerte und Toleranzgrenzen für die 

Inputvariablen zu berechnen. 

Für all die Fälle, in denen keine Sollwerte und Toleranzgrenzen für die Produktvariablen 

vorhanden sind, verwenden wir die Formeln der statistischen Tolerierung für die Produktund 

Inputvariablen und berechnen die statistischen Sollwerte und Toleranzgrenzen für die 

Inputvariablen. 

Die Berechnungen der statistischen Sollwerte und Toleranzgrenzen für die Input- und Prozessvariablen 

unter den entsprechenden Bedingungen werde ich an dem folgenden Beispiel 

demonstrieren. 

Beispiel 5.16.1: Chemischer Prozess. Statistische Tolerierung der Input- und 


Die statistischen Toleranzgrenzen wurden mit dem Prozessspezialisten abgesprochen, 

geringfügig korrigiert und in der Tabelle 5.16.1 zusammengefasst. 

Tabelle 5.16.1: Statistische Toleranzgrenzen für die Produktvariablen 

Produktvariable Untere Toleranz Obere Toleranz 

Y 1 0 8 

Y 2 1680 1820 

Y 3 1902 1920 

Y 4 1546 1565 

Y 5 8000 10000 

Y 6 320 400 

Mit den abgestimmten statistischen Toleranzgrenzen wurden die uniund multivariaten 

Prozessfähigkeitsindizes berechnet und in der Tabelle 5.16.2 zusammengestellt. 

Die Prozessfähigkeiten sind kleiner als 1; der Prozess muss verbessert werden.


Tabelle 5.16.2: Uni- und multivariate Prozessfähigkeitsindizes 

Produktvariable C p k C pk 

Y 1 0,194 3,82 –0,55 

Y 2 1,38 0,005 1,375 

Y 3 0,315 0,342 0,207 

Y 4 0,432 0,038 0,415 

Y 5 0,227 0,194 0,183 

Y 6 0,217 0,268 0,159 

Multivariate Prozessfähigkeiten 

MC p 0,65 

MC pk 0,038 

Die folgenden beiden Abbildungen enthalten die Star Plots für alle Input-, Prozess- und 

Produktvariablen und nur für die Inputvariablen, da der Verdacht besteht, dass für die 

Inputvariablen weder Sollwerte und Toleranzgrenzen berechnet, noch Eingangsprüfungen 

vorgenommen wurden. 

100 108 

90 

80 

70 

60 

50 

40 

30 

20 

Abb. 5.16.1: Star Plots für die Input-, Prozess- und Produktvariablen 

10


337 

X11 

X17 

X18 

X19 

X20 

X21 

Z1 

Z2 

Z3 

Z4 


X10 

Z5 

X9 

Z6 

X7 

Z7 

X6 

Z8 

X3 

X2 

X1 

Y1 

Z11 

Z10 

Z9 

Die Star plots zeigen: 

• 

• 

• 

• 

die Streuungen für die einzelnen Variablen sind sehr groß; man vergleiche z. B. die Stars 

55 und 104 miteinander, 

der Prozess zeigt ein gewisses „Atmen“, d. h. eine gewisse systematische Veränderung 

bis zum Star 50 und dann eine ziemlich rigide Veränderung. 

Innerhalb der Gruppen gibt es aber auch noch sehr starke Veränderungen, 

die Produktvariable Y 1 (unerwünschtes Nebenprodukt) kommt mal sehr selten, siehe 

z. B. die Star Plots 86, 87, 49, 40 und ein anderes Mal sehr häufig vor, siehe z. B. die Star 

Plots 90, 91, 10, … 

100 

90 

80 

70 

60 

50 

40 

30 

Abb. 5.16.3: Star Plots für die Input- und Produktvariable Y 1 

20 

10


Da die Stars aufgrund der vielen Achsen (Variablen) schwer zu interpretieren sind, weil sowohl 

Input-, Prozess- und Produktvariablen dargestellt wurden, wollen wir noch die Inputund 

die Produktvariablen allein betrachten, um zu sehen, ob die Inputvariablen ebenfalls 

stark streuen und diese Streuungen einen Einfluss auf die Produktvariable Y 1 haben. 

Z5 

Z4 

Z3 

Z6 

Z2 

Z7 

Z1 

Z8 

Y1 

Z9 

. Z10 

Z11 

Abb. 5.16.4: Schlüssel für die Star Plots für die Input- und Produktvariablen Y 1 

Interpretation der Star Plots für die Input- und die Produktvariablen 

Die Inputvariablen schwanken sehr stark. Das Produkt kann daher gar nicht homogen sein, 

oder anders gesprochen, das unerwünschte Nebenprodukt kommt mal vor und mal nicht. 

Schauen Sie sich nur einmal die Plots mit den Nummern 49 und 91 an, dann sehen Sie die 

gewaltigen Unterschiede. Beim Plot Nummer 91 kommt das unerwünschte Nebenprodukt 

in hoher Konzentration vor. Beim Plot Nummer 40 kommt das Nebenprodukt praktisch 

T2 

0 50 100 150 

5 10 15 20 

Abb. 5.16.5: Multivariate Kontrollkarte für das „Lieferantenprodukt“


339 

überhaupt nicht vor. Schon hieraus muss man schließen, dass das unerwünschte Nebenprodukt 

im Herstellungsprozess entsteht und dass der Prozess so gesteuert werden kann, 

dass das Nebenprodukt nicht mehr vorkommt. Die moderne Industrie muss nach meinem 

Dafürhalten anders, präziser arbeiten. 

Die multivariate Kontrollkarte für die Inputvariablen mit der berechneten Toleranzgrenze 

für das Inputprodukt in der Abbildung 5.16.5 bestätigt unsere Vermutung hinsichtlich der 

Inputvariablen, dass für diese nämlich keine Sollwerte und Toleranzgrenzen zu existieren 

scheinen. 

Das „Lieferantenprodukt“ sind die zusammengefassten Inputvariablen des chemischen 

Prozesses. Die Abbildung zeigt ganz deutlich: Die meisten Werte der Teilstichproben liegen 

oberhalb der Toleranzgrenze für das „Lieferprodukt“, d. h. die meisten Lieferantenprodukte 

sind Ausschuss. Die Input variablen erfüllen offenbar keinerlei Vorgaben. Es muss etwas 

getan werden. 

Uni- und multivariater Prozessfähigkeitsnachweis für die Inputprodukte 

Der Nachweis der simultanen Erfüllung der Kundenanforderungen bzgl. der Lieferantenprodukte 

(Menge der Inputvariablen) erfolgt über die Fähigkeiten der Tabelle 5.16.3. 


Inputvariable 

untere 

Toleranz 

obere 

Toleranz 

Mittel Stabw. C p k C pk 

Z 1 19,4 28,6 24,857 1,88 0,815 0,186 0,663 

Z 2 0,8 1,2 1,223 0,363 0,183 1,115 –0,021 

Z 3 100 160 134,85 40,136 0,249 0,161 0,209 

Z 4 0,3 0,4 0,3565 1,1326 0,0147 0,129 0,0128 

Z 5 100 180 144,56 51,654 0,258 0,114 0,229 

Z 6 90 130 107,93 26,86 0,248 0,103 0,222 

Z 7 1,12 1,18 1,13 0,0118 0,846 0,667 0,282 

Z 8 9,22 10,78 9,749 0,962 0,27 0,32 0,183 

Z 9 1600 1780 1677,25 221,79 0,135 0,142 0,116 

Z 10 900 1000 905,68 1147,18 0,0145 0,886 0,0017 

Z 11 2500 3300 2991,58 2033,33 0,066 0,229 0,051 


MC p = 0.3104 

MC pk = 0.0372 

Die uniund multivariaten Prozessfähigkeitsindizes bestätigen die vorangegangene Vermutung. 

Sie sind viel kleiner als 1. Die Inputvariablen erfüllen nicht die Anforderungen. 

Wie kann man die Werte für die wesentlichen Input- und Prozessvariablen finden, die auf 

jeden Fall die genannten Ziele der Reduktion der Variation und der Übereinstimmung 

von Mittel- und Sollwerten erfüllen?


5.16.2 Berechnung der statistischen Sollwerte und Toleranzgrenzen für 

die Inputvariablen unter der Bedingung der gegebenen Werte für 

die Produktvariablen 

Diese Berechnungen werden mit dem linearen Modell mit stochastischen Variablen realisiert, 

wobei die Inputvariablen als Zielgrößen fungieren und für die Produktvariablen die 

Sollwerte und Toleranzgrenzen eingesetzt werden. 

Die so zu berechnenden Gleichungen nennen wir Inputgleichungen. 

Nach Diskussion und Abstimmung mit den Prozessexperten erhalten wir die Resultate in 

Tabelle 5.16.4. 

Tabelle 5.16.4: Statistische Sollwerte und Toleranzgrenzen für die Inputvariablen 

Inputvariable Sollwert untere Toleranz obere Toleranz 

Z 1 23,57 22,2 24,9 

Z 2 0,89 0,11 1,66 

Z 3 115,5 46,5 184,6 

Z 4 0,014 0 2,59 

Z 5 65,6 30,4 100,9 

Z 6 101,1 60,4 141,7 

Z 7 1,12 1,1 1,14 

Z 8 11,3 9,2 13,4 

Z 9 1867 1511 2223 

Z 10 733 633 933 

Z 11 2351 1160 3538 

Berechnung der statistischen Toleranzen für die wesentlichen Prozessvariablen 

Analog wie vorher werden Einstellgleichungen für die wesentlichen Prozessvariablen 

berechnet. In diese werden die Sollwerte und Toleranzgrenzen für die Produktvariablen 

und die abgestimmten statistischen Sollwerte und statistischen Toleranzgrenzen für die 

Inputvariablen eingesetzt. Damit erhält man die Einstellwerte und zugehörigen statistischen 

Toleranzgrenzen für die wesentlichen Prozessvariablen in Tabelle 5.16.5. 

Die Kunden haben für die unerwünschte Produktvariable die obere Grenze (oG) für Y 1 

vorgegeben. Diese ist oG (Y 1 ) = 8.00 [‰]. Die optimale Einstellung der Input- und wesentlichen 

Prozessvariablen für die Erreichung des Zieles: „die Werte von Y 1 dürfen nicht größer 

als 8 [‰] sein, sollten aber mehr in der Nähe der Null liegen“ ist durch die statistischen 

Sollwerte und Toleranzgrenzen für die Prozessvariablen und die unter den Bedingungen 

gegebener Produkt- und Prozessvariablen berechneten Sollwerte und Toleranzgrenzen für 

die Inputprodukte gegeben. 

Prozessgleichung für den gesteuerten Prozess 

Nach der Steuerung mit der Prozessgleichung wurde eine neue Stichprobe gezogen. Die 

erneute Berechnung der Prozessgleichung findet sich in Tabelle 5.16.6. 

Nach der erneuten Red-Auswahl erhält man die noch einmal reduzierte Prozessgleichung 

der Tabelle 5.16.7.


341 

Tabelle 5.16.5: Statistische Toleranzgrenzen für die wesentlichen Prozessvariablen 

Prozessvariable Sollwert untere Toleranz obere Toleranz 

X 1 67,8 66 69,6 

X 2 99,7 99,2 100,3 

X 3 65,2 63 67,4 

X 6 9,7 9,5 9,9 

X 7 10 9,4 10,6 

X 9 1130 1123 1137 

X 10 1060 960 1160 

X 11 1500 1400 1600 

X 17 2,6 2,5 2,7 

X 18 2,7 2,6 2,8 

X 19 36 30 42 

X 20 38,6 38,1 39,1 

X 21 25 17,8 32,2 

Tabelle 5.16.6: Prozessgleichung nach der Steuerung 

Variable Koeff.Proz.Gleich. Red(j) 

b o –273,416 0 

X 1 0,32589 0,00137 

X 2 –1,08663 0,01091 

X 3 –0,20621 0,002856 

X 6 –0,595993 0,000465 

X 7 –1,36983 0,0152204 

X 9 0,261945 0,0047759 

X 10 0,114271 0,010079 

X 11 –0,0716 0,0073467 

X 17 85,48145 0,0024669 

X 18 –49,4267 0,0015969 

X 19 0,114293 0,00582 

X 20 0,635618 0,007018 

X 21 0,167596 0,027981 

Z 1 0,455685 0,026173 

Z 2 1,633097 0,0080945 

Z 3 0,0121218 0,005202 

Z 4 4,065848 0,002721 

Z 5 0,068044 0,07361 

Z 6 –0,01391 0,00199 

Z 7 –18,1231 0,00493298 

Z 8 –0,385073 0,005596 

Z 9 –0,006996 0,011288 

Z 10 –0,00021174 9,91 E–7 

Z 11 0,0015124 3,177 E–3


Tabelle 5.16.7: Prozessgleichung nach der erneuten Red-Auswahl 

Variable Koeff.Proz.Gleich. Red(j) 

b 0 –280,853 0 

X 1 0,333204 0,001372 

X 18 –50,0706 0,001596 

Z 6 –0,013221 0,001992 

X 17 87,2177 0,002466 

Z 4 4,431869 0,002721 

X 3 –0,225889 0,0028566 

Z 11 0,0013754 0,0031779 

X 9 0,259213 0,0047758 

Z 7 –18,15834 0,004932 

Z 3 0,012232 0,005202 

Z 8 –0,381648 0,005596 

X 19 0,11539 0,00582 

X 20 0,656262 0,007019 

X 11 –0,07158 0,007346 

Z 2 1,601321 0,0080945 

X 10 0,114915 0,010079 

X 2 –1,064585 0,010916 

Z 9 –0,0072043 0,011288 

X 7 –1,470685 0,01522 

Z 1 0,462309 0,026173 

X 21 0,173212 0,027981 

Z 5 0,067565 0,07361 

Die erneute Red-Auswahl führte dazu, dass die beiden Variablen X 6 und Z 10 gestrichen 

werden konnten. Das Maß der Beherrschbarkeit für die Prozessgleichung des gesteuerten 

2 

Prozesses ist mit R Y / X = 0,9072 sehr hoch. Die bedingte Standardabweichung (Streuung 

um die Prozessgleichung) ist s Y/X = 0,369. 

Die graphische Darstellung der Werte für Y 1 vor und nach der Steuerung zeigt die Abbildung 

5.16.6 

Anteil in ppm 

50 

45 

y1(gesteuert) 

40 

35 

30 

25 

20 

15 

10 

5 

0 

1 51 101 151 201 

Messwertsatz 

y1(ungesteuert) 

Abb. 5.16.6: Werte für die Produktvariable Y 1 vor und nach der Steuerung mit der Prozessgleichung


343 

Die Prozessverbesserung ist enorm. Hinsichtlich der Mittelwerte beträgt die Verbesserung 

ca. 450 %! Oder anders ausgedrückt, der Anteil des unerwünschten Nebenproduktes wird 

auf ca. 1/5 reduziert. 

Der Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen erfolgt 

durch uniund multivariate Prozessfähigkeitsindizes. 

Tabelle 5.16.8: Univariate Prozessfähigkeiten für den gesteuerten Prozess 

Produktvariable C p k C pk 

Y 1 1,099 0,0048 1,094 

Y 2 1,005 0,0015 1,003 

Y 3 1,0086 0,027 1,004 

Y 5 1,0676 0,009 1,0579 

Y 6 1,072 0,0113 1,06 


MC p = 1,182 

MC pk = 1,173. 

Das Maß der Beherrschbarkeit und die Prozessfähigkeitsindizes zeigen, dass der Prozess beherrscht 

wird und fähig ist, Produkte mit den geforderten Eigenschaften zu produzieren. 

Die Inputvariablen erfüllen ebenfalls simultan die Anforderungen, wie die uniund multivariaten 

Prozessfähigkeitsindizes der folgenden Tabelle zeigen. 

Tabelle 5.16.9: Univariate Prozessfähigkeitsindizes für die Inputvariablen nach der Steuerung 

Inputvariable C p k C pk 

Z 1 1,041 0,0075 1,034 

Z 2 0,957 0,025 0,933 

Z 3 0,993 0,0047 0,998 

Z 4 1,103 0,0056 1,097 

Z 5 1,0778 0,0052 1,072 

Z 6 1,0294 0,0055 1,072 

Z 7 0,991 0,0001 0,99 

Z 8 0,937 0,01 0,927 

Z 9 0,959 0,0073 0,953 

Z 10 1,035 0,0099 1,024 

Z 11 0,976 0,0008 0,975 

Die multivariaten Prozessfähigkeitsindizes für die Lieferantenprodukte sind 

MC p = 1,027 

MC pk = 1,017. 

Auch die Lieferantenprodukte haben sich verbessert. Die Qualität der Lieferantenprodukte, 

ausgedrückt durch die multivariaten Prozessfähigkeitsindizes ist geringfügig größer als 1, 

kann also noch etwas verbessert werden. 

Die uniund multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die 

Prozessvariablen sind in folgender Tabelle dargestellt.



Prozessvariable C p k C pk 

X 1 0.38 0.025 0.37 

X 2 0.84 0.083 0.77 

X 3 0.619 0.026 0.60 

X 6 1.11 0.11 0.98 

X 9 0.20 0.4 0.12 

X 10 0.12 0.003 0.12 

X 11 0.12 0.11 0.105 

X 17 0.05 0.12 0.045 

X 18 0.049 0.18 0.04 

X 19 1.31 0.097 1.18 

X 20 0.937 0.048 0.89 

X 21 0.98 0.12 0.85 

Die multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die Prozessvariablen 

sind 

MC p = 0.9399 

MC pk = 0.0798. 

Die Einstellung der Prozessvariablen ist nicht in Ordnung. Mit den berechneten Einstellwerten 

für die Prozessvariablen erhält man die Fähigkeitsindizes der Tabelle 5.16.11. 

Tabelle 5.16.11: Univariate Prozessfähigkeitsindizes für die Prozessvariablen 

Prozessvariable C p k C pk 

X 1 0.48 0.008 0.48 

X 2 0.98 0.14 0.84 

X 3 0.68 0.00 0.68 

X 6 1.21 0.05 1.15 

X 9 0.26 0.004 0.26 

X 10 0.15 0.005 0.15 

X 11 0.12 0.01 0.12 

X 17 0.033 0.004 0.03 

X 18 0.03 0.03 0.03 

X 19 0.89 0.01 0.88 

X 20 0.86 0.05 0.81 

X 21 1.22 0.005 1.22 

Die multivariaten Prozessfähigkeitsindizes für die Prozessvariablen sind 

MC p = 0.992 

MC pk = 0.8226. 

Die Qualität des Prozesses muss weiter verbessert werden. Die Zentrierung ist in Ordnung, 

die Reduktion der Variabilität der Prozessvariablen ist nicht ausreichend. Die Entscheidung 

muss aber das Management fällen, da die weitere Verbesserung Kosten verursacht.


345 

Die Verbesserung des Prozesses durch die Steuerung mit der Prozessgleichung kann durch 

die multivariate Regelkarte für die „Produkte“ in Abbildung 5.16.7 sichtbar gemacht 

werden. Auch die Verbesserung der Lieferantenprodukte durch die Steuerung des Lieferantenprozesses 

mit den berechneten Sollwerten und Toleranzgrenzen als Zielgebiet kann 

visualisiert werden. 

T2 

0 1 2 3 4 5 

0 10 20 30 40 

Abb. 5.16.7: Multivariate Kontrollkarte für die Produkte des gesteuerten Prozesses 

Alle Produkte liegen unterhalb der Toleranzgrenze für das Produkt. Der Prozess ist in Ordnung, 

d. h. die Produkte erfüllen simultan alle relevanten Kundenanforderungen. 

Die multivariate Kontrollkarte für die Lieferantenprodukte ist in der Abbildung gegeben. 

T2 

0 1 2 3 4 5 6 

0 10 20 30 40 

Abb. 5.16.8: Kontrollkarte für die gesteuerten Lieferantenprodukte 

Bei dieser Karte liegen zwei Stichproben oberhalb der Kontrollgrenze. Der Lieferantenprozess 

muss noch weiter verbessert werden.


5.17 Zusammenfassung der Produktvariablen 

Welches Problem soll mit der Zusammenfassung gelöst werden? 

Wiederholt habe ich darauf hingewiesen, dass 

• ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben wird, 

• sich die Produktvariablen mitunter bzgl. ihrer Zielstellung gegensätzlich verhalten, d. h. die 

eine Produktvariable muss eventuell maximiert, die andere minimiert werden, 

• der Prozess zur Herstellung eines Produktes aber nur nach dem Zielwert einer Produktvariablen 

gesteuert werden kann, 

• die Steuerung nur mit einer optimalen Teilmenge von Input- und Prozessvariablen möglich 

ist und 

• nur mit einer optimalen Einstellung für die Input- und Prozessvariablen vorgenommen 

werden kann. 

Aus diesen Feststellungen folgt, dass für die Ermittlung der einen optimalen Teilmenge von 

Input- und Prozessvariablen und die Berechnung der optimalen Einstellung, die Produktvariablen 

zusammengefasst werden müssen. 

Diese Zusammenfassung kann natürlich nicht auf der Addition basieren, denn die Produktvariablen 

haben verschiedene Dimensionen und sind nicht unabhängig voneinander. 

Wie können die verschiedenen Produktvariablen zusammengefasst werden? 

Um diese Frage beantworten zu können, müssen wir einige Sachverhalte aus der Schätztheorie 

wiederholen. 

Es liege wieder eine Stichprobe X 1 , …, X N für den zufälligen Vektor X T = (X 1 , …, X n ) vor. Der 

T 

Vektor der Mittelwerte X = ( X 1 ,…, X n ) ist n-dimensional normalverteilt mit dem Erwartungswert 

μ T = (µ 1 , …, µ n ) und der Kovarianzmatrix N –1 Σ. Wir symbolisieren diese Tatsache 

−1 

durch X ∼ Nn 

( μ, N Σ) 

. 

Die Schätzfunktion N S ist Wishart verteilt mit den Verteilungsparametern Σ und N – 1, wobei 

S die Stichprobenkovarianzmatrix bezeichnet. Die Wishart Verteilung ist eine multivariate 

Verallgemeinerung der χ 2 Verteilung. Diesen Sachverhalt kürzen wir durch die Symbolik 

N S ~ W n (Σ, N – 1) ab. 

Analog wie im univariaten Fall gilt auch im multivariaten Fall, dass X und N S unabhängig 

voneinander sind. Mit diesen Bezeichnungen gilt, 

T 

−1 2 

( N −1)( X − μ) S ( X − μ) = T . 

T 2 bezeichnet die Hotelling Statistik und leistet genau das von uns Gewünschte. Wir verwenden 

also die T 2 -Statistik für die Zusammenfassung der m, m ≥ 1 Produktvariablen zu einer neuen 

univariaten Statistik in der Form 

2 T −1 

T i i i 

= ( X − X) S ( X − X). 

Die T 2 -Statistik von Hotelling ist die multivariate Verallgemeinerung des Quadrates der univariaten 

t 2 -Statistik.


347 

Beispiel 5.17.1: Karosseriebau. Zusammenfassung der Produktvariablen 

Die m = 14 nicht unabhängigen Produktvariablen Y 1 , …, Y 14 werden zu „Produkten“ über 

die T 2 -Statistik von Hotelling zusammengefasst. Die Werte für diese Statistik werden in 

der Abbildung 5.17.1 dargestellt. 

80 

Produkte 

60 

40 

20 

0 

0 40 80 120 160 200 240 

Messwertsätze 

Abb. 5.17.1: Produkte für die Karosserievariablen 

Es ist, so glaube ich, sofort einzusehen, dass sich die univariaten T 2 i-Werte leichter einschätzen 

lassen als die Matrix der m = 14 mal N Einzelwerte. 

Große Werte können vorkommen, weil 

• 

• 

entweder ein Einzelwert für eine Produktvariable sehr groß wird oder 

die Werte für mehrere oder alle Produktvariablen an den Grenzen der statistischen 

Konfidenzintervalle liegen. 

Für die T 2 -Statistik gilt des weiteren 

T 

2 

( N − 1) n 

≥ F 

N − n 

nN , −n ( α ). 

Mit dieser Eigenschaft kann die T 2 -Statistik von Hotelling verwendet werden, um verschiedene 

Hypothesen über den Vektor X bzw. X zu prüfen. 

Außerdem gilt 

T 1 1 

i − 

− 

i i i 

E[( X − X) S ( X − X)] = Sp{ E[ X − X) ( X − X) S ]] = n. 

Diese Eigenschaft ist bei vielen praktischen Anwendungen nachteilig. So kann man aufgrund 

dieser Eigenschaft die T 2 -Statistik nicht verwenden, um die Prozessverbesserung nachzuweisen, 

indem man die Produktvariablen Y 1 , …, Y m vor und nach der Prozessverbesserung zu den 

Produkten zusammenfasst. 

Übung Kneterprozess 

Probleme 

In einem Unternehmen der Kunststoffindustrie gibt es Probleme mit den Knetern. 

Die ex- und internen Kundenanforderungen sind nur in einem Lastenheft verbal hinterlegt. 

Die Kunden der Kneterprodukte sind unzufrieden, können aber ihre Unzufriedenheit nicht 

quantitativ belegen. Die Streuungen der einzelnen Produktvariablen sind nachweisbar zu groß. 

Der Messwertaufwand ist für die vorliegenden Resultate zu hoch.


Prozessbeschreibung 

Die Inputprodukte werden durch k = 14 Inputvariablen, der Prozess wird durch n = 21 Prozessvariablen 

und die Produkte werden durch m = 16 Produktvariablen beschrieben. 

Die Visualisierung einer Stichprobe von N = 155 Wertesätzen für die Produktvariablen liefert 

die Star Plots der Abbildung 5.17.2. Diese bestätigen die großen Streuungen der einzelnen 

Variablen. Die Stars variieren in ihrer Form sehr stark, zeigen aber auch gewisse periodische 

Schwankungen, deren Ursache wir nicht kennen. 

Die Zusammenfassung der Produktvariablen liefert die Abbildung 5.17.4. 

Die Zusammenfassung der Inputvariablen liefert die Abbildung 5.17.5. 

Der Vergleich der beiden Abbildungen zeigt einen deutlichen Zusammenhang zwischen den 

Input- und Produktvariablen. Daraus folgt, dass die Ursache für das Problem in der Kommunikation 

zwischen dem Kunden- und Lieferantenprozess zu liegen scheint. 

144 150 

131 

118 

105 

92 

79 

66 

53 

Abb. 5.17.2: Star Plots für die Kneterprodukte


349 

MISCH05.Y5 

MISCH05.Y4 

MISCH05.Y7 

MISCH05.Y8 

MISCH05.Y2 

MISCH05.Y1 

MISCH05.Y10 

MISCH05.Y12 

MISCH05.Y14 


T-Squared 

30 

25 

20 

15 

10 

5 

0 

Multivariate Control Chart 

0 30 60 90 120 150 

Observation 

Abb. 5.17.4: Zusammenfassung der Produktvariablen 

UCL = 25,37 

T-Squared 

30 

25 

20 

15 

10 

5 

0 

zusammengefasste Inputparameter 

0 30 60 90 120 150 

Observation 

UCL = 20,38 

Abb. 5.17.5: Zusammenfassung der Inputvariablen 

Für die statistische Prozessanalyse habe ich für Sie eine Auswahl für die Input-, Prozess- und 

Produktvariablen getroffen, damit Sie mit den beiliegenden Programmen arbeiten können. 

Diese sind: 

• 

• 

zwei Rohstoffe, die durch Z 13 und Z 14 beschrieben werden, 

die drei Prozessvariablen 

X 4 Masse [kg] 

X 10 Drehzahl [U/min] 

X 12 Mischzeit [min] 

und die beiden


• Produktvariablen mit den Sollwerten und Toleranzgrenzen 

Y 9 Rheo Wert (Soll = 0,6, T u = 0,59, T o = 0,61) 

Y 12 Dichte (Soll = 1,05, T u = 1,024, T o = 1,076). 

Führen Sie bitte eine umfassende statistische Prozessanalyse mit den Zwischenergebnissen 

• 

• 

• 

• 

Definition des Problems, 

Quantifizierung der Abhängigkeitsstruktur, 

Berechnung der Prozessgleichungen, 

Steuerung des Prozesses mit der Prozessgleichung 

durch. 

5.18 Kalibrierung 

Die pra ktische Erfahrungen – nicht immer positiv – eines Labors zur Untersuchung von Bodenproben 

mit der DIN ISO 8466-2 „Kalibrierstrategie für nichtlineare Kalibrierfunktionen 

zweiten Grades“, Auftraggebern und Gutachtern für die Verfahrensetablierung, veranlassten 

uns, diesen Beitrag aufzunehmen. 

Das Problem aus dem Zusammenspiel der Kombattanten besteht häufig in der Vorgabe einer linearen 

Kalibrierung durch die Verfahrensetablierung, obwohl der Sachverhalt nichtlinear ist. 

Zur Lösung dieses Problems muss dafür Sorge getragen werden, dass obige Norm unbedingt 

angewandt wird. Dazu sind einige Verbesserungen erforderlich, die wir im Folgenden diskutieren 

wollen. 

Messwerte und Entscheidungen 

Eine umweltbelastende Konsequenz der industriellen Ansiedlungen sind kontaminierte Böden. 

Diese müssen gereinigt und in den Kreislauf zurückgeführt werden. Dazu sucht der Besitzer 

des Bodens durch Ausschreibung einen Sanierer. Zur Konkretisierung der Ausschreibung und 

für den Nachweis der simultanen Erfüllung aller relevanten Kunden – Besitzer und Gesetzgeber 

– Anforderungen schaltet der Sanierer ein Labor und falls erforderlich einen Gutachter ein. Das 

Labor ermittelt für die kontaminierten Böden nach einer entsprechenden Parametrisierung 

die Istwerte für die festgelegten Variablen. 

In diesem Zusammenhang ist die Kalibrierung von grundlegender Bedeutung, da die Konzentrationen 

bestimmter Substanzen nicht direkt gemessen werden können. Es lässt sich nur eine 

Funktion Y (Kalibrierfunktion) der Konzentration X, Y = f(X) messen. Der Funktionstyp und 

die Koeffizienten der Funktion sind unbekannt und müssen so genau wie möglich bestimmt 

werden. Hierfür werden Daten für Standardproben gewonnen. Die Konzentration X i wird 

vorgegeben und die Funktion der Konzentration Y i , i = 1, …, N wird gemessen. Die Werte Y i 

nennt man der Einfachheit halber Messwerte der Variablen. Bei den praktischen Problemen 

gewinnt man die Messwerte Y i und will durch einen Umkehrschluss X = g(Y) die Konzentration 

der Verbindung bestimmen. Die Funktion g(X) nennt man Analysefunktion. 

Vom Kunden (Gesetzgeber, Besitzer, Weiterverwerter, …) werden die Anforderungen an den 

weiter zu verwertenden Boden gestellt. Das Labor hat nach der Reinigung der Böden die


351 

Kundenanforderungen 

Kundenanforderungen 

Gesetzgeber 

N 

kontaminierter 

Boden 

Sanierung 

gereinigter 

Boden 

E 

J 

Verbringung 

In den Kreislauf 

zurückgeführt 

Bodenvariablen Prozessvariablen Bodenvariablen Prozessvariablen Bodenvariablen 

Labor 

Labor 

Messwertermittlung 

Nachweis der Erfüllung 

Messwertermittlung 

Nachweis der Erfüllung 

Abb. 5.18.1: Netzwerk der Prozesse für die Bodensanierung 

Werte für die Variablen erneut zu bestimmen und den Nachweis zu führen, dass simultan alle 

relevanten Anforderungen durch den gereinigten Boden erfüllt werden. Das Zusammenspiel 

der Prozesse und Verantwortlichen wird durch das abgebildete Netzwerk der Prozesse mit 

Kommunikation dargestellt. 

Nach dieser Abbildung sind die folgenden Fehlentscheidungen möglich: 

Tabelle 5.18.1: Entscheidungen und Fehlentscheidungen 

Boden 

Entscheidungen 

A Anforderungen nicht erfüllt B Anforderungen erfüllt 

kontaminiert Ja Fehlentscheidung 1 

saniert Fehlentscheidung 2 ja 

Die Fehlentscheidung 1 besagt, dass ein kontaminierter Boden in den Kreislauf zurückkommt 

und die Umwelt weiter schwer belastet. Durch das Zurückholen und erneute Reinigen des Bodens 

entsteht ein enormer Verlust für den Kunden. Die Fehlentscheidung 2 verlangt, dass ein 

ausreichend sanierter Boden erneut saniert wird und daher ein Verlust für die Bodensanierer 

entsteht. 

Die Wahrscheinlichkeiten für Fehlentscheidungen müssen minimiert werden, um Verluste zu 

vermeiden oder zumindest ebenfalls zu minimieren. 

Hierfür stehen uns aber nur zwei Möglichkeiten zur Verfügung. Der erste Weg bedeutet Investitionen 

in neue Geräte. Der zweite Weg verlangt geistige Investition, um die Gesetzmäßigkeiten 

der Sanierung und den simultanen Nachweis der Erfüllung aller relevanten Anforderungen im 

Sinne der DIN ISO Norm zu erkennen und auszunutzen. Damit wird deutlich, dass der erste 

Weg nur dann beschritten werden darf, wenn der zweite nicht mehr weiter führt, zumal in der 

Regel die materiellen Investitionen ausgeschöpft sind.


Beispiel 5.18.1: Kalibrierung. Linear 

Für die Kalibrierung liegen die Messwerte M 1 und die Konzentrationen vor. Die Darstellung 

dieser Wertepaare enthält die Abbildung 5.18.2. 

Werden die Punkte durch eine lineare Kalibrierfunktion angepasst, dann erhält man die 

Abbildung 5.18.3. 

Die Kalibriergerade hat die Koeffizienten 

Y = M 1 = b 0 + b Y/X X = –44611 + 1,36577 Konzentration. 

Zur Beurteilung der Kalibrierfunktion werden das Quadrat des Korrelationskoeffizienten 

2 

r Y / X = 0.9935 und die Reststandardabweichung S Y/X = 37540 angegeben. 

Der quadrierte Korrelationskoeffizient ist ein Maß für die lineare Abhängigkeit zwischen 

den Messwerten Y und der Konzentration X und gibt an, zu wieviel Prozent die Varianz der 

Messwerte Y durch die Konzentration erklärt wird. Dieser Koeffizient ist erfreulicherweise 

überaus groß, d. h. ca. 99.3 % der Varianz der Messwerte werden durch die Konzentration 

(X 100000) 

15 

12 

9 

M1 

6 

3 

0 

0 0,2 0,4 0,6 0,8 1 

Konzentration 

Abb. 5.18.2: Statistischer Zusammenhang zwischen den Messwerten M 1 und den Konzentrationen 

(X 100000) 

15 

12 

9 

M1 

6 

3 

0 

0 0,2 0,4 0,6 0,8 1 

Abb. 5.18.3: Anpassung der Messwerte durch eine lineare Kalibrierfunktion 

Konzentration


353 

erklärt. Die Reststandardabweichung ist die Standardabweichung der Messwerte um die 

Kalibriergerade. Diese kann nach der einfachen Beziehung 

2 2 2 

Y / X = Y − Y / X 

S S (1 R ) 

berechnet werden. 

Die quadratische Kalibrierfunktion ist 

2 2 

Y = M1 + b0 ′ + bY′ / X X + bY′ 

/ XX X = 6398,8 + 991257 Konz + 383015 Konz 

Das Quadrat des (in diesem Falle multiplen) Korrelationskoeffizienten ist 

2 

Y 

R / X = 0.9987. 

Würde man aufgrund des Korrelationskoeffizienten entscheiden, ob die lineare Kalibrierung 

ausreichend ist, so würde man – wie so häufig – entscheiden, dass die lineare Kalibrierung 

ausreicht. Aber berechnet man die Reststandardabweichung, dann erhält man den Wert 

S Y/X = 16325. 

Das ist eine Verbesserung von mehr als 220 %! 

Die Darstellung der quadratischen Kalibrierfunktion ist in der Abbildung 5.18.4 zu sehen. 

(X 100000) 

15 

12 

9 

M1 

6 

3 

0 

0 0,2 0,4 0,6 0,8 1 

Abb. 5.18.4: Quadratische Kalibrierfunktion mit dem 95 % Konfidenzintervall 

Konzentration 

Auswirkungen des linearen und quadratischen Ansatzes auf die Kalibrierfunktion 

Für die Bestimmung der unbekannten Konzentration einer Substanz wird die Analysefunktion 

X =g(Y) verwendet. Diese Funktion wird in den verschiedenen Standards als Umkehrfunktion 

der Kalibrierfunktion bestimmt. Das ist nicht zulässig, da der Zusammenhang zwischen den 

Messwerten M 1 und der Konzentration stochastisch und damit nicht eineindeutig ist. Es ist 

besser allgemein anzunehmen, dass 

(Y, X) ~ N 2 (µ, Σ), 

wobei µ T = (µ Y , µ X ) und 

⎛ 

2 

σY 

σ ⎞ 

Σ = ⎜ ⎟. 

⎝ σ ⎠ 

YX 

2 

X


Da zu Beginn der Analysen alles unbekannt ist, verwendet man Standardproben und bestimmt 

hierfür für vorgegebene Konzentrationen die Messwerte. 

Unter dieser Annahmen kann man mit derselben Methode und denselben Werten die Analysefunktion 

X = g(Y) bestimmen. 

Mit dieser Funktion kann der Nachweis über das Vorhandensein einer Verbindung geführt 

werden. Darüber hinaus kann aber auch die Konzentration (Gehalt) einer Verbindung bestimmt 

werden. 

Die Chemiker sind an weiteren Charakteristika interessiert. Zu diesen gehören der kritische 

Wert einer Messgröße, die Nachweisgrenze, die Erfassungsgrenze und die Bestimmungsgrenze. 

Diese Charakteristika hängen natürlich ganz stark vom Kurventyp der Kalibrier- bzw. 

Analysefunktion ab und können daher auch als Entscheidung für den einen oder anderen 

Funktionstyp dienen. 

Der kritische Wert der Messgröße Y we ist darauf hin, dass mit vorgebbarer Wahrscheinlichkeit 

die Substanz vorhanden ist. 

Der kritische Wert muss berechnet werden. Als Modell wird die Breite des „Prognoseintervalls“ 

an der Stelle X = 0 (Konzentration ist gleich null) verwendet. 

Für den Vergleich der verschiedenen Typen der Kalibrierfunktion werden die Prognosevarianz 

und damit die Prognoseintervallbreite für den linearen und quadratischen Fall berechnet. 

Für die lineare Kalibrierfunktion erhält man aus den Berechnungen die Schätzung für die 

Prognosevarianz 

⎛ 

ˆvar [ Yˆ 

( X )] 

⎜ 

1 

2 

2 1 ( XE 

− X) 

E = SY / 

⎜ 

X + + 

N 

⎜ N 

2 

⎜ ∑ ( Xi 

− X) 

⎝ 

i= 

1 

und damit die halbe Breite des Prognoseintervalls 

⎞ 

⎟ 

⎟ 

⎟ 

⎟ 

⎠ 

ˆ 1 ( XE 

− X) 

YE + tFG, α ⋅ SY / X ⋅ 1 + + 

. 

N 

N 

2 

( X − X) 

∑ 

i= 

1 

i 

In diesen Darstellungen ist X E die Konzentration für die man die Prognose berechnen möchte 

und Y ˆ ˆ( E = Y XE) 

. 

Für die quadratische Kalibrierfunktion gilt 

2 

ˆ 2 ⎡ 1 

T −1 

⎤ 

ˆvar( YE) = SY / X ⎢ 

1 + + ( XE − X) AXX ( XE 

− X) 

⎣ N 

⎥ 

⎦ 

und damit 

1 

Y t S X X A X X 

N 

ˆ T −1 

E + FG, α ⋅ Y / X ⋅ 1 + + ( E − ) XX ( E − ).


355 

Beispiel 5.18.2: Kalibrierung. Vorhersageintervall 

Für die lineare Kalibrierfunktion erhält man das Prognoseintervall für die Stelle X E = 0 

ˆ 1 ( XE 

− X) 

YE + tFG, α ⋅ SY / X ⋅ 1 + + = − 44611 ± 97845, 

N 

N 

2 

( X − X) 

∑ 

i= 

1 

d. h. die halbe Breite des Prognoseintervalls ist 97845. 

Der kritische Messwert für die lineare Kalibrierfunktion ist 

i 

2 

1 X 

Yk = b0 + tFG, α ⋅ SY / X ⋅ 1 + + = − 44611 + 97845 = 53234. 

N 

N 

2 

( X − X) 

∑ 

i= 

1 

Für die quadratische Kalibrierfunktion erhalten wir 

i 

2 

1 

Y t S X X A X X 

N 

ˆ T −1 

E + FG, α ⋅ Y / X ⋅ 1 + + ( E − ) XX ( E − ) = 6398.8 ± 44542 

d. h. die halbe Breite des Prognoseintervalls 44542 ist sehr viel kleiner als bei der linearen 

Kalibrierfunktion. 

Der Wert Y ˆ( X E = 0) entspricht dem Wert b 0 in den Kalibrierfunktionen. 

Der kritische Messwert für die quadratische Kalibrierfunktion ist 

1 

T −1 

Yk = b0 + tFG, α ⋅ SY / X ⋅ 1 + + ( XE − X) AXX ( XE 

− X) = 6398 + 44542 

N 

= 50940. 

Beispiel 5.18.3: Nachweisgrenze 

Die Nachweisgr enze ist die Konzentration, die dem kritischen Wert des Messwertes entspricht. 

Im linearen Fall erhält man für die Funktion X = g(Y) die halbe Breite des Prognoseintervalls 

ˆ 1 ( YE 

− Y) 

XE + tFG, α ⋅ SX / Y ⋅ 1 + + 

N 

N 

( Y − Y) 

und damit die Nachweisgrenze 

∑ 

i= 

1 

1 ( Yk 

− Y) 

XNG = tFG, α ⋅ SX / Y⋅ 1 + + = 0.069987. 

N 

N 

2 

( Y − Y) 

∑ 

i= 

1 

i 

i 

2 

2 

2


Im quadratischen Fall erhält man 

1 

X b t S Y Y A Y Y 

N 

ˆ T −1 

E = 0′ + FG, α ⋅ X / Y ⋅ 1 + + ( E − ) YY ( E − ) 

und die Nachweisgrenze 

1 

T −1 

XNG = tFG, α ⋅ SX / Y⋅ 1 + + ( YE− Y) AYY ( YE− Y) = 0.05696. 

N 

Die Nachweisgrenze für den quadratischen Ansatz liegt ungefähr bei nur 80 % des linearen 

Ansatzes. 

Beispiel 5.18.4: Erfassungsgrenze 

Diese Grenze bezei chnet die kleinste Konzentration bei der mit vorgebbarer Wahrscheinlichkeit 

der Nachweis der Substanz möglich ist. 

Für den linearen Fall erhält man für die vorgebbare Wahrscheinlichkeit β = α die Erfassungsgrenze 

1 ( Yk 

− Y) 

XEG = XNG + tFG, α ⋅ SX / Y⋅ 1 + + = 0.1399. 

N 

N 

2 

( Y − Y) 

Für den quadratischen Fall gilt 

1 

T −1 

XEG = XNG + tFG, α ⋅ SX / Y⋅ 1 + + ( YE− Y) AYY ( YE− Y) = 0.11392. 

N 

∑ 

i= 

1 

i 

2 

Beispiel 5.18.5: Bestimmungsgrenze 

Für diese Grenze mus s die relative Ergebnisunsicherheit, die sich aus der halben Breite des 

Prognoseintervalls für die Konzentration X und der Bestimmungsgrenze X BG sowohl für 

den linearen 

t 

1 

⋅ S ⋅ 1 + + 

N 

FG, α X / Y 

X 

als auch quadratischen Fall 

BG 

2 

( Yi 

− Y) 

N 

2 

∑ ( Yi 

− Y) 

i= 

1 ΔXBG 

XBG 

= = V (lin) 

r 

tFG, α ⋅ SX / Y⋅ 1 

T −1 

1 + + ( Yi− Y) AYY ( Yi 

N 

− Y) 

X 

BG 

ΔXBG 

= = Vr 

(quad) 

X 

BG 

ergibt, bestimmt werden. Dieser Quotient soll nun mit vorgegebener Wahrscheinlichkeit 

α einen vorher definierten Wert k annehmen, z. B. k =3. Symbolisch kann man hierfür 

schreiben P (V r ≥ k) = α.


357 

In die Formeln für die Prognoseintervalle muss anstelle des beliebigen Messwertes Y i der 

Messwert an der Stelle der Bestimmungsgrenze eingesetzt werden. Dieser Wert ist aber unbekannt. 

Folglich müsste man ein approximatives Verfahren entwickeln oder eine Schätzung 

einsetzen. Als Schätzung wird nach dem HBU Standard der Wert Y BG = k ΔY BG verwendet. 

Hierfür gilt P (ΔX BG ≥ k X BG ) = α. 

Formt man nun die Quotienten V r um, dann erhält man für den linearen Fall die Bestimmungsgrenze 

1 ( k ⋅YNG 

− Y) 

XBG = k ⋅tFG, α ⋅ SX / Y⋅ 1 + + = 0.167822 

N 

N 

2 

( Y − Y) 

bzw. für den quadratischen Fall die Grenze 

∑ 

i= 

1 

1 

T −1 

XBG = k ⋅tFG, α ⋅ SX / Y⋅ 1 + + ( k ⋅YNG− Y) AYY 

( k ⋅YNG 

− Y) = 0.065005. 

N 

Auch hier sieht man wieder die Verbesserung um ca. 250 % beim Übergang vom linearen 

zum quadratischen Ansatz. 

Schlussfolgerungen 

Wenn der Zusammenhang zwischen der Konzentration und dem Messwert nichtlinear ist, dann 

muss mit der nichtlinearen Kalibrierfunktion gearbeitet werden, da ansonsten der Verlust an 

Genauigkeit (Reststandardabweichung) zu groß wird und damit der kritische Messwert, die 

Nachweis-, Erfassungs- und Bestimmungsgrenzen zu ungenau – ebenfalls zu hoch – bestimmt 

werden. Die Verschlechterungen können in der Regel nicht durch die materielle Investition in 

Geräte aufgefangen werden und sind außerdem sehr teuer. 

Die DIN ISO Norm 8466-2: 2000-09 sollte mit den hier vorgestellten Verfahren vervollständigt 

werden, damit das Konfliktpotential bei der Ausschreibung zwischen den Kombattanten 

im Sinne einer klaren Entscheidung aufgrund eindeutiger statistischer Ergebnisse reduziert 

werden kann. 

In diesem Zusammenhang sollten auch die Konfliktpotentiale, die auf der Bestimmung der 

Kalibrierfunktion mit Wiederholungen und der Rekalibrierung basieren, diskutiert und beseitigt 

werden. 

i 

2

Praxisleitfaden QualitÃ¤t - M-QM

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?