09.06.2015 Aufrufe

Praxisleitfaden Qualität - M-QM

Praxisleitfaden Qualität - M-QM

Praxisleitfaden Qualität - M-QM

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Praxisleitfaden</strong> Qualität<br />

Walter Jahn, Lorenz Braun<br />

Prozessoptimierung mit multivariater Statistik in 150<br />

Beispielen<br />

ISBN 3-446-40616-6<br />

Leseprobe<br />

Weitere Informationen oder Bestellungen unter<br />

http://www.hanser.de/3-446-40616-6 sowie im Buchhandel


5 Qualität in der Fertigung<br />

Dieses Kapitel ist zweifelsfrei für den Nutzer aus der Fertigung das wichtigste, da in diesem<br />

grundsätzliche Fragen, wie z. B.<br />

• Was ist Qualität?<br />

• Was besagen die Bezeichnungen Produktqualität, Prozessqualität und Lieferantenqualität?<br />

• Wie kann die Qualität für Vergleiche messbar gemacht werden?<br />

• Wie können Sie die Kundenanforderungen spezifizieren?<br />

• Was ist Fähigkeit?<br />

• Wie können Sie die Fähigkeit ermitteln?<br />

• Wie können Sie aufgrund der Fähigkeiten entscheiden?<br />

• Welche Entscheidungsmöglichkeiten haben Sie?<br />

• Was heißt Prozessverbesserung?<br />

• Was ist eine Prozessgleichung?<br />

• Wie können Sie mit der Prozessgleichung die Prozesse steuern?<br />

• Wie können Sie die Ergebnisse der statistischen Prozessanalyse und Steuerung der Prozesse<br />

in die Praxis überführen?<br />

beantwortet werden.<br />

Zur Beantwortung dieser und zahlreicher anderer Fragen müssen wir strukturiert vorgehen,<br />

um die komplizierte Materie für Sie so aufzubereiten, damit Sie die Methoden zur notwendigen<br />

Lösung Ihrer betrieblichen Probleme anwenden und vor allem deren Ergebnisse zum Nutzen<br />

für das Unternehmen interpretieren können.<br />

5.1 Was ist ein Produkt ?<br />

Das Ergebnis jeder Tätigkeit und jedes (Herstellungs- oder Dienstleistungs-) Prozesses ist ein<br />

Produkt.<br />

Das Produkt kann z. B. ein Nahrungsmittel sein, oder es ist ein Teil für die Weiterverwendung<br />

in umfassenderen Produkten, wie z. B. der Motor für ein Auto usw. Das Produkt kann aber<br />

auch eine Dienstleitung, z. B. eine Taxi-Fahrt oder die Bestellung von Materialien für die Herstellung,<br />

der Vertrieb der Produkte usw. sein.<br />

Jedes Produkt wird auf einem Markt realisiert, d. h. angeboten und gekauft. Aber damit ein<br />

Produkt gekauft wird, muss es Anforderungen von Kunden erfüllen. Diese Anforderungen werden<br />

häufig durch Eigenschaften charakterisiert, so z. B. muss ein PKW modern sein, geringen<br />

Benzinverbrauch haben, ständig einsatzbereit sein. Die Eigenschaften werden z. B. auch für<br />

Produktweiterentwicklungen durch die WAS Fragen ermittelt.


156 5 Qualität in der Fertigung<br />

Eigenschaften sind aber häufig nicht oder nicht einfach zu messen. Daher müssen die Eigenschaften<br />

parametrisiert werden. Oft sind die Parameter physikalisch, chemisch, biologisch oder<br />

ökonomisch stetig messbare Variablen. Der Spritverbrauch beim PKW ist ein physikalisch<br />

messbarer Parameter. Die Eigenschaft „modern“ muss aber erst noch in solche Parameter<br />

übersetzt werden. Modern könnte sich auf die Elektronik im PKW beziehen und die Motorsteuerung<br />

oder die Klimaanlage betreffen. Diese Aggregate können dann durch eine Vielzahl<br />

von Variablen parametrisiert werden.<br />

Die Ausprägungen der Variablen, d. h. welche Werte sollen die Variablen annehmen, werden<br />

unter der Frage WIE z. B. bei QFD charakterisiert.<br />

Die immense Vielzahl verschiedener Produkte, die unterschiedlichen Anforderungen an die<br />

Produkte und die zahlreichen Weiterverwendungen der Produkte zwingen uns dazu, eine<br />

Ordnung in diese riesige Menge und den unterschiedlichen Sprachgebrauch zu bringen.<br />

Daher vereinbaren wir, dass ein Produkt durch m, m ≥ 1 Produktvariable Y 1 , …, Y m beschrieben<br />

wird.<br />

Die Produktvariablen sind Realisierungen von Zufallsgrößen. Das wird deutlich, wenn wir uns<br />

ein konkretes Produkt anschauen.<br />

Beispiel 5.1.1: Ziegelsteinherstellung. Nicht unabhängige Zufallsgrößen<br />

Ein Ziegelstein besteht aus einer Mischung aus Lehm, Kalk, Feldspat und gewissen Additiven.<br />

Die Verteilung der Komponenten wird auch nach sehr langer Mischzeit nicht völlig<br />

homogen sein.<br />

Die geformten Ziegelsteine werden in Stapeln auf Paletten geschichtet und langsam durch<br />

einen Brennofen gefahren.<br />

Das heterogene Gemisch aus verschiedenen Komponenten, die unterschiedliche Lage eines<br />

Ziegelstein im Stapel, die unterschiedlich lange Dauer der Ofenreise und die damit verbundene<br />

unterschiedliche Temperaturkapazität pro Stein führen dazu, dass die Produktvariablen<br />

des Ziegelsteins, wie die Bruchfestigkeit, die geometrischen Abmessungen, das Gewicht usw.<br />

selbst für eine „gleichbehandelte“ Charge in gewissen Grenzen schwanken. Die Messwerte<br />

für die Produktvariablen sind zufallsbehaftet, d. h. die Messwerte haben einen mehr oder<br />

weniger großen zufälligen Fehler.<br />

Die Produktvariablen sind nicht unabhängig voneinander, sondern sie sind mehr oder weniger<br />

stark miteinander korreliert. Diesen Sachverhalt können Sie sich anhand der Abbildung 5.1.1<br />

verdeutlichen.<br />

r 12<br />

Y 2 ±Δ Y 2<br />

Y 1<br />

r 23<br />

r 13<br />

Y 3<br />

Abb. 5.1.1: Korrelative Abhängigkeiten für Produktvariable


5.1 Was ist ein Produkt?<br />

157<br />

Diese Abbildung zeigt Ihnen, dass sich z. B. die Veränderung des Wertes von Y 2 um den Betrag<br />

ΔY 2 sowohl auf Y 1 als auch auf Y 3 auswirken kann. Die „Größe“ dieser Abhängigkeiten,<br />

besser der Grad der linearen Abhängigkeiten zwischen jeweils zwei Zufallsvariable wird durch<br />

den Korrelationskoeffizienten r jk , j, k = 1,2,3 gemessen. Das sind dimensionslose Zahlen, die<br />

zwischen –1 und +1 liegen. Sind zwei Variablen unabhängig voneinander, dann ist der Korrelationskoeffizient<br />

gleich null.<br />

Beispiel 5.1.2: Dämpfung der Motorvibration. Abhängigkeiten<br />

Für die Dämpfung der Motorvibration werden Hydrolager verwendet. An diesem Produkt<br />

werden viele Produktvariablen gemessen. Wir wollen hier nur die beiden Produktvariablen<br />

Y 1 = dynamische Steifigkeit [N/mm] und Y 2 = Phasenverschiebung [Φ] betrachten Mit den<br />

Daten aus einer großen Stichprobe wurde die dreidimensionale Häufigkeitsverteilung in<br />

Abbildung 5.1.2 gezeichnet.<br />

Was können Sie aus der Abbildung 5.1.2 ablesen?<br />

•<br />

•<br />

•<br />

Die Werte für die beiden Produktvariable streuen sehr stark. Das ist ein Ausdruck für<br />

den zufälligen Charakter der Produktvariablen.<br />

Es gibt viele Ausreißer.<br />

Die Grundfläche der Häufigkeitsverteilung, d. h. die Punktwolke für die Messwertpaare,<br />

ausgedrückt durch das Streudiagramm in Abbildung 5.1.3, ist offensichtlich nicht kreisförmig,<br />

sondern elliptisch umrissen. Das zeigt Ihnen, dass die beiden Produktvariablen<br />

nicht unabhängig voneinander sind.<br />

Abb. 5.1.2: Dreidimensionale Häufigkeitsverteilung für zwei Produktvariablen eines Hydrolagers


158 5 Qualität in der Fertigung<br />

250<br />

CDYN<br />

200<br />

150<br />

100<br />

0 10 20 30 40 50 60<br />

PHASE<br />

Abb. 5.1.3: Streudiagramm für die hydraulischen Motorlager<br />

Aus Abbildung 5.1.2 und Abbildung 5.1.3 müssen Sie die Schlussfolgerungen ziehen,<br />

dass<br />

• die Daten aufbereitet werden müssen; Ausreißer sind zu erkennen und zu eliminieren,<br />

• jeder Prozess zu Herstellung eines Produktes gesteuert werden muss, um die vielen<br />

Ausreißer zu vermeiden und die Streuung zu reduzieren.<br />

Für die Steuerung benötigen Sie Zielwerte und zulässige Streuintervalle für die Produktvariablen<br />

und eine Prozessgleichung.<br />

5.2 Wie können Sie entscheiden, ob Ihre Prozesse in<br />

Ordnung sind oder verbessert werden müssen?<br />

Die konkreten Produktdarstellungen zeigen Ihnen, dass<br />

• jedes Produkt durch die Angabe von Sollwerten und Toleranzgrenzen für alle nicht unabhängigen<br />

Produktvariablen präzisiert werden muss – man spricht in diesem Zusammenhang<br />

von der Spezifizierung aller relevanten Kundenanforderungen und<br />

• ein Kriterium gesucht wird, nach dem entschieden wird, ob ein Produkt simultan alle<br />

relevanten Kundenanforderungen erfüllt oder der Prozess verbessert werden muss.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

159<br />

5.2.1 Was ist ein modernes Produktaudit ?<br />

Audits im Qualitätsmanagement sind durch die Unternehmensleitung initiierte, systematische<br />

und unabhängige Qualitätsprüfungen, um festzustellen, ob die qualitätsbezogenen Tätigkeiten<br />

den geplanten Anforderungen entsprechen, ob diese Anforderungen tatsächlich verwirklicht<br />

sind und ob sie geeignet sind, die Ziele zu erreichen (Linß [2005, 393]). Nach Linß wird in<br />

Systemaudits, Produktaudits und Prozessaudits unterschieden.<br />

Durch das Produktaudit soll nach ISO 9000: 2000 ff. und Linß [2004, 394] die Übereinstimmung<br />

der Ausführung von Produkten mit den festgelegten Qualitätsforderungen untersucht<br />

und beurteilt werden.<br />

Die beiden Seiten eines Audits, nämlich die<br />

•<br />

•<br />

Anforderungen und<br />

der Istzustand eines Produktes<br />

müssen quantifiziert werden. Das Gleiche gilt für die Beurteilung der Übereinstimmung, damit<br />

z. B. Übereinstimmungen verglichen werden können, um festzustellen, ob Verbesserungsmaßnahmen<br />

wirksam waren. Zu diesem Zweck zählen wir zum „modernen“ Produktaudit<br />

die Aktivitäten:<br />

1. Zusammenstellung der (ex- und/oder internen) Kundenanforderungen zu einem Kunden-<br />

Anforderungs-Profil (KAP),<br />

2. Parametrisierung der Kundenanforderungen durch die Produktvariablen,<br />

3. Datensammlung für alle Produktvariablen,<br />

4. Zusammenstellung der Sollwerte und Toleranzgrenzen; falls erforderlich muss die statistische<br />

Tolerierung für alle nicht unabhängigen Produktvariablen durchgeführt werden,<br />

5. Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen mit<br />

6. korrigierten univariaten und multivariaten Prozessfähigkeitsindizes,<br />

7. Entscheidung aufgrund der Indizes für<br />

– Prozessverbesserung im Sinne der<br />

–<br />

–<br />

–<br />

·<br />

·<br />

Reduktion der Variabilität mindestens einer Produktvariablen,<br />

Übereinstimmung der Mittel- mit den Sollwerten,<br />

neue statistische Tolerierung,<br />

Kontrolle des Prozesses mit den uni- und/oder multivariaten Kontrollkarten,<br />

Investitionen in Maschinen, Anlagen, Mitarbeiter, Methodik usw.<br />

5.2.1.1 Was beinhaltet das Kunden-Anforderungs-Profil (KAP)?<br />

Ein (in- oder externer) Kunde, der eine Dienstleistung oder das materielles Produkt eines Vorläuferprozesses<br />

benötigt, stellt Anforderungen an das Produkt und seine zu gewährleistenden<br />

Funktionen. Die Anforderungen werden häufig in Form von Eigenschaften formuliert.<br />

Über die Kundenanforderungen wird das Produkt definiert.


160 5 Qualität in der Fertigung<br />

Beispiel 5.2.1: Kunststoffscheiben. Definition von Kundenanforderungen<br />

Problem:<br />

Die Glasscheiben in einem PKW sollen durch Kunststoffscheiben auf Basis von Polycarbonat<br />

mit Hartbeschichtung ersetzt werden, um das<br />

•<br />

•<br />

•<br />

zukünftige Design von Scheiben und Karosserie durch ganzheitliches Design und<br />

Konstruktion zu revolutionieren.<br />

die Sicherheitsaspekte zu verbessern,<br />

das Gewicht zu reduzieren usw.<br />

Aus der Analyse der Marktsituation sollen unter Beachtung der KAP der europäischen<br />

Automobilhersteller nachfolgenden Studien<br />

1. über die Machbarkeit und<br />

2. internationalen Verfügbarkeit der Prozesse<br />

erarbeitet werden.<br />

Hierbei sollen die globalen Ziele<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

Verbesserung der Sicherheit gegen Einbruch,<br />

Reduktion des Gewichts,<br />

Verbesserung des Komfort (Geräuschdämpfung, thermische Eigenschaften)<br />

Verbesserung des Schutzes gegen Unfälle, Überfälle usw.,<br />

Erhöhung der Verschleißfestigkeit (Kratzfestigkeit, …)<br />

Verbesserung der Formgebung/Design und Konstruktion,<br />

Erhaltung der optischen Eigenschaften des Glases,<br />

Erhöhung der Wirtschaftlichkeit bei den Herstellern und<br />

Verbesserung der Instandhaltungsfreundlichkeit<br />

verfolgt werden.<br />

Die globalen Ziele werden auf geforderte Eigenschaften und auch schon geforderte Parameter<br />

zurückgeführt und im Kunden-Anforderungs-Profil (KAP) zusammengefasst.<br />

Unter einem Parameter wollen wir hier eine messbare Variable verstehen.<br />

Zu den Eigenschaften gehören z. B.<br />

•<br />

•<br />

die Zähigkeit<br />

diese kann parametrisiert werden durch die physikalischen Variablen<br />

–<br />

–<br />

–<br />

–<br />

Biegefestigkeit,<br />

Schlagfestigkeit,<br />

Bruchfestigkeit,<br />

E-Modul<br />

• Beständigkeit der Oberfläche nach dem Verkleben,<br />

–<br />

–<br />

Temperaturbereich,<br />

Medien,


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

161<br />

–<br />

–<br />

–<br />

Luftfeuchte,<br />

NaCl bzw. CaCl-Lösungen,<br />

Tenside<br />

• Verformbarkeit,<br />

–<br />

–<br />

–<br />

–<br />

Spannungs- Verformungs- Verhalten mit der<br />

Normalspannung,<br />

Tangentialspannung,<br />

Scherspannung<br />

• optische Eigenschaften,<br />

–<br />

–<br />

–<br />

–<br />

–<br />

–<br />

Trübung<br />

Lichtreflektion,<br />

Lichttransmission,<br />

Verzerrung,<br />

Brechungsindex,<br />

Lichtdurchlässigkeit<br />

• Oberflächeneigenschaften<br />

–<br />

–<br />

–<br />

–<br />

–<br />

–<br />

–<br />

Farbe<br />

Verfärbung,<br />

Schlierenbildung,<br />

Glanz,<br />

Beschichtungsdefekte,<br />

Abriebfestigkeit,<br />

Kratzfestigkeit<br />

• Thermisches Verhalten<br />

–<br />

–<br />

–<br />

–<br />

Wärmedämmung,<br />

Wärmedurchgang,<br />

Wärmeausdehnung,<br />

Überwölbung<br />

Anforderungen in Parameterform sind z. B.<br />

•<br />

•<br />

•<br />

•<br />

•<br />

Steifigkeit,<br />

Gewicht,<br />

Lebensdauer,<br />

geometrische Maße, wie z. B. Scheibendicke, Kantenrundung,<br />

Oberflächenspannung,<br />

und vieles mehr.<br />

Die Parametrisierung führt zur Benennung der Produktvariablen. Hier einige Beispiele:<br />

Y 1 = Biegefestigkeit<br />

Y 2 = Bruchfestigkeit (gleiche Bruchfestigkeit über einem großen Temperaturbereich)<br />

Y 3 = Formbarkeit<br />

Y 4 = Lichtdurchlässigkeit (Transparenz)<br />

Y 5 = Elastizitätsmodul<br />

Y 6 = Einbaustabilität<br />

Y 7 = Geräuschdämpfung


162 5 Qualität in der Fertigung<br />

Y 8 = Kratzfestigkeit<br />

Y 9 = Witterungsbeständigkeit<br />

Y 10 = Korrosionsbeständigkeit<br />

Y 11 = Gewicht<br />

Y 12 = Reflexion der Wärmestrahlung<br />

Y 13 = Wirtschaftlichkeit, Preis<br />

Y 14 = Abriebfestigkeit<br />

Y 15 = optische Verzerrung<br />

und viele mehr.<br />

Die Produktvariable sind mit Sicherheit nicht unabhängig voneinander.<br />

Alle Eigenschaften müssen parametrisiert werden. Das ist bisher nicht gelungen. Ursachen<br />

hierfür sind:<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

fehlende Gewissheit über die Vollständigkeit der Eigenschaften und damit der Parametrisierung,<br />

fehlende Invarianz der vom Kunden beschriebenen Eigenschaften,<br />

mehrere Eigenschaften sind Funktionen von diversen anderen Parametern.<br />

Diese Funktionen sind mitunter kompliziert.<br />

Keine klare Trennung von Eigenschaften, Parametern und deren Prüfungen.<br />

Die bisher parametrisierten Eigenschaften sind unvollständig spezifiziert.<br />

Die Sollwerte liegen z. T. als Bereiche und nur selten als Zahlen vor, Toleranzgrenzen fehlen<br />

grundsätzlich.<br />

Dieses Beispiel demonstriert, das die Zusammenstellung des KAP eine wichtige und auch<br />

komplizierte Aufgabe ist, an der verschiedene Experten zusammenarbeiten sollten.<br />

5.2.1.2 Wie kann man die parametrisierten Kundenanforderungen statistisch<br />

tolerieren?<br />

Bei der Definition des Produktaudits wird auf die beiden Seiten, nämlich die<br />

•<br />

•<br />

Anforderungen und<br />

den Istzustand eines Produktes<br />

hingewiesen. Hier wollen wir uns damit befassen, wie<br />

•<br />

•<br />

gegebene CAD Toleranzen zu überprüfen sind oder<br />

diese beim Fehlen von Sollwerten und Toleranzgrenzen berechnet werden können.<br />

Die Frage der statistischen Tolerierung ist bedeutsam, da die Produktvariablen in der Regel<br />

nicht unabhängig, sondern im Gegenteil sehr häufig sehr stark miteinander korreliert sind. Die<br />

meisten – bisher bekannten – statistischen Tolerierungsverfahren basieren auf dem Faltungssatz<br />

für Zufallsgrößen. Dieser setzt die Unabhängigkeit der Zufallsgrößen voraus. Wie wir bei der<br />

Korrelationsanalyse im Abschnitt 5.6 sehen, wird die Straffheit einer Abhängigkeitsstruktur<br />

durch die Determinante der Korrelationsmatrix beurteilt.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

163<br />

Bei einem Autobauer sollten für den Karosseriebau die Toleranzen vieler Maße überprüft<br />

werden, da es Probleme bei der Montage gab. Zur Auswahl standen<br />

•<br />

•<br />

das Maßkettenkonzept nach dem Faltungssatz und<br />

die statistische Tolerierung von Jahn.<br />

Als Entscheidungskriterium wählte ich die Determinante der Korrelationsmatrix.<br />

Für ca. 60 Produktvariable galt Det(R YY ) = 1.28 10 –135 . Dieser Wert liegt sehr viel näher an<br />

der Null als an der für das Maßkettenkonzept geforderten 1! Das Maßkettenkonzept muss<br />

zugunsten der statistischen Tolerierung von Jahn verworfen werden.<br />

Problem<br />

Ein Kunde kommt mit seinem Wunsch nach einem bestimmten Produkt zu einem Unternehmen.<br />

Z. B. ein Autobauer möchte ein Dämpfungssystem (Motorlager) von seinem Lieferanten. Der<br />

Kunde formuliert seine Anforderungen an die Eigenschaften des Motorlagers hinsichtlich<br />

der Vibration, des Fahrverhaltens und der Dämmung des Geräuschpegels. Der Hersteller des<br />

Dämpfungssystems (der Lieferant) akzeptiert den Wunsch, parametrisiert die Eigenschaften,<br />

z. B. in die Produktvariablen statische und dynamische Steifigkeiten, Phasenverschiebung,<br />

Ausreißkräfte usw., spezifiziert die Produktvariablen in Form von Sollwerten und Toleranzgrenzen<br />

für die Produktentwicklung mit Hilfe eines CAD Systems oder des Maßkettenkonzeptes.<br />

Für die Herstellung sind diese Toleranzen in der Regel nicht geeignet. Hierfür sollten<br />

aufgrund der Abhängigkeitsstruktur der Produktvariablen die Maßtoleranzen zumindest<br />

durch die statistische Tolerierung für alle relevanten Produktvariablen überprüft werden. Die<br />

statistischen Toleranzen für eine Pilotfertigung oder für Vorläuferprodukte werden mit dem<br />

Kunden abgestimmt, denn die Anforderungen können zu einem Widerspruch innerhalb der<br />

Maßkettentoleranzen oder zwischen den Maßketten- und statistischen Toleranzen führen, wie<br />

auch im vorliegenden Fall, zu einer hohen Steifigkeit der Gummimischung für das Fahrverhalten<br />

und einer niedrigen Steifigkeit für die Geräuschdämmung. Die statistischen Toleranzen<br />

werden als Toleranzen anerkannt und die Produkte werden produziert. Der Produzent für<br />

das Motorlager liefert die Produkte und weist nach, dass die geforderte Qualität im Sinne der<br />

simultan Erfüllung aller relevanten Kundenanforderungen geliefert wird. Danach stellt er die<br />

Rechnung und verlangt sein Geld.<br />

Das Problem beinhaltet zwei zu lösende Teilprobleme:<br />

•<br />

•<br />

Tolerierung der nicht unabhängigen Produktvariable für die Entwicklung und Fertigung,<br />

Nachweis der simultanen Erfüllung aller spezifizierten relevanten Kundenanforderungen.<br />

Problemlösung<br />

Bisheriges Kernstück einer funktions-, fertigungs- und montagegerechten Tolerierung ist die<br />

Maßkettentheorie . Sie ist die Lehre von der funktionsgerechten Bemessung aneinander gereihter<br />

Maße, deren Toleranzen sich summieren. Die Maßkette ist eine Aneinanderreihung von<br />

zusammenwirkenden Einzelmaßen und dem von ihnen abhängigen Schlussmaß. Sie bildet bei<br />

schematischer Darstellung einen geschlossenen Linienzug (eine Masche). Die Maße (Einzelmaße<br />

– Schlussmaß) sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette mit<br />

Schlussmaß ist ihre Geschlossenheit. Bei der Berechnung von Maßketten (Toleranzketten) ist zu


164 5 Qualität in der Fertigung<br />

beachten, dass die Einzelmaße unterschiedlichen Systemen angehören können, und zwar dem<br />

herzustellenden Gerät, dem Werkstück, der Bearbeitungseinheit aus Maschine, Vorrichtung,<br />

Werkzeug usw. Die Maßkette schafft Voraussetzungen zur Festlegung der Abmessungen der<br />

Einzelteile und des Gerätes, der Einzeltoleranzen, der Bearbeitungsfolge, der Arbeitszugaben<br />

usw. Die Toleranzkettentheorie ist die Lehre von der möglichen Größe und Lage der Toleranz<br />

(Schlusstoleranz) des funktionsbestimmenden resultierenden Maßes (Summenmaß) einer<br />

Maßkette. Unter Funktionssicherheit wird dabei die Einhaltung der für ein Erzeugnis vorgegebenen<br />

Funktionsfehlergrenzen für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen<br />

verstanden. Innerhalb dieser Grenzen ist das Produkt funktionstüchtig. Die Funktionstoleranz<br />

ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten aller die<br />

Funktionstüchtigkeit beschreibenden Eigenschaften eines Produktes. Die Herstellungstoleranz<br />

ist die Differenz zwischen dem oberen und unteren erreichten Grenzwert bei der Herstellung<br />

mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigprodukte. Die Maßtoleranz ist die<br />

Differenz zwischen dem zulässigen Größt- und Kleinstmaß. Die Messtoleranz ist die Differenz<br />

zwischen der zulässigen oberen und unteren Abweichung des Messwertes von der Messgröße.<br />

Sie entspricht der zulässigen Fehlergrenze der Messung.<br />

Die Bedeutung der Tolerierung liegt in<br />

• der Gewinnung von Zielwerten und den zugehörigen Intervallen für die Steuer- und Regelung<br />

von Prozessen und<br />

• der Ableitung von Genauigkeitsintervallen (Toleranzintervallen) für die Input- und Prozessvariablen.<br />

Wie wird eine Maßkette berechnet?<br />

Das Nennmaß N 0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen<br />

Maßkettengliedern additiv aus den Nennmaßen N j der m Einzelmaße<br />

N<br />

0<br />

m<br />

= ∑kj<br />

N<br />

j=<br />

1<br />

j<br />

zusammen, wobei die k j die Richtungskoeffizienten sind, siehe z. B. Hofmann [1986]. Diese<br />

Koeffizienten nehmen die Werte +1 oder –1 an, je nachdem, ob der Einfluss des Einzelmaßes auf<br />

das Schlussmaß positiv oder negativ ist. Positive Einzelmaße bewirken bei ihrer Vergrößerung<br />

oder Verkleinerung eine gleichsinnige Veränderung des Schlussmaßes. Der Richtungskoeffizient<br />

ist der Maßkette zu entnehmen.<br />

Wie wird eine Toleranzkette berechnet?<br />

Sind die Toleranzen der Einzelmaße und die Kleinstspiele S kj gegeben, so beträgt nach Hofmann<br />

[1986] die Schlusstoleranz T 0 des Schlussmaßes<br />

0<br />

m−e m<br />

∑ j ∑ kj<br />

j= 1 j= m− e+<br />

1<br />

T = T + S<br />

Hieraus können die Einzeltoleranzen T j berechnet werden.<br />

.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

165<br />

Unterscheidet sich die Tolerierung für die Produktentwicklung von der für die Fertigung?<br />

Dem Maßkettenkonzept soll die statistische Tolerierung gegenüber gestellt werden, denn<br />

•<br />

•<br />

die Produktvariablen der gefertigten Produkte sind Zufallsgrößen und<br />

die Zufallsgrößen sind nicht unabhängig voneinander.<br />

Das Maßkettenkonzept auf die Fertigung angewandt, basiert auf der Faltung von Zufallsgrößen<br />

und setzt Unabhängigkeit voraus. Diese Voraussetzung ist aber nur selten erfüllt. Daher wollen<br />

wir uns mit einer Möglichkeit der statistischen Tolerierung befassen, die auch bei korrelierten<br />

Produktvariablen richtige Resultate liefert.<br />

Die statistische Tolerierung quantifiziert das „Können des Prozesses“. Folglich müssen die<br />

statistischen Toleranzgrenzen für alle relevanten Produktvariablen mit den Experten der Produktentwicklung<br />

abgestimmt werden, damit aus den statistischen allgemeingültige Toleranzen<br />

werden.<br />

Für die Berechnung der multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten<br />

Potentials des Prozesses, Produkte mit vorgegebenen Eigenschaften zu produzieren (Qualität),<br />

benötigen wir, neben dem Können des Prozesses, die Möglichkeit des Vergleiches des Soll- und<br />

Istzustandes der Fertigung für den multivariaten Fall.<br />

Der Vektor der Produktvariablen sei wieder Y T = (Y 1 , …, Y m ). Dieser Vektor sei m-dimensional<br />

normal verteilt Y ~ N m (µ, Σ YY ), wobei die Kovarianzmatrix Σ YY positiv definit sein soll oder die<br />

Verteilung von Y gehöre zur Familie der elliptisch umrissenen Verteilungen.<br />

5.2.1.3 Auf welchem Prinzip basiert die statistische Tolerierung ?<br />

Der Vektor Y wird in die beiden Teile<br />

Y T = (Y j , Y T m – j )<br />

zerlegt.<br />

Die einzelnen Produktvariablen sind nicht unabhängig voneinander, sondern durch die<br />

Abhängigkeitsstruktur, ausgedrückt durch die folgende partitionierte Kovarianzmatrix des<br />

aufgespalteten Vektors der Produktvariablen, miteinander verbunden.<br />

Die Kovarianzmatrix der Produktvariablen ist<br />

⎛<br />

2<br />

σ<br />

⎞<br />

j σj.<br />

m−<br />

j<br />

ΣYY<br />

= ⎜ ⎟.<br />

⎝ Σm−j.<br />

m−j⎠<br />

Die Realisierungen (Messwertvektoren) des normal verteilten Vektors der Produktvariablen<br />

sind Punkte im m-dimensionalen euklidischen Raum und liegen wegen der Verteilungsvoraussetzung<br />

innerhalb eines Hyperellipsoides. Das sieht man, wenn man den Exponent der<br />

multivariaten Normalverteilung<br />

1 ⎧ 1<br />

T −1<br />

⎫<br />

f( y; μΣ , YY ) = ⋅ exp ⎨− ⋅( Y − μ) ⋅Σ ⋅( − )<br />

1<br />

YY Y μ⎬<br />

⎩ 2<br />

⎭<br />

2 ⋅ π ⋅ Σ 2<br />

gleich einer Konstanten setzt, z. B.<br />

YY<br />

T −1<br />

Y − ⋅ YY ⋅ Y − = c1−α<br />

( μ) Σ ( μ ) . (1)


166 5 Qualität in der Fertigung<br />

Dann ist das die Gleichung für ein Hyperellipsoid mit dem Mittelpunkt µ, wobei 1 – α die<br />

Wahrscheinlichkeit ist, mit der die Punkte innerhalb des Hyperellipsoides liegen. Das Hyperellipsoid<br />

beschreibt das Können des Prozesses. Die Form des Hyperellipsoides wird durch die<br />

Abhängigkeitsstruktur bestimmt. Diese wiederum haben wir durch den Grad der Multikollinearität<br />

−1<br />

YY<br />

δ = R (2)<br />

charakterisiert.<br />

Zunehmender Grad der Multikollinearität führt zu größeren Diagonalelemente der inversen<br />

Korrelationsmatrix,<br />

R<br />

−1<br />

YY<br />

⎧<br />

2 −1<br />

(1 − ρj/<br />

m−<br />

j) , für alle j = 1, …,<br />

m<br />

⎪ −ρ<br />

= ⎨ jk / m−( j, k)<br />

, j, k 1, , ,<br />

1<br />

= … m j<br />

⎪ ≠<br />

⎡<br />

2 2<br />

(1 − ρ<br />

2<br />

j/ m−j) (1 − ρk/<br />

m−k)<br />

⎤<br />

⎪ ⎩ ⎣<br />

⎦<br />

wobei ρ 2 j/m – j das Quadrat des multiplen Korrelationskoeffizienten zwischen Y j und einer Linearkombination<br />

in den restlichen (Y 1 , …, Y j – 1 , Y j + 1 , …, Y m ) = Y m – j ist. ρ jk/m – (j, k) sind die<br />

partiellen Korrelationskoeffizienten zwischen Y j und Y k unter der Bedingung der restlichen<br />

Produktvariablen.<br />

Zumindest einige der multiplen Korrelationskoeffizienten für beliebige Y j in Abhängigkeit von<br />

den Linearkombinationen in den anderen Produktvariablen werden mit wachsendem δ größer.<br />

Damit werden die Differenzen 1 – ρ 2 j/m – j kleiner und somit die Quotienten (1 – ρ2 j/m – j )–1<br />

größer. Das heißt aber nicht anderes, als dass sich ein oder mehrere Produktvariablen sehr gut<br />

durch andere darstellen lassen. Sind die zugehörigen multiplen Korrelationskoeffizienten groß<br />

genug, dann sagt man, diese Produktvariablen sind redundant.<br />

Beachtet man noch den dritten Fakt, dass die Längen der Hauptachsen des Hyperellipsoides<br />

gleich L j sind, mit<br />

2<br />

j λj χm<br />

,1 −α<br />

L = 2⋅ ⋅ für j = 1, … m<br />

wobei λ j die Eigenwerte der Kovarianzmatrix Σ YY sind, dann sieht man, dass mit zunehmendem<br />

Grad der Multikollinearität das Hyperellipsoid einer „Zigarre“ immer ähnlicher und zumindest<br />

die 1. Hauptachse des Ellipsoides immer länger wird.<br />

Ist der Grad der Multikolinearität δ = 1, dann sind die Produktvariablen nach der obigen<br />

Beziehung unkorreliert und das Hyperellipsoid wird zu einer Hyperkugel.<br />

Bei vielen Anwendungen ist für jede Produktvariable Y j , j = 1, …, m ein Toleranzintervall<br />

gegeben. Inwieweit bei deren Festlegungen die Abhängigkeitsstruktur zwischen den Produktvariablen<br />

beachtet wurde, muss in jedem konkreten Fall hinterfragt werden. In der Regel wird<br />

das nicht der Fall sein. In diesen Fällen müssen die Toleranzgrenzen aufgrund der statistischen<br />

Kenntnisse über den Prozess zumindest überprüft, meist jedoch neu berechnet und mit den<br />

Konstrukteuren abgestimmt werden. Sind die Toleranzgrenzen aus technischer Sicht bindend,<br />

dann könnte das kartesische Produkt dieser Toleranzintervalle, das ist dann ein Hyperkubus für<br />

den gemeinsamen Toleranzbereich, gebildet werden. Die Forderung der simultanen Erfüllung<br />

aller relevanten Kundenanforderungen bedeutet geometrisch, dass das Hyperellipsoid mit<br />

vorgebbarer Wahrscheinlichkeit in diesem Hyperkubus enthalten sein muss, d. h.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

167<br />

⎡<br />

m ⎤<br />

T −1<br />

P⎢( Yj − μj) ⋅ ΣYY ⋅( Yj − μj) ∈X( To, j − Tu,<br />

j) ⎥ = 1 − α.<br />

⎢⎣ j = 1 ⎥⎦<br />

(5)<br />

Die Frage ist nun,<br />

5.2.1.4 Wie können unter der Bedingung (1) die Toleranzintervalle für jede<br />

einzelne Produktvariable unter Beachtung der Abhängigkeitsstruktur<br />

statistisch bestimmt werden?<br />

So, dass das kartesische Produkt der einzelnen Toleranzintervalle die Bedingung (2) erfüllt.<br />

Y 2 (Produktvariable)<br />

Abb. 5.2.1: Toleranzgebiet und Streuungsellipse<br />

Y 1 (Produktvariable)<br />

Die Lösung dieses Problems ist:<br />

Wie aus der Abbildung ersichtlich ist, müssen hier im 2-dimensionalen Fall die Tangenten an<br />

die Ellipse, parallel zu den beiden Achsen der Produktvariable, bestimmt werden. Im m-dimensionalen<br />

Fall müssen die Tangentialhyperebenen an das Hyperellipsoid bestimmt werden.<br />

Für diese Konstruktion ist das nachfolgende Theorem von ausschlaggebender Bedeutung.<br />

Satz 1 (Jahn): Die Projektionen der Ellipse bzw. des Hyperellipsoides auf die Koordinatenachsen<br />

haben die Längen<br />

2<br />

j ≤ j/ m−j = j/ m−j,<br />

Y σ σ<br />

wobei σ 2 j/m – 1 die bedingte Varianz der j-ten Komponente von Y unter der Bedingung der<br />

Konstanz der restlichen Komponenten des Vektors der Produktvariable ist, wobei m – j = m – 1<br />

wieder die Indexmenge {1, …, j – 1, j + 1, …, m} bezeichnet.<br />

Den Beweis für diesen überaus wichtigen Satz findet man auf der beiliegenden CD.


168 5 Qualität in der Fertigung<br />

Bemerkungen:<br />

1. Das Theorem ist für die Berechnung der statistischen Toleranzgrenzen über die Momente<br />

der bedingten Verteilung von Y j unter der Bedingung Y m – j = y m – j d. h. konstant, überaus<br />

bedeutsam.<br />

Korollar 1 (Jahn): Die oberen und unteren statistischen Toleranzgrenzen für die einzelnen,<br />

nicht unabhängigen Produktvariablen können nach den Beziehungen<br />

USL<br />

LSL<br />

2 2<br />

j = μj + χm,1 −α<br />

⋅σj/<br />

m−j<br />

2 2<br />

j = μj − χm,1 −α<br />

⋅σj/<br />

m−j<br />

berechnet werden, wobei χ 2 m,1 – α das 1 – α Quantil der Chi Quadrat Verteilung mit m<br />

Freiheitsgraden ist.<br />

2. Die statistischen Toleranzgrenzen USTL und LSTL (upper and lower tolerance limits)<br />

beschreiben das “Können” des Prozesses. Diese Grenzen sind daher unbedingt mit den<br />

Konstrukteuren abzustimmen.<br />

Korollar 2 (Wang et. al[1999]): Die statistischen Toleranzgrenzen werden nach den Beziehungen<br />

und<br />

USL<br />

LSL<br />

berechnet.<br />

2 −1 2<br />

χm,1−α<br />

⋅ SY−1. Y−1 χm,1<br />

−α<br />

⋅ SYY<br />

j = μj + = μ<br />

1<br />

j +<br />

−<br />

Det( SYY ) Det( SY −1. Y −1)<br />

Det( ) Det( )<br />

2 −1 2<br />

χm,1−α<br />

⋅ SY−1. Y−1 χm,1<br />

−α<br />

⋅ SYY<br />

j = μj − = μ<br />

1<br />

j −<br />

−<br />

Det( SYY ) Det( SY −1. Y −1)<br />

Det( ) Det( )<br />

Korollar 3 (Jahn):<br />

Die bedingten Stichprobenvarianzen S 2 j/m – j können auch aus den Diagonalelementen der<br />

inversen Kovarianzmatrix berechnet werden. Es gilt<br />

S<br />

−1<br />

YY<br />

⎧⎡<br />

−<br />

⋅ − ⎤<br />

− = − =<br />

⎣ 2 2 1 -2<br />

Sj (1 Rj/ m j) Sj/<br />

m j, für j 1, …,<br />

m<br />

⎦<br />

⎪ S ⋅S ⋅ R<br />

k<br />

= ⎨ j k jk/ m−<br />

j,<br />

k<br />

− , für j ≠<br />

⎪ 1<br />

⎪ ⎡<br />

2 2<br />

(1 − R − ⋅ − − ⎤ 2<br />

j/ m j) (1 Rk/<br />

m k)<br />

⎩<br />

⎣<br />


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

169<br />

Beispiel 5.2.2: Akkubohrschrauber. Statistische Tolerierung<br />

Die Produktvariablen und der Sollzustand für dieses Beispiel sind in der Tabelle 5.2.1<br />

zusammengestellt.<br />

Tabelle 5.2.1: Sollzustand für die Plastikschalen<br />

Parameter Sollwert Toleranzgrenzen<br />

Y 1 = Thermoschrumpf 1,1 0,2 2<br />

Y 2 = Axialität 0 –0,3 0,3<br />

Y 3 = Dicke 3,1 2,9 3,3<br />

Y 4 = Parallelität, 0 –0,6 0,6<br />

Für die Berechnung der statistischen Toleranzgrenzen benötigen wir die Stichprobenkovarianzmatrix<br />

und deren Inverse. Beide Matrizen sind in Tabelle 5.2.2 und Tabelle 5.2.3<br />

enthalten.<br />

Tabelle 5.2.2: Kovarianzmatrix für die Produktvariablen<br />

Thermoschrumpf Axialität Dicke Parallel<br />

Thermoschrumpf 0,22495 0,00353 –0,00455 –0,10751<br />

Axialit 0,00353 0,04206 –0,00081 0,04239<br />

Dicke –0,00455 –0,00081 0,00882 0,01654<br />

Parallel –0,10751 0,04239 0,01654 0,24588<br />

T u<br />

T o<br />

Tabelle 5.2.3: Inverse Kovarianzmatrix<br />

Thermoschrumpf Axialität Dicke Parallel<br />

Thermoschrumpf 62.301 –44.043 –42.555 37.697<br />

Axialit –44.043 334.037 173.955 –88.554<br />

Dicke –42.555 173.955 1.394.678 –142.413<br />

Parallel 37.697 –88.554 –142.413 82.002<br />

Mit den Elementen der inversen Kovarianzmatrix kann man nach Korollar 1 die statistischen<br />

Toleranzgrenzen für die vier Produktvariablen berechnen. In der Tabelle 5.2.4 sind<br />

die Werte zusammengestellt.<br />

Tabelle 5.2.4: Sollwerte und statistische Toleranzgrenzen<br />

Sollwert<br />

±Toleranz<br />

Thermoschrumpf 1,1 ±1,62<br />

Axialität 0 ±0,7<br />

Dicke 3,1 ±0,34<br />

Parallelität 0 ±1,4<br />

Mit den statistischen Toleranzgrenzen können wir die univariaten und multivariaten Prozessfähigkeitsindizes<br />

berechnen (vgl. Abschnitt 5.2.1.6 und 5.2.1.7).


170 5 Qualität in der Fertigung<br />

5.2.1.5 Wie kann man das „Produkt“ statistisch tolerieren?<br />

Wir stellten bereits fest, dass ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen<br />

Y 1 , …, Y m beschrieben wird.<br />

Wir forderten auch schon, dass ein Prozess so gesteuert werden muss, dass simultan alle Kundenanforderungen<br />

erfüllt werden. Wir wissen auch, dass ein Prozess nur<br />

•<br />

•<br />

•<br />

•<br />

mit einer Einstellung der Input- und Prozessvariablen,<br />

mit einer optimalen Teilmenge von Input- und Prozessvariablen,<br />

entweder mit Blick auf eine Produktvariable oder einer geschickten Zusammenfassung<br />

aller Produktvariablen gesteuerten werden kann und<br />

dass wir hierfür entweder den Sollwert und die Toleranzgrenzen für die eine Produktvariable<br />

oder die vereinigten Sollvorgaben für das „Produkt“ als Ziele für die Steuerung<br />

benötigen.<br />

Die vereinigten Sollvorgaben wollen wir Toleranzbereich für das Produkt nennen und deren<br />

Grenze Toleranzgrenze für das Produkt (TG Prod ) nennen.<br />

Σ<br />

*<br />

YY<br />

In dem Ausdruck Σ ∗ YY<br />

⎛T , − , ⎞ ⎛ o, − u, ⎞<br />

= diag ⎜ oj T uj T<br />

⎝<br />

⎟ diag<br />

6 ⎠<br />

⎜ j T<br />

R<br />

j<br />

YY<br />

⎝ 6<br />

⎟<br />

⎠<br />

bezeichnen R YY die Abhängigkeitsstruktur und T o T = (T o,1 … T o,m ) bzw. T u T = (T u,1 … T u,m ) die<br />

Vektoren der oberen bzw. unteren Toleranzgrenzen für alle relevanten Produktvariablen. Die<br />

Korrelationsmatrix muss aus einer großen Stichprobe geschätzt werden.<br />

Unter diesen Annahmen gilt<br />

T * −1<br />

o ΣYY<br />

o Prod<br />

c* = ( T − M) ( ) ( T − M) = TG .<br />

TG Prod ist die Toleranzgrenze für das Produkt T 2 , d. h. die über T 2 zusammengefassten Produktvariablen.<br />

Die Toleranzgrenze (TG Prod ) für das Produkt hängt ab von<br />

1. der Abhängigkeitsstruktur R YY – über die theoretische Kovarianzmatrix Σ * YY ,<br />

2. die Toleranzgrenzen für die einzelnen Produktvariablen und<br />

3. den Vektor der Sollwerte.<br />

Mit der berechneten Toleranzgrenze TG Prod wird die simultane Erfüllung aller relevanten Kundenanforderungen<br />

geprüft. Die Gleichung für T 2 ist auch bekannt als Mahalanobis Abstand.<br />

5.2.1.6 Univariate Prozessfähigkeitsindizes<br />

W as heißt „ein Prozess ist fähig“?<br />

Die Fähigkeit i st das inhärente Potential eines Prozesses, Produkte mit vorgegebenen Eigenschaften<br />

zu produzieren. Die Anwendung auf betriebliche Prozesse bedeutet,<br />

• dass für eine, mehrere oder alle Produktvariablen Toleranzgrenze vorliegen, die den „vorgegebenen<br />

Eigenschaften“ entsprechen und


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

171<br />

• impliziert, dass geprüft werden kann, ob die produzierten Produkte den vorgegebenen<br />

Eigenschaften entsprechen.<br />

In der Folge werden wir uns ausführlich mit<br />

•<br />

•<br />

den univariaten und<br />

multivariaten Prozessfähigkeitsindizes<br />

befassen.<br />

Wie kann die Eigenschaft „ein Prozess ist fähig“ nachprüfbar formuliert und quantifiziert<br />

werden?<br />

Für die Beantwortung der Frage stellen wir zunächst alles zusammen, was uns bekannt ist. Die<br />

Produktvariable sei Y. T o und T u seien die gegebenen Toleranzgrenzen und M sei der Soll wert.<br />

Die Produktvariable Y sei normal verteilt mit dem geforderten Erwartungswert µ = Sollwert<br />

= M und der zulässigen Standardabweichung<br />

σ<br />

T<br />

− T<br />

6<br />

Zul = o u .<br />

Dieser Ausdruck ist das Ergebnis der 3 σ-Regel, die besagt, dass im Intervall µ – 3 σ ≤ Y ≤ µ + 3 σ<br />

ca. 99.73 % aller Einzelwerte der vorausgesetzten Normalverteilung mit dem Erwartungswert<br />

µ und der Standardabweichung σ liegen.<br />

Die Produktion liefert Produkte an denen nach einer zufälligen Auswahl die Werte Y i , i = 1, …, N<br />

gemessen werden, wobei N den Stichprobenumfang bezeichnet.<br />

Es ist nun zu prüfen, ob die Stichprobe mit den spezifizierten Kundenanforderungen in Form<br />

des Sollwertes und der Toleranzgrenzen übereinstimmt. Hierfür können statistische Hypothesentests<br />

verwendet werden.<br />

• Die Nullhypothese H 0 : σ 2 = σ 2 zul gegen die Alternative H 1 : σ2 ≠ σ 2 zul kann mit dem F-Test<br />

Fˆ<br />

2 2<br />

σzul ( To − Tu<br />

)<br />

= =<br />

2 2<br />

σ 36 ⋅ S<br />

• und die Hypothese H 0 : µ = M gegen H 1 : µ ≠ M kann mit dem Abweichungstest<br />

Y − M<br />

zˆ = N −1.<br />

σ<br />

zul<br />

geprüft werden.<br />

Die beiden Tests wurden formalisiert, so dass wir Ausdrücke für die univariaten Prozessfähigkeitsindizes<br />

erhalten.<br />

Wie können Sie die univariate Prozessfähigkeitsindizes für eine Produktvariable berechnen?<br />

Eine Produktvariable wird mit Y bezeichnet, deren Verhalten durch die Verteilungsfunktion<br />

(Vf)Y ~ P(Y ≤ y) = F(y) oder falls sie existiert durch die Verteilungsdichte (Vd) f(y) charakterisiert<br />

wird. Durch die Prozessfähigkeiten wird beurteilt, ob die statistische Breite von f(y)


172 5 Qualität in der Fertigung<br />

vollständig oder nur z. T. innerhalb des Toleranzintervalls liegt. Die statistische Breite wird<br />

nach der 3 σ-Regel berechnet.<br />

Bevor wir eine Formel für den Vergleich zwischen der Toleranzbreite und Breite der Verteilungsdichte<br />

angeben, sollen noch einige wichtige Begriffe erläutert und präzisiert werden.<br />

Häufig wird der Ausdruck, „der Prozess wird beherrscht“ ver wendet und durch die Zeitinvarianz<br />

der Verteilung erklärt, wobei darauf hingewiesen wird, dass die zeitlichen Veränderungen<br />

eine Verschiebung der Verteilung auf der Achse der Produktvariablen, eine Änderung der<br />

Streuung oder eine Änderung der Form der Verteilung sein kann, siehe z. B. Rinne, Mittag<br />

[1999]).<br />

An dieser Stelle muss darauf hingewiesen werden, dass der Prozess zur Herstellung eines Produktes<br />

durch die Häufigkeitsverteilung einer Produktvariablen beurteilt werden soll. Das ist<br />

nur bedingt möglich. Die Beherrschbarkeit eines Prozesses wird durch die folgende Definition<br />

präzisiert.<br />

Definition: Die Aufschlüsselung der Varianz der Produktvariablen Y durch die in der Prozessgleichung<br />

vorkommenden Input- und Prozessvariablen wird durch das Maß der Beherrschbarkeit<br />

gemessen.<br />

Diese Definition ist notwendig, denn die Produktvariable Y ist Ergebnis des Wirkens eines<br />

Prozesses, die Produktvariable ist eine Zufallsgröße und die Verteilung der Produktvariablen<br />

kann nur nach dem Ursache-Wirkungs-Prinzip über die Veränderung der Input- und Prozessvariablen<br />

verändert werden. Ein beherrschter Prozess bedeutet, dass er so gesteuert werden<br />

muss, dass alle spezifizierten Kundenanforderungen an das Produkt simultan erfüllt werden,<br />

d. h. der Vektor der Mittelwerte der gemessenen Werte für die Produktvariablen Y 1 , …, Y m<br />

muss im statistischen Sinne mit dem Vektor der Sollwerte M 1 , …, M m übereinstimmen, die<br />

Variabilität des Vektors der Produktvariablen muss so klein sein, dass die Verteilung innerhalb<br />

des Toleranzbereiches liegt und die Verteilung muss zeitlich stabil bleiben, d. h. die Mittelwertvektoren<br />

und die Stichprobenkovarianzmatrizen zeitlich aufeinanderfolgender Stichproben<br />

dürfen keinen Trend besitzen.<br />

Für die Überprüfung der statistischen Beherrschbarkeit eines Prozesses müssen wir die Maße<br />

der Beherrschbarkeit und die uni- und multivariaten Prozessfähigkeitsindizes berechnen.<br />

Die uni- und multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten Potential<br />

eines Prozesses, Produkte mit den durch die Toleranzgrenzen für alle relevanten Produktvariablen<br />

vorgegebenen Eigenschaften zu produzieren, werden als Entscheidungskriterium<br />

für die Notwendigkeit der Prozessverbesserung im Sinne der Reduktion der Variabilität der<br />

Produktvariablen und damit der Vergrößerung des Maßes der Beherrschbarkeit verwendet.<br />

Die Maße der Beherrschbarkeit dienen ebenfalls für die Entscheidung zur Prozessverbesserung<br />

im Sinne der Suche nach weiteren Input- und Prozessvariablen, die die Variabilität der<br />

Produktvariablen besser erklären.<br />

Bei der Festlegung der CAD Toleranzgrenzen unterscheiden wir die Möglichkeiten, die in der<br />

Abbildung dargestellt sind.<br />

• Einseitige Tolerierung, d. h. es gibt nur eine obere T o oder untere T u Toleranzgrenze.<br />

• Auf die Angabe des Sollwertes wird in diesen Fällen häufig verzichtet. Wir müssen prüfen,<br />

ob das sinnvoll ist, denn der Sollwert wird als Zielwert für die Steuerung des Prozesses<br />

benötigt.<br />

• Zweiseitige Tolerierung. Hier müssen wir zwischen dem symmetrischen und unsymmetrischen<br />

Fall unterscheiden.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

173<br />

Fall 1<br />

Fall 2<br />

Fall 3<br />

Abb. 5.2.2: Toleranzintervalle<br />

Die Toleranz wird nun wie folgt definiert:<br />

Δ<br />

T u Sollwert T o<br />

Produktvariable Y<br />

⎧To<br />

− Sollwert, bei Vorgabe von To<br />

⎪<br />

Sollwert − Tu, bei Vorgabe von T<br />

⎪<br />

u<br />

⎪T − T bei Vorgabe von T und T<br />

=<br />

o u<br />

o u<br />

⎨ ,<br />

⎪ 2<br />

⎪ − Tu To −<br />

Tu To<br />

⎪<br />

⎩<br />

min{(Soll ),( Soll)}, bei gegebenen und und<br />

asymmetrischer Tolerierung<br />

Für den Toleranzbereich schreiben wir in der Regel [T o , T u ] = T o – T u = 2 Δ.<br />

Im symmetrischen Fall gilt<br />

To<br />

+ Tu<br />

Sollwert = = Toleranzmittelwert.<br />

2<br />

Zweiseitige Toleranzgrenzen – die Produktvariable ist normal verteilt<br />

Der Sollzustand für die Produktvariable Y wird durch<br />

•<br />

•<br />

den Sollwert M und die<br />

Toleranzgrenzen<br />

–<br />

–<br />

T u untere Toleranzgrenze<br />

T o obere Toleranzgrenze<br />

definiert.<br />

Der Prozess sei optimal eingestellt. An zufällig ausgewählten Produkten wird die normal<br />

verteilte Produktvariable Y gemessen. Die Messwerte sind Y 1 , …, Y N , wobei N der Stichprobenumfang<br />

ist.<br />

Visuell kann der Istzustand mit dem Sollzustand verglichen werden, indem man schaut, ob<br />

die Häufigkeitsverteilung der Messwerte, wie die Durchmesser der gedrehten Welle in der<br />

Abbildung 5.2.3, innerhalb der eingezeichneten Toleranzgrenzen liegt und der Mittelwert der<br />

Wellendurchmesser im statistischen Sinne mit dem Sollwert übereinstimmt. Bei der Welle in


174 5 Qualität in der Fertigung<br />

Häufigkeiten<br />

50<br />

Sollwert<br />

T o<br />

T u<br />

-3s<br />

40<br />

30<br />

+3s<br />

20<br />

10<br />

0<br />

19.8 19.9 20 20.1 20.2<br />

Wellendurchmesser [mm]<br />

Abb. 5.2.3: Häufigkeitsverteilung der Durchmesser einer Welle<br />

Abbildung 5.2.3 liegt die ±3 S Breite der Häufigkeitsverteilung vollständig im Toleranzintervall.<br />

Die univariate Prozessfähigkeit als Quotient der Toleranzbreite zur Breite der Häufigkeitsverteilung<br />

muss größer als 1 sein. Es wird kein Ausschuss produziert. Der Sprachgebrauch „im<br />

statistischen Sinn“ soll jeweils deutlich machen, dass wir es mit stochastischen Sachverhalten<br />

zu tun haben. Hieraus folgt, dass alle Aussagen mit einer Unschärfe versehen sind, die der<br />

Streuung von Variablen adäquat sind.<br />

Der zahlenmäßige Vergleich zwischen dem Soll- und Istzustand basiert auf einem Charakterisierungssatz,<br />

nach dem eine Normalverteilung vollständig durch den Mittelwert y<br />

und die Standardabweichung s beschrieben wird. Die Schätzfunktionen y für den Erwartungswert<br />

und s 2 für die Varianz sind unabhängig voneinander. Nach der 3 σ-Regel erhält<br />

man mit der Irrtumswahrscheinlichkeit α = 0.0027 die Breite der Häufigkeitsverteilung<br />

y + 3 ⋅ s −[ y − 3 ⋅ s] = 6⋅<br />

s .<br />

Die einfache Prozessfähigkeit C p (siehe Bhote [1990], Omnias [1992], Rinne, Mittag [1999])<br />

vergleicht die Sollbreite (T o – T u ) mit der Breite 6 · s der Häufigkeitsverteilung:<br />

Toleranzbreite<br />

was der Kunde fordert To<br />

− Tu<br />

Cp<br />

= = =<br />

(1)<br />

Breite der Häufigkeitsverteilung was der Kunde erhält 6 ⋅ s<br />

Wenn C p < 1, dann ist die Breite der Häufigkeitsverteilung größer als die Toleranzbreite.<br />

Produkte mit Werten für den Produktvariable, die nicht den Anforderungen genügen sind<br />

die Folge.<br />

Wenn C p > 1, dann ist die Breite der Häufigkeitsverteilung kleiner als die Toleranzbreite, d. h.<br />

die Häufigkeitsverteilung passt vollständig in das Toleranzintervall.<br />

Aber trotzdem kann Ausschuss produziert werden. Das liegt daran, dass bisher nur das<br />

Streuverhalten des Produktes mit der Toleranzbreite verglichen wurde. Nach dem Charakterisierungssatz<br />

muss in diesen Vergleich die Abweichung zwischen dem Soll- und Mittelwert<br />

einbezogen werden. Hierzu muss der Korrekturfaktor


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

175<br />

k =<br />

y − M<br />

1 ⋅ ( To<br />

− T ) u<br />

2<br />

(2)<br />

berechnet werden, mit dem C p zu<br />

C pk = (1 – k) C p (3)<br />

korrigiert wird. Diese Darstellung setzt voraus, dass der Sollwert in der Mitte des Toleranzintervalls<br />

liegt und bewertet die Abweichungen vom Sollwert.<br />

Ist C pk < 1, dann wird Ausschuss produziert, der Prozess muss verbessert werden, siehe Juran<br />

[1990]. Ist C pk > 1, dann genügen die Produkte der durch den Sollwert und die Toleranzgrenzen<br />

spezifizierten Anforderung.<br />

Welche Entscheidungen aufgrund der univariaten Prozessfähigkeitsindizes können Sie treffen?<br />

Die besprochenen möglichen Entscheidungen aufgrund der Prozessfähigkeiten werden durch<br />

die Abbildung 5.2.4 visualisiert.<br />

Damit kann man sagen, die Fähigkeit beschreibt das inhärente Potential eines Prozesses, Produkte<br />

oder Dienstleistungen zu produzieren, die spezifizierten Anforderungen genügen.<br />

Daten<br />

T u M T o T u M T o T u M T o<br />

Cp ≤ 1 Cp > 1 Cp > 1<br />

Cpk ≤1 Cpk < 1 Cpk > 1<br />

Prozessverbesserung<br />

oder Überprüfung der<br />

Tolerierung<br />

SPC<br />

Reduktion der<br />

Streuung<br />

Justierung<br />

Abb. 5.2.4: Entscheidungen aufgrund der Prozessfähigkeiten<br />

Beispiel 5.2.3: Wellendurchmesser. Univariate Prozessfähigkeit<br />

Eine zu drehende Welle soll den Solldurchmesser M = 12.5 [mm] und die Toleranzen<br />

T u = 12.35 [mm] und T o = 12.65 [mm] haben. Eine Stichprobe von N = 130 Wellen ergab<br />

die statistischen Maßzahlen<br />

Y = 12,499 [mm] und s = 0,05012 [mm].


176 5 Qualität in der Fertigung<br />

Setzt man diese Größe in die Formeln für die Prozessfähigkeitsindizes ein, dann erhält<br />

man<br />

C p = 1,00, k = –0,01 und C pk = 0,99.<br />

Die Häufigkeitsverteilung liegt vollständig im Toleranzintervall, darf aber nicht hin- und<br />

herbewegen. Nach der Abbildung 5.2.4 muss der Prozess verbessert werden, um zu garantieren,<br />

dass kein Ausschuss produziert wird.<br />

Bemerkung zu den univariaten Prozessfähigkeitsindizes<br />

Die univariaten Prozessfähigkeitsindizes besitzen die äquivalente Darstellung<br />

und<br />

C<br />

p<br />

To<br />

− T<br />

=<br />

6 S<br />

u<br />

⎧To<br />

− Y Y − Tu⎫<br />

Cpk = Min ⎨ , ⎬ = Min { Clo, Cpu},<br />

⎩ 3S<br />

3S<br />

⎭<br />

wobei C po die Prozessfähigkeit für die obere und C pu für die untere einseitige Toleranzgrenze<br />

bezeichnen.<br />

Diese Darstellung bewertet eindeutig die Abweichungen von den Toleranzgrenzen und ist<br />

insbesondere dann zu empfehlen, wenn die Streuung der Produktvariablen sehr groß ist, oder<br />

die Verteilung der Werte der Produktvariablen nahe bei einer Toleranzgrenze liegt.<br />

Sind Rückschlüsse von den Fähigkeiten auf den Ausschussanteil möglich?<br />

Bei der Antwort auf diese Frage sind einige Aspekte zu beachten.<br />

Prozessfähigkeiten und Verlustfunktion<br />

Die ökonomisch en Kennzahlen werden über die Verlustfunktion bewertet, wobei der ökonomische<br />

Verlust einer produzierten Einheit durch den Abstand seines Wertes für die Produktvariablen<br />

vom Sollwert entsteht. Der erwartete Verlust ist dann im Grunde genommen eine<br />

Kennzahl für die Fähigkeit.<br />

Erste Hinweise auf diese Problematik finden sich bereits bei den British Standards 2564 aus<br />

dem Jahre 1955 und bei Juran [1974] in seinem Quality Control Handbook.<br />

L(y)<br />

1<br />

Abb. 5.2.5: Verlustfunktion<br />

Tu Sollwert To Y


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

177<br />

Um diese Zusammenhänge zu verdeutlichen, betrachten wir zunächst einmal den Ausschussanteil<br />

p.<br />

Zu p gehört die binäre Verlustfunktion<br />

⎧0, für Y ∈[ To<br />

− Tu]<br />

Ly ( ) = ⎨<br />

⎩ 1, für Y ∉[ To<br />

− Tu]<br />

Diese Verlustfunktion ist ein Sprungfunktion. Das zeigt die Abbildung 5.2.5.<br />

Besitzt Y die Vd f(y) und die Vf F(y), dann erhält man den erwarteten Verlust<br />

∞<br />

∫<br />

E[ L( Y)] = L( y) ⋅ f( y)dy<br />

−∞<br />

∫<br />

= 0 ⋅ f( y)dy + 1 ⋅ f( y)dy<br />

y∈TB<br />

= P( Y∉ TB) = : p<br />

∫<br />

y∉TB<br />

wobei [T o – T u ] =: TB.<br />

Für die zweiseitige Betrachtung erhält man<br />

p = 1 – P(T u ≤ Y ≤ T o ) = 1 – F(T o ) + F(T u ) = p o + p u .<br />

Für die einseitige Betrachtung erhält man<br />

bzw.<br />

p = P(Y > T o ) = 1 – F(T o )<br />

p = P(Y < T u ) = F(T u ).<br />

Diese Betrachtung über die traditionelle Verlustfunktion hat wesentliche Nachteile. Zum einen<br />

drückt sie nur den Verlust des Produzenten aus, obwohl der Konsument natürlich ebenfalls<br />

durch die nicht zielwertkonformen Produkte Verluste erleidet. Zum anderen ist der Verlauf<br />

dieser Verlustfunktion in keiner Weise plausibel. Betrachten wir z. B. ein Produkt, dessen Wert<br />

für die Produktvariable in unmittelbarer Nähe der oberen oder unteren Toleranzgrenze, aber<br />

noch innerhalb des Toleranzintervalls liegt, so wird der Verlust mit 0 bewertet. Für einen anderen<br />

Wert, der sich vom vorangegangenen nur ganz wenig unterscheidet, aber außerhalb des<br />

Toleranzbereiches liegt, wird der Verlust 1 angenommen.<br />

Taguchi hat diesen Missstand durch die Einführung der quadratischen Verlustfunktion korrigiert.<br />

Danach ist ein Produkt umso besser, je näher der Wert seines Produktvariables am<br />

Sollwert liegt. Je größer die Differenz zwischen Soll- und Istwert ist, desto größer ist der Verlust<br />

über die gesamte Lebenszeit des Produktes.<br />

Für die zweiseitige Tolerierung lautet die Taguchi-Verlustfunktion<br />

L T (y) = c (y – M Y ) 2 ,<br />

wobei M Y der Sollwert für die Produktvariable Y und c ein Proportionalitätsfaktor sind. Analog<br />

kann man die Verlustfunktion für einseitige Tolerierung aufschreiben.


178 5 Qualität in der Fertigung<br />

Für den Erwartungswert der Verlustfunktion – das Risiko – erhält man mit der Vd f(y)<br />

∞<br />

∫<br />

∞<br />

2 2<br />

y ∫ μy μY Y<br />

−∞<br />

∞ ∞ ∞<br />

∫<br />

2 2<br />

μY μY Y ∫ μY μY Y ∫<br />

−∞ −∞ −∞<br />

E[ L( y)] = c ⋅( y − M ) ⋅ f( y)d y = c ⋅ [( y − ) + ( − M )] f( y)dy<br />

−∞<br />

⎧⎪<br />

⎫⎪<br />

= c ⋅⎨<br />

( y− ) f( y)dy+ 2 ⋅( −M ) ⋅ ( y− ) ⋅ f( y)d y+ ( −M ) ⋅ f( y)dy⎬<br />

⎪⎩<br />

⎪⎭<br />

= c ⋅ { σ + ( − ) }<br />

2 2<br />

μY<br />

MY<br />

Das ist der bekannte mittlere quadratische Fehler (engl. mean square error), der z. B. für die<br />

Güte einer Schätzfunktion verwendet wird. Der Term (µ Y – M Y ) 2 ist der quadratische Bias.<br />

Damit werden die zwei Hauptaufgaben aus der Abbildung zur Entscheidung mit den Prozessfähigkeiten<br />

noch einmal verdeutlicht. Der Bias gibt die Abweichung des Mittelwertes vom<br />

Sollwert an. Ist ein Bias vorhanden, dann muss der Prozess neu zentriert werden, sodass diese<br />

Abweichung null wird. Ist die Streuung so groß, dass die „Schwänze“ der Verteilung über die<br />

Toleranzgrenzen hinausragen, dann muss der Prozess so verbessert werden, dass die Streuung<br />

kleiner wird.<br />

Prozessfähigkeit nach Taguchi auf der Grundlage der Verlustfunktion<br />

Nach Rammelmüller [1993] und Taam [1993] können die univariaten Prozessfähigkeitsindizes<br />

auch wie folgt geschrieben werden<br />

To<br />

− Tu<br />

T − T 6 S Cp<br />

C = = =<br />

D<br />

wobei<br />

o u<br />

pm<br />

2 2<br />

1<br />

6 S + ( Y − M)<br />

⎡<br />

2<br />

( Y − M)<br />

⎤2<br />

⎢1<br />

+<br />

2 ⎥<br />

1<br />

2 2<br />

⎡ ( Y − M)<br />

⎤<br />

D = ⎢1<br />

+<br />

2 ⎥<br />

⎣ S ⎦<br />

⎣ S ⎦<br />

die Abweichung des Mittelwertes der Werte für die Produktvariable vom Sollwert M misst.<br />

Beispiel 5.2.4: Wellendurchmesser. Prozessfähigkeit nach Taguchi<br />

Verwenden Sie die Angaben für den Soll- und Istzustand von oben und setzen diese Werte<br />

in die Formeln für die Taguchi Fähigkeiten ein, dann erhalten Sie die Werte D = 1.000199<br />

und C pm = 0,9998. Diese Werte stimmen mit den Werten von oben überein. Damit ist auch<br />

die zu fällende Entscheidung dieselbe.<br />

Welche Schlüsse können Sie aus den verschiedenen univariaten Prozessfähigkeitsindizes für<br />

die praktische Anwendung ziehen?<br />

C p beschreibt das Verhältnis von Spezifikationsbreite zur Breite der Verteilung der Messwerte für<br />

die Produktvariable. Je größer C p wird, desto weniger streuen die Werte für die Produktvariable.<br />

Bei C p = 1 stimmt die 6 s Breite der Häufigkeitsverteilung mit der Toleranzbreite überein.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

179<br />

C pk wächst für jedes konstante σ linear mit der Annäherung des Mittelwertes Y an den Sollwert.<br />

Das heißt aber, ein Mittelwert Y nahe beim Sollwert wird genauso bewertet wie ein Mittelwert<br />

nahe einer der Toleranzgrenzen. Daraus folgt für die Anwendung, dass ein großer C pk -Wert<br />

mitunter zu wenig über die Zentriertheit des Prozesses aussagt.<br />

C pm beinhaltet sowohl die Streuung der Produktvariablen, wie auch die Zentriertheit ( Y − M )<br />

der Verteilung der Produktvariablen auf den Sollwert. C pm = 1 besagt, dass Y innerhalb der mittleren<br />

Drittels von (T o – T u ) liegt. Hieraus folgt, der Index C pk sollte durch C pm ersetzt werden.<br />

Das ist ein positiver Beitrag zur Diskussion, welcher Philosophie bei der Kontrolle von Prozessen<br />

zu folgen ist,<br />

•<br />

•<br />

dem Nachweis der Erfüllung der spezifizierten Kundenanforderungen oder<br />

der Erfüllung gewisser statistischer Gesetzmäßigkeiten.<br />

Im Kapitel 6 wird diese Diskussion noch einmal aufgegriffen.<br />

Prozessfähigkeit und Ausfallrate<br />

Wir betrachten nur die univariate Produktvariable Y mit dem Sollzustand M = Sollwert und<br />

der unteren T u und oberen T o Toleranzgrenze.<br />

[T o – T u ] ist das Toleranzintervall. Falls der Wert Y i eines Produktes für die Produktvariable<br />

Y innerhalb des Toleranzintervalls liegt, d. h. falls Y i ∈ [T o – T u ], dann sagen wir das Produkt<br />

ist konform zur Spezifikation. Wenn Y i ∉ [T o – T u ], dann sagen wir, das Produkt ist nicht<br />

konform zur Spezifikation.<br />

Die Wahrscheinlichkeit dafür, dass ein Messwert Y i , i = 1, …, N von Y außerhalb der Toleranzgrenzen<br />

liegt, ist<br />

p = 1 – F(T o ) + F(T u ).<br />

Die Fähigkeit des Prozesses ist eine Funktion der Ausfallrate, d. h.<br />

p = P( Y ∈[ To<br />

− Tu]) = 1 − ∫ f( y)d y.<br />

[ To−Tu]<br />

Prozesse mit kleinem p werden fähig genannt. Wie klein p sein muss, um einen Prozess als<br />

fähig zu charakterisieren ist das Anliegen des Qualitätsverantwortlichen des Unternehmens. In<br />

der Praxis hat sich die Forderung p < 0.0027 für fähige Prozess bewährt. Es muss aber darauf<br />

verwiesen werden, dass eine solche Forderung von den Herstellungskosten abhängig ist und<br />

daher nur akademischen Charakter hat.<br />

Setzen wir noch voraus, dass Y ~ N (µ, σ 2 ) gilt, dann erhalten wir für das einseitig nach oben<br />

begrenzten Toleranzintervall<br />

∞<br />

⎧<br />

2<br />

1 ⎪ ( y − μ)<br />

⎫⎪<br />

po = P( Y > To) = ∫ exp⎨−<br />

2 ⎬d y.<br />

σ 2 π ⎪⎩<br />

2 σ ⎪⎭<br />

To<br />

Hierfür können wir nach der Standardisierung der Zufallsgröße Y und deren Toleranzgrenzen<br />

auch schreiben<br />

∞<br />

o − μ o − μ μ − o<br />

⎛ T ⎞ ⎛T ⎞ ⎛ T ⎞<br />

po = P ⎜Z > ⎟ = = − ⎜ ⎟ =<br />

⎝ ⎠ ∫ Φ()d z z 1 Φ Φ<br />

⎝ ⎠<br />

⎜<br />

⎝<br />

⎟.<br />

σ ω σ ⎠<br />

To<br />

−μ<br />

σ


180 5 Qualität in der Fertigung<br />

Hieraus folgt,<br />

p o = 1 – Φ (3 C po ) = Φ (–3 C po ).<br />

Ein analoger Ausdruck ist der Ausschussanteil bei dem einseitig unten begrenzten Toleranzintervall.<br />

Das p ist nun leider unbekannt. Daher betrachten wir für eine Stichprobe die Schätzung<br />

N<br />

1<br />

Fˆ( y ) = ∑I ( Yi<br />

< y )<br />

N<br />

i=<br />

1<br />

für unbekannte Verteilungsfunktion F, wobei I (Y i < y) die Indikatorfunktion<br />

⎧1, falls Yi<br />

< y<br />

I( Yi<br />

< y)<br />

= ⎨<br />

⎩0, falls Yi<br />

≥ y<br />

bezeichnet.<br />

Damit erhalten wir<br />

1<br />

pˆ = 1 − Fˆ( T ) + Fˆ( T ) = 1 − I( T ≤ Y ≤ T )<br />

und die Schätzungen<br />

bzw.<br />

und<br />

∑<br />

o u u i o<br />

N<br />

i=<br />

1<br />

̃ ⎛T − ⎞ ⎛ − ⎞<br />

= − ⎜ o Y Y T<br />

p 1 Φ ⎟ + Φ<br />

⎝ ⎠<br />

⎜ u<br />

s ⎝ s<br />

⎟<br />

⎠<br />

p̃<br />

Tu<br />

⎛ u − ⎞ ⎛ − ⎞<br />

= ⎜ ⎟<br />

̃<br />

o<br />

Φ<br />

T Y , pT<br />

= Φ<br />

T Y<br />

o<br />

⎝ s ⎠<br />

⎜<br />

⎝ s<br />

⎟<br />

⎠<br />

p̃ = p̃ + p̃<br />

T .<br />

u To Damit können wir für den Prozessfähigkeitsindex schreiben<br />

N<br />

⎛Y − Tu<br />

⎞ ⎛To<br />

− Y ⎞ 1<br />

−1 −<br />

= ⎜ ⎟ ⎜ ⎟ = − ̃<br />

1<br />

C ̃<br />

pk min , min { Φ ( pT<br />

), Φ ( p )}<br />

u<br />

T .<br />

o<br />

⎝ s ⎠ ⎝ s ⎠ 3<br />

Beispiel 5.2.5: Fähigkeiten und Ausfallrate<br />

Y ~ N(0, σ 2 ). Der Sollzustand für diese Produktvariable ist<br />

Sollwert M = 0,<br />

T u = –0,3<br />

T o = 0,3.<br />

Da s und p unbekannt sind, ziehen wir eine Stichprobe vom Umfang N = 113.<br />

Mit den Werten dieser Stichprobe berechnen wir den Mittelwert = 0,00968 und die Standardabweichung<br />

s = 0,20509.<br />

Damit berechnen wir die statistischen 3 s-Grenzen [–0,605596, 0,624958].<br />

Die univariaten Prozessfähigkeitsindizes sind C p = 0,49, k = 0,03 und C pk = 0,47.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

181<br />

Damit gilt<br />

To − Y 0,3 − 0,00968<br />

= = 1,415<br />

s 0,20509<br />

und<br />

Y<br />

− Tu 0,00968 − ( −0,3)<br />

= = 1,51<br />

s 0,20509<br />

Aus einer Tafel mit den Werten der standardisierten Normalverteilung erhalten wir für<br />

diese beiden Zahlen die Werte<br />

F(1,42) = 1 – 0,92219 = 0,0778<br />

und<br />

F(1,51) = 1 – 0,934478 = 0,0655.<br />

Oberhalb der oberen Toleranzgrenze T o liegen 7,78 % aller Einzelwerte und unterhalb der<br />

unteren Toleranzgrenze liegen 6,55 % der Werte.<br />

Zusammenfassend können sagen, bei der univariaten Prozessfähigkeit C pk = 0,47 liegen ca.<br />

14,3 % aller Werte außerhalb der Toleranzen.<br />

Bei einer Prozessfähigkeit C pk = 0,8 lägen nur noch ca. 1,4 % außerhalb der Toleranzgrenzen.<br />

Hieraus lesen wir ab, dass die Vergrößerung der Prozessfähigkeit um ca. 58 % eine Verringerung<br />

des Ausschusses von ca. 90 % zur Folge hat.<br />

Beispiel 5.2.6: Wellendurchmesser. Ausfallrate<br />

Die Prozessfähigkeit C p = 1 zeigt, dass kein Messwert für die gefertigten Wellen außerhalb<br />

des Toleranzintervalls liegt, d. h. die Anteil der Messwert oberhalb der oberen Toleranzgrenze<br />

ist null und der Anteil der Messwerte unterhalb von T u ist ebenfalls null.<br />

Wenn wir allerdings diese Anteile nach obiger Formel schätzen, dann erhalten wir die<br />

Werte:<br />

•<br />

•<br />

geschätzter Anteil oberhalb der oberen Toleranzgrenze ist 1296 [ppm]<br />

geschätzter Anteil unterhalb der unteren Toleranzgrenze ist 1472 [ppm]<br />

Zusammen ergibt das einen Anteil außerhalb des Toleranzintervalls von 2768 [ppm].<br />

Voraussetzungen für die Durchführung von Fähigkeitsnachweisen<br />

Wie jedes mathematische oder mathematisch statistisches Verfahren ist die Durchführung von<br />

Prozessfähigkeitsnachweisen an Voraussetzungen geknüpft. Diese betreffen<br />

•<br />

•<br />

•<br />

•<br />

•<br />

die Fähigkeit des Mitarbeiters,<br />

die Fähigkeit des Messprozesses,<br />

die Fähigkeit der Prozesse, Maschinen und Anlagen,<br />

Verteilung der Produktvariablen,<br />

die Prozessbeherrschung.


182 5 Qualität in der Fertigung<br />

Wenn Sie die Fähigkeit des Messprozesses oder der Maschinen untersuchen wollen, verweise<br />

ich Sie auf das Buch von Rinne, Mittag [1999]. Dort werden diese Verfahren sehr ausführlich<br />

beschrieben.<br />

Wenn Sie Hypothesen über die zugrunde liegende Verteilung der Produktvariablen Y prüfen<br />

wollen, verweise ich Sie auf die einschlägigen Bücher über die univariate Statistik von Schwarze<br />

[1997], Lehnen, Wegmann [1985], Rinne, Mittag [1999] u. a.<br />

In der Literatur, so z. B. auch bei Rinne und Mittag, wird auf die Bedeutung der Stabilität der<br />

„Verhältnisse in der Produktion“ hingewiesen und erklärt, dass damit die zeitliche Konstanz<br />

der Verteilung der Produktvariablen gemeint ist.<br />

Braucht man die Stabilität für die Interpretation der Prozessfähigkeitsindizes?<br />

Ich meine nicht, denn die Stabilitätsanforderung müsste vor der Fähigkeitsanalyse überprüft<br />

werden. Erst nachdem nachgewiesen wurde, dass ein Prozess fähig ist, sollten Regelkarten<br />

eingeführt werden. Andererseits wird behauptet, die Stabilität mit Regelkarten nachzuweisen.<br />

Das sieht aus, wie eine Katze, die sich in den Schwanz beißt.<br />

Die Toleranzgrenzen liegen fest. Jedes Produkt, dessen Wert für die Produktvariable außerhalb<br />

des Toleranzintervalls liegt, ist Ausschuss. Der Grund, warum das Produkt Ausschuss ist, ist<br />

zwar interessant, aber erst bei der Ursachenforschung und nicht bei der Definition der Fähigkeiten.<br />

Der Begriff Stabilität sorgt immer wieder für Irritationen, so z. B. in den Arbeiten von<br />

Stark [1999] und Kaiser, Nowack [1999]. In diesen Arbeiten will man neue Gesichtspunkte<br />

für die univariaten Fähigkeitsberechnungen und Kontrollkartentechniken ableiten, lässt aber<br />

die spezifizierten Kundenanforderungen außer acht und bezieht nur statistische Aspekte ein.<br />

Das ist nicht zulässig.<br />

Können wir auch univariate Prozessfähigkeitsindizes berechnen, wenn die Produktvariable<br />

nicht normal verteilt ist?<br />

Ja. Wir betrachten als Benchmark den Fall, die<br />

Produktvariable Y ist binomial verteilt.<br />

Die Produktvariable Y kann nur zwei verschiedene Werte annehmen, z. B.<br />

Y<br />

⎧0, wenn das Produkt n. i. O.<br />

= ⎨<br />

⎩ 1, wenn das Produkt i. O.<br />

wie z. B. bei der Wareneingangsprüfung.<br />

Die Wahrscheinlichkeiten für diese beiden Fälle seien P(Y = 0) = p und P(Y = 1) = 1 – p. Die<br />

Ausschusswahrscheinlichkeit p ist unbekannt und wird mit einer Stichprobe von N Werten,<br />

die ja nur 0 oder 1 sein können, bestimmt.<br />

Die Wahrscheinlichkeit dafür, dass in der Stichprobe vom Umfang N k Produkte defekt sind,<br />

ist durch die folgende Formel gegeben,<br />

⎛<br />

N<br />

⎞ ⎛N<br />

⎞<br />

P ⎜∑<br />

yi<br />

= k⎟<br />

= ⎜ ⎟ p ⋅(1 − p)<br />

⎝ ⎠ ⎝ k ⎠<br />

i=<br />

1<br />

wobei k zwischen 0 und N liegt.<br />

k N−k


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

183<br />

Die Häufigkeiten für die verschiedenen k, d. h. für k = 0, k = 1, … werden durch die Häufigkeitsverteilung<br />

visualisiert und durch das Einzeichnen des Sollwertes p und der Toleranzgrenzen<br />

p u und p o mit dem Sollzustand verglichen. Die Binomialverteilung wird ebenfalls vollständig<br />

durch den Mittelwert<br />

Y = pˆ und die Standardabweichung s =<br />

pˆ<br />

(1 − pˆ)<br />

N<br />

charakterisiert. Damit können die obigen Formeln 1, 2 und 3 zur Berechnung der Prozessfähigkeitsindizes<br />

verwendet werden. Man erhält<br />

p −<br />

−<br />

o p<br />

pˆ<br />

p<br />

u<br />

Cp = , k = und Cpk = (1 − k) ⋅Cp.<br />

6 ⋅ s 1<br />

( po<br />

− pu)<br />

2<br />

Wir betrachten noch den etwas selteneren Fall,<br />

die Produktvariable Y ist nach Poisson verteilt.<br />

Bei dieser Verteilung sind Mittelwert und Standardabweichung gleich, d. h. es gilt Y = λ und<br />

s = λ . Hiermit sind wiederum die Formeln 1, 2 und 3 von oben anwendbar.<br />

Müssen Sie etwas über die Verteilungen der Prozessfähigkeitsindizes wissen?<br />

Ja, den n die univariaten Prozessfähigkeitsindizes sind Zufallsgrößen. Das wird deutlich, wenn<br />

Sie beachten, dass diese von Y und s abhängen. Y und s sind aber Zufallsgrößen, denn diese<br />

hängen wiederum nur von den Stichprobenwerten Y 1 , …, Y N ab.<br />

Aus der Verteilung der Prozessfähigkeitsindizes können Sie die Konfidenzintervalle für die<br />

Indizes berechnen.<br />

Wozu benötigen Sie die Konfidenzintervalle für die Prozessfähigkeitsindizes?<br />

Die Prozessfähigkeitsindizes sind Zufallsgrößen. Sie schwanken von Stichprobe zu Stichprobe,<br />

obwohl die Produktionsbedingungen gleich sind. Ist die ursprüngliche Streuung groß, so kann<br />

das zu Fehlentscheidungen führen. Daher wollen wir Ihnen mit den Konfidenzintervallen ein<br />

Instrument in die Hand geben, um die Unsicherheit zu quantifizieren.<br />

Für die Ableitung der Konfidenzintervalle benötigen wir die Verteilung der Indizes. Um diese<br />

berechnen zu können, fasse ich die bisherigen Ergebnisse zusammen.<br />

Unter der Voraussetzung Y ∼ N (μ, σ 2 ) gilt<br />

1.<br />

Y<br />

⎛<br />

2<br />

σ ⎞<br />

∼ N ⎜μ<br />

, ⎟ , wobei N der Stichprobenumfang ist<br />

⎝ N ⎠<br />

2.<br />

( N −1)<br />

⋅ s<br />

σ<br />

2<br />

2<br />

2<br />

∼ χ , falls Y 1 , …, Y N unabhängig nach N (0, 1) verteilt sind<br />

3. Y und s 2 sind unabhängig voneinander verteilt und


184 5 Qualität in der Fertigung<br />

4.<br />

Y − μ<br />

⋅<br />

σ<br />

( N −1)<br />

( N −1)<br />

N<br />

⋅ s<br />

2<br />

⋅σ<br />

2<br />

Y − μ<br />

= ⋅ N ∼ t<br />

s<br />

N −1<br />

5. Konfidenzintervall für σ 2 ist durch<br />

2 2<br />

( N −1) ⋅ s 2 ( N −1)<br />

⋅ s<br />

≤ σ ≤<br />

2 2<br />

χ<br />

χ<br />

α<br />

α<br />

1−<br />

2 2<br />

gegeben. Daraus folgt<br />

( N −1) ⋅ s 2 ( N −1)<br />

⋅ s<br />

≤ σ ≤<br />

2 2<br />

χ<br />

χ<br />

R<br />

2 2<br />

L<br />

,<br />

wobei R den rechten Schwanz und L den linken Schwanz der χ 2 -Verteilung bezeichnen.<br />

Beweise: siehe z. B. Schmetterer [1956, S 131].<br />

In<br />

C<br />

p<br />

To<br />

− T<br />

=<br />

6 ⋅ s<br />

u<br />

sind T o und T u fest. Nur s ist eine Zufallsgröße. Damit erhält man für C p das Konfidenzintervall:<br />

C<br />

≤ κ<br />

≤ C<br />

p p p<br />

mit<br />

wobei<br />

1 1<br />

Cp = Cp ⋅ und Cp = Cp<br />

⋅<br />

b<br />

b<br />

u<br />

o<br />

N − 1<br />

bo, α =<br />

2<br />

χ α<br />

N −1,1−<br />

2<br />

N − 1<br />

bu, α =<br />

2<br />

χ α<br />

N −1, 2<br />

κ<br />

p<br />

To<br />

− T<br />

=<br />

6 ⋅ σ<br />

u<br />

In ähnlicher Weise kann man ein Konfidenzintervall für C pk berechnen. Ausgangspunkt ist die<br />

Darstellung von C pk in der Form


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

185<br />

C<br />

pk<br />

1<br />

T ( o u )<br />

o Y Y T<br />

⋅ T − T − Y − M<br />

⎧ − − u⎫<br />

= Min , 2<br />

⎨<br />

⎬ =<br />

.<br />

⎩ 3⋅ s 3⋅ s ⎭<br />

3⋅<br />

s<br />

Die Konfidenzintervalle für µ und σ 2 sind:<br />

und<br />

s ⋅t s ⋅t<br />

Y − ≤ μ ≤ Y +<br />

N<br />

N<br />

α<br />

α<br />

N−1, N−1,<br />

2 2<br />

2 2<br />

( N −1) ⋅ s 2 ( N −1)<br />

⋅ s<br />

≤ σ ≤<br />

χ<br />

χ<br />

α<br />

α<br />

N−1,1− N−1,<br />

2 2<br />

Indem man die Konfidenzintervalle für µ und σ 2 in die Formel für C pk einsetzt, erhält<br />

man das Konfidenzintervall für C pk mit der unteren Intervallgrenze C pk<br />

C<br />

pk<br />

=<br />

t α ⋅ s<br />

1<br />

N −1, ⋅ ( T − − − 2<br />

o Tu<br />

) Y − M<br />

2<br />

N<br />

3 ⋅ s ⋅<br />

N − 1<br />

χ<br />

2<br />

α<br />

N −1, 2<br />

.<br />

Zur Abkürzung setzen wir<br />

und<br />

a<br />

b<br />

α<br />

α<br />

N −1, 2<br />

: = ,<br />

N<br />

=<br />

t<br />

N − 1<br />

o. α 2<br />

χ α<br />

N −1,1−<br />

2<br />

N − 1<br />

bu, α =<br />

2<br />

χ α<br />

N −1, 2<br />

Damit erhält man<br />

C<br />

pk<br />

1 1<br />

⋅( To − Tu) − Y − M − aα<br />

⋅ s ⋅( To − Tu)<br />

− Y − M<br />

=<br />

2<br />

=<br />

2<br />

aα<br />

−<br />

3⋅ s ⋅b 3⋅ s ⋅b 3⋅b<br />

1 a 3 ⋅Cpk<br />

− a<br />

α<br />

= Cpk<br />

⋅ − =<br />

b 3⋅b 3⋅b<br />

u, α u, α u, α<br />

u, α u, α u, α<br />

α<br />

.


186 5 Qualität in der Fertigung<br />

Analog erhält man für die obere Intervallgrenze Cpk<br />

3 ⋅ Cpk<br />

+ aα<br />

Cpk<br />

=<br />

3 ⋅ bo,<br />

α<br />

so dass<br />

⎛3⋅Cpk<br />

− aα<br />

3⋅ Cpk<br />

+ aα<br />

⎞<br />

P ⎜<br />

≤ κpk<br />

≤ ⎟ = 1 − α.<br />

⎝ 3⋅b<br />

3⋅b<br />

⎠<br />

u, ε<br />

o, ε<br />

Beispiel 5.2.7: Akkubohrschrauber. Konfidenzintervalle für C p und C pk<br />

Die Sollvorgaben für die Produktvariable Y 2 Produktvariable sind<br />

M 2 = 0 [mm]<br />

T u,3 = –0.3 [mm]<br />

T o,3 = 0.3 [mm]<br />

Aus der Stichprobe von N = 113 vermessenen Gehäusen erhält man die statistischen Maßzahlen<br />

für den Istzustand<br />

Y 2 = 0.0099 [mm]<br />

s 2 = 0.204 [mm]<br />

Damit erhält man<br />

C<br />

k<br />

p<br />

0.6<br />

= = 0.49<br />

6 ⋅ 0.204<br />

0.0099<br />

= =<br />

0.3<br />

C pk = 0.474.<br />

0.033<br />

Die Konfidenzintervalle zu C p und C pk sollen für die Irrtumswahrscheinlichkeit α = 0.05<br />

bestimmt werden. Dazu muss man die Koeffizienten a α und b o , α und b u , α berechnen.<br />

a<br />

α<br />

t<br />

N<br />

α<br />

−1, = 2 1.9814<br />

= = 0.18639<br />

N 113<br />

mit<br />

und<br />

t 112,0.025 = 1.9814<br />

N − 1 112<br />

= = = 0.92998<br />

129.5<br />

bo, α 2<br />

χ α<br />

N −1,1−<br />

2<br />

und<br />

N − 1 112<br />

= = = 1.22842<br />

χ α<br />

74.22<br />

N −1, 2<br />

bu, α 2


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

187<br />

mit<br />

χ<br />

χ<br />

2<br />

112,0.975<br />

2<br />

112,0.025<br />

= 129.5<br />

= 74.22<br />

Damit erhält man<br />

P( Cp ≤ κp ≤ Cp) = 1−<br />

α<br />

P (0.3989 ≤ κ ≤ 0.5268) = 0.95<br />

und<br />

p<br />

P( Cpk ≤ κpk ≤ Cpk<br />

) = 1−<br />

α<br />

P (0.335 ≤ κ ≤ 0.577) = 0.995<br />

pk<br />

Die berechneten Prozessfähigkeiten und deren Konfidenzintervalle zeigen, dass der Prozess<br />

zur Herstellung der Plastikschalen verbessert werden muss.<br />

Zusammenstellung der Eigenschaften des univariaten Prozessfähigkeitsindizes C p<br />

•<br />

•<br />

Der einfache Prozessfähigkeitsindex C p ist eine streng monoton fallende Funktion von σ.<br />

Die Funktion C p ist konvex, d. h.<br />

dC p To<br />

− Tu<br />

1<br />

=− =− C<br />

2<br />

dσ<br />

6 ⋅ σ σ<br />

p<br />

Die grafische Darstellung von C p ist in der Abbildung 5.2.6 enthalten<br />

5<br />

Cpj<br />

0.33333<br />

0.2 s j<br />

3<br />

Abb. 5.2.6: C p in Abhängigkeit von σ<br />

Die Elastizität der Funktion C p wird nach der Beziehung<br />

dC<br />

Cp<br />

η( Cp) = = −1<br />

dσ<br />

σ<br />

p


188 5 Qualität in der Fertigung<br />

berechnet. Dieser Ausdruck bedeutet, C p ist isoelastisch, d. h. eine Vergrößerung von σ um 1 %<br />

führt zu einer Verkleinerung von C p von 1 %.<br />

•<br />

•<br />

Die Anforderung an C p lautet nach Montgomery [1996], S. 446 C p > 1.33.<br />

Die Aussagen über C p betreffen die Verbindung zum Gutanteil der Produktion oder zur<br />

Ausschussquote. Diese können erst nach der Korrektur mit dem Korrekturfaktor k formuliert<br />

werden, da eine Verteilung, insbesondere die Normalverteilung, durch die beiden<br />

Momente Mittelwert und Standardabweichung vollständig charakterisiert wird.<br />

• Die Schätzfunktion für C p , hier mit<br />

ˆ To<br />

− Tu<br />

Cp<br />

=<br />

6 ⋅ s<br />

Ĉp<br />

bezeichnet, ist<br />

• Die Verteilung von C p ist unter der Annahme Y ~ N(μ, σ 2 ) eine χ 2 N – 1 Verteilung mit<br />

N – 1 FG. Die Schätzfunktion Ĉ p ist asymptotisch erwartungstreu und MSE-konsistent<br />

• Das Konfidenzintervall für C p ist<br />

⎛⎧<br />

2 2<br />

χ<br />

⎫⎞<br />

α χ α<br />

⎜<br />

⎪<br />

− − −<br />

⎪⎟<br />

⎜⎨<br />

ˆ N 1, N 1,1<br />

2 2<br />

P Cp<br />

⋅ ≤ Cp<br />

≤ ⎬⎟<br />

= −<br />

⎪ −1 −1<br />

⎪<br />

1 α<br />

N<br />

N<br />

⎜<br />

⎝⎪<br />

⎪⎟<br />

⎩<br />

⎭⎠<br />

• Ein Test zur Prüfung der Hypothese H 0 : C<br />

χ<br />

N − 1<br />

2 0<br />

= C p ⋅<br />

2<br />

χ α<br />

N −1,1−<br />

2<br />

p<br />

0<br />

p<br />

≤ C gegen die Alternative H 1 : C<br />

p<br />

0<br />

p<br />

> C ist<br />

Die Hypothese H 0 bedeutet, der Prozess ist nicht fähig. C p bezeichnet die Vorgabe des<br />

0<br />

Unternehmens bzgl. der Prozessfähigkeit, z. B. den Wert c p = 1.33 .<br />

• Für den Korrekturfaktor k erhält man die Resultate<br />

μ − M<br />

k =<br />

1 ( To<br />

− T ) u<br />

2<br />

k = 0 ⇔ µ = M<br />

k = 1 ⇔ µ = T o oder µ = T u<br />

0 < k < 1 ⇔ µ ∈ {( T o , T u ) \ {M}}<br />

k > 1 ⇔ µ ∉ [T u , T o ]<br />

lim k =∞<br />

μ →±∞<br />

k ist eine lineare Funktion von µ, wie die Abbildung 5.2.7 zeigt.<br />

k ist nur von µ abhängig. Die Funktion k ist nicht monoton.<br />

K ist linear fallend für µ < M und linear wachsend für µ > M.<br />

k ist somit ein dimensionsloses Maß für die Dezentrierung, bzw. 1 – k ist ein Maß für die<br />

Zentrierung des Prozesses auf den Sollwert M.<br />

0


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

189<br />

0.6667<br />

0.8<br />

0.6<br />

k i<br />

0.4<br />

0.2<br />

0<br />

-2 -1 0 1 2<br />

m i<br />

Abb. 5.2.7: Darstellung von k<br />

Eine Schätzfunktion für k ist<br />

kˆ<br />

=<br />

Y − M<br />

1 ( To<br />

− Tu<br />

)<br />

2<br />

mit<br />

2<br />

k ˆ ∼ N1<br />

( μk<br />

, σk<br />

),<br />

μ<br />

k<br />

2 2<br />

μ − M<br />

2 σY<br />

σY<br />

= und σk<br />

= = .<br />

1 N<br />

( T −<br />

−<br />

⋅<br />

o Tu ) ( To Tu<br />

)<br />

N Δ<br />

2 2<br />

Die Schätzfunktion ˆk ist verzerrt. k wird systematisch zu groß geschätzt. Die Schätzfunktion<br />

ist aber asymptotisch erwartungstreu, d. h. der Bias konvergiert mit dem Stichprobenumfang<br />

N gegen null.<br />

Für die Ableitung eines Tests zur Prüfung von Hypothesen über k muss ˆk etwas umgeformt<br />

werden.<br />

Es gilt<br />

ˆ Y − M k − μk<br />

μk<br />

k = : Z = = σk<br />

+ .<br />

Δ σ σ<br />

Der Ausdruck<br />

k − μk<br />

U = ∼ N (0, 1)<br />

σ<br />

k<br />

Für den 2. Ausdruck kann man schreiben<br />

k<br />

k<br />

δ<br />

2<br />

2 2<br />

2 2<br />

⎛μ ⎞ ⎛ − ⎞<br />

k μY<br />

M Δ k N<br />

= ⎜ ⎟ = ⎜ ⎟ =<br />

2<br />

⎝σ ⎠ ⎝σ / N ⎠ σ<br />

k Y Y<br />

Der Ausdruck (U + δ) 2 ~ χ 2 (1; δ 2 ), d. h. das Quadrat der Summe der beiden Summanden U und<br />

δ 2 ist nichtzentral χ 2 verteilt mit einem Freiheitsgrad und dem Nichtzentralitätsparameter δ 2 .


190 5 Qualität in der Fertigung<br />

Mit diesen Darstellungen erhält man das Schwankungsintervall für ˆk<br />

σ Y<br />

χ<br />

⎛Δ ⎞ ˆ σ ⎛Δ<br />

⎞ .<br />

Δ N<br />

2 2 2 2<br />

2 k N Y 2 k N<br />

α ⎜ ⎟ ≤ k ≤ χ<br />

2 1−<br />

α ⎜ 2 ⎟<br />

2<br />

⎝ σY<br />

⎠ Δ N<br />

2<br />

⎝ σY<br />

⎠<br />

Setzt man in den Nichtzentralitätsparameter ein hypothetisches k 0 ein, dann kann man das<br />

Intervall als Test verwenden.<br />

Vorstellung von C pk :<br />

Die Verbindung zwischen C pk und der Ausschussquote bzw. dem Anteil der guten Produktion<br />

(Gutanteil) ist gegeben durch<br />

⎛To<br />

− μY<br />

⎞ ⎛Tu<br />

− μY<br />

⎞<br />

Q = P({ Tu<br />

≤ Y ≤ To})<br />

= Φ⎜ ⎟ − Φ<br />

⎝ σ ⎠<br />

⎜<br />

⎝ σ ⎟<br />

⎠<br />

Löst man C p nach σ auf, dann erhält man<br />

⎛ To<br />

− μY<br />

⎞ ⎛ Tu<br />

− μY<br />

⎞<br />

Q = Φ⎜6⋅Cp<br />

⎟ − Φ⎜6⋅Cp<br />

⎝ T − T ⎠ ⎝ T − T ⎟<br />

⎠<br />

o u o u<br />

Y<br />

Hieraus kann man zunächst ablesen, dass C p allein zur Beschreibung der Ausschusses oder<br />

alternativ dazu des Gutanteils nicht ausreicht.<br />

Die Verwendung von<br />

liefert<br />

To + Tu To − T<br />

μY<br />

= + κ u , mit κ ∈R<br />

2 2<br />

Q = Q( C , κ) = Φ[3 ⋅(1 − κ) C ] − Φ[ −3 ⋅ (1 + κ) C ].<br />

p p p<br />

Sind k und C p bekannt, dann ist die zweiseitige Ausschussquote eindeutig durch<br />

d. h.<br />

bestimmt.<br />

P = 2 − Φ[3 ⋅ C (1 + k)] − Φ[3 ⋅C (1 − k)]<br />

p<br />

⎛ 1 + k ⎞<br />

P = 2 − Φ(3 Cpk<br />

) + Φ⎜3Cpk<br />

⎝<br />

⎟<br />

1 − k ⎠<br />

p<br />

Y<br />

Korrigierter Prozessfähigkeitsindex C pk<br />

min ( To<br />

− μY; μY<br />

− Tu)<br />

Δ − μY<br />

− M<br />

Cpk<br />

= = = (1 − k)<br />

C<br />

3σ<br />

3σ<br />

Y<br />

C pk soll möglichst groß sein, denn große C pk garantieren geringe Ausschussquoten.<br />

Y<br />

p<br />

C<br />

pk<br />

⎧ Cpo<br />

für μY<br />

< M<br />

⎪<br />

= ⎨Cp<br />

fürμY<br />

= M<br />

⎪<br />

⎩Cpu<br />

fürμY<br />

> M


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

191<br />

μY<br />

− Tu<br />

To<br />

− μY<br />

wobei Cpu<br />

= und Cpo<br />

= .<br />

3 ⋅ σY<br />

3 ⋅ σY<br />

Die Funktion C pk = C pk (µ Y , σ Y ) besitzt bezüglich der Argumentvariablen die Eigenschaften<br />

max<br />

C ( μY; σY) = C ( M; σY)<br />

= C<br />

μ ∈ R<br />

μ<br />

Y<br />

Y<br />

pk pk p<br />

lim<br />

C −∞<br />

→±∞<br />

pk ( μY; σY)<br />

und bzgl. der Variablen σ<br />

und<br />

⎧∞ für Tu<br />

< μY<br />

< To<br />

lim<br />

⎪<br />

C ( μY; σY) = ⎨0 fürμY = T oderμY<br />

= T<br />

σ → 0<br />

⎪<br />

⎩ −∞ für μY<br />

< Tu<br />

oder μY<br />

> T<br />

Y<br />

pk u o<br />

lim<br />

C =<br />

→∞<br />

pk ( μY; σY) 0.<br />

σ<br />

C pk > η, wenn der Streubereich [μ Y – 3 η σ Y ; μ Y + 3 η σ Y ] vollständig im Toleranzbereich<br />

[T u ; T o ] enthalten ist. Hieraus folgt, dass C pk > 1, wenn [μ Y – 3 σ Y ; μ Y + 3 σ Y ] vollständig in<br />

[T u ; T o ] liegt.<br />

Die partiellen Ableitungen von C pk nach µ Y und σ Y sind<br />

⎧ 1<br />

− für μY<br />

> M<br />

∂Cpk<br />

⎪ 3 σY<br />

= ⎨<br />

∂μY<br />

⎪<br />

1<br />

für μY<br />

< M<br />

⎪⎩ 3 σY<br />

∂C<br />

∂σ<br />

pk<br />

Y<br />

1<br />

=− C<br />

σ<br />

Y<br />

pk<br />

.<br />

Hiermit können die Elastizitäten berechnet werden Es gilt<br />

η σ<br />

∂Cpk<br />

Cpk<br />

( Cpk<br />

) = : = −1<br />

∂σ<br />

σ<br />

Y<br />

d. h. bzgl. σ Y ist C pk eine isoelastische Funktion.<br />

Y<br />

⎧ μ<br />

−<br />

Y<br />

∂Cpk<br />

Cpk<br />

⎪ Δ − μY<br />

− M<br />

ημ<br />

( Cpk<br />

) = : = ⎨<br />

∂μY<br />

μY<br />

⎪<br />

μ +<br />

Y<br />

⎪ ⎩ Δ − μY<br />

− M<br />

ist nicht eindeutig, so dass bzgl. µ Y keine Aussage über die Elastizität formuliert werden kann.<br />

Die Darstellung von C pk ist in der Abbildung 5.2.8 zu sehen.<br />

o


192 5 Qualität in der Fertigung<br />

4<br />

3<br />

2<br />

40<br />

20<br />

10<br />

0<br />

1<br />

0<br />

10<br />

20<br />

30<br />

Abb. 5.2.8: Darstellung des korrigierten Prozessfähigkeitsindexes<br />

Die Schätzfunktion für C pk ist<br />

Cˆ<br />

pk<br />

0.5 ( To<br />

− Tu)<br />

− Y − M<br />

= = (1 − k)<br />

Cˆ<br />

s<br />

3 Y<br />

p<br />

Die Verteilungsdichte für Ĉ pk ist recht kompliziert. Diese wurde von Chou, Owen [1989]<br />

abgeleitet. Hier soll auf die Wiederholung der Darstellung verzichtet werden, da deren Angabe<br />

keinen praktischen Nutzen zeigt.<br />

Prozessfähigkeitsindex C pm nach Taguchi<br />

Ausgangspunkt für diese Darstellung ist die Variabilität τ 2 von Y bzgl. des Sollwertes M, d. h. die<br />

Beziehung E [(Y – M) 2 ] = σ 2 Y + (µ Y – M) 2 =: τ 2 , in der σ 2 Y die Varianz um den Erwartungswert<br />

µ Y und der zweite Term den quadratischen Bias angibt. Da σ ≤ τ mit der Gleichheit nur für<br />

µ Y = M, gilt selbstverständlich C pm ≤ C p . Genauer kann man schreiben<br />

C pm = σ Y / τ C p .<br />

Die grafische Darstellung von C pm ist in der Abbildung 5.2.9 enthalten.<br />

Die beiden Graphen für C pk und C pm unterscheiden sich vor allem hinsichtlich der nichtlinearen<br />

Abhängigkeit des Indexes C pm von µ Y und σ Y .


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

193<br />

2<br />

1.5<br />

1<br />

30<br />

40<br />

20<br />

10<br />

10<br />

0.5<br />

0 0<br />

Abb. 5.2.9: Darstellung des Prozessfähigkeitsindexes nach Taguchi<br />

20<br />

5.2.1.7 Was sind multivariate Prozessfähigkeitsindizes?<br />

Problem<br />

Ein Prozess wird fähig genannt, wenn er konsequent Produkte produziert, dessen Produktvariablen<br />

innerhalb des Spezifikationsbereiches liegen. Ein Produkt wird durch m, m ≥ 1 nicht<br />

unabhängige Produktvariable Y 1 , …, Y m beschrieben. Der rechteckige Spezifikations- oder<br />

Toleranzbereich ist<br />

m<br />

TB : = { Y : Y ∈R<br />

und Y ∈ [ T , T ] für j = 1, …, m}.<br />

j u, j o, j<br />

Manchmal ist TB durch ein Hyperellipsoid oder ein anderes Gebilde spezifiziert.<br />

Ein Maß für die Fähigkeit des Prozesses, der aufgrund aller relevanten, nicht unabhängigen<br />

Produktvariablen beurteilt werden soll, wird multivariater Prozessfähigkeitsindex genannt und<br />

mit MC p (einfacher) bzw. MC pk (korrigierter) bezeichnet. Das Problem besteht nun darin,<br />

die multivariaten Prozessfähigkeitsindizes zu bestimmen und Entscheidungen aufgrund der<br />

multivariaten Prozessfähigkeitsindizes zu treffen.<br />

Sind die Entscheidungsmöglichkeiten analog denen der univariaten Prozessfähigkeitsindizes?<br />

In der neueren Literatur gibt es einige Ansätze für multivariate Prozessfähigkeitsindizes, so wie<br />

diese in den Arbeiten von Chan, Chen, Spiring [1988], Taam et al. [1993], Wang et al. [2000],<br />

Jahn [1997].<br />

Die Notwendigkeit für die Ableitung von Formeln soll an Beispielen mit unterschiedlicher<br />

Abhängigkeitsstruktur betrachtet werden.


194 5 Qualität in der Fertigung<br />

Beispiel 5.2.8: Simulationen. Maßzahlen und univariate Fähigkeiten<br />

Es wird der zweidimensionale Fall mit den beiden Produktvariablen Y 1 und Y 2 betrachtet.<br />

Der Y sei normal verteilt mit dem Vektor der Erwartungswerte µ T = (µ 1 , µ 2 ) und der<br />

Kovarianzmatrix<br />

Σ<br />

YY<br />

⎛<br />

2<br />

σ ⎞<br />

1 σ12<br />

= ⎜<br />

2<br />

⎟.<br />

⎝ σ ⎠<br />

2<br />

Die Sollwerte seien M T = (5.0, 5.0),<br />

und die unteren und oberen Toleranzgrenzen seien<br />

T o T = (7.5, 7.5)<br />

T u T = (2.5, 2.5).<br />

Für die beiden Fälle werden Stichproben mit den sehr großen Stichprobenumfängen<br />

N 1 = N 2 = 5000 simuliert.<br />

Für den unkorrelierter Fall erhält man die Schätzungen r 12 = –0.0078,<br />

S YY<br />

⎛0.6261 −0.0053 ⎞<br />

= ⎜<br />

⎝<br />

⎟,<br />

0.7395 ⎠<br />

und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.5.<br />

Tabelle 5.2.5: Univariate Prozessfähigkeitsindizes für den unkorrelierten Fall<br />

T u T o Mittel Stdabw. C p k C pk<br />

Y 1 2,5 7,5 5,505 0,7913 1,053 0,202 0,8401<br />

Y 2 2,5 7,5 4,288 0,86 0,969 0,2846 0,6933<br />

Für den extrem hoch korrelierten Fall erhält man die Schätzungen r 12 = 0.9987,<br />

S YY<br />

⎛0.6591 0.70827 ⎞<br />

= ⎜<br />

⎝<br />

⎟,<br />

0.76344⎠<br />

und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.6.<br />

Tabelle 5.2.6: Univariate Prozessfähigkeitsindizes für den hoch korrelierten Fall<br />

T u T o Mittel Stdabw. C p k C pk<br />

Y 1 2,5 7,5 5,4904 0,8122 1,0261 0,1962 0,8248<br />

Y 2 2,5 7,5 4,2899 0,8732 0,9544 0,2841 0,6833<br />

Aus den Tabellen liest man ab, dass sich die statistischen Maßzahlen für den unkorrelierten<br />

und hoch korrelierten Fall im statistischen Sinne nicht unterscheiden und die Kovarianzmatrizen<br />

und damit natürlich die Korrelationsmatrizen sich wesentlich unterscheiden.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

195<br />

Sind der unkorrelierte und hoch korrelierte Fall aber bzgl. der simultanen Erfüllung der<br />

Kundenanforderungen beider Produktvariablen als gleich anzusehen?<br />

Zur Beantwortung dieser Frage müssen weitere Charakteristika berechnet werden. Zu diesen<br />

zählen die Eigenwerte, die Längen der Hauptachsen der Streuungsellipsen, in deren Inneren<br />

alle Punkte (Y i1 , Y i2 ), i = 1, …, N mit der Wahrscheinlichkeit 1 – α = 0.0027 liegen und die<br />

Projektionen der Hauptachsen auf die Achsen der Produktvariablen.<br />

Längen der Hauptachsen der Ellipse :<br />

Für die Kovarianzmatrix Σ YY können wir die Eigenwerte über die charakteristische Gleichung<br />

det(S YY – λ I) = 0,<br />

d. h.<br />

2<br />

1 s12<br />

2<br />

21 s2<br />

s − λ<br />

s<br />

− λ<br />

= 0<br />

berechnen.<br />

Wir erhalten die quadratische Gleichung<br />

2 2 2 2 2 2 2 2 2<br />

1 − λ 2 − λ − 12 = λ − λ 1 + 2 + 1 2 − 12<br />

2<br />

λ λ Sp SYY<br />

SYY<br />

( s )( s ) s ( s s ) ( s s s )<br />

= − ⋅ ( ) + det( ) = 0<br />

Beispiel 5.2.9: Simulationen. Eigenwerte und Längen der Hauptachsen<br />

Hieraus können wir für beide Fälle die Eigenwerte für den<br />

unkorrelierten Fall<br />

λ 1 = 0.73975 und λ 2 = 0.62585 und den<br />

hoch korrelierten Fall<br />

λ 1 = 1.42092 und λ 2 = 0.0006178<br />

berechnen.<br />

Die Eigenwerte unterscheiden sich wesentlich.<br />

Mit den Eigenwerten können wir die Längen der Hauptachsen der Streuungsellipsen nach<br />

der Formel<br />

L<br />

j<br />

= 2 λ ⋅c,<br />

j<br />

berechnen, wobei<br />

c<br />

=−2⋅ln(2⋅π<br />

⋅h<br />

⋅ 1 −ρ12<br />

2 ).<br />

Die maximale Höhe h max der Vd ist Φ (0, 0). Die Höhe der Vd für eine vorgegebene Wahrscheinlichkeit<br />

α ist<br />

1 1<br />

h α = 0.0027 = = = 0.083367<br />

2π det( Σ YY ) 11.995087


196 5 Qualität in der Fertigung<br />

Hieraus folgt<br />

c<br />

2 π ⋅0.0027 ⋅ det( ΣYY<br />

)<br />

=−2⋅ln(2⋅π<br />

⋅ h0.0027<br />

det( ΣYY<br />

) =−2ln<br />

2π<br />

det( Σ )<br />

2<br />

1 −α,<br />

m<br />

=− 2 ln( α) =− 2 ln(0.0027) = 11.82973 = χ .<br />

YY<br />

Die Längen der Hauptachsen der Ellipsen für die beiden Fälle sind<br />

L<br />

L<br />

1,unkorr<br />

2,unkorr<br />

= 0.73975 ⋅ 11.82973 = 2 ⋅ 2.95822 = 5.9164<br />

= 0.62585 ⋅ 11.82973 = 2 ⋅ 2.72096 = 5.4419<br />

und<br />

L<br />

L<br />

1,hochkorr<br />

2,hochkorr<br />

= 2 ⋅ 1.42092 ⋅ 11.82973 = 2 ⋅ 4.09989 = 8.19978,<br />

= 2 ⋅ 0.0006178 ⋅ 11.82973 = 2 ⋅ 0.08548 = 0.17097<br />

Die Projektionen der ersten beiden Hauptachsen auf die Koordinaten- (Toleranz-) Achsen<br />

ergibt<br />

P 1 = 4.18<br />

P 2 = 5.798.<br />

Die Flächeninhalte der beiden Ellipsen sind<br />

für den unkorrelierten Fall F unkorr = 25.287 und<br />

für den hoch korrelierten Fall F hoch korr = 1.101.<br />

Aus dem Beispiel 5.2.9 erkennt man, dass im Falle der Unkorreliertheit die Ellipse im Toleranzgebiet<br />

liegen würde, wenn die Abweichung zwischen den Soll- und Mittelwerten klein<br />

genug wäre.<br />

Im Falle der starken Korreliertheit ragt die Ellipse auch für den Fall kleiner Abweichungen<br />

zwischen den Soll- und Mittelwerten über das Toleranzgebiet hinaus.<br />

Das bedeutet aber, dass in dem unkorrelierten Fall der Prozess hinsichtlich des<br />

Streuungsverhaltens fähig und im korrelierten Fall nicht fähig ist.<br />

Dieses Verhalten wird durch die univariaten Prozessfähigkeitsindizes nicht wider gespiegelt.<br />

Daher ist die Verallgemeinerung der uni- auf die multivariaten Prozessfähigkeitsindizes notwendig.<br />

Die nachfolgende Abbildung verdeutlich diesen Schluss geometrisch.<br />

In Abbildung 5.2.10. werden die beiden Grundflächen der schwach und hochkorrelierten<br />

Verteilung in einer Grafik in Bezug auf den<br />

•<br />

•<br />

gemeinsamen Sollzustand (M T = (5; 5) und T T = (T o,1 – T u,1 ; T o,2 – T u,2 ) = (5; 5) und<br />

T<br />

den Mittelpunkt Y = ( Y 1 Y 2 ) dargestellt.<br />

Wir können aus dieser Abbildung folgende Sachverhalte ablesen:<br />

1. Für den unkorrelierten Fall liegt die Streuungsellipse in Sollwertlage, d. h. mit dem Mittelpunkt<br />

M vollständig innerhalb des Toleranzrechteckes mit den Diagonalen der Länge<br />

7.071.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

197<br />

T o2 = 7,5<br />

M 2 = 5<br />

Y2<br />

T u,2 = 2,5<br />

T u.1 = 2,5 M 1 = 5<br />

Y1<br />

T 0,1 = 7,5<br />

Abb. 5.2.10: Streuungsellipsen für den schwach und hoch korrelierten Fall im Toleranzgebiet<br />

2. Die Streuungsellipse für den hoch korrelierten Fall ragt auch in der Sollwertlage über das<br />

Toleranzgebiet hinaus.<br />

3. Die Streuungsellipsen in Mittelwertlage ragen in beiden Fällen über die Toleranzgrenzen<br />

hinaus, d. h. die zu beiden Verteilungen gehörenden Prozesse liefern Ausschuss. Die Prozesse<br />

sind nicht fähig.<br />

Diese Abbildung wird durch die Streuungsellipsen der Abbildung 5.2.11 und Abbildung 5.2.12<br />

für den unkorrelierten und hoch korrelierten Fall bestätigt.<br />

Die Abbildungen bestätigen die obigen Aussagen, dass mit größer werdenden Korrelationskoeffizienten<br />

der Anteil der Punkte außerhalb des Toleranzgebietes größer wird und dass<br />

dadurch die multivariaten Prozessfähigkeitsindizes kleiner werden und deren Berechnung<br />

notwendig ist.<br />

8<br />

6<br />

4<br />

Y2<br />

2<br />

0<br />

2 3 4 5 6 7 8<br />

Y1<br />

Abb. 5.2.11: Streudiagramm für den unkorrelierten Fall


198 5 Qualität in der Fertigung<br />

8<br />

6<br />

4<br />

Y2<br />

2<br />

0<br />

2 3 4 5 6 7 8<br />

Y1<br />

Abb. 5.2.12: Streudiagramm für den hoch korrelierten Fall<br />

Vor der Ableitung neuer multivariater Prozessfähigkeitsindizes (multivariate process capability<br />

indices) MC p und MC pk werden die folgenden Voraussetzungen und Anforderungen gestellt:<br />

• Die Produktivität eines Unternehmens ist wesentlich von dem Niveau der im Unternehmen<br />

angewendeten Methoden für die Strukturierung des Unternehmens, die statistische Prozessanalyse<br />

und die Entscheidungsfindung für die Prozessverbesserung, die Tolerierung oder<br />

Überprüfung der Toleranzen mit multivariaten statistischen Methoden auf der Grundlage<br />

der Prozessfähigkeiten abhängig.<br />

• Jedes Produkt wird durch mehrere (m ≥ 1) Produktvariablen Y 1 , …, Y m beschrieben. Die<br />

Produktvariablen sind nicht unabhängig voneinander.<br />

Der Sollzustand wird durch<br />

•<br />

•<br />

den Vektor der Sollwerte M T = (M 1 , …, M m ) und<br />

die Vektoren der Toleranzgrenzen T T o = (T o1 , …, T om ) und TT u = (T u1 , …, T um )<br />

und der Istzustand durch<br />

•<br />

•<br />

den Vektor der Mittelwerte Y = ( Y 1 … Y m ) und<br />

die positiv definite Stichprobenkovarianzmatrix S YY<br />

T<br />

beschrieben.<br />

Was ist Qualität? (Wir müss en hier von Produktqualität sprechen)<br />

Die Qualität eines Produktes wird durch die simultane Erfüllung aller relevanten Kundenanforderungen<br />

definiert. Für den Vergleich ist es notwendig, dass<br />

• die relevanten Kundenanforderungen unter Beachtung der Abhängigkeitsstruktur zwischen<br />

den Produktvariablen durch Sollwerte und Toleranzgrenzen spezifiziert werden müssen.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

199<br />

• Zum anderen ist es ebenfalls notwendig, den Istzustand für alle relevanten, nicht unabhängigen<br />

Produktvariablen durch die m-dimensionale Häufigkeitsverteilung, bzw. durch die<br />

Angabe des Mittelwertvektors und der Stichprobenkovarianzmatrix S YY zu erfassen.<br />

• Über den Vergleich von Soll- und Istzustand muss die Qualität quantifiziert werden, um<br />

sinnvolle Entscheidungen treffen zu können.<br />

Die multivariaten Prozessfähigkeitsindizes quantifizieren die Qualität<br />

• Der Vektor der Produktvariable Y sei entweder<br />

gemeinsam normal verteilt, d. h. Y ~ N m (µ, Σ YY ), Σ YY > 0<br />

oder die gemeinsame Verteilung gehört zur Klasse der elliptisch umrissenen Verteilungen.<br />

• Die multivariaten Prozessfähigkeitsindizes sollen Eigenschaften haben, die analog zu denen<br />

der univariaten Prozessfähigkeitsindizes sind. Insbesondere sollen die multivariaten<br />

Prozessfähigkeitsindizes als Entscheidungsgrundlage für<br />

–<br />

–<br />

–<br />

die Prozessverbesserung im Sinne der Reduktion der Variabilität der Produktvariable,<br />

falls MC p < 1,<br />

der Justierung des Prozesses, falls MC p > 1 und MC pk < 1,<br />

der Überprüfung oder Neuberechnung der Toleranzgrenzen, falls MC p < 1 und die<br />

Differenz zwischen MC p und MC pk sehr groß ist,<br />

dienen.<br />

–<br />

–<br />

–<br />

–<br />

–<br />

–<br />

–<br />

–<br />

Der multivariate Prozessfähigkeitsindex MC p , der das Streuverhalten des zufälligen Vektors<br />

der Produktvariablen im Vergleich zum Toleranzbereich beurteilt, muss 1 sein, falls<br />

das Streuungsellipsoid den Toleranzbereich an allen Koordinatenebenen berührt,<br />

MC pk ≤ MC p für K ≥ 0.<br />

K ist nichtlinear von Y − M abhängig,<br />

die Form des Ellipsoids oder Hyperellipsoids der Realisierungen des Vektors der Produktvariablen<br />

ist vom Grad der Multikollinearität δ =<br />

1<br />

abhängig.<br />

Je größer der Grad der Multikollinearität ist, desto kleiner wird die kleinste Hauptachse<br />

des Hyperellipsoides.<br />

MC p muss folglich ebenfalls von δ abhängen.<br />

MC p soll für verschiedene Toleranzbereiche<br />

m<br />

· unabhängige Spezifikationsbereiche ( T − T )<br />

∏ oj<br />

uj<br />

j=<br />

1<br />

R YY<br />

· abhängige Spezifikationsbereiche (T o – M) T A (T o – M)<br />

gelten.<br />

Sind die Produktvariablen unabhängig voneinander, kann die Benferoni Ungleichung angewandt<br />

werden, um sicher zustellen, dass dieselbe Wahrscheinlichkeit α für alle Produktvariablen<br />

gilt. Außerdem kann in diesem Fall die multivariate Prozessfähigkeit durch das Produkt über<br />

alle Prozessfähigkeiten für jeden Produktvariable<br />

m<br />

MPC′ = ∏C<br />

p p, j<br />

j=<br />

1<br />

abgeschätzt werden.


200 5 Qualität in der Fertigung<br />

Sind die Produktvariablen nicht unabhängig voneinander, dann sind sie korreliert. Die<br />

Abhängigkeitsstruktur zwischen den Produktvariablen, ausgedrückt durch die Korrelationsoder<br />

Kovarianzmatrix, muss berechnet werden. In diesen Fällen liefern die Produkte über die<br />

einfachen Prozessfähigkeitsindizes unsinnige Ergebnisse.<br />

Was müssen wir tun, um im multivariaten Fall den Soll- mit dem Istzustand vergleichen zu<br />

können?<br />

Im univariaten Fall haben wir Intervalle (Breite des Toleranzintervalls und Breite der Häufigkeitsverteilung)<br />

miteinander verglichen.<br />

Im zweidimensionalen Fall könnten wir Flächen – die Streuungsellipse und den Toleranzbereich<br />

– miteinander vergleichen. Das hieße, dass wir im m-dimensionalen Fall Volumen<br />

vergleichen müssten.<br />

Welche Zahl können wir für m = 2 einer Fläche zuordnen?<br />

Die Flächeninhalte des Kreises und der Ellipse mit dem Flächeninhalt des Toleranzbereiches<br />

zu vergleichen, ergäbe für den unkorrelierten Fall den Wert<br />

Toleranzbereich 25<br />

= =<br />

Streuungsbereich 25.287<br />

und für den hoch korrelierten Fall<br />

Toleranzbereich 25<br />

= =<br />

Streuungsbereich 1.101<br />

0.988<br />

22.706.<br />

Dieser Vergleich macht keinen Sinn, denn die Abbildungen 5.14 und 5.15 zeigen, dass<br />

•<br />

•<br />

•<br />

Die „Ecken“ des Toleranzbereiches durch den Prozess nicht belegt werden können,<br />

der Streuungskreis für den unkorrelierten Fall und<br />

die Streuungsellipse für den hoch korrelierten Fall<br />

über die Toleranzgrenzen hinausragen.<br />

An dieser Stelle möchte ich Ihnen die Frage stellen, warum sind Schießscheiben rund?<br />

Natürlich weil die Trefferbilder eines jeden Schießgerätes kreisförmig umrissen sind. Die Ecke<br />

eines rechteckigen Zielgebietes zu treffen ist genauso schwierig, wie in das Zentrum zu treffen,<br />

ja man kann sagen, jeder Eckpunkt ist der Mittelpunkt eines Vierteilkreises. Da der Flächenvergleich<br />

kein Ergebnis liefert, müssen wir uns etwas anderes überlegen.<br />

Wir können die Definition des univariaten Prozessfähigkeitsindex auch anders interpretieren,<br />

indem wir fragen, wie groß ist der Abstand zwischen der oberen und unteren Toleranzgrenze<br />

relativ zur Standardabweichung der betrachteten Produktvariablen?<br />

Das würde bedeuten, dass wir die Abstände zwischen Punkten in beliebig dimensionalen Räumen<br />

unter Beachtung der Abhängigkeitsstruktur zwischen den Produktvariablen betrachten<br />

und nach passenden Abstandsdefinitionen suchen.<br />

Im Kapitel 10 über die Klassifikationsverfahren, speziell bei der Einführung der Clusteranalyse,<br />

werden einige Abstandsdefinitionen eingeführt und betrachtet. Der für die Ableitung der<br />

multivariaten Prozessfähigkeitsindizes passende Abstandsbegriff ist der


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

201<br />

Mahalanobis Abstand<br />

Der gewichtete A bstand zwischen den beiden Vektoren z. B. Y 1 und Y 2 mit den Gewichten, die<br />

durch die inversen Kovarianzmatrix geliefert werden, ist durch<br />

T<br />

1 2 1 2<br />

T −1<br />

1 2 ΣYY<br />

1 2<br />

D = ( Y − Y ) A( Y − Y )<br />

= ( Y − Y ) ⋅ ⋅( Y − Y )<br />

definiert, wobei die Gewichtsmatrix A durch die inverse Kovarianzmatrix ersetzt wird. Ist<br />

Σ YY unbekannt, so wird sie durch die Stichprobenkovarianzmatrix S YY ersetzt. Sind die Stichprobenkovarianzmatrizen<br />

von Y 1 und Y 2 verschieden, so kann man S YY durch die gemittelte<br />

(pooled) Kovarianzmatrix ersetzen.<br />

Nehmen wir wie oben an, dass der zufällige Vektor Y der Produktvariablen Y 1 , …, Y m m-dimensional<br />

normal verteilt ist, dann hat er die Verteilungsdichte<br />

1 ⎧ 1<br />

⎫<br />

f ( y; , ) exp ( Y ) ( Y ) ⎬,<br />

⎭<br />

T −1<br />

Y μΣ = ⋅ ⎨− − μY ⋅ΣYY ⋅ − μ<br />

m<br />

Y<br />

1 ⎩ 2<br />

(2 π)<br />

2 ⋅ ΣYY<br />

2<br />

wobei Σ YY eine positiv definite Kovarianzmatrix ist. Diesen Sachverhalt kürzen wir durch<br />

Σ YY > 0 ab. In dieser Darstellung erkennen wir, dass die quadratische Form im Exponenten<br />

der m-dimensionalen Normalverteilung mit den Abweichungen der Messwertvektoren Y i vom<br />

T −1<br />

i YY i<br />

Erwartungswertvektor µ genau ein Mahalanobis Abstand D = ( Y − μ) Σ ( Y − μ ) ist, der<br />

den „gewichteten“ Abstand einer Zufallsgröße Y i von ihrem Erwartungswert misst.<br />

Das wollen wir uns für die Definition der multivariaten Prozessfähigkeitsindizes zunutze<br />

machen.<br />

Neue Definition der multivariaten Prozessfähigkeitsindizes<br />

Beim Übergang von d en univariaten zu den multivariaten Prozessfähigkeitsindizes müssen<br />

wir anmerken, dass sich von Stichprobe zu Stichprobe mit den Vektoren der Einzelwerte<br />

Y i , i = 1, …, N auch die Vektoren der Mittelwerte Y und die Stichprobenkovarianzmatrizen<br />

ändern können. Die einzige nahezu unveränderliche „Größe“ ist die Korrelationsmatrix für<br />

die Produktvariablen.<br />

Bedingte Prozessfähigkeitsindizes<br />

Infolgedessen suchen wir den mit der Stichprobenkovarianzmatrix gewichteten Abstand<br />

zwischen dem Vektor der Abweichungen des Einzelwertes Y i vom Vektor der Mittelwerte. Das<br />

wäre der mittlere Mahalanobis Abstand<br />

1<br />

N<br />

N<br />

∑<br />

i=<br />

1<br />

Nun gilt aber<br />

T −1<br />

i − SYY i<br />

( Y Y) ( Y − Y).<br />

⎡ ⎛<br />

N<br />

−<br />

⎞⎤<br />

⎧<br />

N<br />

E 1 1 1<br />

−<br />

⎫<br />

⎢ ⎜ − − ⎟⎥ = ⎨ ⎡<br />

1<br />

Sp ∑ ( ∑ − − ⎤<br />

⎣ ⎦⎬<br />

⎢⎣<br />

⎝<br />

Y T<br />

T<br />

i Y ) SYY ( i ) Sp YY ( i )( i )<br />

N<br />

Y Y i= 1 ⎠⎥⎦<br />

⎩N<br />

E S Y Y Y Y<br />

i=<br />

1<br />

⎭<br />

n<br />

= = const<br />

N


202 5 Qualität in der Fertigung<br />

Zudem muss dieser Abstand relativ zu dem gewichteten Abstand zwischen den Vektoren der<br />

oberen Toleranzgrenzen und den Sollwerten<br />

−1<br />

YY<br />

( T − M) S ( T − M)<br />

o<br />

T<br />

o<br />

betrachtet werden.<br />

Dieser Abstand kann auch mit dem Spurkriterium in den Ausdruck<br />

⎡ m ( T − ⎤<br />

−1 ⎡<br />

−1<br />

o, j M )<br />

T<br />

T<br />

j<br />

( T − − = − − ⎤<br />

o M) SYY<br />

( To M) Sp<br />

⎣<br />

( To M)( To<br />

M)<br />

SYY<br />

⎦<br />

= ⎢∑<br />

⎥<br />

⎢⎣j<br />

= 1<br />

Sj/<br />

m−<br />

j ⎥⎦<br />

umgeformt werden. Die Summanden dieser Summe sehen aus wie die einfachen Prozessfähigkeitsindizes<br />

mit den bedingten anstelle der einfachen Standardabweichungen. Für die einzelnen<br />

Produktvariablen kann die Formel<br />

( To, j − Tu,<br />

j)<br />

MCp() j = , ∀ j = 1, …,<br />

m<br />

6 ⋅ S<br />

j/<br />

m−<br />

j<br />

als einfacher bedingter oder multivariater Prozessfähigkeitsindex für die j-te Produktvariable<br />

verwendet werden. Der Korrekturterm für die Messung der Abweichung des Mittelwertes vom<br />

Sollwert ist<br />

Mj − E( Yj / Ym−<br />

j)<br />

kj<br />

= 2 , ∀ j = 1, …, m.<br />

T − T<br />

o, j u, j<br />

Der korrigierte bedingte (oder multivariate) Prozessfähigkeitsindex für die j-te Produktvariable<br />

ist<br />

MC () j = [1 − k MC ()]. j<br />

pk<br />

j<br />

p<br />

Die bedingten Prozessfähigkeitsindizes hängen noch über die bedingte Varianz von der Kovarianzmatrix<br />

ab. Daher ist es sinnvoll, noch ein globales Maß für die multivariate Prozessfähigkeit<br />

auszurechnen.<br />

Multivariate Prozessfähigkeitsindizes<br />

Wir gehen wieder vom univariaten Prozessfähigkeitsindex C p aus und schreiben den in der<br />

Form<br />

To<br />

− Tu<br />

1 1<br />

Cp<br />

= ⋅ = σ*<br />

6 S S<br />

wobei<br />

T<br />

o<br />

− T<br />

6<br />

u<br />

= σ*<br />

die maximale Streuung für die Produktvariable ist, die garantiert, dass die Häufigkeitsverteilung<br />

für die Werte der Produktvariablen innerhalb des Toleranzintervalls liegt. Ist S > σ*, dann ist<br />

C p < 1. Diesen Ausdruck für C p wollen wir auf den multivariaten Fall verallgemeinern.<br />

Eine Möglichkeit der Verallgemeinerung wäre die Bildung des verallgemeinerten Varianzquotienten<br />

* −1<br />

( Σ S ).<br />

YY<br />

YY<br />

2


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

203<br />

Dieser Ausdruck oder gewisse Funktionale davon scheinen nicht geeignet zu sein. Daher wählen<br />

wir für den multivariaten Prozessfähigkeitsindex den Quotient zweier quadratischer Formen.<br />

Die quadratische Form im Zähler ist die schon betrachtete<br />

−1<br />

YY<br />

( T − M) S ( T − M).<br />

o<br />

T<br />

o<br />

Die im Nenner stehende zweite quadratische Form wird mit der so genannten „theoretischen“<br />

*<br />

*<br />

Kovarianzmatrix Σ YY anstelle der Stichprobenkovarianzmatrix S YY gebildet. Σ YY wird aus der<br />

Korrelationsmatrix, den Toleranzgrenzen und Sollwerten für alle m Produktvariablen berechnet.<br />

Mit diesen Überlegungen erhält man für die Vektoren der oberen Toleranzgrenzen<br />

T<br />

o o,1 o, m<br />

T = ( T … T )<br />

und der Sollwerte<br />

T<br />

den Ausdruck<br />

wobei<br />

M = ( M 1 … M m )<br />

MC<br />

Σ<br />

T -1<br />

o − SYY o −<br />

p =<br />

T * −1<br />

o − ΣYY<br />

o<br />

( T M) ( T M)<br />

( T M) ( ) ( T − M)<br />

⎛ − ⎞ ⎛ − ⎞<br />

= diag ⎜ T M ⎝<br />

⎟ R diag<br />

⎠<br />

⎜ T M<br />

YY<br />

⎝<br />

⎟<br />

3 3 ⎠<br />

* o o<br />

YY<br />

die theoretische Kovarianzmatrix und R YY die Korrelationsmatrix des Vektors Y T = (Y 1 , …, Y m )<br />

der m, m ≥ 1 Produktvariablen ist.<br />

Für schiefsymmetrische Toleranzgrenzen verwendet man<br />

MC<br />

T −1<br />

o o − SYY<br />

o −<br />

p =<br />

T * −1<br />

o − ΣYY<br />

o<br />

( T M) ( T M)<br />

( T M) ( ) ( T − M)<br />

MC<br />

T −1<br />

u ( M − Tu) SYY<br />

( M − Tu)<br />

p =<br />

T * −1<br />

M − Tu<br />

ΣYY<br />

M − Tu<br />

( ) ( ) ( )<br />

Der Korrekturterm wird nach der Formel<br />

MC<br />

T −1<br />

u − u SYY<br />

p =<br />

T * −1<br />

− u ΣYY<br />

( M T ) ( M − Tu<br />

)<br />

( M T ) ( ) ( M − T )<br />

berechnet. Damit wir der korrigierte multivariate Prozessfähigkeitsindex<br />

MCpk = MCp / K<br />

berechnet.<br />

Die Entscheidung wird entsprechend den Größen von MC p und MC pk vorgenommen.<br />

u


204 5 Qualität in der Fertigung<br />

Daten<br />

T u 2<br />

T u 2<br />

T u 2<br />

M 2<br />

M 2<br />

M 2<br />

T l 2<br />

Y 2<br />

T l 1 M 1 T u 1 Y 1<br />

T l 2<br />

Y 2<br />

T l 1 M 1 T u 1 Y 1<br />

T l 2<br />

Y 2<br />

T l 1 M 1 T u 1 Y 1<br />

MC p < 1 MC p > 1 MC p > 1<br />

MC pk < 1 MC pk < 1 MC pk >1<br />

Prozessverbesserung<br />

Kontrolle des Prozesses<br />

Reduktion der<br />

Variation<br />

Justierung des<br />

Prozesses<br />

Abb. 5.2.13: Entscheidungen aufgrund der multivariaten Prozessfähigkeitsindizes<br />

Gilt MC p < 1 (bzw. 1.33), dann ragt die multivariate Häufigkeitsverteilung der Produktvariablen<br />

an einer, mehreren oder allen Rändern über den Toleranzbereich hinaus. Ausschuss wird<br />

produziert. Der Prozess muss so verbessert werden, dass die Variabilität der Produktvariablen<br />

kleiner wird. Das kann nur über die Steuerung des Prozesses mit den Sollwerten und Toleranzgrenzen<br />

als Zielwerte für die Produktvariablen erreicht werden. In diesem Fall ist auch<br />

MC pk < 1, da K > 0 ist.<br />

Gilt MC p > 1 (bzw. 1.33) und MC pk < 1 (bzw. 1.33), dann weicht der Vektor der Mittelwerte<br />

zu stark vom Vektor der Sollwerte ab. Die multivariate Häufigkeitsverteilung der Produktvariablen<br />

kann über den Toleranzbereich hinausragen. Das bedeutet aber, dass trotz MC p > 1<br />

(bzw. > 1.33) Ausschuss produziert wird. Der Prozess muss verbessert werden, so dass die<br />

Mittel- und Sollwerte übereinstimmen.<br />

Gelten sowohl MC p > 1 und MC pk > 1 (bzw. > 1.33), dann ist der Prozess fähig, Produkte<br />

mit den durch Sollwerte und Toleranzgrenzen vorgegebenen Eigenschaften zu produzieren.<br />

In diesem Fall muss der Prozess mit den multivariaten Kontrollkarten des Kapitels 6 ständig<br />

überwacht werden. Die Entscheidungen werden durch die Abbildung 5.2.13 visualisiert.<br />

Was besagen die Begriffe Produktqualität, Lieferantenqualität und Prozessqualität?<br />

Die bedingten und multivariaten Prozessf ähigkeitsindizes sind auf die Produkte, die Inputoder<br />

Lieferantenprodukte und die Prozesse anwendbar. In jedem Falle müssen die Sollzustände,<br />

ausgedrückt durch Sollwerte und Toleranzgrenzen, für die nicht unabhängigen Variablen mit<br />

den Istzuständen, ausgedrückt durch die Schätzungen für die Mittelwertvektoren und Kovarianzmatrizen,<br />

verglichen werden.<br />

Für die Anwendung der multivariaten Prozessfähigkeitsindizes MC p und MC pk auf die Produkte,<br />

Prozesse und Lieferantenprodukte wollen wir die folgenden Bezeichnungen einführen.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

205<br />

•<br />

•<br />

•<br />

•<br />

•<br />

PC p und PC pk werden für die Messung der simultanen Erfüllung aller relevanten Kundenanforderungen<br />

verwendet. Diese Fähigkeitsindices wollen wir Produktfähigkeiten nennen.<br />

Die Produktfähigkeit PC pk misst die Produktqualität.<br />

LC p und LC pk werden für die Beurteilung der Input- oder Lieferantenprodukte verwendet.<br />

Die Lieferantenfähigkeit LC pk misst die Lieferantenqualität.<br />

ProzC p und ProzC pk wollen wir für die Beurteilung der Prozesse verwenden.<br />

Die Prozessfähigkeit ProzC pk misst die Prozessqualität.<br />

Die Lieferanten- und Prozessqualität sind die notwendigen Voraussetzungen für die Produktqualität.<br />

Mitunter, wenn keine Verwechslungen möglich sind, werden aber die übergeordneten Bezeichnungen<br />

MC p und MC pk verwendet.<br />

An mehreren Beispielen wollen wir jetzt demonstrieren, wie die multivariaten Prozessfähigkeitsindizes<br />

zu interpretieren sind.<br />

Beispiel 5.2.10: Demonstrationsbeispiel. Multivariate Fähigkeiten<br />

Für fünf Produktvariable mit den Sollwerten und Toleranzgrenzen der folgenden Tabelle<br />

Tabelle 5.2.7: Sollzustand Demonstrationsbeispiel<br />

Produktvariable Sollwert untere<br />

Toleranzgrenze<br />

obere<br />

Toleranzgrenze<br />

Y 1 7,5 5,7 9,3<br />

Y 3 128 113 143<br />

Y 3 65 56 74<br />

Y 4 1,2 1,05 1,35<br />

Y 5 1,8 0,3 3,3<br />

und eine gegebene Korrelationsmatrix R YY wurden zwei Stichproben erzeugt.<br />

Die Stichprobenkovarianzmatrix der einen Stichprobe ist<br />

S YY<br />

und die der zweiten<br />

S YY<br />

⎛0,502067 3,042725 0,546106 0,0160155 0,147379 ⎞<br />

⎜<br />

29,794251 3,073832 0,140759 1,768678 ⎟<br />

⎜<br />

⎟<br />

(1) = ⎜ 11,653298 0,127856 0,991572 ⎟<br />

⎜<br />

0,0021438 0,0153684⎟<br />

⎜<br />

⎟<br />

⎝<br />

0,185228 ⎠<br />

⎛0,346178 2,356153 0,481964 0,014896 0,161749 ⎞<br />

⎜<br />

26,378731 3,025746 0,147258 2,095516⎟<br />

⎜<br />

⎟<br />

(2) = ⎜ 9,128812 0,122732 1,047801⎟.<br />

⎜<br />

0,0025146 0,020078⎟<br />

⎜<br />

⎟<br />

⎝<br />

0,268881⎠


206 5 Qualität in der Fertigung<br />

Die theoretische Kovarianzmatrix ist<br />

*<br />

Σ YY<br />

⎛0,36 2,360133 0,40639 0,014645 0,144981 ⎞<br />

⎜ 25 2,47446 0,139237 1,882212⎟<br />

⎜<br />

⎟<br />

= ⎜ 9 0,121336 1,012367 ⎟.<br />

⎜<br />

0,0025 0,01928 ⎟<br />

⎜<br />

⎟<br />

⎝<br />

0,25 ⎠<br />

*<br />

Sie sehen, die Stichprobenkovarianzmatrix S YY (2) unterscheidet sich von Σ YY sehr viel<br />

weniger als S YY (1). Folglich müssen die multivariaten Prozessfähigkeitsindizes der zweiten<br />

Stichprobe in der Nähe von 1 liegen und die der 1. Stichprobe kleiner sein. Die Prozessfähigkeitsindizes<br />

der ersten Stichprobe sind<br />

Tabelle 5.2.8: Fähigkeiten der Stichprobe 1<br />

Univariate Capabilities:<br />

LSL USL Mean Stdv C p k C pk<br />

Y 1 5.70 9.30 7.8634 0.7086 0.8468 0.2019 0.6758<br />

Y 2 113.00 143.00 129.6605 5.4584 0.9160 0.1107 0.8146<br />

Y 3 56.00 74.00 64.8889 3.4137 0.8788 0.0123 0.8680<br />

Y 4 1.05 1.35 1.2015 0.0463 1.0799 0.0102 1.0689<br />

Y 5 0.30 3.30 1.8390 0.4304 1.1618 0.0260 1.1316<br />

Multivariate Capabilities:<br />

PC p : 0.658<br />

D: 1.2892 PC pm : 0.5104<br />

und die der zweiten<br />

Tabelle 5.2.9: Fähigkeiten der Stichprobe 2<br />

Univariate Capabilities:<br />

LSL USL Mean Stdv C p k C pk<br />

Y 1 5.70 9.30 7.5328 0.5884 1.0198 0.0182 1.0012<br />

Y 2 113.00 143.00 128.3841 5.1360 0.9735 0.0256 0.9486<br />

Y 3 56.00 74.00 64.9522 3.0214 0.9929 0.0053 0.9876<br />

Y 4 1.05 1.35 1.2009 0.0501 0.9971 0.0057 0.9914<br />

Y 5 0.30 3.30 1.8220 0.5185 0.9643 0.0147 0.9501<br />

Multivariate Capabilities:<br />

PC p : 0.9735<br />

K: 0.014 PC pk : 0.9599<br />

D: 1.0238 PC pm : 0.9509


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

207<br />

Der multivariate Prozessfähigkeitsindex MC p , der eine Aussage über das Streuverhalten<br />

gestattet, liegt bei der zweiten Stichprobe nahe an der 1 und bei der ersten Stichprobe ist<br />

er bedeutend kleiner als 1.<br />

1<br />

Der Mittelwert der Eigenwerte von ( Σ * SYY<br />

− ) als Test für die Gleichheit von Kovarianzmatrizen<br />

ist für die 1. Stichprobe 1,772 und für die 2. Stichprobe 0,989. Hieraus folgt, dass bei der<br />

1. Stichprobe die theoretische Kovarianzmatrix ungleich der Stichprobenkovarianzmatrix<br />

ist. Im zweiten Fall stimmen die Kovarianzmatrizen fast überein.<br />

Beispiel 5.2.11: Dämpfung der Motorvibration. Multivariate Fähigkeiten<br />

Das Hydrolager wurde durch die beiden Produktvariablen<br />

Y 1 = Phasenverschiebung [Φ] und<br />

Y 2 = dynamische Steifigkeit [N/mm]<br />

beschrieben. Die dreidimensionale Häufigkeitsverteilung und das Streudiagramm sind in<br />

Abbildung 5.1.2 und Abbildung 5.1.3 dargestellt.<br />

Die Sollvorgaben sind<br />

Tabelle 5.2.10: Sollvorgaben für die Produktvariable Phasenverschiebung und Steifigkeit<br />

Phasenverschiebung<br />

dyn. Steifigkeit<br />

Sollwert 43 185<br />

untere Toleranzgrenze 36 140<br />

obere Toleranzgrenze 48 230<br />

Die Kennzahlen für den Istzustand nach der Ausreißererkennung mit dem aerk-Kriterium<br />

und Elimination sind in der Tabelle 5.2.11 zusammengestellt.<br />

Tabelle 5.2.11: Istzustand<br />

Phasenverschiebung<br />

dyn. Steifigkeit<br />

Minimum 2.90 119.92<br />

Mittelwert 42.526 196.587<br />

Standardabweichung 2.83727 8.193489<br />

Maximum 60.00 272.79<br />

Tabelle 5.2.12: Univariate Prozessfähigkeitsindizes<br />

Phasenverschiebung<br />

dyn. Steifigkeit<br />

C p 0.7049 1.8307<br />

K 0.0877 0.2575<br />

C pk 06431 1.3593<br />

Hier hat man den Fall, dass eine Produktvariable eine univariate Prozessfähigkeit hat, die<br />

größer ist als 1.33 und eine, deren Fähigkeit kleiner als 1.33 ist.


208 5 Qualität in der Fertigung<br />

Wie soll man entscheiden?<br />

Die multivariaten Prozessfähigkeitsindizes müssen berechnet werden.<br />

Wir erhalten die Werte<br />

MC p = 1.375<br />

MC pk = 1.057.<br />

Da der korrigierte multivariate Prozessfähigkeitsindex kleiner als 1.33 ist, muss der Prozess<br />

verbessert werden, sodass vor allem die Streuung der dynamische Steifigkeit Y 2 kleiner<br />

wird.<br />

Beispiel 5.2.12: Akkubohrschrauber. Prozessfähigkeiten<br />

Für das Plastikgehäuse des Akku-Bohrschraubers haben wir vorn die statistischen Toleranzgrenzen<br />

berechnet. Die statistischen Toleranzgrenzen unterscheiden sich von den gegebenen<br />

CAD Toleranzen. Mit den statistischen Toleranzgrenzen haben wir die Fähigkeiten berechnet<br />

und in der Tabelle 5.2.13 zusammengestellt.<br />

Tabelle 5.2.13: Univariate Prozessfähigkeitsindizes Beispiel Akkubohrschrauber<br />

Variable Toleranzgrenzen Mittelwert Stabw. C p k C pk<br />

untere obere<br />

Thermoschrumpf –0,52 2,72 1,5152 0,4743 1,138 0,256 0,847<br />

Axialität –0,7 0,7 0,0097 0,205 1,138 0,014 1,122<br />

Parallelität –1,4 1,4 0,0788 0,496 0,941 0,056 0,888<br />

Dicke 2,76 3,44 3,137 0,094 1,207 0,108 1,076<br />

Die multivariaten Prozessfähigkeitsindizes sind:<br />

MC p 1,0963<br />

D 1,4317<br />

MC pk 0,766<br />

Da MC pk < 1 ist, muss der Prozess so verbessert werden, dass die Streuungen für die Produktvariablen<br />

kleiner werden.<br />

Der Vektor der Produktvariablen kann aber auch der allgemeineren Klasse der elliptisch<br />

umrissenen Verteilung en zugeordnet werden, zu der natürlich auch die Normalverteilungen<br />

gehören. Diese Klasse ist durch die Verteilungsdichte charakterisiert<br />

1<br />

−<br />

⎡<br />

T −1<br />

Y μΣ = ΣYY 2 − μY ⋅ΣYY ⋅ − μY<br />

f ( y; , ) g ⎤<br />

⎣<br />

( Y ) ( Y )<br />

⎦<br />

,<br />

wobei g eine nicht wachsende Funktion ist. Wählt man für g die Funktion<br />

m 1<br />

− − ⋅u<br />

2 2<br />

gu ( ) = (2 π)<br />

⋅e<br />

dann erhält man die Verteilungsdichte der m-dimensionale Normalverteilung. Der Exponent<br />

T −1<br />

Y YY Y Y<br />

( Y − μ ) ⋅Σ ⋅( − μ )<br />

der multivariaten normalen oder elliptisch umrissenen Dichte spezifiziert die Gleichung<br />

eines Hyperellipsoides im m-dimensionalen Raum, wenn er gleich einer beliebigen positiven<br />

Konstante c gesetzt wird.


5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />

209<br />

Beispiel 5.2.13: Karosseriebau. Multivariate Fähigkeiten<br />

An einer Karosserie wurden nach dem Tür-, Heckklappen- und Motorhaubeneinbau m = 73<br />

Produktvariable, wie Spaltmaße, Symmetrien, Parallelitäten, Längen, Höhen, Distanzen<br />

usw. gemessen. Der Stichprobenumfang betrug N = 228.<br />

Der Grad der Multikollinearität war sehr hoch, d. h. die Determinante der Korrelationsmatrix<br />

der Produktvariablen nahm den überaus kleinen Wert Det(R YY ) = 2,2 10 –135 an. Aus<br />

der Analyse wurden über das Red-Auswahlverfahren und die multiple Korrelationsanalyse<br />

p = 59 Produktvariable gestrichen.<br />

Die übrig gebliebenen Produktvariablen wurden neu mit Y 1 , …, Y 14 nummeriert.<br />

Die gegebenen Toleranzen für alle Produktvariablen wurden nach der arithmetischen<br />

Tolerierung berechnet. Diese setzt aber die Unabhängigkeit der Produktvariablen, d. h.<br />

Det(R YY ) ≅ 1 voraus. Der tatsächliche Wert für die Determinante der Korrelationsmatrix<br />

liegt aber sehr viel näher an Null als an der Eins! Hieraus folgt, dass auf alle Fälle das Ergebnis<br />

der gegebenen Tolerierung infrage gestellt werden muss.<br />

Die statistischen Toleranzgrenzen wurden berechnet und in der Tabelle 5.2.14 zusammengestellt.<br />

Tabelle 5.2.14: Produktvariable mit den statistischen Maßzahlen und den Toleranzgrenzen<br />

Produktvar. Mittelwert Standardabw. T u T o Dimension<br />

Y 1 0,51 0,4435 –0,924 1,944 mm<br />

Y 2 –0,5144 0,1904 –1,172 0,142 mm<br />

Y 3 –0,3546 0,0512 –0,528 –0,182 mm<br />

Y 4 –0,211 0,5532 –0,638 0,216 mm<br />

Y 5 1,558 0,1154 1,016 2,1 mm<br />

Y 6 –0,1112 0,088 –0,576 0,353 mm<br />

Y 7 1,671 0,115 1,188 2,154 mm<br />

Y 8 –0,0916 0,1305 –0,802 0,62 mm<br />

Y 9 0,0171 0,0615 –0,208 0,242 mm<br />

Y 10 –0,1681 0,0841 –0,498 0,162 mm<br />

Y 11 –0,1603 0,0566 –0,464 0,143 mm<br />

Y 12 –0,5871 0,0814 –0,865 –0,309 mm<br />

Y 13 –0,0445 0,1017 –0,292 0,203 mm<br />

Y 14 –15,525 0,8507 –19,919 –11,131 mm<br />

Die berechneten statistischen Toleranzgrenzen wurden mit dem Vertragspartner abgestimmt<br />

und akzeptiert.<br />

Mit den berechneten Toleranzgrenzen wurde die uni- und multivariaten Prozessfähigkeitsindizes<br />

berechnet und in Tabelle 5.2.15 zusammengestellt.<br />

Nur eine der univariaten, korrigierten Prozessfähigkeitsindizes ist kleiner als 1 und fünf<br />

sind kleiner als 1.33. Für die Entscheidung, ob der Prozess verbessert werden muss, ist die<br />

Berechnung der multivariaten Prozessfähigkeitsindizes unerlässlich.


210 5 Qualität in der Fertigung<br />

Tabelle 5.2.15: Univariate Prozessfähigkeiten für die wesentlichen Produktvariablen<br />

Prod.Par. C p k C pk<br />

Y 1 1,0778 0,0003 1,0775<br />

Y 2 1,15 0,001 1,1489<br />

Y 3 1,1483 0,0023 1,1458<br />

Y 4 1,5436 0,0001 1,5436<br />

Y 5 1,5653 0,0001 1,5652<br />

Y 6 1,7585 0,0006 1,7573<br />

Y 7 1,3993 0,0001 1,3993<br />

Y 8 1,8158 0,0008 1,8143<br />

Y 9 1,2187 0,0004 1,2183<br />

Y 10 1,3081 0,0004 1,3076<br />

Y 11 1,7863 0,0006 1,7852<br />

Y 12 1,1382 0,0002 1,1377<br />

Y 13 0,8108 0,0002 0,8107<br />

Y 14 1,7216 0,0001 1,7215<br />

Die multivariaten Prozessfähigkeitsindizes sind<br />

PC p = 1,5518<br />

PC pk = 1,5517<br />

Die multivariaten Prozessfähigkeitsindizes besagen, der Prozess ist in Ordnung. Trotzdem<br />

muss der Prozess mit den multivariaten Kontrollkarten kontinuierlich überprüft werden.<br />

5.3 Vergleich verschiedener Tolerierungsverfahren<br />

an 6- und 5-dimensionalen Beispielen<br />

Für die Tolerierung gibt es, wie wir gesehen haben, verschiedene Herangehensweisen. Einmal<br />

die Art der Tolerierung, die von Technikern eingeführt wurde und den technischen Aspekt in<br />

den Vordergrund stellt. Mathematisch basiert diese Art der Tolerierung auf dem Fehlerfortpflanzungsgesetz<br />

und letztlich auf der Faltung voneinander unabhängiger Zufallsgrößen.<br />

Die andere von Jahn eingeführte multivariate statistische Tolerierung basiert auf den Tatsachen,<br />

dass<br />

•<br />

•<br />

•<br />

•<br />

•<br />

es nicht nur Montageprozesse gibt,<br />

das Produkt eines jeden (Herstellungs- oder Service-) Prozesses durch m,<br />

m ≥ 1 nicht unabhängige Produktvariable Y 1 , …, Y m beschrieben wird,<br />

die Produktvariablen Realisierungen von Zufallsgrößen sind und<br />

die Sollwerte und Toleranzgrenzen für jeden Prozess Zielwerte der Steuer- und Regelung<br />

sind.


5.3 Vergleich verschiedener Tolerierungsverfahren<br />

211<br />

5.3.1 Charakteristische Zusammenhänge zwischen Funktionssicherheit<br />

und Toleranz aus Sicht der Techniker<br />

Hoffmann [1986] definiert einige bedeutende Grundlagen, wie z. B.<br />

•<br />

•<br />

•<br />

•<br />

•<br />

die Funktionssicherheit ist die Einhaltung der für ein Erzeugnis vorgegebenen Funk tionsfehlergrenzen<br />

für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen.<br />

Innerhalb der Funktionsfehlergrenzen ist das Erzeugnis funktionstüchtig.<br />

Funktionstoleranz ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten<br />

aller die Funktionstüchtigkeit beschreibenden Eigenschaften eines Erzeugnisses.<br />

Die Herstellungstoleranz ist Differenz zwischen dem oberen und unteren erreichten<br />

Grenzwert bei der Herstellung mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigerzeugnisse.<br />

Die Maßtoleranz ist die Differenz zwischen dem zulässigen Größt- und Kleinstmaß.<br />

Die Messtoleranz ist die Differenz zwischen der zulässigen oberen und unteren Abweichung<br />

des Messwertes von der Messgröße. (Fehlergrenze der Messung).<br />

Die Funktionstoleranz ist in der Regel größer als die Maßtoleranz. Die Herstellungstoleranz und<br />

die Messtoleranz sind bei beherrschter Produktion grundsätzlich kleines als die Maßtoleranz.<br />

Die verschiedenen Toleranzen müssen für ein Projekt optimiert werden, denn<br />

•<br />

•<br />

kleiner werdende Toleranzen führen zu höheren Fertigungs- und Prüfkosten,<br />

größer werdende Toleranzen führen zu höheren Kosten für Nacharbeit und zusätzlichen<br />

Leistungen bei der Montage (Siehe Beispiel Akku-Bohrschrauber – MOST: Maynard Operation<br />

Sequence Technic, Zeitmessungen bei der Montage).<br />

Grundsätzlich ist anzustreben, die Produktion zu „entfeinern“, d. h. die Herstellungstoleranzen<br />

so groß wie möglich zu machen. Andererseits ist erwiesen, dass die Verringerung des spezifischen<br />

Aufwandes an vergegenständlichter und lebendiger Arbeit nur durch eine Einengung vor allem<br />

der Herstellungs-, aber auch der Funktions- und Messtoleranzen möglich ist. Gründe für das<br />

Nichterreichen der Fertigungssollmaße können sein:<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

Ungenauigkeiten der Maschinen, Werkzeuge, Vorrichtungen,<br />

Verschleiß der Maschinen, Werkzeuge und Vorrichtungen,<br />

Einstellfehler an Maschinen, Werkzeugen und Vorrichtungen,<br />

elastische Verformungen durch Spann- und Schnittkräfte,<br />

Verformungen durch Temperatureinfluss,<br />

zufällige Fehler.<br />

Was muss alles gemessen werden?<br />

Die Produktvariablen Y 1 , …, Y m , (nach Hoffmann [1986] die Werkstückabmessungen), die<br />

Input- und Prozessvariable (nach Hoffmann: Werkzeugeinstellung, Verschleiß, Schnittkräfte,<br />

Drehzahl, Drehmoment, Spannkräfte, Temperaturen, …) und die noise Variablen müssen<br />

gemessen werden, wenn eine vernünftige Tolerierung bewerkstelligt werden soll.


212 5 Qualität in der Fertigung<br />

Wie werden Maß- und Toleranzketten aufgebaut?<br />

Wie üblich benötigen wir einige neue Definitionen, bevor wir mit dem Aufbau der Maßketten<br />

beginnen können.<br />

Maßkette<br />

Lehre von der funktionsgerechten Bemessung aneinander gereihter Maße, deren Werte sich<br />

summieren. Die Maßkette ist eine Aneinanderreihung von zusammenwirkenden Einzelmaßen<br />

und dem von ihnen abhängigen Schlussmaß. Die Maßkette bildet einen Linienzug, d. h. eine<br />

Masche. Die Einzelmaße sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette<br />

ist ihre Geschlossenheit.<br />

Bei der Berechnung der Maßketten ist zu beachten, dass die Einzelmaße aus unterschiedlichen<br />

Systemen stammen können, und zwar dem herzustellenden Gerät (Produkt), dem Werkstück<br />

(Input) oder der Werkzeugmaschine, Vorrichtung, Werkzeug (Prozess). Die in Klammern<br />

stehenden Bezeichnungen stellen die Verbindung zu meiner viel allgemeineren Theorie der<br />

Tolerierung dar.<br />

Zur Berechnung der Maßkette werden für die Einzelmaße M j , j = 1, …, m die Nennmaße N j ,<br />

und die dazu gehörenden Toleranzmittenabmaße E Cj , oder Erwartungsabmaße E Ej bestimmt.<br />

Auftretende Spiele werden mit der halben Größe des Kleinstspiels ½ S kj wie Einzelmaße behandelt.<br />

Für das Schlussmaß M 0 bestimmt man das Nennmaß N 0 und die zugehörige Toleranz<br />

E C0 , oder das Erwartungsabmaß E E0 . Ist die Schlusstoleranz eine Passtoleranz oder ein Spiel,<br />

so wird das Toleranzmittenabmaß E C0 oder das Erwartungsabmaß E E0 durch das mittlere oder<br />

halbe Größtspiel ½ S g0 gebildet.<br />

Es werden die folgenden Bezeichnungen verwendet:<br />

Nennmaß<br />

= N ist das Maß auf das die Maßkette bezogen wird,<br />

Einzelmaß<br />

= M j (mitunter sind Einzel- und Nennmaße gleich),<br />

Istmaß<br />

= I ist das Maß des gefertigten Werkstücks,<br />

Größtmaß<br />

= G ist das zulässiges Maximum des Istmaßes,<br />

Kleinstmaß<br />

= K ist das zulässiges Minimum des Istmaßes,<br />

Toleranzmittenmaß = C ist der arithmetische Mittelwert aus Größt- und Kleinstmaß,<br />

Erwartungsmaß = E ist der arithmetische Mittelwert aus eine Serie von Istmaßen,<br />

Istabmaß<br />

= A j ist die Differenz zwischen Ist- und Nennmaß,<br />

Oberes Abmaß = ES ist die Differenz zwischen Größt- und Nennmaß,<br />

Unteres Abmaß = El ist die Differenz zwischen Kleinst- und Nennmaß,<br />

Toleranzmittenabmaß = E C ist die Differenz zwischen Toleranzmittenmaß und Nennmaß,<br />

Erwartungsabmaß = A E ist die Differenz zwischen Toleranzmitten- und Nennmaß,<br />

Maßtoleranz, Toleranz = T ist die Differenz zwischen Größt- und Kleinstmaß,<br />

Spiele<br />

= S ist die halbe Größe des Kleinstspiels = 1/2 S kj , sie werden wie<br />

Einzelmaße behandelt,<br />

Anzahl der Spiel- und Übergangspassungen = e<br />

Koeffizient der relativen c j = 2 s j / T j Standardabweichung,<br />

Koeffizient der relativen a j = (A Ej – E Cj ) / T j und die Asymmetrie.


5.3 Vergleich verschiedener Tolerierungsverfahren<br />

213<br />

5.3.2 Berechnung von Maß- und Toleranzketten für vollständige<br />

Austauschbarkeit<br />

Maßketten<br />

Das Nennmaß N 0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen Maßkettengliedern<br />

additiv aus den Nennmaßen N j der j = 1, …, m Einzelmaße M j zusammen.<br />

N<br />

0<br />

m<br />

= ∑ kj<br />

Nj,<br />

j=<br />

1<br />

wobei k j den Richtungskoeffizient des j-ten Einzelmaßes auf das Schlussmaß bezeichnet. Dieser<br />

Koeffizient ist gleich +1, wenn der Einfluss des Einzelmaßes positiv ist. Positive Einzelmaße<br />

bewirken bei ihrer Vergrößerung oder Verkleinerung eine gleichsinnige Veränderung des<br />

Schlussmaßes.<br />

Ist das Nennmaß N 0 des Schlussmaßes bekannt und sind die Nennmaße N j der Einzelmaße<br />

unbekannt, so ergibt sich für das j-te Nennmaß die Berechnungsformel<br />

⎛<br />

⎞<br />

N N k N k N ⎟<br />

⎠<br />

j−1<br />

m<br />

1<br />

j = ⎜ 0 −∑<br />

l j −∑<br />

l j<br />

kj ⎝ l= 1 l=<br />

1<br />

wobei j = 1, …, m die Laufvariable und m die Anzahl der Einzelmaße ohne Schlussmaß ist. Sind<br />

die Toleranzmittenabmaße E Cj der Einzelmaße gegeben und soll aus denen das Toleranzmittenabmaß<br />

E C0 des Schlussmaßes berechnet werden, so ist unter Beachtung aller e Spiel- und<br />

Übergangspassungen die funktionell mindestens erforderliche Spiel- und Übergangspassung<br />

1<br />

E = k E − S ,<br />

C0<br />

zu berechnen.<br />

m−e m<br />

∑<br />

∑<br />

j Cj kj<br />

j= 1<br />

2<br />

j= m−e−1<br />

Toleranzketten<br />

Sind die Einzeltoleranzen T j , j = 1, …, m der Einzelmaße und die Kleinstwerte der Spiel- und<br />

Übergangspassungen gegeben, so beträgt die Schlusstoleranz T 0 des Schlussmaßes<br />

T = T + S ,<br />

0<br />

m−e<br />

m<br />

∑ j ∑ kj<br />

j= 1 j= m−e−1<br />

wobei e die Anzahl der Spiel- und Übergangspassungen ist. S kj bezeichnet das Kleinstspiel des<br />

Maßes j. Die Einzeltoleranz T j des j-ten Einzelmaßes resultiert aus<br />

j−1<br />

m−e m<br />

j = 0 −∑ l − ∑ l − ∑ kj<br />

l= 1 l= j+ 1 j= m− e+<br />

1<br />

T T T T S<br />

Dieser Ausdruck ist für m > 1, e > 1 unbestimmt. Daher wird zunächst für jedes Einzelmaß<br />

eine durchschnittliche Einzeltoleranz<br />

⎛<br />

m<br />

T 1<br />

= ⎜ T − ∑<br />

m<br />

S<br />

⎞<br />

⎟<br />

0<br />

kj<br />

− e ⎝ j= m−e−1<br />

⎠<br />

berechnet. Anschließend werden auf dieser Grundlage die Einzeltoleranzen berechnet.


214 5 Qualität in der Fertigung<br />

Beispiel 5.3.1: Einfaches Getriebe. Maßketten<br />

Ein einfaches Getriebe wird durch die folgende Skizze beschrieben.<br />

M 5 M 1 M 2<br />

M 4 M 3<br />

M 0<br />

Abb. 5.3.1: Schematische Darstellung des einfachen Getriebes<br />

Die Maßkette für das einfache Getriebe besteht aus 6 Gliedern, die sich aus m = 5 Einzelmaßen<br />

und dem Schlussmaß zusammensetzt. Der Konstrukteur gab die Nennmaße N j ,<br />

j = 1, …, 5 für die einzelnen Glieder vor. Die Richtungskoeffizienten resultieren aus dem<br />

Verlauf der Maßkette und sind k 1 = +1, k 2 = +1, k 3 = –1, k 4 = –1, k 5 = –1 und k 0 = –1.<br />

Die Werte für die Nennmaße N j , Toleranzen T j , Richtungskoeffizienten k j , Toleranzmittenabmaße<br />

E Cj und der Einzelmaße M j sind aus der folgenden Wertetabelle zu entnehmen.<br />

Tabelle 5.3.1: Wertetabelle für die Tolerierung in [mm]<br />

j N j T j k j E Cj M j + T j , – T j oder ±T j<br />

0 0 0,15 –1 0,105 0 0,18<br />

0,03<br />

1 25 0,033 1 0,035 25 0,0515<br />

0,0185<br />

2 40 0,04 1 0,04 40 0,06<br />

0,02<br />

3 2,5 0,015 –1 0 2,5 ±5700,0<br />

4 60 0,047 –1 –0,03 60 –0,0065<br />

–0,0535<br />

5 2,5 0,015 –1 0 2,5 ±5700,0


5.3 Vergleich verschiedener Tolerierungsverfahren<br />

215<br />

Die M j bedeuten hierbei<br />

M<br />

j<br />

⎧⎪ E<br />

= Nj<br />

+ ⎨<br />

⎪⎩<br />

E<br />

Cj<br />

Cj<br />

+ 0.5 Tj<br />

.<br />

− 0.5 T<br />

j<br />

Das Nennmaß des Schlussgliedes ist N 0 = 25 + 40 –2.5 – 60 – 2.5 = 0 [mm]. Die Summe der<br />

Einzeltoleranzen T j ergibt die Schlusstoleranz<br />

T 0 = 0.033 + 0.04 + 0.015 + 0.047 + 0.015 = 0.15 [mm].<br />

Um den freien Lauf der Getriebewelle im Gehäuse zu gewährleisten, soll das untere Abmaß<br />

mindestens ej u0 = 0.03 [mm] betragen. Das Toleranzmittenabmaß des Schlussmaßes muss<br />

dann mindestens E C0 = ej u + 0.5 T 0 = (0.03 + 0.075) [mm] = 0.105 [mm] sein. Das Toleranzmittenabmaß<br />

des Schlussmaßes ist<br />

E C0 = k 1 E C1 + k 2 E C2 +k 4 E C4 = (+1) 0.035 + (+1) 0.04 + (–1) – 0.03 = 0.105 [mm].<br />

Mit der Schlusstoleranz T 0 0.15 [mm] und dem Toleranzmittenabmaß E C0 lassen sich schließlich<br />

die oberen und unteren Abmaße es o0 = 0.18 [mm] und es u0 = 0.03 [mm]berechnen. Das axiale<br />

größte Spiel beträgt S g = 180 [µm] und das axiale kleinste Spiel S k = 30 [µm].<br />

Warum habe ich bisher die technische Tolerierung nicht verstanden?<br />

Warum fiel es mir schwer, diese Art der Tolerierung zu verallgemeinern?<br />

Weil:<br />

• drei- oder zweidimensionale Gebilde der Einfachheit wegen auf den R 1 (den eindimensionalen<br />

Vektorraum) reduziert wurden, obwohl das nicht unbedingt einzusehen ist und<br />

• daher die Metrik nicht verallgemeinerungsfähig ist.<br />

5.3.3 Verallgemeinerung der Tolerierung<br />

Für die Verallgemeinerung der Tolerierung wird der reelle Vektorraum benötigt, um z. B. dreidimensionale<br />

Gebilde auch dreidimensional behandeln zu können. Ein Getriebe z. B. ist nun<br />

einmal ein dreidimensionales Gebilde. Die Reduktion der Dimension des Raumes auf die Ebene<br />

oder wie bei der Tolerierung durch Maß- und Toleranzketten auf den R 1 hat offensichtlich nur<br />

den Zweck der Vereinfachung.<br />

Der reelle Vektorraum<br />

Für die Definition von Vektoren benötigt man den Vektorraum. Wir wollen hier den dreidimensionalen<br />

realen physikalischen Anschauungsraum R 3 , indem wir alle uns befinden, betrachten.<br />

Ein Element dieses Raumes, ein Punkt in diesem Raum wird durch ein dreier- Tupel (x 1 , x 2 , x 3 )<br />

reeller Zahlen charakterisiert. Mit diesen reellen Zahlen kann man rechnen.<br />

Sind (x 1 , x 2 , x 3 ) und (y 1 , y 2 , y 3 ) solche drei-Tupel reeller Zahlen, so werde deren Summe durch<br />

(x 1 , x 2 , x 3 ) + (y 1 , y 2 , y 3 ) = (x 1 + y 1 , x 2 + y 2 , x 3 + y 3 ) erklärt. Die Summe ist wieder ein drei-Tupel<br />

reeller Zahlen. Ist λ ∈ R 1 und (x 1 , x 2 , x 3 ) ∈ R 3 , so ist λ (x 1 , x 2 , x 3 ) = (λ x 1 , λ x 2 , λ x 3 ) ∈ R 3 .<br />

Da die Rechenoperationen dadurch entstanden sind, dass einfach die Operationen des Rechnens<br />

mit reellen Zahlen auf die Komponenten (x 1 , x 2 , x 3 ) des R 3 übertragen wurden, so übertragen<br />

sich auch deren Rechenregeln. Wählt man einen Punkt 0 zum Nullpunkt, so kann man alle


216 5 Qualität in der Fertigung<br />

Punkte als Ortsvektoren bezüglich null auffassen, kann sie mit reellen Zahlen multiplizieren<br />

und wie im Kräfteparallelogramm addieren. Dadurch erhält man einen Vektorraum.<br />

Definition: Ein Tripel (V, +, ⋅) bestehend aus einer Menge V, einer Addition und einer Multiplikation<br />

heißt ein reeller Vektorraum.<br />

Die Physiker verstehen unter Vektoren etwas anderes als die Mathematiker. Daher soll der<br />

Gesichtspunkt der Physiker in den Blickpunkt gerückt werden, denn die Tolerierung fällt im<br />

weitesten Sinne in das Gebiet der Physiker. Nach diesem Gesichtspunkt werden Vektoren durch<br />

ihre Größe (quantity), Richtung (direction) und ihren Betragt (magnitude) erklärt. Der Betrag<br />

eines Vektors, die Norm z. B. aus dem R 3 wird durch<br />

2 2 2<br />

1 2 3<br />

x = x + x + x<br />

definiert. (Das ist der Satz des Pythagoras.) Für zwei Vektoren x 1 , x 2 ∈ R 3 nennt man die Zahl<br />

〈x 1 , x 2 〉 = x 11 x 21 + x 12 x 22 + x 31 x 23 das Skalarprodukt v on x 1 und x 2 . Einen reellen Vektorraum<br />

mit einem Skalarprodukt nennt man einen euklidischen Vektorraum.<br />

Der Winkel zwischen den beiden Vektoren x 1 und x 2 wird durch<br />

x1,<br />

x2<br />

α ( x1, x2) = arccos<br />

für x 1 ≠ 0 und x 2 ≠ 0<br />

x1 x2<br />

,<br />

berechnet.<br />

Mit dieser Definition kann die Orthogonalität zw ischen Vektoren definiert werden. Ein r-Tupel<br />

von Vektoren (x 1 , …, x r ) ∈ R n heißt orthogonal, wenn x = 1, j = 1, … r und 〈x j , x k 〉 = δ jk .<br />

Beispiel 5.3.2: Einfaches Getriebe. Ortsvektoren<br />

Wir betrachten wieder das Getriebebeispiel. Es wird das Koordinatensystem x 1 , x 2 eingeführt<br />

und als Benchmark für alle Punkte betrachten wir die beiden Ortsvektoren, die wir<br />

mit m 1 und m 2 bezeichnen.<br />

j<br />

x 2<br />

M 6<br />

M 5<br />

M 1 M 2<br />

m 2<br />

m 1<br />

M 4<br />

0<br />

x 1<br />

M 3<br />

M 0<br />

Abb. 5.3.2: Getriebe mit zwei Ortsvektoren anstelle der üblichen Bemaßung


5.3 Vergleich verschiedener Tolerierungsverfahren<br />

217<br />

Ortsvektoren ordnen jedem Punkt M j der Ebene (des Raumes) die Verschiebung<br />

m j = M j – 0, j = 1, …, n<br />

zu.<br />

Aus der Abbildung und der Wertetabelle kann man ablesen, das z. B.<br />

m 1 = (M 2 , M 6 ) T = (40, 40) T<br />

m 2 = (M 3 , M 6 ) T = (65, 40) T .<br />

Damit erhalten wir<br />

m<br />

⎛65⎞ ⎛40⎞ ⎛25⎞<br />

− m = ⎜ ⎟ − ⎜ ⎟ =<br />

⎝40⎠ ⎝40⎠ ⎜<br />

⎝ 0 ⎟<br />

⎠<br />

2 1<br />

Auf diese Art kann man alle Punkte einer Abbildung (einer Ebene oder eines Raumes) als<br />

Ortsvektoren darstellen und die Abstände durch Bildung der Differenzen von Vektoren ermitteln.<br />

Ein weiterer wesentlicher Begriff ist die Linearkombination von Vektoren. Sind x 1 , …, x r Vektoren<br />

aus dem n-dimensionalen Euklidischen Vektorraum R n , dann nennt man λ 1 x 1 + … + λ r<br />

x r = y eine Linearkombination, wobei λ j ∈ R 1 . Die Menge aller Linearkombinationen heißt<br />

lineare Hülle des r-Tupels von Vektoren.<br />

Ein r-Tupel x 1 , …, x r von Vektoren aus dem Euklidischen Vektorraum heißt linear abhängig,<br />

wenn einer dieser Vektoren aus den anderen linear kombiniert werden kann. Diesen linear<br />

kombinierten Vektor kann man dann ohne Schaden für die lineare Hülle weglassen. Mit dieser<br />

Definition kann man natürlich auch die lineare Unabhängigkeit definieren. V sei wieder ein Vektorraum,<br />

x 1 , …, x r ∈ V. Dieses r-Tupel heißt linear unabhängig, wenn eine Linearkombination<br />

von x 1 , …, x r nur dann null sein kann, wenn alle Koeffizienten verschwinden, d. h. wenn aus<br />

λ 1 x 1 + … + λ r x r = 0<br />

stets folgt, dass λ 1 = … = λ r = 0. Man kann auch sagen, (x 1 , …, x r ) ist genau dann linear unabhängig,<br />

wenn keiner dieser Vektoren Linearkombination der übrigen ist.<br />

Sei jetzt y = λ 1 x 1 + … + λ n x n eine Linearkombination von n Vektoren aus dem Euklidischen<br />

Vektorraum. Damit bilden wir das Skalarprodukt mit dem Vektor x, d. h.<br />

⎛y1<br />

⎞<br />

n<br />

x, y = ( x … x ) ⎜… ⎟ = a x x + … + a x x = a x x<br />

1 n 1 1 1<br />

n n n j j j<br />

⎜ ⎟<br />

j=<br />

1<br />

⎝yn<br />

⎠<br />

⎛a1 … 0 ⎞ ⎛x1⎞<br />

= ( x ⎜ ⎟ ⎜ ⎟<br />

1 … xn) 0 … 0 … .<br />

⎜ ⎟ ⎜ ⎟<br />

⎝ 0 … a ⎠ ⎝x<br />

⎠<br />

n<br />

Eine solche Form nennt man quadratische Form und sc hreibt abkürzend dafür<br />

x T A x = Q A (x).<br />

n<br />


218 5 Qualität in der Fertigung<br />

Beispiel 5.3.3: Quadratische Form<br />

Betrachten wir (x 1 , x 2 ) ∈ R 2 ,<br />

Fall 1:<br />

⎛1 0⎞<br />

A = ⎜<br />

⎝0 1 ⎟ , dann ist die quadratische Form<br />

⎠<br />

⎛1 0⎞ ⎛x1⎞ ⎛x1⎞<br />

2 2<br />

QA( x) = ( x1 x2) ⎜ = ( x1 x2) = x1 + x2.<br />

⎝0 1⎟ ⎠<br />

⎜<br />

⎝x<br />

⎟<br />

⎠<br />

⎜<br />

⎝x<br />

⎟<br />

⎠<br />

2 2<br />

In diesem Falle gilt QA ( x ) = x .<br />

Betrachten wir den konkreten Vektor x T = (x 1 , x 2 ) = (0.8, 0.3), dann gilt<br />

⎛1 0⎞ ⎛0.8⎞ (0.8 0.3) ⎜ ⎟ ⎜ ⎟ = 0.73 und 0.73 = 0.854.<br />

⎝0 1⎠ ⎝0.3⎠<br />

Fall 2:<br />

⎛1<br />

c ⎞<br />

Es sei A = ⎜ ⎟, c ≤ 1, so dass A positiv definit ist. In diesem Fall gilt<br />

⎝c<br />

1⎠<br />

⎛1<br />

c⎞ ⎛x1⎞ ⎛x1⎞<br />

QA( x) = ( x1 x2) ⎜ ⎟ ⎜ ⎟ = ( x1 + c x2 c x1 + x2)<br />

⎝c 1⎠ ⎝x ⎠<br />

⎜<br />

⎝<br />

⎟<br />

2 x2⎠<br />

2 2<br />

= x + 2 c x x + x .<br />

Hieraus folgt<br />

1 1 2 2<br />

2 2<br />

1 1 2 2<br />

x + 2 c x x + x<br />

ist die Länge des Vektors x, wenn die Komponenten von x nicht linear unabhängig voneinander<br />

sind.<br />

Betrachten wir anstelle der Einheitsmatrix die positiv definite Matrix<br />

⎛ 1 0.6⎞<br />

A = ⎜<br />

⎝0.6 1 ⎟<br />

⎠<br />

dann erhält man für die quadratische Form<br />

⎛ 1 0.6⎞ ⎛0.8⎞ ⎛0.8⎞<br />

(0.8 0.3) ⎜ ⎟ ⎜ ⎟ = (0.8 + 0.18 0.18 + 0.3)<br />

⎝0.6 1 ⎠ ⎝0.3⎠ ⎜<br />

⎝0.3⎟<br />

⎠<br />

= 0.928 und 0.928 = 0.9633.<br />

Die beiden Längen des Vektors x sind je nachdem, ob die Matrix eine Diagonal- oder vollständige<br />

Matrix ist, verschieden.<br />

Erinnern wir uns daran, dass bei der Konstruktion von Produkten, insbesondere Montageprodukten,<br />

Toleranzketten verwendet werden können, diese aber nicht auf alle Produkte,<br />

z. B. chemische Produkte und die Fertigung übertragen werden können, dann sind weitere<br />

Verallgemeinerungen notwendig.


5.3 Vergleich verschiedener Tolerierungsverfahren<br />

219<br />

Insbesondere nach der Herstellung der Produkte können die Messwerte für die verschiedenen<br />

Produktvariablen nicht mehr als beliebige reelle Zahlen, sondern müssen als Realisierungen<br />

von Zufallsgrößen angesehen werden.<br />

5.3.3.1 Statistische Tolerierung<br />

Der Ausgangspunkt bei dieser Art der Tolerierung ist, dass die Einzelmaße Y 1 , …, Y m unabhängig<br />

und identisch nach F j (y j ) j = 1, …, m verteilt sind. Die Toleranzen T o,j und T u,j , j = 1, …, m<br />

sind entweder unbekannt oder sollen mit den Maßen, an gefertigten Produkten gemessen,<br />

überprüft werden. Sind die Zufallsgrößen außerdem normal verteilt mit den Erwartungswerten<br />

µ j und σ j 2 , dann gilt, die Summenvariable<br />

m<br />

Y = ∑ Yj<br />

j=<br />

1<br />

ist normal verteilt mit den beiden Momenten<br />

m<br />

m<br />

2 2<br />

∑ j ∑ j<br />

j= 1 j=<br />

1<br />

μ = μ und σ = σ .<br />

Sind die Einzelmaße nicht normal verteilt, dann folgt aus dem zentralen Grenzwertsatz der<br />

Wahrscheinlichkeitsrechnung, dass die Summenvariable approximativ normal verteilt ist,<br />

ebenfalls mit den Summenmomenten.<br />

Nach der 3 σ-Regel liegen mit der Wahrscheinlichkeit 1 – α = 1 – 0.0027 = 0.9973 fast alle<br />

Realisierungen einer normal verteilten Zufallsgröße im Intervall µ ± 3 σ. Hieraus folgt die<br />

Toleranzbreite T o – T u sollte 6 σ sein.<br />

Die Toleranzkette kann unter diesen Voraussetzungen nach der Formel<br />

m<br />

T = 6 ∑ S<br />

j=<br />

1<br />

j<br />

berechnet werden, wobei die S j die Stichprobenstandardabweichungen für die Einzelmaße M j ,<br />

j = 1, …, m sind.<br />

Beispiel 5.3.4: Einfaches Getriebe. Tolerierung<br />

Fall 1: Wir nehmen an, dass Y 1 , …, Y 6 unabhängig voneinander sind. An N Getrieben<br />

wurden die obigen Maße gemessen. Die statistischen Maßzahlen sind<br />

Tabelle 5.3.2: Statistische Maßzahlen für die Maße des Getriebes<br />

Y 0 Y 1 Y 2 Y 3 Y 4 Y 5<br />

Min: –6,6976445 2498,2527947 3998,0283577 249,3489343 5997,5019191 249,4489296<br />

Mean: 0,1312104 2499,9594152 4000,0388603 250,0179791 5999,9552836 249,9896311<br />

Max: 6,3486367 2501,4088584 4002,4427941 250,5956959 6001,6589824 250,5393647<br />

Std.Dev.: 2,3978975 0,6064117 0,7160356 0,2388075 0,7569649 0,2253856<br />

Die Korrelationsmatrix zur Überprüfung der Voraussetzung der Unabhängigkeit ist in der<br />

Tabelle 5.3.3 zusammengestellt.


220 5 Qualität in der Fertigung<br />

Tabelle 5.3.3: Korrelationsmatrix für die 6 Maße des Getriebes<br />

Y 0 Y 1 Y 2 Y 3 Y 4 Y 5<br />

Y 0 1 0,1388 0,0211 0,005 –0,0144 –0,0351<br />

Y 1 1 –0,1343 –0,065 –0,0746 0,028<br />

Y 2 1 0,0246 0,1598 –0,0264<br />

Y 3 1 –0,0264 –0,0899<br />

Y 4 1 0,0213<br />

Y 5 1<br />

Die Korrelationskoeffizienten für alle Paare von Maßen sind sehr klein. Das globale Maß<br />

für die Korreliertheit ist det (R) = 0.9150239. Die univariate statistische Tolerierung kann<br />

angewandt werden. Wir erhalten die Toleranzgrenzen in der Tabelle 5.3.4.<br />

Tabelle 5.3.4: Toleranzgrenzen nach der univariaten statistischen Tolerierung<br />

Variable Mittelwert 6* Stabw. Zielwert Toleranzgrenze<br />

untere<br />

obere<br />

Y 0 0,1312 14,3874 0 –10,6188 10,6188<br />

Y 1 2499,95 3,6385 2500 2497,35 2502,65<br />

Y 2 4000,04 4,2962 4000 3996,86 4003,14<br />

Y 3 250,02 1,4328 250 248,94 251,06<br />

Y 4 5999,95 4,5418 6000 5996,67 6003,33<br />

Y 5 249,9896 1,3523 250 248,996 251,004<br />

Für das Schließmaß T 0 erhalten wir nach der obigen Formel (6* Sigma)<br />

T 0 = 3.6385 + 4.2962 + 1.4328 + 4.5418 + 1.3523 = 15.2616,<br />

d. h. in etwa den mit CAD geplanten Wert von 15, bzw. nach Division durch 100 den Wert<br />

T 0 = 0.1526. Die Vergleiche der uni- und multivariaten statistischen und CAD Tolerierung<br />

sind in der Tabelle 5.3.5 enthalten. Der Einfachheit halber wurden in diese Tabelle nur die<br />

Toleranzbreiten (nach Division durch 100) aufgenommen.<br />

Tabelle 5.3.5: Vergleich der der statistischen Toleranzbreiten und der CAD Toleranzbreiten<br />

Maß Statistische Tolerierung CAD Toleranzen<br />

univariat<br />

multivariat<br />

6* s j T o – T u T o – T u<br />

Y 0 0,1438 0,2123 0,15<br />

Y 1 0,0364 0,053 0,033<br />

Y 2 0,0429 0,0627 0,04<br />

Y 3 0,0143 0,0212 0,015<br />

Y 4 0,0454 0,0665 0,047


5.3 Vergleich verschiedener Tolerierungsverfahren<br />

221<br />

Die Unterschiede resultieren aus den Standardabweichungen, die z. T. doch etwas größer<br />

sind als (T o – T u )/6 und den doch vorhandenen, wenn auch kleinen Korrelationskoeffizienten.<br />

Fall 2: Korrelierter Fall<br />

Für den korrelierten Fall erhalten wir die statistischen Maßzahlen der Tabelle:<br />

Tabelle 5.3.6: Statistische Maßzahlen für die Maße des Getriebes<br />

Y 0 Y 1 Y 2 Y 3 Y 4 Y 5<br />

Min: –6,5002924 2498,1719699 3998,1664578 249,402514 5998,1848565 249,3888472<br />

Mean: –0,1628116 2499,9900478 3999,9855229 249,989664 5999,9347344 250,0006535<br />

Max: 6,0165154 2501,5162199 4001,8814676 250,525068 6002,2974761 250,6449878<br />

Std.Dev.: 2,3576676 0,5884604 0,6832856 0,240879 0,8346444 0,2479773<br />

Die statistischen Maßzahlen unterscheiden sich nicht wesentlich von denen des Falles 1.<br />

In der Tabelle 5.3.7 steht die Korrelationsmatrix.<br />

Tabelle 5.3.7: Korrelationsmatrix<br />

Y 0 Y 1 Y 2 Y 3 Y 4 Y 5<br />

Y 0 1 0,4212 0,3697 0,856 0,5342 0,7047<br />

Y 1 1 0,1977 0,3841 0,2669 0,0732<br />

Y 2 1 0,1893 0,1479 0,2386<br />

Y 3 1 0,3767 0,5799<br />

Y 4 1 0,1817<br />

Y 5 1<br />

Die Korrelationsmatrix zeigt einige sehr große Korrelationskoeffizienten. Die Annahme<br />

der Unabhängigkeit ist nicht mehr gerechtfertigt. Das globale Maß der Korreliertheit ist<br />

det(R) = 0.04598723.<br />

Die statistische Tolerierung liefert die Werte der Tabelle 5.3.8.<br />

Tabelle 5.3.8: Uni- und multivariate statistische Toleranzen<br />

Variable Mittelwert Stabw. Zielwert Toleranzgrenzen<br />

untere<br />

obere<br />

Y 0 –0,1628 14,146 0 –3,522 3,522<br />

Y 1 2499,99 3,5308 2500 2497,766 2502,234<br />

Y 2 3999,986 4,0997 4000 3997,293 4002,707<br />

Y 3 249,9897 1,4453 250 249,4806 250,5194<br />

Y 4 5999,9347 5,0079 6000 5997,117 6002,883<br />

Y 5 250,0007 1,4879 250 249,3086 250,6914


222 5 Qualität in der Fertigung<br />

Tabelle 5.3.9: Vergleich der statistischen und CAD Toleranzbreiten<br />

Maß Statistische Tolerierung CAD Toleranzen<br />

univariat<br />

multivariat<br />

6* s j T o – T u T o – T u<br />

Y 0 0,1415 0,0704 0,15<br />

Y 1 0,0353 0,0447 0,033<br />

Y 2 0,04099 0,0541 0,04<br />

Y 3 0,0144 0,0103 0,015<br />

Y 4 0,05 0,0577 0,047<br />

Y 5 0,0149 0,0138 0,015<br />

Die univariate statistische Toleranzkettenformel liefert für die Schließtoleranz den Wert<br />

T 0 = 0.1556. Die multivariate statistische Tolerierung liefert im korrelierten Fall schmalere<br />

Toleranzbreiten für die Einzelmaße. Die 6* S Toleranzen sind wiederum ähnlich denen im<br />

unkorrelierten Fall. Das ist nicht verwunderlich, wirken sich doch in der Regel die korrelativen<br />

Abhängigkeiten nicht auf die Standardabweichungen der Einzelmaße aus.<br />

Die multiplen Korrelationskoeffizienten für die Einzelmaße sind:<br />

R 2 0/1,2,3,4,5 = 0.8888, R2 1/0,2,3,4,5 = 0.28132, R2 2/0,1,3,4,5 = 0.21746,<br />

R 2 3/0,1,2,4,5 = 0.76823, R2 4/0,1,2,3,5 = 0.40528 und R2 5/0,1,2,3,4 = 0.61256.<br />

Aus diesen Korrelationskoeffizienten liest man ab, dass sich das Schließmaß T 0 am besten<br />

aus den anderen Maßen ableiten lässt, oder anders gesprochen, die anderen Maße haben<br />

einen großen Einfluss auf das Schließmaß. Folglich ist die Differenz zwischen der uni- und<br />

multivariaten Berechnung für dieses Maß am größten.<br />

5.3.3.2 Übung<br />

Ein Produkt wird durch m nicht unabhängige Produktvariable Y 1 , …, Y m beschrieben. Der Vektor<br />

der Produktvariable Y T = (Y 1 , …, Y m ) ist ein zufälliger Vektor. Die Verteilung des zufälligen<br />

Vektors Y gehöre zur Klasse der m-dimensionalen Normalverteilungen Y ~ N m (µ, Σ YY ), wobei<br />

Σ YY positiv definit sein möge. Das von Ihnen zu untersuchende Produkt ist ein Tippgeber, der<br />

in automatischen Schaltgetrieben benötigt wird.<br />

Tabelle 5.3.10: Sollzustand für den Tippgeber<br />

Variable Sollwert Toleranzgrenzen<br />

Y 1 14,23 ±0,05<br />

Y 2 6,45 ±0,05<br />

Y 3 0,55 ±0,15<br />

Y 4 0,55 ±0,15<br />

Y 5 2,25 ±0,15<br />

Y 6 2,25 ±0,15


5.3 Vergleich verschiedener Tolerierungsverfahren<br />

223<br />

Diese müssen verschiedene Funktionen, wie z. B. die automatische Rückstellung in die<br />

„=“ Position, geräuscharmes Schalten usw. realisieren. Die Tippgeber werden durch sechs<br />

Produkt variablen charakterisiert. Der Sollzustand wird durch die Werte der Tabelle 5.3.10<br />

beschrieben.<br />

Problem<br />

Der Kunde ist mit der Qualität der Tippgeber nicht zufrieden.<br />

Was müssen Sie tun?<br />

Sie müssen das Problem definieren.<br />

Wie definieren Sie das Problem?<br />

Dazu müssen Sie eine Stichprobe von Tippgebern zufällig der Fertigung entnehmen und die<br />

Werte für die Produktvariablen messen.<br />

Die Werte für den Tippgeber sind in der Datei Ü5.3 enthalten.<br />

Für Sie habe ich die Daten dieser Datei als Star Plots visualisiert (siehe auch Seite 282).<br />

46<br />

40<br />

30<br />

20<br />

10<br />

1<br />

Abb. 5.3.3: Star Plots für die Tippgeber


224 5 Qualität in der Fertigung<br />

Y3<br />

. Y2<br />

Y4<br />

Y1<br />

Y5 Y6<br />

Abb. 5.3.4: Schlüssel für die Star Plots der Tippgeber<br />

In der Abbildung 5.3.5 habe ich für Sie noch die Korrelationsdiagramme dargestellt.<br />

Y2<br />

Y3<br />

Y4<br />

Y5<br />

Y6<br />

Y1<br />

Y2 Y3 Y4 Y5<br />

Abb. 5.3.5: Korrelationsdiagramme für die Tippgeber<br />

Welche Schlüsse ziehen Sie aus den beiden Abbildungen?<br />

Definieren Sie bitte das Problem und überprüfen Sie die gegebene Tolerierung mit den beigefügten<br />

Programmen.<br />

Was müssen Sie tun, um das Problem zu lösen?<br />

5.4 Warum sollen Sie die Prozessdarstellung wählen?<br />

Sie haben anerkannt, dass jede Tätigkeit und jedes (materielle und/oder immaterielle) Produkt<br />

das Ergebnis eines Prozesses ist. Jetzt müssen Sie mir weiter folgen und den zugehörigen Prozess<br />

strukturieren. Die Produktvariablen sind Funktionen der Input-, Prozess- und Störvariablen<br />

und können nach dem Ursache-Wirkungs-Prinzip nur über diese Variablen verändert werden.


5.4 Warum sollen Sie die Prozessdarstellung wählen?<br />

225<br />

äußere Variable (Störvariable)<br />

Inputs Prozess Produkt<br />

Inputvariable Prozessvariable Produktvariable<br />

Ursachen<br />

Wirkungen<br />

Abb. 5.4.1: Prozessdarstellung<br />

Die Inputvariablen, wie Material, Maschinen, Anlagen, Zusatzstoffe und auch die Fähigkeiten<br />

der Mitarbeiter fließen mit ihren Eigenschaften in den Prozess hinein.<br />

Die Produktvariablen müssen die spezifizierten Kundenanforderungen erfüllen. Über die Veränderung<br />

der Prozessvariablen muss aus den gegebenen Inputvariablen das Produkt mit seinen<br />

geforderten Eigenschaften entstehen. Damit dieses spannende Zusammenspiel zwischen den<br />

Variablen klappt, müssen die Inputvariablen, die ja Produktvariablen von Vorläuferprozessen<br />

sind, ebenfalls die spezifizierten Anforderungen des Prozesses erfüllen. Die spezifizierten Anforderungen<br />

kann man beim Eintreffen der Inputs überprüfen (Wareneingangsprüfung) oder<br />

man vereinbart in einem Dialog mit den Lieferanten, dass die Inputs mit ihren entsprechenden<br />

uni- und multivariaten Fähigkeitsnachweisen geliefert werden.<br />

Die Werte für die Prozessvariablen kann man auch nicht beliebig einstellen, da auf dieser Basis<br />

bestimmt nicht das Produkt mit den geforderten Eigenschaften entsteht. Der Prozess muss mit<br />

einer Prozessgleichung so gesteuert werden, dass bei Kenntnis der Inputvariablen das geforderte<br />

Produkt herauskommt.<br />

Beispiel 5.4.1: Drehen einer Welle. Prozessdarstellung<br />

Aus einem Rundstahl soll eine Welle gedreht werden. Die Welle soll Kundenanforderungen<br />

erfüllen. Zu diesen gehören die Maßhaltigkeit, die Rundheit, die Konizität und gewisse<br />

Festigkeitseigenschaften.<br />

Die Inputs sind der Rundstahlrohling, die Eigenschaften der Drehmaschine, der Kühlmittelstand<br />

usw. Zu den Prozessvariablen zählen die Drehgeschwindigkeit, die Kühlmitteltemperatur,<br />

die Standzeit der Schneidwerkzeuge usw. Die Menge der Produktvariablen umfasst<br />

die Maßhaltigkeit, die Rundheit der Welle, d. h. die Differenz zweier Durchmesser vorn<br />

und hinten an der Welle gemessen usw. Die Prozessdarstellung ist in der Abbildung 5.4.2<br />

enthalten.<br />

Fordert der Kunde vom Lieferanten (Dreherei) eine Welle z. B. mit einem spezifizierten<br />

Elastizitätsmodul [N/m 2 ], so muss der Wellenhersteller bei seinem Lieferanten für die<br />

Rohlinge diese Eigenschaft anfordern, denn beim Drehen wird der Elastizitätsmodul kaum<br />

verändert.


226 5 Qualität in der Fertigung<br />

äußere Variable (Störvariable)<br />

Rundstahl,<br />

Kühlflüssigkeit, Drehen einer Welle Welle<br />

Schneidwerkzeug, ..<br />

Inputvariable Prozessvariable Produktvariable<br />

Drehgeschwindigkeit<br />

Rundheit<br />

Standzeit<br />

Rundheit<br />

Konizität<br />

Temp. Kühlflüssigkeit<br />

Konizität<br />

Stahleigenschaften Temp. Werkzeug<br />

Maßhaltigkeit<br />

Stand der Kühlflüssigkeit,<br />

Ursachen<br />

...<br />

Wirkungen<br />

Abb. 5.4.2: Drehen einer Welle<br />

Dieses Beispiel zeigt schon, dass zwischen den Kunden und Lieferanten ein Dialog stattfinden<br />

muss.<br />

Wie kann man den Dialog zwischen Kunden und Lieferanten führen?<br />

Bevor wir diesen Dialog aufbauen, wollen wir ein Netzwerk von Prozessen betrachten.<br />

5.5 Warum müssen Sie Ihr Unternehmen als Netzwerk von<br />

Dienstleistungs- und Fertigungsprozessen darstellen?<br />

Ein Unternehmen muss durch Fertigungs- und Dienstleistungsprozesse strukturiert werden.<br />

Ziele der Steuerung und Regelung des gesamten Unternehmens sind Erfüllung aller (Markt-)<br />

Kundenanforderungen, Erwirtschaftung der notwendigen Gelder zur erweiterten Reproduktion,<br />

das Bestehen im internationalen Wettbewerb, die Steigerung der betriebswirtschaftlichen<br />

Kennziffern und damit die Existenzsicherung. Die Strukturierung dient ebenfalls der Veränderung<br />

der Organisationsstruktur, nach der die Aufgaben und Verantwortlichkeiten eindeutig<br />

festlegt und die Mitarbeiter dadurch motiviert werden, an der Realisierung der betrieblichen<br />

Ziele mitzuwirken. Nicht zuletzt ist die Strukturierung auch die Grundlage für eine verbesserte<br />

Kostenrechnung auf der Basis des notwendigen Verbrauchs an allen Ressourcen, die z. B.<br />

gewährleistet, dass die stetig steigenden, nicht aufschlüsselbaren Gemeinkostenzuschläge der<br />

Vergangenheit angehören werden.


5.5 Warum müssen Sie Ihr Unternehmen als Netzwerk darstellen?<br />

227<br />

Wir betrachten zunächst zwei Prozesse, um daran die Vernetzung zu demonstrieren. Diese beiden<br />

Prozesse mögen einfach A und B heißen. Der eine Prozess, nehmen wir an, es sei der Prozess<br />

B, soll der Vorläufer- oder Lieferantenprozess vom Prozess A sein. Der Prozess A verarbeitet die<br />

Produkte von Prozess B, d. h. die Produkte B werden zu Inputs von A. Der Prozess A ist damit<br />

der Kundenprozess von B. Folglich muss A formulieren, was er von B verlangt. A muss also<br />

sein (Kunden-) Anforderungsprofil an B formulieren. B muss die Kundenanforderungen durch<br />

Sollwerte und Toleranzgrenzen für alle Produktvariablen des Produktes B spezifizieren. B muss<br />

dann seinen Prozess mit den Sollwerten für alle relevanten Produktvariablen als Zielwerte so<br />

steuern und regeln, dass alle Anforderungen erfüllt werden. B muss außerdem den Nachweis<br />

führen, dass die in B produzierten Produkte alle Kundenanforderungen erfüllen.<br />

Die Produkte von A werden von einem weiteren (externen oder internen) Kunden benötigt.<br />

Dieser Kunde stellt natürlich seine Anforderungen an die Produkte von A. Hieraus wird deutlich,<br />

dass jeder Prozess Kunden- und Lieferantenprozess zugleich ist.<br />

Dieses Zusammenspiel ist in der Abbildung 5.5.1 schematisch dargestellt. Dieses Zusammenspiel<br />

zwischen zwei Prozessen ist in der Literatur unter dem Begriff „internes Kunden-Lieferanten-Verhältnis“<br />

(KLV) bekannt geworden und charakterisiert in unserem Verständnis die<br />

Schnittstelle zwischen zwei Prozessen. In der Literatur wird das KLV nur beschrieben, es kommt<br />

aber darauf an, das KLV zu modellieren und zu realisieren.<br />

Anforderungen<br />

Inputs Prozess B Produkt B<br />

Input für A<br />

Prozess A<br />

Produkt A<br />

Inputvariable Prozessvariable Produktvariable Prozessvariable Produktvariable<br />

Nachweis der<br />

Erfüllung aller<br />

Anforderungen<br />

Vorläuferprozess<br />

Nachfolgerprozess<br />

= Lieferant = Kunde<br />

Abb. 5.5.1: Kunden-Lieferanten-Verhältnis<br />

Beispiel 5.5.1: Papierfeeder. Prozessnetzwerk<br />

Wir betrachten in der Abbildung 5.5.2 die Herstellung eines Papierfeeders als ein Netzwerk<br />

von Prozessen, in denen mechanische Teile, elektronische Komponenten und Kunststoffteile<br />

hergestellt werden.<br />

Das Netzwerk sieht recht einfach aus. Aber wir haben das Netzwerk ohne Kommunikation<br />

dargestellt. So kann das Netzwerk nicht funktionieren.


228 5 Qualität in der Fertigung<br />

Input<br />

Kunststoffherst.<br />

Plastikteile<br />

Inputvariable Prozessvariable Produktvariable<br />

Input<br />

Metallherstellung.<br />

Metallteile<br />

Montage Feeder Funktionen<br />

Inputvariable Prozessvariable Produktvariable<br />

Prozessvariable<br />

Produktvariable Funktionen Par.<br />

Input<br />

Elektroteileherst .<br />

Elektroteile<br />

Inputvariable Prozessvariable Produktvariable<br />

Abb. 5.5.2: Netzwerk von Herstellungsprozessen<br />

5.6 Kommunikation zwischen Prozessen<br />

Im Vorangegangenen haben wir alles Tun in einem Unternehmen durch Prozesse modelliert.<br />

Wie haben des weiteren gesehen, dass die Prozesse nicht unabhängig voneinander sind, schon<br />

allein deswegen, weil jeder Prozess Kunden- und Lieferantenprozess zugleich ist. Eine Kommunikation<br />

zwischen den Prozessen ist somit notwendig. Ohne diese beobachten wir das<br />

tägliche Chaos.<br />

Jede Kommunikation braucht eine Sprache. Die für die Kommunikation zwischen Prozessen<br />

benötigte Sprache haben wir schon bereit gestellt. Diese Sprache hat die Worte bzw. Phrasen<br />

(Teilsätze) oder Elemente<br />

•<br />

•<br />

•<br />

•<br />

•<br />

Zusammenstellung des externes und/oder internen Kundenanforderungsprofils (KAP),<br />

Parametrisierung der gewünschten Eigenschaften,<br />

Datengewinnung für die Produktvariablen,<br />

Spezifizierung des KAP durch Sollwerte und Toleranzgrenzen, mit der CAD oder statistischer<br />

Tolerierung,<br />

Nachweis der simultanen Erfüllung aller (ex- oder internen) Kundenanforderungen mit<br />

uni- und multivariaten Prozessfähigkeitsindizes,<br />

Treffen einer Entscheidung auf der Grundlage der uni- und multivariaten Prozessfähigkeitsindizes<br />

für die statistische Prozessanalyse, falls die Fähigkeiten kleines als 1 sind,<br />

– mit anschließender Prozessverbesserung durch die Steuerung der Prozesse mit der Prozessgleichung<br />

und den Sollwerten und Toleranzgrenzen als Zielwerte bzw. Zielgebiet,


5.6 Kommunikation zwischen Prozessen<br />

229<br />

– Justierung der Prozesse, falls die einfachen uni- und multivariaten Prozessfähigkeitsindizes<br />

größer und die korrigierten Indizes kleines als 1 sind,<br />

• laufende Kontrolle der Prozesse mit den uni- und vor allem multivariaten Kontrollkarten,<br />

falls die einfachen und korrigierten Fähigkeiten größer als eins sind,<br />

• neue Tolerierung, falls die Abhängigkeiten zwischen den Produktvariablen bei der Tolerierung<br />

vernachlässigt wurden,<br />

• Investitionen, falls das vorherige Ausreizen aller Möglichkeiten nicht ausreichte, Produkte<br />

zu produzieren, die alle Kundenanforderungen erfüllen und trotz der vorgegebenen Marktpreise<br />

durch den Verkauf einen Gewinn erzielen.<br />

Wie man sehen kann, ist diese technische Sprache recht einfach. Die Schwierigkeit liegt in der<br />

Bereitstellung der Elemente, die für Sprache benötigt werden, wie der Definition des Problems,<br />

der Berechnung der Sollwerte und Toleranzgrenzen für alle, nicht unabhängigen Produktvariablen<br />

mit Hilfe CAD oder multivariaten statistischen Tolerierung, der Berechnung der uniund<br />

multivariaten Prozessfähigkeitsindizes, des Treffens einer Entscheidung, der Kontrolle der<br />

Prozesse mit uni- und multivariaten Kontrollkarten und der Datenerfassung.<br />

Diese Schwierigkeiten traten in der Vergangenheit auf, weil viele der genannten Elemente bisher,<br />

aus mir nicht bekannten Gründen, nicht zur Verfügung standen. Im Abschnitt 5.3. habe ich<br />

Ihnen die von mir entwickelten neuen Methoden für die Durchführung eines modernen Audits<br />

zur Definition eines Problems und Entscheidungsfindung zur Verfügung gestellt.<br />

Beispiel 5.6.1: Papierfeeder. Prozessnetzwerk mit Kommunikation<br />

Wir betrachten jetzt, nachdem wir die Elemente der technischen Sprache genannt und im<br />

Abschnitt 5.3 zur Verfügung gestellt haben, dasselbe Netzwerk mit Kommunikation in der<br />

Abbildung 5.6.1.<br />

KAP<br />

KAP<br />

KAP<br />

Input Kunststoffherst. Plastikteile<br />

Inputvariable<br />

Prozessvariable Produktvariable<br />

MC PK<br />

KAP<br />

KAP<br />

KAP<br />

KAP<br />

KAP<br />

Input<br />

Metallherstellg.<br />

Metallteile<br />

MC PK<br />

Montage Feeder Funktionen<br />

Input<br />

MC PK<br />

Prozessvariable Produktvariable<br />

Prozessvariable Produktvariable<br />

Funktionenvariable<br />

KAP<br />

KAP<br />

KAP<br />

Input Elektroteileherst. Elektroteile<br />

MC PK<br />

Inputvariable Prozessvariable Produktvariable<br />

MC PK<br />

Abb. 5.6.1: Netzwerk für die Feederherstellung mit Kommunikation


230 5 Qualität in der Fertigung<br />

Die Abbildung zeigt, dass dieses Netzwerk mit Kommunikation auf den ersten Blick kompliziert<br />

aussieht. Aber die Kommunikation ist notwendig, um das tägliches Chaos zu ordnen,<br />

die Prozesse zu verbessern, Produkte mit geforderten Eigenschaften zu produzieren, die<br />

Qualität der Produkte nachzuweisen und zu quantifizieren.<br />

Es gilt die alte Weisheit: „… je flacher die Fertigungstiefe wird, desto intensiver muss die Kommunikation<br />

geführt werden …“.<br />

Die Antwort auf die Frage:<br />

„Wie wird in Ihrem Unternehmen die Kommunikation zwischen Prozessen geführt?“<br />

wird entweder nicht verstanden oder aber lapidar damit beantwortet, dass man sagt, „… wir<br />

regeln die Angelegenheit mit unseren Lieferanten durch Lasten- oder Pflichtenhefte …“<br />

Ich habe mir in vielen Unternehmen Lasten und/oder Pflichtenhefte angeschaut und daher<br />

die neuen Methoden entwickelt.<br />

5.7 Was heißt Prozessverbesserung und was müssen Sie<br />

tun?<br />

Nach dem Entscheidungsgraphen in Abbildung 5.16 beim Produktaudit im Abschnitt 5.3 muss<br />

im Fall MC pk < 1 entschieden werden, dass der Prozess zu verbessern ist, denn der Prozess ist<br />

nicht fähig, Produkte (materielle oder immaterielle) mit geforderten Eigenschaften zu produzieren.<br />

Ausschuss ist die Folge und der kostet Geld. Außerdem führt er zur Nichteinhaltung<br />

der versprochenen Liefertermine.<br />

Die Ursachen hierfür können sein:<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

die Prozesse werden heuristisch ohne Zielwerte gesteuert, das Methodenniveau ist zu<br />

niedrig,<br />

daher können die Streuungen der Produktvariablen zu groß sein oder<br />

die Mittelwerte von den Sollwerten abweichen,<br />

die Tolerierung wurde unter Missachtung der Abhängigkeiten zwischen den Produktvariablen<br />

vorgenommen und ist daher nicht korrekt,<br />

die Anlagen und Maschinen sind zu alt und nicht mehr fähig,<br />

die Mitarbeiter sind nicht genügend qualifiziert und vieles mehr.<br />

Gilt ebenfalls MC p < 1, dann bedeutet das, die Streuung mindestens einer Produktvariablen<br />

ist zu groß. Die Reduktion der Variabilität – man nennt diesen Sachverhalt schlicht Prozessverbesserung<br />

– mindestens einer Produktvariablen ist notwendig.<br />

Gilt MC p > 1 und MC pk < 1, dann ist das Streuverhalten der Produktvariablen in Ordnung, aber<br />

der Vektor der Mittelwerte weicht vom Vektor der Sollwerte an. Der Prozess ist zu justieren.<br />

Die verschiedenen Zielstellungen, die man aufgrund der Größen für die uni- und multivariaten<br />

Prozessfähigkeitsindizes zu verfolgen hat, sind unterschiedlich aufwendig und kosten<br />

daher unterschiedlich viel. Daher ist ja die Entscheidung für den einen oder anderen Weg so<br />

vorteilhaft für die Qualitätsverbesserungsprojekte.


5.7 Was heißt Prozessverbesserung und was müssen Sie tun?<br />

231<br />

Beispiel 5.7.1: Chemischer Prozess. Prozessverbesserung<br />

Das Produkt eines chemischen Prozesses wird durch m = 6 Produktvariable erklärt, von<br />

denen die Variable Y 1 den Anteil einer unerwünschten Substanz beschreibt, die für viel Geld<br />

aus dem Produkt herausgefiltert werden muss. Die Frage lautet, kann der Prozess so gesteuert<br />

werden, dass der Anteil der unerwünschte Substanz so klein wird, dass die unerwünschte<br />

Substanz dem Verbraucher keinen Schaden mehr zufügen kann?<br />

Die Ausgangssituation bzgl. der Produktvariablen Y 1 , d. h. der ungesteuerte Prozess und<br />

der verbesserte Prozess sind in Abbildung 5.7.1 und Abbildung 5.7.2 dargestellt.<br />

Y<br />

ungesteuerter<br />

Prozess<br />

Y<br />

gesteuerter<br />

Prozess<br />

40<br />

40<br />

30<br />

30<br />

20<br />

20<br />

10<br />

10<br />

0<br />

0 20 40 60 80 100<br />

t<br />

0<br />

0 20 40 60 80 100<br />

t<br />

Abb. 5.7.1: Vergleich der Ergebnisse des ungesteuerten und gesteuerten Prozesses<br />

Beim heuristisch oder ungesteuerten Prozess sieht man, dass die unerwünschte Substanz<br />

mal häufiger und mal seltener vorkommt und ein Trend beobachtet wird. Daraus kann<br />

man aber bereits ableiten, dass zumindest ein Teil der Ursachen für das Vorkommen der<br />

unerwünschten Substanz im Prozess oder den Inputs liegt.<br />

Der gesteuerte Prozess zeigt, dass die unerwünschte Substanz durch die Steuerung des<br />

Prozesses mit einer Prozessgleichung nahezu vollständig vermieden werden kann. Genau<br />

das ist das zu erreichende Ziel, mit Hilfe der geistigen Investition, oder anders formuliert,<br />

der Anwendung multivariater statistischer Methoden, Prozesse wesentlich zu verbessern.<br />

Das spricht nicht gegen das hohe Expertenwissen der Mitarbeiter, die aufgrund ihrer Erfahrung<br />

das heutige hohe Niveau der „heuristischen“ Steuerung erreicht haben. Ich habe<br />

großen Respekt vor diesen Leistungen. Allerdings müssen wir uns heute dem Diktat der<br />

Globalisierung und des internationalen Marktes beugen und jeden möglichen Euro für<br />

die Sicherung der Existenz deutscher Unternehmen herausfiltern. Und das ist nur mit den<br />

modernen Methoden der multivariaten Statistik möglich.<br />

Die Verteilung der Produktvariablen Y 1 (unerwünschtes Nebenprodukt) des ungesteuerten<br />

Prozesses lässt sich in der Abbildung 5.7.2, links, darstellen.<br />

Diese Abbildung repräsentiert die univariate Betrachtung. Es wird ausschließlich die<br />

Produktvariable Y 1 betrachtet, ohne die anderen vorhandenen Informationen zu berücksichtigen.<br />

Können wir uns das noch leisten?<br />

Schon die linke Darstellung in Abbildung 5.7.2 zeigt, dass außer den Werten für die Produktvariable<br />

Y 1 weitere Informationen in Form wenigstens einer Input- und/oder Prozessvariablen,<br />

hier mit t bezeichnet, vorliegt. Betrachten Sie nach dem Ursache-Wirkungs-Prinzip<br />

Y 1 als Funktion von den Input- und Prozessvariablen, dann erhalten Sie als Ergebnis die


232 5 Qualität in der Fertigung<br />

Y<br />

40<br />

30<br />

20<br />

10<br />

Ausgangssituation<br />

Was haben wir?<br />

Ohne die Anwendung der multivariaten statistischen<br />

Methoden eine breite Verteilung von Y 1<br />

Y<br />

40<br />

30<br />

20<br />

10<br />

Prozessverbesserung<br />

Was müssen wir tun?<br />

Die Prozessgleichung berechnen und die<br />

Verteilung von Y 1<br />

um die Gleichung<br />

betrachten<br />

Y<br />

40<br />

30<br />

20<br />

10<br />

0<br />

0 20 40 60 80 100<br />

t<br />

0<br />

0 20 40 60 80 100<br />

t<br />

0<br />

0 20 40 60 80 100<br />

t<br />

Abb. 5.7.2: Schritte der Prozessverbesserung<br />

Prozessgleichung, die hier in der rechten Abbildung durch die Gerade markiert ist. Uns<br />

interessiert nun die Streuung der Werte von Y 1 um die Prozessgleichung. Diese Verteilung ist<br />

auch im rechten Bild der Abbildung 5.7.2 zu sehen. Die Breite der Verteilung ist wesentlich<br />

kleiner als die Breite der Verteilung von Y 1 . Das ist nach der Shannon Theorie auf den Informationsgewinn<br />

durch die Betrachtung der zusätzlichen Variablen zurück zuführen. Die<br />

Verkleinerung der Breite der ursprünglichen Verteilung durch die Betrachtung zusätzlicher<br />

Variabler messen wir mit dem Maß der Beherrschbarkeit des Prozesses. Der Informationsgewinn<br />

ist aber bereits eine Prozessverbesserung ohne materielle Investitionen. Wir<br />

können die Prozessverbesserung steigern, indem wir den Prozess mit der Prozessgleichung<br />

steuern. Das Ergebnis ist das Bild 3 in der Abbildung 5.7.2. Die unerwünschte Substanz<br />

kommt kaum noch vor, die Verteilung der Messwerte für Y 1 des gesteuerten Prozesses ist<br />

sehr schmal, d. h. deren Streuung ist sehr klein.<br />

5.8 Wie können wir das Ergebnis erreichen?<br />

Der Prozess wurde eingeführt, da sich damit zeigen lässt, dass die Produktvariablen nach dem<br />

Ursache-Wirkungs-Prinzips nur verändert werden können, wenn sowohl die Input- als auch<br />

die Prozessvariablen verändert werden. Die Folge daraus ist, dass die Variation der Produktvariablen<br />

nur dann reduziert werden kann, wenn sowohl die Input- als auch die Prozessvariablen<br />

verändert werden. Nichts anderes tun die Prozessexperten aufgrund „ihrer“ Erfahrung.<br />

Wir müssen die Erfahrung durch Wissen ersetzen. Das können wir nur dann tun, wenn wir<br />

dem Prozess sein Wissen abluchsen. Dazu müssen wir mit den Prozessen kommunizieren und<br />

das ist nach dem Grundsatz des Galilei: „messe alles, und das nicht Messbare mache messbar“<br />

nur über die Daten für alle Produkt-, Input-, Prozess- und Störvariablen möglich. Mit diesen<br />

Daten kann<br />

• die Abhängigkeitsstruktur zwischen den Input-, Prozess- und Produktvariablen quantifiziert<br />

und analysiert und<br />

• eine Prozessgleichung berechnet werden, die über die Input- und Prozessvariablen die<br />

Steuerung der Produktvariablen so ermöglicht, dass simultan alle Kundenanforderungen<br />

durch die produzierten Produkte erfüllt werden.


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

233<br />

An dieser Stelle sei noch einmal daran erinnert, dass wir mit dieser Methodik sowohl Herstellungs-<br />

als auch Dienstleistungsprozesse behandeln müssen, um betriebswirtschaftliche<br />

Verbesserungen zu erzielen.<br />

Die Verfahren der univariaten Statistik können dieses Anliegen nicht erfüllen. Daher ist die<br />

multivariate Statistik die geeignete Methodik. Multivariat heißt nichts anderes als mehrdimensional.<br />

Und mehrdimensional müssen die statistischen Methoden schon sein, denn es gibt ja<br />

im trivialsten Fall wenigstens eine Prozess- und eine Produktvariable.<br />

Für die Prozessverbesserung benötigt man multivariate statistische Methoden zur<br />

•<br />

•<br />

•<br />

•<br />

•<br />

Analyse der Abhängigkeitsstruktur,<br />

Klassifikation einer heterogenen Stichprobe in homogene Teilstichproben,<br />

Auswahl der wesentlichen Input- und Prozessvariablen und Berechnung der Prozessgleichung,<br />

Optimierung und Steuerung des Prozesses,<br />

Kontrolle des verbesserten Prozesses mit uni- und multivariaten Kontrollkarten.<br />

5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses ?<br />

Ein Prozess wird durch die Input-, Prozess-, noise- und Produktvariablen beschrieben. Diese<br />

Variablen werden in dem Vektor der Zufallsgrößen<br />

(Z 1 , …, Z l , X 1 , …, X n , U 1 , …, U p , Y 1 , …, Y m ) T = (Z T , X T , U T , Y T ) T<br />

zusammengefasst.<br />

Die Zufallsgrößen sind nicht unabhängig voneinander, sondern durch eine Abhängigkeitsstruktur<br />

miteinander verbunden. Das soll die Abbildung 5.9.1 verdeutlichen.<br />

Inputs Prozess Produkt<br />

X 1<br />

X 2<br />

Y 1<br />

Y 2<br />

X 3<br />

Abb. 5.9.1: Abhängigkeitsstruktur zwischen Input-, Prozess- und Produktvariablen


234 5 Qualität in der Fertigung<br />

Der Einfachheit halber wurden die Input- und Prozessvariablen mit dem Buchstaben X<br />

bezeichnet. Diese Abbildung zeigt, dass selbst bei einer geringen Anzahl von Variablen die<br />

Abhängigkeitsstruktur schon recht kompliziert werden kann. Stellt man sich noch vor, dass<br />

die Abhängigkeiten sowohl positiv als auch negativ sein können, dann kann man sich vorstellen,<br />

dass selbst für die logische Analyse der kleiner Abhängigkeitsstrukturen der menschliche<br />

Verstand nicht mehr ausreicht und an dessen Stelle statistische Modelle eingesetzt werden<br />

müssen.<br />

Diese Abhängigkeitsstruktur muss quantifiziert werden. Dazu dienen die Korrelations-, die<br />

Hauptkomponenten- und Faktoranalysen.<br />

5.9.1 Wie führt man eine Korrelationsanalyse (KA) durch und was<br />

besagen die Ergebnisse?<br />

Unter der Korrelationsanalyse verstehen wir die Berechnung der Abhängigkeiten<br />

• zwischen jeweils zwei Zufallsgrößen – in unserem Sprachgebrauch zwischen jeweils zwei<br />

(Input-, Prozess- und/oder Produkt-) Variablen mit dem einfachen Korrelationskoeffizienten.<br />

Die Berechnung der paarweisen Abhängigkeiten zwischen allen ⎜<br />

⎛n + p + m⎞<br />

⎝ 2 ⎟<br />

⎠<br />

Variablen liefert ebenso viele Korrelationskoeffizienten, die in der Korrelationsmatrix R<br />

zusammengefasst werden.<br />

• Häufig müssen Korrelationskoeffizienten zwischen jeweils zwei Zufallsgrößen unter der<br />

Bedingung, dass andere Zufallsgrößen konstant gehalten werden, berechnet werden. Diese<br />

Korrelationskoeffizienten heißen partielle Korrelationskoeffizienten. So wird häufig die<br />

Frage gestellt, wie ist die lineare Abhängigkeit zwischen zwei Prozessvariablen, wenn die<br />

Inputvariablen konstant gehalten werden müssen, oder anders formuliert, wenn die Werte<br />

für die Inputvariablen gegeben sind? Das bedeutet, es sind die Korrelationskoeffizienten für<br />

die Zufallsgrößen einer bedingten Verteilung, im vorliegenden Fall der bedingten Verteilung<br />

der Prozessvariablen unter der Bedingung der gegebenen Inputvariablen zu berechnen.<br />

• Zur Korrelationsanalyse zählen wir auch die Berechnung der Abhängigkeit einer Zufallsgröße,<br />

z. B. einer Produktvariablen Y j , j = 1, …, m von einer Linearkombination aller<br />

Input- und Prozessvariablen. Diese Korrelationskoeffizienten nennt man multiple Korrelationskoeffizienten<br />

und bezeichnet sie mit R 2 Y j / allen Input- und Prozessvariablen .<br />

• Außer diesen Abhängigkeiten ist häufig die Abhängigkeit zwischen einer Zufallsgröße, z. B.<br />

der Produktvariablen Y und einer Linearkombination der wesentlichen Prozessvariablen<br />

X unter der Bedingung der wesentlichen Inputvariablen Z zu quantifizieren. Ein solches<br />

Maß der Abhängigkeit nennt man partiell multipler Korrelationskoeffizient.<br />

• Da ein Produkt durch mehrere, z. B. m, m ≥ 1 Produktvariable beschrieben wird und die<br />

Kenntnis der Abhängigkeit der Gesamtheit der Produktvariablen von allen Input- und<br />

Prozessvariablen als verallgemeinertes Maß der Beherrschbarkeit eines Prozesses notwendig<br />

ist, wird auch der multivariate, multiple Korrelationskoeffizient berechnet.<br />

• Für weiterführende Analysen werden noch die multivariat partiell-multiplen und die<br />

multivariat semipartiell-multiplen Korrelationskoeffizienten eingeführt.<br />

Es versteht sich von selbst, dass die Analyse einer Abhängigkeitsstruktur mit der Berechnung<br />

der einfachen Korrelationskoeffizienten beginnt.


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

235<br />

Was sind einfache Korrelationskoeffizienten?<br />

Die einfachen Korrelationskoeffizienten messen die lineare Abhängigkeit zwischen zwei zufälligen<br />

Variablen.<br />

Beispiel 5.9.1: Bremsweg eines PKW. Korrelationskoeffizienten<br />

Fährt man mit einem PKW durch eine Stadt und muss vor einem auftretenden Hindernis<br />

plötzlich bremsen, dann können der Bremsweg und die gefahrene Geschwindigkeit<br />

gemes sen werden. Für die Rekapitulation von Unfallgeschehen möchte die Polizei wissen,<br />

wie streng die Länge des Bremsweges von der gefahrenen Geschwindigkeit des PKW abhängt.<br />

Lässt man z. B. N PKW’s fahren, dann erhält man N Wertepaare. Die Wertepaare können<br />

als Punkte in einer Ebene gedeutet und aufgezeichnet werden. Für das Experiment erhält<br />

man die Abbildung 5.9.2.<br />

51<br />

46<br />

Bremsweg<br />

41<br />

36<br />

31<br />

26<br />

21<br />

53 58 63 68<br />

Geschwindigkeit<br />

Abb. 5.9.2: Länge des Bremsweges in Abhängigkeit von der Geschwindigkeit<br />

Die Punktwolke der Wertepaare ergeben eine elliptisch umrissene Punktwolke. Intuitiv<br />

würde man sagen, der Zusammenhang zwischen der Geschwindigkeit und dem Bremsweg<br />

ist eng. Aber diese Aussage muss quantifiziert werden, denn eine qualitative Einschätzung<br />

sagt sehr wenig aus und man kann nicht für alle möglichen Abhängigkeiten erst eine<br />

Abbildung zeichnen und dann eine subjektive Einschätzung vornehmen. Der berechnete<br />

Korrelationskoeffizient r Bremweg, Geschwindigkeit = 0.88.<br />

Was besagt dieser Koeffizient und wie kann man den Korrelationskoeffizienten berechnen?<br />

Der Korrelationskoeffizient ist eine dimensionslose Zahl, die zwischen –1 und +1 liegt. Ist der<br />

Korrelationskoeffizient groß gegen 1, dann nähert sich das Aussehen der Punktwolke immer<br />

stärker dem Aussehen einer Zigarre an, d. h. die eine Hauptachse der Ellipse wird immer<br />

länger, die andere immer kürzer. Ist der Korrelationskoeffizient gleich 1, dann wird aus der<br />

Ellipse eine Gerade. Der Anstieg der Gerade kann positiv oder negativ sein. Entsprechend<br />

dem Anstieg ist der Korrelationskoeffizient positiv oder negativ. Gibt es zwischen den beiden


236 5 Qualität in der Fertigung<br />

Variablen keine Abhängigkeit, d. h. sind die beiden Variablen unabhängig voneinander, dann<br />

ist der Korrelationskoeffizient null.<br />

Für den einfachen Korrelationskoeffizienten<br />

ρ<br />

12<br />

σ12<br />

= =<br />

σ ⋅ σ<br />

1 2<br />

Kovarianz<br />

Produkt der Streuungen<br />

erhält man nach der Maximum Likelihood Methode die Schätzung<br />

wobei<br />

r<br />

12<br />

S12<br />

= .<br />

S ⋅ S<br />

1 2<br />

N<br />

∑<br />

S = ( Y − Y )( Y − Y )<br />

12 i,1 1 i,2 2<br />

i=<br />

1<br />

die Stichprobenkovarianz zwischen Y 1 und Y 2 ist. Zur Begründung des eben gesagten betrachten<br />

wir zunächst nur zwei Produktvariable Y 1 und Y 2 und nehmen an, dass der Vektor dieser beiden<br />

Variablen Y T = (Y 1 , Y 2 ) normalverteilt ist mit dem Vektor der Erwartungswerte (Mittelwerte<br />

der Grundgesamtheit)<br />

µ T = (µ 1 , µ 2 )<br />

und der Kovarianzmatrix<br />

Σ<br />

YY<br />

⎛<br />

2<br />

σ ⎞<br />

1 σ12<br />

= ⎜<br />

2<br />

⎟<br />

⎝ σ ⎠<br />

2<br />

in der σ 2 1 die Varianz von Y 1 (Quadrat der Standardabweichung von Y 1 in der Grundge samtheit),<br />

σ 2 2 die Varianz von Y 2 und σ 12 die Kovarianz zwischen Y 1 und Y 2 ist. Die Kovarianz von Y 1 und<br />

Y 2 ist als Produkt der Abweichungen der Y 1 Werte vom Erwartungswert µ 1 und der Y 2 Werte<br />

von µ 2 durch<br />

E [(Y 1 – µ 1 ) (Y 2 – µ 2 )] = σ 12<br />

definiert. Die Kovarianz ist ein Abhängigkeitsmaß zwischen Y 1 und Y 2 , d. h. diese gibt an, wie<br />

sich z. B. Y 1 in Abhängigkeit von Veränderungen von Y 2 verändert. Die Kovarianz ist aber von<br />

den Dimensionen der beiden Zufallsgrößen Y 1 und Y 2 abhängig. Das ist unschön und soll<br />

durch Standardisierung der beiden Zufallsgrößen Y 1 und Y 2 aufgehoben werden.<br />

Unter Standardisierung versteht man dabei den Übergang von Y j zu Z j über die Beziehung<br />

Z<br />

j<br />

Yj<br />

− μ j<br />

= , j = 1,2.<br />

σ<br />

j<br />

Für die standardisierten Zufallsgrößen Z 1 und Z 2 ist die Kovarianz E [Z 1 Z 2 ] durch<br />

E[( Y1 − μ1) ⋅( Y2 − μ2)]<br />

E[ Z1 ⋅ Z2]<br />

=<br />

σ ⋅ σ<br />

1 2<br />

gegeben. Die Kovarianz zwischen den standardisierten Zufallsgrößen Y 1 und Y 2 nennt man<br />

Korrelationskoeffizient ρ 12


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

237<br />

Y 2<br />

Y 1<br />

ρ 12 = 1<br />

Y 2 + ΔY 2<br />

Y 2<br />

Y 1 Y 1 + ΔY 1<br />

Abb. 5.9.3: Lineare Abhängigkeit zwischen Y 1 und Y 2<br />

Für diesen gilt:<br />

• 1 ≤ ρ 12 ≤ 1,<br />

wobei ρ 12 = 1 genau dann gilt, wenn Y 1 und Y 2 mit der Wahrscheinlichkeit eins linear abhängig<br />

sind, wie das in der Abbildung 5.9.3 dargestellt ist. Linear abhängig heißt in diesem<br />

Zusammenhang, wenn mit der Wahrscheinlichkeit 1 eine Veränderung von z. B. Y 1 zu einer<br />

determinierten Veränderung von Y 2 führt und umgekehrt, d. h. wenn P (Y 2 = β 0 + β Y.1 Y 1 )<br />

= 1, wobei β 0 und β Y.1 die unbekannten Koeffizienten der Geradengleichung sind.<br />

Man kann diesen Sachverhalt auch in der folgenden Art beschreiben: die Punkte (Y 1 , Y 2 )<br />

liegen auf der Geraden, die den funktionalen Zusammenhang zwischen Y 1 und Y 2 beschreibt,<br />

d. h. Y 1 und Y 2 haben keine Streuungen. Das wiederum heißt aber, dass der Zusammenhang<br />

zwischen Y 1 und Y 2 determiniert ist. Diesen Sachverhalt verdeutlicht die Abbildung 5.9.3.<br />

• ρ 12 = 0 gilt nur dann, wenn Y 1 und Y 2 linear unabhängig sind. In diesem Falle liegen die<br />

Realisierungen von Y 1 und Y 2 , d. h. die Wertepaare von Y 1 und Y 2 in einem kreisförmigen<br />

Gebiet.<br />

• Für alle anderen Werte des Korrelationskoeffizienten liegen die Wertepaare in elliptisch<br />

umrissenen Gebieten. Diese Ellipsen können steigend oder fallend sein, je nachdem wie<br />

das Vorzeichen des Korrelationskoeffizienten ist.<br />

• Von ρ 12 = 0 bzw. r 12 = 0 kann man nicht auf die Unabhängigkeit von Y 1 und Y 2 schließen.<br />

• Der Korrelationskoeffizient der Grundgesamtheit ρ 12 wird mit der Formel<br />

r<br />

12<br />

=<br />

N<br />

∑<br />

i=<br />

1<br />

( Y − Y ) ⋅( Y − Y )<br />

1, i 1 2, i 2<br />

N<br />

N<br />

2 2<br />

∑ ( Y1, i − Y1 ) ⋅∑<br />

( Y2, i − Y2<br />

)<br />

i= 1 i=<br />

1<br />

und den Wertepaaren (Y 11 , Y 21 ), …, (Y 1,N , Y 2,N ), d. h. der Stichprobe geschätzt.<br />

Die Korrelationskoeffizienten für alle möglichen ⎛ m ⎞<br />

⎜<br />

⎝2<br />

⎟ Paare von Produktvariablen werden<br />

⎠<br />

in der Korrelationsmatrix


238 5 Qualität in der Fertigung<br />

R<br />

YY<br />

⎛1 r12 ... r1<br />

m ⎞<br />

⎜ 1 ... r ⎟<br />

2m<br />

= ⎜<br />

⎟<br />

⎜ ... ⎟<br />

⎜<br />

⎝<br />

1 ⎟<br />

⎠<br />

zusammengestellt.<br />

Die Korrelationsmatrix ist symmetrisch, denn es gilt r jk = r kj für alle<br />

j, k = 1, … (j – 1) j (j + 1), …, (k – 1), k, (k + 1), …, m, j ≠ k. Für j = k ist ρ jj = ρ kk = 1.<br />

Die Korrelationsmatrix ist für reguläre m-dimensionale Verteilungen positiv definit, wenn<br />

das Produkt widerspruchsfrei durch die Produktvariablen beschrieben wird.<br />

Wie kann geprüft werden, ob ein berechneter Korrelationskoeffizient eine Abhängigkeit<br />

ausdrückt, die statistisch gesichert von null verschieden ist?<br />

Zu diesem Sachverhalt sagt man kurz, die Abhängigkeit zwischen zwei Zufallsgrößen ist „signifikant<br />

von null verschieden“.<br />

Da der Korrelationskoeffizient mit den Werten einer Stichprobe geschätzt wurde, hängt er<br />

einmal vom Stichprobenumfang und von der „Zufälligkeit“ der beteiligten Variablen, d. h.<br />

der Größe der Streuungen ab. Aus diesem Grund muss beim Korrelationskoeffizienten stets<br />

gefragt werden, wie groß kann r 12 von null abweichen, ohne dass die Unabhängigkeit von Y 1<br />

und Y 2 verletzt ist?<br />

Zur Beantwortung dieser Frage müssen Hypothesen über ρ 12 formuliert werden, die mit r 12<br />

zu beantworten sind, d. h. man benötigt einen Test. Die Hypothesen lauten:<br />

H 0 : ρ 12 = 0 (d. h. die Zufallsgrößen Y 1 und Y 2 sind nicht miteinander korreliert) und<br />

H 1 : ρ 12 ≠ 0 (d. h. die Zufallsgrößen sind linear nicht unabhängig voneinander)<br />

Die Prüfung der H 0 gegen die Alternativhypothese H 1 wird mit dem t-Test<br />

ˆ<br />

r12<br />

t = ⋅ N − 2<br />

2<br />

1 − r<br />

12<br />

geprüft. Ist tˆ<br />

< t α , N −2, dann kann die H 0 nicht verworfen werden. Aufgrund der Stichprobe<br />

d. h. der Größe von r 12 kann dann gesagt werden, dass Y 1 und Y 2 nicht linear abhängig voneinander<br />

sind.<br />

Beispiel 5.9.2: Bremsweg eines PKW. Abhängigkeit des Bremsweges<br />

Das erweiterte Bremswegbeispiel enthält die Produktvariable<br />

Y Länge des Bremsweges in [m]<br />

und die Input- und Prozessvariablen<br />

X 1 Geschwindigkeit des PKW in einer Ortschaft [km/h]<br />

X 2 mittlere Profiltiefe der Reifen aller 4 Räder [mm]<br />

X 3 Reaktionszeit des Fahrers in [sec].<br />

Die statistischen Maßzahlen sind in der folgenden Tabelle 5.9.1 zusammengestellt.


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

239<br />

Tabelle 5.9.1: Statistische Maßzahlen für das Bremswegbeispiel<br />

Bremsweg Geschwindigkeit Profiltiefe Reaktionszeit<br />

Mittelwert 29,96 49,74 3,47 1,24<br />

Varianz 33,5398 95,4792 0,59036 0,14773<br />

S 5,791 9,771 0,768 0,384<br />

Min 13,65 19,3 1,44 0,064<br />

Max 46,41 76,5 5,26 2,076<br />

R 32,7 57,2 3,8 2,01<br />

V 19 19 22 31<br />

Für dieses Beispiel ist die Korrelationsmatrix in der Tabelle 5.9.2 enthalten.<br />

Tabelle 5.9.2: Korrelationsmatrix Beispiel Bremsweg<br />

Bremsweg Geschwindigkeit Profiltiefe Reaktionszeit<br />

Bremsweg 1 0,837 –0,373 0,457<br />

Geschw 1 –0,207 0,168<br />

Profil 1 0,098<br />

Reaktion 1<br />

Der Abhängigkeitsgraph für diese vier Variablen ist in der Abbildung 5.9.4 dargestellt.<br />

X 1<br />

r Y1 = 0.84<br />

r 12 = - 0.20<br />

X 2<br />

Y<br />

r Y2 = - 0.37<br />

r 13 = 0.1<br />

X 3<br />

r Y3 =0.45<br />

r 23 = 0.17<br />

Abb. 5.9.4: Abhängigkeitsgraph für das Bremswegbeispiel<br />

Zur Demonstration der Anwendung des t-Tests überprüfen wir die Nullhypothese H 0 des<br />

Korrelationskoeffizienten r 23 , die lautet H 0 : ρ 23 = 0 gegen H 1 : ρ 23 ≠ 0<br />

Der t-Test liefert<br />

0.1<br />

tˆ = ⋅ 28 = 0.532<br />

2<br />

1−<br />

0.1


240 5 Qualität in der Fertigung<br />

Der zugehörige Tafelwert für die einseitige Fragestellung ist t 0.05; 28 = 2.048. Der berechnete<br />

t-Wert ist kleiner als der Tafelwert. Folglich kann die Nullhypothese nicht verworfen werden,<br />

d. h. der aus der Stichprobe vom Umfang N = 30 berechnete Korrelationskoeffizient r 23 = 0.1<br />

unterscheidet sich nicht statistisch gesichert von null. Der Stichprobenkorrelationskoeffizient<br />

r 23 weicht nur zufällig von null ab, d. h. X 2 und X 3 sind nicht miteinander korreliert.<br />

Es ist an dieser Stelle notwendig darauf hinzuweisen, dass man im Fall der Ablehnung der H 0<br />

nicht einfach sagen kann, X j und X k sind linear abhängig, denn der Korrelationskoeffizient<br />

ist ein Maß für den Grad der linearen Abhängigkeit zwischen den beiden Zufallsgrößen.<br />

Man kann in diesem Fall nur sagen, X j und X k sind korreliert.<br />

Die Hypothesen H 0 bzgl. aller anderen Korrelationskoeffizienten müssen analog geprüft<br />

werden. Am stärksten ist die Abhängigkeit zwischen der Reaktionszeit X 3 und der Alkoholkonzentration<br />

X 5 gefolgt von der Korrelation zwischen dem Bremsweg und der<br />

Geschwindigkeit.<br />

Die Korrelationsmatrix ist der Ausdruck für die Abhängigkeitsstruktur der Produkt- und<br />

Prozessvariablen (oder nur der Produkt-, oder nur der Prozessvariable), die in der nebenstehenden<br />

Abbildung für die Produktvariable und die ersten drei Input- und Prozessvariablen<br />

symbolisiert ist. Aus dieser Abbildung wird deutlich, dass die Abhängigkeit zwischen zwei<br />

Parametern natürlich durch die anderen Parameter beeinflusst wird.<br />

Der Zusammenhang zwischen der Kovarianz- und Korrelationsmatrix wird matriziell durch<br />

die Beziehung<br />

⎛ ⎞ ⎛ ⎞<br />

R = D⎜ 1 ⎟ ⋅Σ<br />

⋅ D⎜ 1 ⎟ ⎝σj<br />

⎠ ⎝σj<br />

⎠<br />

j = … n , bzw.<br />

Σ = D( σ ) ⋅ R ⋅ D( σ )<br />

j<br />

j<br />

ausgedrückt.<br />

Außerdem gilt für die Determinanten der Korrelations-R XX und Kovarianzmatrix Σ XX der oft<br />

nützliche Zusammenhang<br />

wobei<br />

n<br />

Σ = ∏ σ 2 R<br />

XX j XX<br />

j=<br />

1<br />

R<br />

XX<br />

⎧⎪ 1, falls ρjk<br />

= 0, ∀ jk , = 1, …, nj , ≠ k<br />

= ⎨<br />

⎪⎩<br />

0, falls wenigstens ein ρjk<br />

= 1, für j ≠ k.<br />

Das Modell der Korrelationskoeffizienten ist – wie jedes Modell – von den Voraussetzungen<br />

abhängig. Hier bei diesem Modell handelt es sich um die Voraussetzungen der Normalverteiltheit,<br />

Linearität der Abhängigkeiten und der Unabhängigkeit der Elemente der Stichprobe.<br />

Gibt es ein globales Maß für die Straffheit der Abhängigkeitsstruktur?<br />

⎛n + m⎞<br />

In einer Korrelationsmatrix gibt es aufgrund der Symmetrie der Matrix ⎜<br />

⎝ 2 ⎟ verschiedene<br />

Korrelationskoeffizienten. Diese können groß oder klein, positiv oder negativ sein.<br />

⎠<br />

Diese


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

241<br />

Verhältnisse erschweren die Interpretation der Abhängigkeitsstruktur. Daher suchen wir ein<br />

globales Maß für die Abhängigkeitsstruktur. Dieses Maß ist die Determinante det(R) der<br />

Korrelationsmatrix.<br />

Der maximale Wert der Determinante ist det(R) = 1. Dieser Wert wird erreicht, wenn alle<br />

Korrelationskoeffizienten gleich null sind. (Zur Erinnerung sei wiederholt, dass im Falle der<br />

Unabhängigkeit alle Korrelationskoeffizienten gleich null sind.) Die Determinante ist null,<br />

wenn wenigstens ein Korrelationskoeffizient außerhalb der Hauptdiagonalen gleich 1 ist.<br />

Beispiel 5.9.3: Bremsweg eines PKW. Determinante der Korrelationsmatrix<br />

Die Determinante der Korrelationsmatrix für die Input-, Prozess- und Produktvariablen<br />

ist det(R) = 0.12163. Interessanter ist die Determinante der Input- und Prozessvariablen,<br />

denn diese bestimmt den Grad der Multikollinearität. Hierfür berechnen wir den Wert<br />

det(R XX ) = 0.9124. Der Grad der Multikollinearität ist sehr gering und beeinflusst später<br />

folgende Resultate, wie z. B. die Berechnung der Prozessgleichung nicht.<br />

Was passiert, wenn eine oder beide Voraussetzungen verletzt sind?<br />

In diesem Fall können die verteilungsfreien Korrelationskoeffizienten bere chnet werden.<br />

5.9.2 Verteilungsfreie Korrelationskoeffizienten<br />

Verteilungsfreie Korrelationskoeffizienten benötigen keine Annahme über die zugrunde liegende<br />

Verteilung der Zufallsgrößen. Diese Koeffizienten sind daher robuster als die anderen.<br />

5.9.2.1 Was ist ein Vierfelder Korrelationskoeffizient?<br />

Es seien X, Y zwei Zufallsgrößen mit diskreter Verteilung, die nur qualitativ gemessen werden<br />

können, d. h. die Messwerte sind die Häufigkeiten einer Alternative, wie z. B. Raucher und<br />

Nichtraucher, Produkt in Ordnung und Produkt defekt usw. Eine Stichprobe eines zweidimensionalen<br />

Vektors alternativ verteilter Zufallsgrößen, wie z. B. die Zufallsgröße X besteht<br />

im Vorhandensein oder Nichtvorhandensein einer Eigenschaft A und Y bezieht sich analog<br />

auf eine Eigenschaft B, liefert vier verschiedene Häufigkeiten, die in einer Vierfeldertafel, siehe<br />

Tabelle 5.9.3 aufgeschrieben und mit dem Vierfelder Korrelationskoeffizienten ausgewertet<br />

werden müssen.<br />

Tabelle 5.9.3: Vierfeldertafel<br />

Eigenschaft A<br />

Zeilensumme<br />

vorhanden<br />

nicht vorhanden<br />

Eigenschaft B<br />

vorhanden<br />

nicht vorhanden<br />

a<br />

c<br />

b<br />

d<br />

a + b<br />

c + d<br />

Spaltensumme a + c b + d = a + b + c + d


242 5 Qualität in der Fertigung<br />

In dieser Tafel bezeichnen<br />

a die Häufigkeit des Vorkommens von A und B<br />

a + c die Häufigkeit des Vorkommens von A<br />

a + b die Häufigkeit des Vorkommens von B<br />

d die Häufigkeit der Alternative von A und B,<br />

d. h. des Nichtvorkommens von A und B<br />

b + d die Häufigkeit des Nichtvorkommens von A<br />

c + d die Häufigkeit des Nichtvorkommens von B.<br />

Die zu prüfende Nullhypothese lautet<br />

H 0 : „die beiden Alternativen verteilen sich unabhängig voneinander“<br />

Zur Prüfung dieser Hypothese verwendet man den χ 2 -Test<br />

V<br />

2<br />

χ<br />

a ⋅d − b ⋅c<br />

= =<br />

N [( a + b) ⋅ ( a + c) ⋅ ( b + d) ⋅ ( c + d)]<br />

Für diesen Koeffizienten gilt –1 ≤ V ≤ 1.<br />

Beispiel 5.9.4: Stillstandszeiten<br />

Es soll überprüft werden, ob es zwischen den Stillständen einer Anlage und den Ausschussteilen,<br />

einen Zusammenhang gibt. Die Anlage arbeitet in 3 Schichten. Pro Stunde werden 2<br />

Produkte auf der Anlage hergestellt. Die Produkte werden beurteilt ob sie i. O. oder defekt<br />

sind. Über eine längere Zeitspanne wurden die kurzfristigen Ausfälle der Anlage notiert.<br />

Man erhielt das Ergebnis in der Tabelle 5.9.4.<br />

Tabelle 5.9.4: Stillstandszeiten und defekte Produkte<br />

Produkt<br />

Zeilensumme<br />

i. O. defekt<br />

Anlage<br />

kein Stillstand<br />

Stillstand<br />

91<br />

8<br />

39<br />

18<br />

130<br />

26<br />

Spaltensumme 99 57 156<br />

Damit können wir den Vierfelderkorrelationskoeffizienten<br />

2 156 ⋅(91 ⋅18 − 39 ⋅8)<br />

χ = = 14.38<br />

130 ⋅26 ⋅99 ⋅57<br />

und<br />

V<br />

14.38<br />

= =<br />

156<br />

0.3<br />

ausrechnen. Dieser Wert besagt aufgrund des zugehörigen χ 2 -Wertes, dass ein Zusammenhang<br />

zwischen den Stillständen und den defekten Produkten vorhanden ist, oder anders<br />

formuliert, dass die Stillstandszeiten der Anlage die Qualität beeinflussen.


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

243<br />

5.9.2.2 Was für ein Abhängigkeitsmaß können wir berechnen,<br />

wenn die Variablen über eine Rangskala quantifiziert wurden?<br />

Beispiel 5.9.5: Lieferterminüberschreitung. Rangkorrelationskoeffizienten<br />

Bei 14 Kunden wurden die Lieferfristenüberschreitungen Y in Tagen gemessen. Gleichzeitig<br />

wurden für die Partien, aus denen die Kundenlieferungen stammten, die univariaten<br />

Prozessfähigkeiten für eine sehr wichtige Produktvariable ermittelt. Da weder die<br />

Lieferfristenüberschreitungen noch die korrigierten univariaten Prozessfähigkeitsindizes<br />

normal verteilt sind, wurde entschieden, anstelle des einfachen Korrelationskoeffizienten<br />

den Rangkorrelationskoeffizienten nach Spearman zu berechnen.<br />

Die Rangkorrelationskoeffizienten s ind aus dem Konzept entstanden, eine Rangskala als eine<br />

Intervallskala aufzufassen und die Rangwerte als Messwerte zu behandeln. Das Ergebnis dieses<br />

Konzeptes sind die Rangkorrelationen von Spearman and Kendall (siehe Kandall [1952]).<br />

Der Spearman’scher Rangkorrelationskoeffizient<br />

F ür die beiden Variablen X und Y kann man aus den Beobachtungsreihen X i , Y i , i = 1, …, N die<br />

beiden Rangreihen x [i] und y [i] , i = 1, …, N bilden und als neue als Messwerte auffassen.<br />

Haben Sie z. B. die Messwerte 5, 2, 7, 4 vorliegen, dann können Sie diese der Größe nach in<br />

2, 4, 5, 7 ordnen. Der Wert x 1 = 5 wird in den Rangreihe zu x [3] . Mit der Gauß’schen Summe<br />

erhält man<br />

und<br />

N<br />

∑<br />

x<br />

N ⋅ ( N + 1)<br />

= =<br />

∑<br />

i<br />

i= 1<br />

2<br />

i=<br />

1<br />

N<br />

⋅ + ⋅ +<br />

∑<br />

2 N<br />

N ( N 1) 2N<br />

1<br />

x = = ∑<br />

2<br />

i<br />

yi<br />

i= 1<br />

6<br />

i=<br />

1<br />

Außerdem gilt<br />

N<br />

N<br />

2 2<br />

∑( xi<br />

x)<br />

∑xi<br />

i= 1 i=<br />

1<br />

N<br />

y<br />

i<br />

2<br />

⎛<br />

N<br />

⎞ 2<br />

⎡ ⋅ + ⎤<br />

⎜∑<br />

x<br />

N ( N 1)<br />

i<br />

⎝<br />

⎟ ⎢ ⎥<br />

i=<br />

1 ⎠ N ⋅ ( N + 1) ⋅ (2N<br />

+ 1) ⎣ 2 ⎦<br />

− = − = −<br />

N<br />

6<br />

N<br />

2<br />

N ⋅( N −1)<br />

=<br />

12<br />

Für die Summe der quadratischen Abweichungen der y i Werte von ihrem Mittelwert erhält<br />

man denselben Ausdruck. Es sind nun noch die Differenzen der Rangpaare<br />

zu bilden.<br />

d i = X [i] – y [i] , i = 1, …, N,


244 5 Qualität in der Fertigung<br />

Setzt man all diese Umformungen in die Formel<br />

r<br />

xy<br />

=<br />

N<br />

∑<br />

i=<br />

1<br />

( x − x) ⋅( y − y)<br />

i<br />

N<br />

N<br />

2 2<br />

∑( xi<br />

− x) ⋅∑( yi<br />

− y)<br />

i= 1 i=<br />

1<br />

i<br />

.<br />

r<br />

s<br />

N<br />

∑d<br />

2<br />

i<br />

i=<br />

1<br />

2<br />

6 ⋅<br />

= 1 −<br />

.<br />

N ⋅( N −1)<br />

Signifikanzprüfung für den Spearman’schen Rangkorrelationskoeffizient<br />

Die H 0 : X und Y sind unabhängig.<br />

Gegen die Alternativhypothese wird mit dem t-Test<br />

tˆ =<br />

rs<br />

⋅ N − 2<br />

1 − r<br />

2<br />

s<br />

geprüft. Falls ˆt > t α; N – 2 dann muss die H 0 verworfen werden, d. h. in diesem Falle sagen wir<br />

die beiden Parameter X und Y sind korreliert.<br />

Beispiel 5.9.6: Lieferfristenüberschreitung. Spearmanscher<br />

Rangkorrelationskoeffizient<br />

Die Daten für dieses Beispiel sind in der Matrix der Tabelle 5.9.5 zusammengestellt.<br />

Tabelle 5.9.5: Daten für Lieferfristenüberschreitung und Prozessfähigkeiten, Rangreihen und deren<br />

Differenzen<br />

der einfachen Korrelationskoeffizienten ein, dann erhält man für den Spearman’schen Korrelationskoeffizienten<br />

Lieferfristenüberschreitung<br />

Prozessfähigkeiten<br />

Rangreihe<br />

X [i]<br />

Rangreihe<br />

Y [i]<br />

13 1,30 1 14 –13<br />

14 1,05 2 5 –3<br />

15 1,65 3 13 –10<br />

16 1,19 4 11 –7<br />

17 1,11 5 7 –2<br />

19 1,13 6 8 –2<br />

20 1,17 7 10 –3<br />

21 1,15 8 9 –1<br />

24 0,95 9 4 5<br />

25 1,20 10 12 –2<br />

30 1,10 11 6 5<br />

31 0,92 12 2 10<br />

36 0,94 13 3 10<br />

40 0,81 14 1 13<br />

d i


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

245<br />

Für den Spearman’schen Rangkorrelationskoeffizienten erhält man den Wert<br />

r s<br />

6⋅<br />

768<br />

= 1 − = −0.69.<br />

2<br />

14 ⋅(14 −1)<br />

Der zugehörige t-Wert ist<br />

0.69<br />

tˆ = ⋅ 12 = 3.3.<br />

2<br />

1−<br />

0.69<br />

Der t-Wert aus der Tafel ist t 0.05; 12 = 1.78. Da der berechnete t-Wert größer als der Tafelwert<br />

ist, muss die H 0 verworfen werden, d. h. die beiden Parameter sind nicht unabhängig<br />

voneinander. Die Lieferfristenüberschreitung ist von den Prozessfähigkeiten abhängig.<br />

Je kleiner die Prozessfähigkeiten für eine wesentliche Produktvariable sind, desto größer<br />

sind die Lieferfristenüberschreitungen. Die berechnete Irrtumswahrscheinlichkeit für die<br />

Ablehnung der H 0 ist α = 0.0059.<br />

In der Abbildung 5.9.5 ist das Korrelationsdiagramm für diese beiden Variablen enthalten.<br />

Man erkennt deutlich die fallende Tendenz, d. h. je größer die Prozessfähigkeiten sind, desto<br />

kleiner sind die Lieferfristenüberschreitungen.<br />

40<br />

35<br />

LTU<br />

30<br />

25<br />

20<br />

15<br />

10<br />

0.8 1.0 1.2 1.4 1.6<br />

Cpk<br />

Abb. 5.9.5: Lieferterminüberschreitung und Prozessfähigkeit<br />

Was ist der Kendall’scher Rangkorrelationskoeffizient?<br />

Es seien wieder zwei Rangfolgen für N Objekte gegeben, d. h. für die nicht normal verteilten<br />

oder skalierten Messwerte zweier Parameter liegen zwei Rangfolgen [i] und [j], i, j = 1, …, N<br />

vor. Als Beispiel stellen wir uns das Lieferfristenbeispiel vor. Für jedes Paar ([i],[j]) von Objekten<br />

(Messwerten) schreiben wir einen Beitrag +1 auf, wenn die Ränge [i] und [j] in der gleichen<br />

aufsteigenden Reihenfolge vorkommen, sonst –1. Konkret bedeutet das, wir definieren für die<br />

erste Rangfolge eine Zufallsgröße V ik , die den Wert +1 annimmt, wenn X i < X k , den Wert 0, wenn<br />

X i = X k und den Wert –1, wenn X i > X k . Analog verfahren wir für den zweiten Parameter Y.


246 5 Qualität in der Fertigung<br />

Die Summe der Beiträge aller Paare ist dann<br />

N<br />

∑ ij<br />

ij , = 1<br />

S = x ⋅ y .<br />

Der Maximalwert dieser Summe ist<br />

Setzt man<br />

⎛N<br />

⎞ 1<br />

⎜ ⎟ = ⋅ N ⋅ ( N − 1).<br />

⎝ 2 ⎠ 2<br />

T =<br />

ij<br />

S<br />

1<br />

⋅ N ⋅( N −1)<br />

2<br />

so nimmt T nur Werte zwischen –1 und +1 an. T = +1 gilt nur dann, wenn die beiden Rangfolgen<br />

übereinstimmen. T = –1 erhält man nur dann, wenn die beiden Rangfolgen entgegengesetzt<br />

sind. Für die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ordnet man<br />

die erste Rangfolge der Größe nach von 1 bis N. Darunter schreibt man die zugeordneten Ränge<br />

der zweiten Rangfolge, also<br />

für X: 1 2 3 … N<br />

für Y: Y 1 = Y [1] Y 2 = Y [N] Y 3 = Y [3] … Y N = Y [2] .<br />

Damit kann man S wie folgt berechnen: man zählt, wie viele der Y’s größer als Y 1 rechts von<br />

Y 1 stehen, dann zählt man wie viele der Y’s größer als Y 2 rechts von Y 2 stehen usw. Die Summe<br />

aller dieser Anzahlen sei P. Damit kann S umgeschrieben werden. Es gilt S ist die Summe von<br />

P Beiträgen +1 und ⎛ N ⎞<br />

⎜ ⎟ − P Beiträgen –1, d. h.<br />

⎝ 2 ⎠<br />

bzw.<br />

1<br />

S = 2 ⋅ P − ⋅ N ⋅( N −1),<br />

2<br />

2 ⋅ P<br />

T = −1.<br />

1<br />

⋅ N ⋅( N −1)<br />

2<br />

Beispiel 5.9.7: Lieferfristenüberschreitung. Kendallscher Rangkorrelationskoeffizient<br />

Die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ergibt für das Beispiel<br />

der Lieferterminüberschreitung den Wert T = –0.538. T ist asymptotisch normal verteilt<br />

mit dem Erwartungswert 0 und der Varianz<br />

2 ⋅ ⋅ +<br />

=<br />

2 (2 N<br />

σ<br />

5) ,<br />

T<br />

9 ⋅ N ⋅( N −1)<br />

siehe z. B. van der Waerden [1957]. Damit kann man die Hypothese der Unabhängigkeit<br />

von X und Y verwerfen, wenn T größer ist als T α = σT<br />

⋅Φ(1 − α ) , wobei Φ die Verteilungsfunktion<br />

der standardisierten Normalverteilung ist.


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

247<br />

Die H 0 der Unabhängigkeit der beiden Zufallsgrößen muss aufgrund des Ergebnisses<br />

T = –0.538 verworfen werden. Die berechnete Irrtumswahrscheinlichkeit ist α′ = 0.0073.<br />

Zum Vergleich wurde der einfache Korrelationskoeffizient berechnet. Man erhält hierfür<br />

den Wert r XY = –0.795. Die berechnete Irrtumswahrscheinlichkeit für die Ablehnung der<br />

H 0 ist α′ = 0.0007.<br />

Neben den einfachen und Rangkorrelationskoeffizienten gibt es weitere Abhängigkeitsmaße.<br />

Diese sind vor allem die<br />

•<br />

•<br />

•<br />

partiellen oder bedingten Korrelationskoeffizienten,<br />

die multiplen Korrelationskoeffizienten und<br />

die multivariaten multiplen Korrelationskoeffizienten.<br />

5.9.3 Was sind partielle Korrelationskoeffizienten<br />

Wozu werden die bedingten (partielle) Korrelationskoeffizienten gebraucht?<br />

Wie werden die bedingten Korrelationskoeffizienten berechnet?<br />

Bisher haben wir die Abhängigkeitsstruktur für die Input-, Prozess- und Produktvariablen<br />

durch die einfachen (paarweisen) Korrelationskoeffizienten beschrieben. Wir haben aber auch<br />

gesehen, dass mitunter Antworten auf praktisch relevante Fragen, wie z. B. die Frage nach den<br />

Abhängigkeiten zwischen den Produkt- und Prozessvariablen ohne den Einfluss der Inputvariablen<br />

erforderlich sind. Diese Frage kann man auch so formulieren,<br />

Wie groß sind die bedingten Abhängigkeitsmaße zwischen den Produkt- und<br />

Prozessvariablen unter der Bedingung der Inputvariablen?<br />

Zur Vereinfachung der Lösung auf die Frage betrachten wir ein triviales Beispiel.<br />

Beispiel 5.9.8: Einfluss von zwei Prozess- auf eine Produktvariable. Abhängigkeiten<br />

In dem Graphen der Abbildung 5.9.6 ist der Einfluss zweier korrelierter Prozessvariablen<br />

auf eine Produktvariable dargestellt.<br />

r Y1 = 0.84<br />

X 1<br />

r 12 = 0.95<br />

Y<br />

r Y2 = 0.86<br />

X 2<br />

Abb. 5.9.6: Einfluss von zwei Prozess- auf eine Produktvariable


248 5 Qualität in der Fertigung<br />

Die Korrelationsmatrix für dieses Beispiel ist<br />

⎛1 0.84 0.86⎞<br />

R = ⎜<br />

⎜<br />

1 0.95⎟<br />

⎟<br />

⎝<br />

1 ⎠<br />

Die beiden Prozessvariablen haben den Korrelationskoeffizient r 12 = 0,95. Für die Steuerung<br />

des Prozessen müssen wir aber wissen, wie z. B. X 1 auf Y wirkt, ohne dass dieser Einfluss<br />

durch das Wirken der zweiten Prozessvariablen „verfälscht“ wird. Der Einfluss von X 2 auf<br />

X 1 soll eliminiert oder konstant gehalten werden. Das ist nur in einem Modell möglich,<br />

denn in der Natur lässt sich dieser Einfluss nicht eliminieren oder konstant halten.<br />

Ein Korrelationskoeffizient dieser Art wird als partieller Korrelationskoeffizient bezeichnet.<br />

Dieser misst den partiellen Einfluss von X 1 auf Y, oder anders ausgedrückt den Einfluss von<br />

X 1 auf Y unter der Bedingung, dass X 2 konstant gehalten wird. Wir können auch sagen, der zu<br />

findende Korrelationskoeffizient ist ein Korrelationskoeffizient der bedingten Verteilung von<br />

Y und X 1 unter der Bedingung von X 2 .<br />

Für diesen Fall wollen wir im Folgenden die Formel zur Berechnung der partiellen Korrelationskoeffizienten<br />

betrachten . Es gilt<br />

rY1 − rY2 ⋅r12<br />

rY<br />

1/2 =<br />

2 2<br />

(1 − r ) ⋅(1 − r )<br />

Y 2 12<br />

wobei r Y1/2 die symbolische Darstellung für die Abhängigkeit zwischen Y und X 1 unter der<br />

Bedingung ist.<br />

Beispiel 5.9.9: Einfluss von zwei Prozess- auf eine Produktvariable.<br />

Partieller Korrelationskoeffizient<br />

Für das Demonstrationsbeispiel gilt<br />

r Y 1/2<br />

0.84 − 0.86 ⋅0.95<br />

= = 0.146.<br />

2 2<br />

(1 − 0.86 ) ⋅(1 − 0.95 )<br />

Das Ergebnis der einfachen- und partiellen Korrelationsanalyse besagt, dass die paarweise<br />

(oder auch totale) Abhängigkeit zwischen Y und X 1 sehr straff ist (r YX1 = 0.84). Es besagt<br />

aber auch, dass diese Abhängigkeit sehr stark durch X 2 beeinflusst wird, denn X 2 wirkt<br />

sehr stark auf X 1 (r 12 = 0.95) und sehr stark auf Y (r Y2 = 0.86). Hält man diesen Einfluss<br />

konstant, oder eliminiert man diesen Einfluss, dann ist die verbleibende Abhängigkeit nur<br />

noch gering (r Y1/2 = 0.146).<br />

Was können Sie aus den Unterschieden zwischen den einfachen und partiellen<br />

Korrelationskoeffizienten ablesen?<br />

Beispiel 5.9.10: Einfluss von zwei Prozess- auf eine Produktvariable.<br />

Maß der Beherrschbarkeit<br />

Y kann einzeln sowohl durch X 1 oder X 2 und gemeinsam durch X 1 und X 2 zusammen<br />

dargestellt werden. Die Genauigkeit der unterschiedlichen Darstellungen wird durch das<br />

Maß der Beherrschbarkeit und durch die Streuungen um die Regressionsgleichung (Reststreuung)<br />

ausgedrückt.


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

249<br />

Die Darstellungen von Y durch X 1 oder X 2 liefern die beiden Gleichungen<br />

Y = b Y1 X 1 = 0.84 X 1<br />

mit dem Maß der Beherrschbarkeit R 2 Y1 = 0.7056 und der Reststreuung<br />

S Y/1 = 0.5425 bzw.<br />

Y = b Y2 X 2 = 0.86 X 2<br />

mit dem Maß der Beherrschbarkeit R 2 Y/2 = 0.7396 und der Reststreuung<br />

S Y/2 = 0.5203.<br />

Wird Y durch beide X gemeinsam dargestellt, dann erhält man die Gleichung<br />

Y = b Y.1/2 X 1 + b Y.2/1 X 2 = 0.2359 X 1 + 0.6359 X 2<br />

mit dem Maß der Beherrschbarkeit R 2 Y/1, 2 = 0.7450 und der Reststreuung<br />

S Y/1, 2 = 0.5049.<br />

Hieraus können Sie ablesen, dass<br />

•<br />

•<br />

•<br />

die Varianz von Y durch X 1 oder X 2 zu ca. 70 % erklärt wird,<br />

durch den gemeinsamen Ansatz mit beiden Einflussvariablen X 1 und X 2 wird das Maß<br />

der Beherrschbarkeit nicht wesentlich kleiner. Die Ursache hierfür ist der große Korrelationskoeffizient<br />

für X 1 und X 2 .<br />

Man nennt diesen Effekt Einfluss der Multikollinearität zwischen den Einflussgrößen<br />

auf die Regressionsgleichung und nennt eine der beiden Variablen redundant.<br />

Berechnung der partiellen Korrelationskoeffizienten über die bedingte Verteilung<br />

Für die allgemeine Ableitung setzen wir voraus, dass der zufällige Vektor (Y T , X T ) normal verteilt<br />

ist. Gesucht sind die partiellen Korrelationskoeffizienten zwischen den Produktvariablen, d. h.<br />

die bedingten Korrelationskoeffizienten der Produktvariablen Y unter der Bedingung, dass die<br />

Input- und Prozessvariablen X konstant gehalten werden, d. h. gegeben sind.<br />

Die bedingte Verteilung von Y unter der Bedingung X ist eine m-dimensionale Normalverteilung<br />

ist mit den bedingten Momenten E[Y/X] und v ar(Y/X). Für diesen verallgemeinerten<br />

Fall erhält man den Vektor bedingter Erwartungswerte<br />

−1<br />

T<br />

Y YX XX X Y / X X<br />

E[ Y/ X] = μ + Σ ⋅ Σ ⋅( X− μ ) = μ + β ⋅( X−<br />

μ )<br />

und die be dingte Kovarianzmatrix<br />

−1<br />

YY YX XX XY YY / X<br />

var [ Y/ X] = Σ − Σ ⋅ Σ ⋅ Σ = Σ .<br />

Die Elemente σ kl/1, … n , k, l = 1, …, m der bedingten Kovarianzmatrix Σ YY/X „messen“ in der<br />

Hauptdiagonalen die Variabilität der Produktvariablen und in den Nebendiagonalen die Abhängigkeiten<br />

zwischen den Produktvariablen unter der Bedingung X, d. h. unter der Bedingung,<br />

dass die Input- und Prozessvariable gegeben sind.<br />

Die partiellen Korrelationskoeffizienten zwischen den Produktvariablen unter der Bedingung,<br />

dass die Input- und Prozessvariable realisiert sind, werden analog den gewöhnlichen Korrelationskoeffizienten,<br />

nur mit den Elementen der bedingten Kovarianmatrix Σ YY/X berechnet.<br />

Wir erhalten die Formel


250 5 Qualität in der Fertigung<br />

ρ<br />

kl /1,…,<br />

n<br />

σkl /1,…, n σkl / X<br />

= =<br />

σ ⋅σ σ ⋅σ<br />

kk /1,…, n kk /1,…, n kk / X ll / X<br />

.<br />

Für σ kk/X kann man natürlich auch σ 2 k/X schreiben. Die Matrizenformel zur Berechnung der<br />

Korrelationskoeffizienten aus der Kovarianzmatrix kann natürlich auch für die bedingte Kovarianzmatrix<br />

aufgeschrieben werden. Wir erhalten<br />

D<br />

und damit<br />

2<br />

σ1/<br />

X<br />

⎜<br />

⎟<br />

= Diag ( ΣYY<br />

/ X ) = Diag<br />

⎜ … ⎟<br />

⎜<br />

2<br />

⎝ σ ⎟<br />

m / X⎠<br />

−<br />

1 −<br />

1<br />

2 ⋅Σ<br />

⋅ 2<br />

YY / X = YY / X ,<br />

D D P<br />

⎛<br />

wobei P YY/X die Matrix der partiellen Korrelationskoeffizienten bezeichnet.<br />

⎞<br />

Beispiel 5.9.11: Bremsweg eines PKW. Partielle Korrelationskoeffizienten<br />

Die partiellen Korrelationskoeffizienten für das Bremswegbeispiel sind in der Tabelle zusammen<br />

gestellt.<br />

Tabelle 5.4.5: Matrix der partiellen Korrelationskoeffizienten<br />

R<br />

partiell<br />

⎛1 0.885 −0.566 0.695⎞<br />

⎜ 1 0.413 −0.55⎟<br />

= ⎜<br />

⎟<br />

⎜ 1 0.475 ⎟<br />

⎜<br />

⎝<br />

1 ⎟<br />

⎠<br />

Vergleicht man die Matrix der bedingten mit der Matrix der einfachen Korrelationskoeffizienten<br />

für dieses Beispiel, dann sieht man, dass<br />

• sich die bedingten wesentlich von den einfachen Korrelationskoeffizienten unterscheiden<br />

können und<br />

• die bedingten auch wesentlich größer als die einfachen Korrelationskoeffizienten werden<br />

können.<br />

Die Vergrößerung oder Verkleinerung hängt im wesentlichen von den Vorzeichen der<br />

einfachen Korrelationskoeffizienten ab.<br />

5.9.4 Was sind multiple Korrelationskoeffizienten und wozu benötigt<br />

man diese?<br />

Der multiple Korrelationskoeffizient ist ein immens wichtiges Abhängigkeitsmaß zwischen<br />

der Produktvariablen Y und der Prozessgleichung, oder anders formuliert dem bedingten Erwartungswert<br />

einer Produktvariablen unter der Bedingung der Input- und Prozessvariablen,<br />

dem ja die Prozessgleichung entspricht.


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

251<br />

T −1<br />

Y Y.<br />

X XX X X<br />

EY [ / X] = μ + σ Σ ( − μ )<br />

mit der bedingten Varianz<br />

2 T −1<br />

YX Y. X XX Y.<br />

X<br />

var( Y/ X) = σ − σ Σ σ .<br />

Die Bezeichnungen liefern uns die Zerlegung der positiv definiten Kovarianzmatrix Σ entsprechend<br />

der Zerlegung des zufälligen Vektors in die Produktvariable Y und den Vektor X der<br />

Prozess- und Inputvariablen Z T = (Y, X T ) in<br />

⎛<br />

2 T<br />

σ ⎞<br />

Y σY.<br />

X<br />

Σ = ⎜ ⎟ .<br />

⎝ Σ ⎠<br />

XX<br />

Warum ist der multiple Korrelationskoeffizient für die Anwendungen so wichtig?<br />

Mit dem multiplen Korrelationskoeffizienten können Sie beurteilen,<br />

•<br />

•<br />

wie gut die Menge der Input- und Prozessvariablen die Produktvariable beeinflusst und<br />

wie gut die Varianz einer Produktvariablen durch die Input- und Prozessvariablen erklärt<br />

wird.<br />

Aus diesem Grunde nennen wir den multiplen Korrelationskoeffizienten das Maß der Beherrschbarkeit<br />

eines Prozesses. Je größer der multiple Korrelationskoeffizient ist, desto besser<br />

wird die Varianz der Produktvariablen durch die Input- und Prozessvariablen aufgeklärt, d. h.<br />

umso sicherer wird der Prozess beherrscht.<br />

Das bedeutet aber auch, dass Sie beurteilen können, wie gut Sie den Prozess nach der Steuerung<br />

mit der Prozessgleichung beherrschen. Streuen die Werte der Produktvariablen nach<br />

der Steuerung nur noch gering um die Prozessgleichung, dann werden die Werte auch nur<br />

noch sehr wenig um den Zielwert streuen. Der Zielwert für die Steuerung ist aber der Sollwert<br />

für die Produktvariable. Damit wird erreicht, dass die Kundenanforderungen überaus präzise<br />

erfüllt werden können.<br />

Für die Definition des multiplen Korrelationskoeffizienten betrachten wir wieder den zufälligen<br />

Vektor (Y, X T ) = Z T und nehmen an, dass Z ~ N n + 1 (µ, Σ) und μ und Σ entsprechend dem Z<br />

partitioniert sind.<br />

Definition des multiplen Korrelationskoeffizienten:<br />

ρ<br />

T −1<br />

2<br />

2 σY. X⋅ΣXX⋅σY.<br />

X σY<br />

/ X<br />

Y / X= = 1 −<br />

2 2<br />

σY<br />

σY<br />

Es gilt 0 ≤ ρ 2 Y/X ≤ 1.<br />

Wenn Y unabhängig von X ist, dann ist ρ 2 Y/X = 0. Wenn Y mit Wahrscheinlichkeit 1 eine Linearkombination<br />

der Komponenten von X ist, dann ist ρ 2 Y/X = 1.<br />

Wenn der zufällige Vektor X nur eine Komponente hat, dann ist ρ 2 Y/X = ρ2 Y.X , d. h. dem Quadrat<br />

des einfachen Korrelationskoeffizienten.<br />

Im standardisierten Fall wird aus der Kovarianzmatrix Σ die Korrelationsmatrix R. R wird<br />

genauso zerlegt wie Σ, d. h.<br />

⎛<br />

T<br />

1 ρ ⎞<br />

Y.<br />

X<br />

R = ⎜ ⎟ .<br />

⎝ R ⎠<br />

XX


252 5 Qualität in der Fertigung<br />

Damit erhält man als Formel zur Berechnung des multiplen Korrelationskoeffizienten<br />

2 T −1<br />

Y / X= Y. X⋅ RXX⋅<br />

Y. X.<br />

ρ ρ ρ<br />

Die Maximum Likelihood Schätzung ist<br />

2 T −1<br />

Y / X = Y. XR<br />

XX Y. X,<br />

R R R<br />

wobei die einzelnen Terme in dieser Formel aus der partitionierten Korrelationsmatrix<br />

R<br />

⎛<br />

T<br />

1 R ⎞<br />

Y.<br />

X<br />

= ⎜ ⎟<br />

⎝ R ⎠<br />

XX<br />

kommen, bzw. mit der Zerlegung der Matrix A in<br />

A<br />

⎛<br />

2 T<br />

a ⎞<br />

Y aY.<br />

X<br />

= ⎜ ⎟<br />

⎝ A ⎠<br />

XX<br />

R<br />

T −1<br />

2 aY. XA<br />

XXaY.<br />

X<br />

Y / X=<br />

2<br />

aY<br />

.<br />

Wie kann eine Hypothese über den multiplen Korrelationskoeffizienten geprüft werden?<br />

Unter den sehr allgemeinen Voraussetzungen, dass der N-dimensionale Stichprobenvektor der<br />

Produktvariablen Y sphärisch mit P (Y = 0) = 0 und die Stichprobenmatrix X unabhängig von<br />

Y ist und mit Wahrscheinlichkeit 1 den Rang n hat, ist der multiple Stichprobenkorrelationskoeffizient<br />

R 2 Y/X nach Muirhead [1982] Beta verteilt, bzw.<br />

N − n −1<br />

R ⋅<br />

Y<br />

n 1 − R<br />

2<br />

/ X<br />

2<br />

Y / X<br />

ist F n, N – n – 1 verteilt. Zur Prüfung der H 0 : ρ 2 Y/X = 0 gegen die allgemeine Alternative H 1 : ρ2 Y/X ≠ 0<br />

wird der F-Test<br />

2<br />

/<br />

2<br />

Y / X<br />

N − n −1 R ⋅<br />

Y X = Fˆ<br />

n 1 − R<br />

verwendet. ˆF ist bei Gültigkeit der H 0 F n, N – n – 1 verteilt mit n und N – n – 1 FG. Der Test zum<br />

Niveau α lehnt die H 0 ab, wenn F ˆ > Fn, N−n−1<br />

( α ) , wobei Fn, N−n−1 ( α ) den oberen 100 α % Punkt<br />

der F n, N – n – 1 Verteilung bezeichnet.<br />

Beispiel 5.9.12: Bremsweg eines PKW. Multipler Korrelationskoeffizient<br />

Zur Demonstration des Rechenweges betrachten wir die Abhängigkeit des Bremsweges<br />

Y von der Geschwindigkeit X 1 , der Profiltiefe X 2 und der Reaktionszeit X 3 . Aus der Stichproben<br />

Kovarianzmatrix S der Tabelle 5.9.6 lesen wir die Werte ab, die in die Formel zur<br />

Berechnung des multiplen Korrelationskoeffizienten einfließen.


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

253<br />

Tabelle 5.9.6: Stichprobenkovarianzmatrix für das Bremswegbeispiel<br />

Bremsweg Geschwindigkeit Profil Reaktion<br />

Bremsweg 31,5056 22,5578 –1,393 1,2417<br />

Geschwindigkeit 22,5578 23,0575 –0,6619 0,3899<br />

Profil –1,393 –0,6619 0,4417 0,0314<br />

Reaktion 1,2417 0,3899 0,0314 0,234<br />

⎛23.0575 −0.6619 0.3899⎞ ⎛22.5578⎞<br />

(22.5578 −1.393 1.2417) ⋅ ⎜ 0.4417 0.0314⎟ ⋅ ⎜ −1.393<br />

⎟<br />

⎜ ⎟ ⎜ ⎟<br />

2 ⎝ 0.234 ⎠ ⎝ 1.2417 ⎠<br />

/1,2,3 =<br />

31.5056<br />

= 0.867.<br />

R Y<br />

Das Ergebnis bedeutet, dass die Varianz des Bremsweges zu 87 % durch die Input- und<br />

Prozessvariablen wie Geschwindigkeit, Profiltiefe und Reaktionszeit erklärt wird. Betrachten<br />

wir die Abhängigkeit des Bremsweges nur von der Geschwindigkeit, dann ist der multiple<br />

Korrelationskoeffizient – das Quadrat des einfachen Korrelationskoeffizienten – gleich<br />

R 2 Y/X = r2 Y.1 = 0.83692 = 0.700,<br />

also kleiner als vorher bei der Betrachtung von 3 Prozessvariablen. Hieraus liest man ab,<br />

dass die multiplen Korrelationskoeffizienten bei Vergrößerung der Anzahl der Input- und<br />

Prozessvariablen nie kleiner werden können, sondern, wenn die Produktvariable Y und die<br />

hinzugenommenen Input- und Prozessvariable nicht unabhängig voneinander sind, stets<br />

größer werden. Das ist logisch, denn durch die Hinzunahme neuer Information kann die<br />

Varianz des Produktvariables immer besser erklärt werden.<br />

Zur Prüfung der H 0 : ρ 2 Y/X = 0 verwenden wir den F-Test<br />

0.867 30 − 3 −1<br />

F ˆ = ⋅ =<br />

1 − 0.867 3<br />

56.49<br />

Aus der Tafel für die F-Verteilung findet man den Wert F 3,140 – 3 = 2.60. Da ˆF > F 3, ∞ , , (0.05)<br />

muss die H 0 verworfen werden, d. h. Y hängt statistisch gesichert von den drei Parametern<br />

Geschwindigkeit, Profiltiefe und Reaktionszeit ab, oder anders ausgedrückt, die Varianz des<br />

Bremsweges wird zu mehr als 86 % durch die drei Prozessvariablen erklärt.<br />

−1<br />

5.9.5 Was sind partiell multiple Korrelationskoeffizienten<br />

und wozu benötigt man diese?<br />

Neben den einfachen, den partiellen und den multiplen Korrelationskoeffizienten muss ich<br />

noch den partiell multiplen Korrelationskoeffizienten ei nführen. Dieser ist für den Nachweis<br />

erforderlich, dass nach der Zerlegung des Vektors X in die Teilvektoren X(k) und X(h) die<br />

Komponenten von X(h) unwesentlich sind. Hierzu muss gezeigt werden, dass die Menge der<br />

unwesentlichen (Input- und Prozess-) Variablen, in X(h) zusammengefasst, tatsächlich unab-


254 5 Qualität in der Fertigung<br />

hängig von der Menge der wesentlichen Variablen und von Y ist und damit aus einer statistischen<br />

Prozessanalyse gestrichen werden kann, oder anders formuliert, ob die Variablen aus X(h) nach<br />

ihrer Streichung die bedingte Varianz von Y unter der Bedingung X(k) kaum vergrößern.<br />

Diesen Sachverhalt kann man auch durch die folgende Frage ausdrücken.<br />

Wie verändern sich der Grad der linearen Abhängigkeit und die Beziehung zwischen Y und X,<br />

wenn der Einfluss von X(h) auf Y und X(k) eliminiert wurde?<br />

Multipel bedeutet in diesem Sprachgebrauch die Messung des Grades der linearen Abhängigkeit<br />

zwischen einer Zufallsgröße – der Produktvariablen Y – und einer Linearkombination von<br />

Zufallsgrößen – der Prozessgleichung in X(k) und partiell bedeutet die Messung des Grades<br />

zwischen zwei „bedingten“ zufälligen Größen, nämlich zwischen den beiden bedingten Erwartungswerten<br />

Y unter X(h) und X(k) unter X(h).<br />

Ausgangspunkt für die Darstellung dieses Korrelationskoeffizienten ist die obige Zerlegung,<br />

in der Y eine Produktvariable bezeichnet, X(k) p und X(h) n – p Parameter enthält, und der<br />

Zerlegungssatz für die bedingten Erwartungswerte und Varianzen.<br />

Mit der analogen Zerlegung des Vektors der Erwartungswerte µ T = (µ Y , µ(k) T , µ(h) T ) und der<br />

Kovarianzmatrix<br />

⎛<br />

2 T T<br />

σ ⎞<br />

Y σY. k σY.<br />

h<br />

⎜<br />

⎟<br />

Σ = ⎜<br />

Σkk<br />

Σkh<br />

⎟<br />

⎜<br />

⎝<br />

Σ ⎟<br />

hh ⎠<br />

erhält man die Momente der bedingten Verteilung von (Y, X(k) T ) unter der Bedingung X(h)<br />

und<br />

⎛ ⎞<br />

E{[ Y, Xk ( ) )/ Xh ( )] } = ( μ μ ) − ⋅Σ ⋅[ Xh ( ) − μ( h)]<br />

T<br />

T T T σYh<br />

. −1<br />

Y k ⎜ ⎟ hh<br />

⎝Σkh<br />

⎠<br />

⎛ ⎞ ⎛ ⎞<br />

var[( Y X( k) )/ ( ) ] ( )<br />

2 T<br />

T<br />

T T σY σY. k σY.<br />

h −1<br />

T<br />

X h = ⎜ ⎟ − ⎜ ⎟ ⋅Σhh ⋅ σY . h Σhk<br />

⎝ Σkk<br />

⎠ ⎝Σkh<br />

⎠<br />

⎛<br />

2<br />

σ ⎛<br />

⎞<br />

Y σ<br />

= ⎜ − ⎜ ⎟<br />

⎝ Σ ⎠ ⎝Σ Σ σ Σ Σ Σ ⎠<br />

⎛<br />

2 T<br />

σ ⎞<br />

Y<br />

= / h σY . k / h<br />

⎜ ⎟ .<br />

⎝ Σ ⎠<br />

T<br />

T −1 T −1<br />

⎞ σ<br />

. Yh . ΣhhσYh . σYh . ΣhhΣ<br />

Y k<br />

hk<br />

⎟<br />

−1 −1<br />

kk kh hh Y . h kh hh hk<br />

kk / h<br />

Die Linearkombination zwischen E[X(k)/X(h)] und E[Y/X(h)] hat die Koeffizienten<br />

T<br />

T −1<br />

Yk . / h = Yk . / h kk/<br />

h<br />

β σ Σ<br />

und die maximale Korrelation<br />

ρ<br />

T −1<br />

2 σYk . / hΣkk/ hσYk . / h<br />

Yk . / h =<br />

.<br />

2<br />

σY / h<br />

Dieser Korrelationskoeffizient wird partiell multipler Korrelationskoeffizient genannt.


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

255<br />

Für die Interpretation dieses Korrelationskoeffizienten betrachten wir die folgenden Beziehungen<br />

oder<br />

T −1 2<br />

2 σYk . / hΣkk/ hσYk . / h σY/<br />

X<br />

Yk . / h<br />

2 2<br />

σY / h σY / h<br />

1 − ρ = =<br />

ρ<br />

2<br />

2 /<br />

Yk . / h<br />

2<br />

Y / h<br />

σY<br />

X<br />

= 1 − .<br />

σ<br />

Es gilt 0 ≤ ρ 2 Y.k/h ≤ 1.<br />

Damit wird deutlich, dass der partiell multiple Korrelationskoeffizient ein Maß für die Reduktion<br />

der bedingten Varianz von Y unter der Bedingung X(k) ist, wenn man den Vektor X(h)<br />

zu X(k) hinzu nimmt.<br />

Sind σ 2 Y/X und σ2 Y/h nahezu gleich groß, dann wird der Quotient nahezu gleich 1, d. h. ρ2 Y.k/h<br />

wird sehr klein sein. Andererseits, wenn σ 2 Y/X im Vergleich zu σ2 Y/h sehr klein ist, dann wird<br />

ρ 2 Y.k/h groß sein.<br />

Kleine Werte von ρ 2 Y.k/h bedeuten eine kleine Reduktion der bedingten Varianz von Y unter<br />

X(k) durch Hinzunahme von X(h).<br />

Weitere nützliche Beziehungen in Bezug auf den partiell multiplen Korrelationskoeffizienten<br />

1. Mit var[Y/X(h)] = σ 2 Y (1 – ρ2 Y/h ) und<br />

var[Y/X(k), X(h)] = σ 2 Y (1 – ρ2 Y/X ) erhält man<br />

ρ<br />

2<br />

ρY<br />

=<br />

1 − ρ<br />

2 / X<br />

Yk . / h<br />

.<br />

2<br />

Y / h<br />

2 2 2<br />

Yk . / h Y/ X Y/<br />

h<br />

ρ ρ − ρ<br />

=<br />

2 2<br />

1−<br />

ρ 1−<br />

ρ<br />

Yk . / h Y/<br />

X<br />

2. Den Zusammenhang zwischen den partiellen und multiplen Korrelationskoeffizienten<br />

erkennt man sofort, wenn X (k) und X(h) als einfache Zufallsgrößen angesehen werden.<br />

In diesem Falle wird aus der Matrix Σ kk/h die skalare Größe σ 2 kh und damit<br />

ρ<br />

T −2 2<br />

2 σYk . / h σk/ hσYk . / h σYh . / k<br />

Yk . / h = =<br />

2 2 2<br />

σY / h σY / h⋅<br />

σY / k<br />

.<br />

Wie können Hypothesen bzgl. des partiell multiplen Korrelationskoeffizienten geprüft<br />

werden?<br />

Es soll die Hypothese H 0 : ρ 2 Y.h/k = 0 gegen die Alternative H 1 : ρ 2 Y.h/k ≠ 0 geprüft werden. Hierzu<br />

ist der F-Test anwendbar. Es gilt<br />

2<br />

. /<br />

ˆ RYk h N − p − ( n − p)<br />

F = ⋅<br />

2<br />

1 − R . /<br />

n − p<br />

Yk h<br />

ist F n – p, N – n verteilt.


256 5 Qualität in der Fertigung<br />

Beispiel 5.9.13: Bremsweg eines PKW. Partiell multipler Korrelationskoeffizient<br />

Wir betrachten die Prozessgleichung<br />

Y = 17.1505 + 0.2935 Geschwindigkeit – 3.5605 Profiltiefe<br />

+ 8.516 Reaktionszeit.<br />

Das Maß der Beherrschbarkeit (Quadrat des multiplen Korrelationskoeffizienten) ist<br />

R 2 Y/1, 2, 3 = 0.867 und die Streuung um die Prozessgleichung (bedingte Standardabweichung)<br />

ist s Y/1, 2, 3 = 2.164 (S 2 Y/1, 2, 3 = 4.6828).<br />

Die Frage ist, ob zwei weitere Variable, wie z. B. Rauheit der Straße und Alkoholkonzentration<br />

den multiplen Korrelationskoeffizienten wesentlich vergrößern können. Die Kovarianzmatrix<br />

bei Einbeziehung der zusätzlichen Variablen und mit einer neuen Stichprobe ist<br />

⎛33.540 34.581 −1.878 1.300 −7.441 0.474 ⎞<br />

⎜ 95.479 −0.367 0.617 −6.665 0.863 ⎟<br />

⎜<br />

⎟<br />

⎜<br />

0.5904 0.0389 0.203 0.0127 ⎟<br />

S = ⎜ 0.1477 0.0313 0.04026 ⎟<br />

⎜<br />

⎟<br />

⎜<br />

5.0646 0.0367 ⎟<br />

⎜<br />

⎟<br />

⎝<br />

0.0217 ⎠<br />

Zur Beantwortung der Frage wird der partiell multiple Korrelationskoeffizient berechnet.<br />

Man erhält<br />

⎛S<br />

⎜<br />

⎝S<br />

und damit<br />

T<br />

Yh .<br />

hh<br />

⎛23.935114 32.237561 −0.021682 0.94003 ⎞<br />

⎞<br />

⎜<br />

⎟<br />

−1<br />

47.516117 0.210268 1.660873<br />

⎟ ⋅Shh ⋅ ( Sy.<br />

h Shk<br />

) = ⎜<br />

⎟<br />

⎠<br />

⎜<br />

0.014019 0.022227⎟<br />

⎜<br />

⎝<br />

0.074965⎟<br />

⎠<br />

⎛9.6048 2.3434 −1.8563 0.35997⎞<br />

⎛<br />

2 T<br />

S ⎞ ⎜ 47.9629 −0.5773 −1.0439<br />

⎟<br />

Y / h SY. k/<br />

h<br />

⎜<br />

⎟ = ⎜<br />

⎟<br />

⎝ S / ⎠ ⎜<br />

0.5764 0.01667<br />

kk h<br />

⎟<br />

⎜<br />

⎝<br />

0.07273⎟<br />

⎠<br />

Mit diesen Werten erhält man die Maximum Likelihood Schätzung für den partiell multiplen<br />

Korrelationskoeffizienten<br />

T −1<br />

2 SYk . / h⋅<br />

Skk/ h⋅SYk . / h<br />

Yk h<br />

SY h<br />

9.583<br />

R . / = = = 0.997.<br />

2<br />

/<br />

9.605<br />

Für die Prüfung der Hypothese H 0 : ρ 2 Y.k/h = 0 gegen die Alternative H 1 : ρ2 Y.k/h ≠ 0 wird der<br />

F-Test verwendet. Man berechnet<br />

2<br />

. /<br />

ˆ ρYk h N − p − ( n − p) 0.997 140 − 3 − 2<br />

F = ⋅ = ⋅ = 2243<br />

2<br />

1 − ρ . /<br />

n − p 1 − 0.997 2<br />

Yk h


5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />

257<br />

Hieraus folgt schon – auch ohne den Tafelwert nach zu schlagen –, dass dieser Wert statistisch<br />

gesichert von null verschieden ist, d. h. dass die beiden Parameter Rauheit der Strasse und<br />

Alkoholkonzentration im Blut das Maß der Beherrschbarkeit wesentlich vergrößern.<br />

Die vollständige Prozessgleichung ist<br />

Y = 27.362 + 0.1939 Geschwindigkeit – 3.272 Profiltiefe<br />

+ 8.4829 Reaktionszeit – 1.151 Rauheit + 2.265 Alkoholkonzentration<br />

Das Maß der Beherrschbarkeit ist R 2 Y/X = 0.999 und die Streuung um die Prozessgleichung<br />

ist S Y/X = 0.11677 (S 2 Y/X = 0.01363).<br />

Welche Aussagen sind mit dem multivariaten, multiplen Korrelationskoeffizient möglich?<br />

Häufig wird eine Maßzahl zur Bewertung der Abhängigkeit zwischen zwei zufälligen Vektoren<br />

gesucht, wie z. B. bei der multivariaten, multiplen Regressionsanalyse mit stochastischen Input-<br />

und Prozessvariablen.<br />

Der multivariate, multiple Korrelationskoeffizient wird über die Formel<br />

τ<br />

2<br />

Y/ X 1<br />

= −<br />

Σ<br />

YY / X<br />

Σ<br />

XX<br />

definiert. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit z. B. zwischen dem zufälligen<br />

Vektor Y und E(Y/X).<br />

Für m = 1 ist τ 2 Y/X identisch mit dem multiplen Korrelationskoeffizienten ρ2 Y/X .<br />

Bemerkungen<br />

1. Ein weiteres Maß für die lineare Abhängigkeit zwischen zwei zufälligen Vektoren ist die<br />

Spurkorrelation nach Anderson [1984] und Höschel [1974, 1976], die über<br />

V<br />

durch<br />

−1 −1<br />

YX = ΣYY ⋅ΣY . X ⋅ΣXX ⋅ΣX.<br />

Y<br />

−1<br />

= m − Sp ( Σyy<br />

⋅Σyy / x )<br />

Sp ( )<br />

2 VYX<br />

ηY<br />

/ X=<br />

min( mn , )<br />

definiert wird.<br />

2. Zusammenhang zwischen den multivariaten, multiplen und kanonischen Korrelationskoeffizienten<br />

κ. Es gilt<br />

2 2 2<br />

Y / X 1 min( m, n)<br />

1 − τ = (1 − κ ) ⋅…<br />

⋅[1 − κ ].<br />

Die kanonischen Korrelationskoeffizienten werden am einfachsten aus den nicht negativen<br />

−1 −1<br />

Eigenwerten von Σ ⋅Σ ⋅Σ ⋅Σ berechnet.<br />

YY Y . X XX X.<br />

Y


258 5 Qualität in der Fertigung<br />

5.9.6 Was besagen der multivariat partiell-multiple und der multivariat<br />

semipartiell-multiple Korrelationskoeffizient?<br />

Die Berechnung von Pro zessgleichungen im Rahmen des multivariaten, multiplen linearen<br />

Modells wird mit der Auswahl der wesentlichen Input- und Prozessvariablen gekoppelt.<br />

Hieraus folgt aber, dass wir Korrelationskoeffizienten für die Beurteilung der<br />

Abhängigkeiten nach der Zerlegung des zufälligen Vektors der Produkt- und Input- und<br />

Prozessvariablen in Z T = (Y T , X(k) T , X(h) T ) für die bedingten Erwartungswerte E[X(h)/X(k)]<br />

−1<br />

T<br />

= Σhk . ⋅Σkk ⋅ Xk () = : β Y/<br />

X ⋅ Xk () mit var[X(h)/X(k)] = Σ hh/k benötigen. Bezeichnen wir die<br />

Fehlermatrizen mit<br />

und<br />

E [ F ⋅ F ] = Σ<br />

Y / k h/ k Y. h/<br />

k<br />

−1<br />

Y / k h/ k = ΣY. h/ k⋅Σhh⋅<br />

h/<br />

k<br />

E [ F / F ]<br />

F<br />

T −1<br />

Y / k Fh/ k = ΣYY / k−<br />

ΣY. h/ kΣhh/ kΣY. h/<br />

k<br />

var [ F / ]<br />

dann können wir den multivariaten partiell-multiplen Korrelationskoeffizienten in der folgenden<br />

Form<br />

Σ<br />

2 = − /( , ) Σ<br />

τ<br />

= −<br />

/<br />

Yh 1 1<br />

. / k<br />

ΣYY / k Σ /<br />

YY k h YY X<br />

YY k<br />

definieren.<br />

Dieser Korrelationskoeffizient misst den Grad der linearen Abhängigkeit zwischen den bedingten<br />

Erwartungswerten E[Y/X] und E[Y/X(k)].<br />

Für jede Produktvariable Y r , r = 1, …, m kann man aufgrund der Darstellung für τ 2 Y.h/k die<br />

Beziehung<br />

τ<br />

σ 2 2 −<br />

2 Red , ( )<br />

Y X σr k σ<br />

rph<br />

r X<br />

= ρr h k= 1 − = =<br />

σ σ σ<br />

2 2 / / /<br />

Yr<br />

. h/ k . / 2 2 2<br />

Y / k r/ k r/<br />

k<br />

aufschreiben, die besagt, dass Hypothesen über die Red p (h) bzw. Red r, p (h) des Abschnittes 5.9.2<br />

mit den partiell-multiplen Korrelationskoeffizienten geprüft werden können.<br />

Aus ρ 2 r.h/k = 0 folgt mit Wahrscheinlichkeit 1, dass die Streichung der Input- und Prozessvariablen<br />

in X(h) keine Vergrößerung der bedingten Varianz σ 2 Y/X zur Folge hat. In diesem Fall<br />

muss gelten, sowohl Σ hk = 0 als auch σ r.h = 0.<br />

Aus ρ 2 r.h/k = 1 folgt mit Wahrscheinlichkeit 1, dass X(h) eine lineare Funktion von X(k) ist.<br />

Für die Zerlegung des Vektors der Input- und Prozessvariablen in X(k) und X(h) gilt für den<br />

partiell-multiplen Korrelationskoeffizienten<br />

2 2 2 2 2 2<br />

r/ X r/ k rh . / k r r/ k rh . / k<br />

σ = σ ⋅(1 − ρ ) = σ ⋅(1 − ρ ) ⋅(1 − ρ ).<br />

Dieser interessante Zusammenhang lässt sich auf den multivariaten Fall übertragen.<br />

Für die Zerlegung des Vektors der Produktvariablen Y in Y(s) und Y(t) mit<br />

s = (s 1 , …, s q ), s 1 < … < s q und<br />

t = (t 1 , …, t m – q ), t 1 < … < t m – q gilt


5.10 Was ist eine Prozessgleichung und wozu benötigt man diese?<br />

259<br />

2 2 2<br />

Y / X s/ X t. X/<br />

s<br />

1 − τ = (1 − τ ) ⋅(1 − τ )<br />

und für die Zerlegung von X in X(k) und X(h) gilt<br />

2 2 2<br />

Y / X Y. h/ k Y / k<br />

1 − τ = (1 − τ ) ⋅(1 − τ ).<br />

In analoger Weise kann der multivariate semi partielle Korrelationskoeffizient<br />

τ<br />

2<br />

Y .( h / k ) 1<br />

gebildet werden.<br />

= −<br />

Σ<br />

YY /( k, h)<br />

Σ<br />

YY<br />

5.10 Was ist eine Prozessgleichung und wozu benötigt man<br />

diese?<br />

Wie wir schon wiederholt feststellten, ist jedes Produkt (materielles Produkt oder Dienstleistung)<br />

das Ergebnis eines (Herstellungs- oder Dienstleistungs-) Prozesses. Jedes Produkt wird<br />

durch m, m ≥ 1 nicht unabhängige Produktvariable beschrieben. Der Kunde, der ein Produkt<br />

kaufen möchte, stellt seine Anforderungen an das Produkt. Diese Anforderungen werden in<br />

einem Kundenanforderungsprofil (KAP) zusammen gestellt. Das KAP wird parametrisiert und<br />

durch Sollwerte und Toleranzgrenzen für alle relevanten Produktvariable spezifiziert.<br />

Ein Prozess wird durch die Input-, Prozessvariablen X als Ursachen und die Produktvariablen<br />

Y als Wirkungen beschrieben. Eine Veränderung der Produktvariablen kann nach dem Ursache-Wirkungs-Prinzip<br />

nur durch die Veränderung der Input- und/oder Prozessvariablen<br />

erreicht werden. Die Veränderungen durch die Störvariablen (noise variables) sind zufällig<br />

und nicht steuerbar, müssen aber trotz alledem berücksichtigt werden, denn deren Einfluss<br />

kann erheblich sein.<br />

Damit die Kundenanforderungen durch die gefertigten Produkte auch wirklich erfüllt werden,<br />

muss der Prozess gesteuert werden. Dazu benötigen wir die Prozessgleichung. In die können<br />

wir Werte für die Input- und Prozessvariable einsetzen und damit die Werte für die Produktvariable<br />

(oder Produktvariablen) berechnen.<br />

Definition der Prozessgleichung<br />

Die Prozessgleichung ist eine Funktion, die den Input- Z und Prozessvariablen X die Produktvariablen<br />

Y zuordnet, sodass eine Steuerung des Prozesses möglich ist.<br />

Die Funktion ist in der Regel unbekannt. Es sind kaum Gesetze bekannt, nach denen die Prozessgleichung<br />

gefunden werden kann. Daher muss die Funktion statistisch bestimmt werden.<br />

Dazu benötigt man möglichst fehlerfreie, vollständige, zuordenbare Messwertsätze in ausreichender<br />

Anzahl für die Input-, Prozess- und Produktvariablen.<br />

Die Input- und Produktvariablen sind dabei in der Regel zufällige Vektoren, denn die Inputvariablen<br />

sind nach Abschnitt 5.5 die Produktvariablen der Produkte von Vorläuferprozessen.<br />

Produktvariable sind zufällige Vektoren, da in jedem Prozess zufällige Komponenten wirken,<br />

deren Beitrag sich auf die Werte der Produktvariablen auswirkt.


260 5 Qualität in der Fertigung<br />

Die Prozessvariablen können zufällig oder determiniert sein. Häufig wirken aber auch die determinierten<br />

Einstellvariablen zufällig auf das Produkt. Diese Voraussetzung bedingt, dass für<br />

die Berechnung der Prozessgleichung gewisse Verteilungsvoraussetzungen benötigt werden.<br />

Beispiel 5.10.1: Brennen von Porzellan. Technologie<br />

Porzellan wird aus Kaolin, Quarz und Feldspat hergestellt. Die aus der Porzellanmasse<br />

geformten Gegenstände werden zuerst in einem Glühbrand von 900 [°C] gesintert, wobei<br />

der Scherben entsteht. Nach dem Verglühen wird der Scherben glasiert und dem Gar- oder<br />

Glattbrennen von 1400 – 1500 [°C] unterworfen. Der Quarz und Feldspat geraten bei der<br />

hohen Temperatur in Fluss und füllen das Gerippe von Kaolin vollständig aus.<br />

Der Brennofen wird auf 900 [°C] oder 1400 [°C] hoch geheizt. Dass Brenngut wird in<br />

Regale einsortiert und eingeschoben. An jeder Stelle des Regals wirkt eine klein wenig<br />

unterschiedliche Temperatur, d. h. trotz der festen Einstellung des Ofens wirken auf die zu<br />

brennenden Gegenstände verschiedene Temperaturen.<br />

Wie kann man eine Prozessgleichung gewinnen?<br />

In der Antwort zu dieser Frage werden Methoden zur Prüfung der Homogenität und zur<br />

Klassifikation der inhomogenen Stichprobe in homogene Teilstichproben, zur Berechnung<br />

der Prozessgleichung und zur Auswahl der wesentlichen Input- und Prozessvariablen bereit<br />

gestellt.<br />

Um die Verbindung zur klassischen Literatur über die Regressionsanalyse herzustellen, betrachten<br />

wir zunächst den klassischen Fall, bei dem angenommen wird, dass nur Y eine Zufallsgröße<br />

oder ein zufälligen Vektor ist und erweitern diesen dann auf den praktikablen Fall, in dem<br />

sowohl die Input-, Prozess- und Produktvariable zufällige Vektoren sind.<br />

5.11 Modelle für die Prozessgleichung<br />

5.11.1 Nur die Produktvariable Y ist zufällig<br />

Wir wollen annehmen, dass Y ~ N m (µ Y , Σ YY ). Die Input- und Prozessvariablen, wir fassen diese<br />

zu dem Vektor x zusammen, sind determiniert. Die funktionale Darstellung der Produktvariable<br />

Y durch die determinierten Input- und Prozessvariablen<br />

Y = f (x) + ε<br />

bezeichnen wir als Prozessgleichung. Wir können dafür auch schreiben,<br />

Y ~ N m (f (x), Σ YY ).<br />

Da x ein Vektor fester Einstellgrößen für die Input- und Prozessvariablen ist, wird das Modell<br />

multivariates lineares Modell mit festen Input- und Prozessvariablen genannt. Ist X ein zufälliger<br />

Vektor von Input- und Prozessvariablen und sind Y und X gemeinsam nach einer n + m<br />

dimensionalen Normalverteilung verteilt, dann wird das Modell multivariates lineares multiples<br />

Modell mit stochastischen Input- und Prozessvariablen genannt. Wir beginnen mit dem Modell<br />

mit determinierten Input- und Prozessvariablen, da dieses aus der Literatur bek annt ist.


5.11 Modelle für die Prozessgleichung<br />

261<br />

Den Vektor der Input- und Prozessvariablen bezeichnen wir mit x, den Vektor der Produktvariablen<br />

mit Y. Um das Ursache-Wirkungs-Prinzip auch in diesem Falle zu betonen, schreiben<br />

wir anstelle der Y auch Y = Y(x 1 , …, x n ).<br />

Das multivariate lineare Modell mit festen Input- und Prozessvariablen wird wie folgt geschrieben<br />

Y(x 1 , …, x n ) = f (x 1 , …, x n ) + ε,<br />

wobei<br />

f (x 1 , …, x n ) ist eine lineare Funktion,<br />

E[Y(x 1 , …, x n )] = f (x 1 , …, x n ),<br />

ε ∼ N μ (0, Σ), Σ ist positiv definit und<br />

f (x 1 , …, x n ) und ε sind unabhängig voneinander. Die Kovarianzmatrix Σ, kann zwei grundsätzliche<br />

verschiedene Strukturen haben. Beim klassischen linearen Modell gilt<br />

var(ε) = σ 2 I N , d. h. var(ε i ) = σ 2 und cov(ε i , ε k ) = 0 für i ≠ k.<br />

Für das allgemeine lineare Modell gilt<br />

var(ε) = σ 2 Σ YY .<br />

Σ YY wird manchmal als bekannt vorausgesetzt, kann aber auch unbekannte Modellparameter<br />

enthalten. σ 2 ist in jedem Fall ein unbekannter Modellparameter. Die Eigenschaft gleicher<br />

Varianz σ 2 der Fehlervariablen ε i , i = 1, …, N wird als Homoskedastizität bezeichnet.<br />

Manchmal ist Σ diago nal, aber ≠ I N , so nennt man diesen Fakt Heteroskedastizität. Im Fall von<br />

Zeitreihendaten ist die Voraussetzung cov(ε i , ε k ) = 0 für i ≠ k, d. h. der Unkorreliertheit der Fehlervariablen<br />

verletzt. In Kurzschrift können wir hierfür auch schreiben Y ~ N m (f (x 1 , …, x n ), Σ)<br />

mit den Eigenschaften der positiven Definitheit von Σ und der Unabhängigkeit von Fehler<br />

und linearer Funktion.<br />

Die statistischen Aufgaben sind in diesem Fall die<br />

•<br />

•<br />

•<br />

Bestimmung der linearen Funktion f (x 1 , …, x n ),<br />

Berechnung des Maßes der Beherrschbarkeit des Prozesses durch die ausgewählten Inputund<br />

Prozessvariablen,<br />

Beantwortung der Frage, ob das berechnete Maß der Beherrschbarkeit auch mit weniger Input-<br />

und Prozessvariablen erreicht werden kann, d. h. Auswahl der optimalen Teilmenge von<br />

wesentlichen Input- und Prozessvariablen und Streichung der redundanten Variablen.<br />

Das lineare Modell mit festen Input- und Prozessvariablen kann nun durch<br />

•<br />

•<br />

Varianzanalysen oder<br />

Regressionsanalysen<br />

realisiert werden. Das Unterscheidungskriterium zwischen diesen beiden Modelltypen ist die<br />

Messbarkeit der Input- und Prozessvariablen. Sind x 1 , …, x n nur qualitativ messbar, d. h. lassen<br />

sich hierfür Abstufungen angeben, dann ist die Varianzanalyse der passende Modelltyp.<br />

Die Input- und Prozessvariablen sind feste Einstellgrößen, d. h. x 1 , x 2 , …, x n ∈ R n . Die m, m ≥ 1<br />

Produktvariablen Y 1 , Y 2 , …, Y m sind Zufallsgrößen und Funktionen der determinierten Inputund<br />

Prozessvariablen. Auch dieser Sachverhalt wird in Verbindung mit einer Verteilungsannahme


262 5 Qualität in der Fertigung<br />

Y ∼ N ( B x, Σ ),<br />

m<br />

Yx .<br />

YY<br />

dargestellt, wobei B Y.x die Matrix der unbekannten Koeffizienten der Prozessgleichungen ist,<br />

die den Vektor der Produktvariablen Y T = (Y 1 … Y m ) als Linearkombination von den Inputund<br />

Prozessvariablen x T = (x 1 … x n ) darstellt. Σ YY ist die Kovarianzmatrix des Vektors der<br />

Produktvariablen.<br />

Die Normalverteilungsannahme ist oft gerechtfertigt und wird genau so oft, zumindest von<br />

Kritikern infrage gestellt. Unter den hier formulierten Voraussetzungen ist sowohl der lineare<br />

als auch nichtlineare Modellansatz möglich.<br />

Bei all diesen höher dimensionalen Problemen sollte die statistische Prozessanalyse zunächst<br />

mit linearen Modellen begonnen werden. Sind die Maße der Beherrschbarkeit niedrig und<br />

können nicht durch zusätzliche Input- und/oder Prozessvariable vergrößert werden, dann<br />

kann man zu den nichtlinearen Modellen übergehen.<br />

Die Stichprobe<br />

T T<br />

1 = 11 … 1n<br />

Y Y ( x , , x )<br />

…<br />

T T<br />

N = N1<br />

… Nn<br />

Y Y ( x , , x )<br />

an den N Messwertstellen für die Input- und Prozessvariablen<br />

⎛ x<br />

⎜<br />

⎜<br />

⎝x<br />

…<br />

…<br />

…<br />

11 1n<br />

N1<br />

x<br />

x<br />

Nn<br />

und die Darstellung<br />

Y = f( x ,…, x ) + ε , ∀ i = 1, …,<br />

N<br />

⎞<br />

⎟<br />

⎟<br />

⎠<br />

i i1<br />

in i<br />

sind Grundlagen für die Berechnung der Prozessgleichung mit festen Input- und Prozessvariablen.<br />

Es wird noch vorausgesetzt, dass<br />

E [ εi] = 0<br />

var ( ε ) = Σ<br />

i<br />

Des weiteren wird angenommen, daß f (x 1 , …, x n ) von den unbekannten Modellparametern<br />

β Y.1 , …, β Y.n abhängen möge. Es gibt folglich eine Funktionenschar<br />

̃ nm ⋅<br />

f ( x ,…, x ; β ,…, β ), mit ( β ,…, β ) ∈ R ,<br />

1 n Y.1 Y. n Y.1 Y.<br />

n<br />

die die unbekannte Funktion enthält. Für die Ableitung von Schätzfunktionen für die unbekannten<br />

Modellparameter wollen wir voraussetzen, daß die Funktion ̃f nur linear von den<br />

unbekannten Koeffizienten abhängt, d. h.<br />

f̃ ( x , … , x ; β , … , β ) = β ⋅ g ( x , … , x ) + … + β ⋅ g ( x , … , x )<br />

1 n Y.1 Y. n Y.1 1 n Y.<br />

n 1 n<br />

wobei g(x 1 , …, x n ) bekannte linear unabhängige Funktionen sind. Diese Gleichung nennen<br />

wir Prozessgleichung, wenn x T = (x 1 , …, x n ) der Vektor der determinierten Input- und Prozessvariablen<br />

ist.


5.11 Modelle für die Prozessgleichung<br />

263<br />

5.11.1.1 Was versteht man unter einem univariaten, linearen, multiplen Modell<br />

mit festen Input- und Prozessvariablen ?<br />

Dieses Modell besitzt die Darstellung<br />

T<br />

Yx . .<br />

Y = β ⋅ x + ε<br />

In diesem Modell ist Y eine nach Y ~ N 1 (β T Y…x x, σ2 ) verteilte Zufallsgröße, x T = (x 1 , …, x n )<br />

der Vektor der festen Input- und Prozessvariablen und ε der Anpassungsfehler Y – β T Y…x x mit<br />

der Verteilung ε ~ N 1 (0, σ 2 ). Y und ε sind unabhängig voneinander verteilt. Das dazugehörige<br />

statistische univariate, lineare, multiple Modell mit festen Input- und Prozessvariablen ist<br />

wobei<br />

Y<br />

Y<br />

T<br />

Yx .<br />

= β ⋅ x + ε<br />

⎛Y1 ⎞ ⎛ x11 … x1N<br />

⎞<br />

= ⎜…<br />

⎟ und x = ⎜ … ⎟<br />

⎜ ⎟ ⎜ ⎟<br />

⎝Y ⎠ ⎝x … x ⎠<br />

N N1<br />

Nn<br />

die Stichproben vom Umfang N für die Produktvariable Y und den Vektor der determinierten<br />

Input- und Prozessvariablen sind. In der Schreibweise mit der Verteilung gilt für dieses Modell<br />

T<br />

2 2<br />

N Y.<br />

x N N N<br />

Y ∼ N ( β ⋅ x, σ ⋅ I ) und ε ~ N (0, σ ⋅ I )<br />

wobei I N die N dimensionale Einheitsmatrix ist.<br />

Was müssen wir weiter tun?<br />

Wir müssen mit der Stichprobe für Y und x die unbekannten Modellparameter für das multivariate,<br />

lineare, multiple Modell mit festen Input- und Prozessvariablen schätzen. Hierzu verwenden<br />

wir die bekannte Methode der kleinsten Quadrate, die von Gauß eingeführt wurde. Diese<br />

Methode wollen wir an dem vereinfachten Beispiel 5.11.1 demonstrieren. Vereinfacht bedeutet,<br />

dass wir nur die eine Prozessvariable Geschwindigkeit betrachten und hierfür annehmen, dass<br />

diese Variable fest ist. Die Festlegung kann realisiert werden, idem wir die Geschwindigkeiten<br />

vorgeben und nach dem plötzlichen Bremsen die Länge des Bremsweges messen.<br />

Beispiel 5.11.1: Bremsweg. Einfache Prozessgleichung<br />

Wir betrachten nur die Abhängigkeit des Bremsweges Y [m] von der vorgegebenen Geschwindigkeit<br />

x [km/h]. In diesem einfachsten Fall erhalten wir das einfache lineare Modell<br />

mit einer festen Prozessvariablen<br />

Y = β Y. x x + ε.<br />

Wir wollen annehmen, dass ε ~ N (0, σ 2 ). Die beiden Modellparameter β Y.x und σ 2 sind<br />

unbekannt. Für deren Bestimmung wird eine Stichprobe für die beiden Produkt- und Prozessvariablen<br />

vom Umfang N benötigt. Um das Nachrechnen zu ermöglichen, betrachten<br />

wir nur die kleine Stichprobe in der Tabelle 5.11.1, die auch in der Datei 052Bremsweg03<br />

auf der beiliegenden CD enthalten ist.


264 5 Qualität in der Fertigung<br />

Tabelle 5.11.1: Messwerte für das Bremswegbeispiel<br />

Nr. Y x<br />

1 35,1 58,0<br />

2 34,1 55,6<br />

3 39,5 60,4<br />

4 36,9 59,8<br />

5 34,1 58,4<br />

6 34,4 58,7<br />

7 30,7 56,3<br />

8 30,3 52,5<br />

9 33,9 54,4<br />

10 49,7 70,5<br />

Zuerst werden die statistischen Maßzahlen berechnet. Man erhält die Werte:<br />

Tabelle 5.11.2: Statistische Maßzahlen für das Bremswegbeispiel<br />

Statistische Maßzahl Y X<br />

Mittelwert 35,87 58,46<br />

Standardabweichung 5,539 4,895<br />

Minimum 30,3 52,5<br />

Maximum 49,7 70,5<br />

Spannweite 19,4 18<br />

Variationskoeffizient 15,4 8,4<br />

Die statistischen Maßzahlen verraten nichts über die Abhängigkeit des Bremsweges von der<br />

Geschwindigkeit, obwohl die natürlich gegeben ist. Das lehrt die Erfahrung und zeigt die<br />

Abbildung 5.11.1. Diese Abbildung zeigt uns auch, dass die Abhängigkeit zwischen diesen<br />

beiden Variablen linear ist.<br />

Für das Bremswegbeispiel erhalten wir die Punktwolke der Abbildung 5.11.1.<br />

Plot Bremsweg über der Geschwindigkeit<br />

50<br />

Bremsweg<br />

46<br />

42<br />

38<br />

34<br />

30<br />

52 56 60 64 68 72<br />

Geschwindigkeit<br />

Abb. 5.11.1: Punktwolke für das Bremswegbeispiel<br />

Was ist in dieser Situation zu tun? Wir denken uns eine Gerade Y = b 0 + b Y.x x durch die<br />

„Punktwolke“ gelegt und fragen, wie die unbekannten Koeffizienten der Gleichung aus den<br />

Messwertepaaren für die beiden Variablen bestimmen werden können.


5.11 Modelle für die Prozessgleichung<br />

265<br />

Das plausibelste Prinzip hierfür ist, den Abstand der einzelnen Punkte von der gedachten<br />

Gerade zu minimieren. Hierbei ist darauf zu achten, dass die Summe der Abstände oberhalb<br />

der Geraden genauso groß ist, wie die Summe der Abstände unterhalb der Geraden.<br />

Für diese Lösung betrachten wir die Quadrate der Abstände der Punkte von der Geraden.<br />

Der quadratische Abstand eines Punktes i mit den Koordinaten (x i , y i ), i = 1, …, N von<br />

der gedachten Geraden<br />

yˆ<br />

= b + b x<br />

0 yx .<br />

2<br />

i<br />

ist ( yˆ<br />

− y ) . Die Summe der quadratischen Abstände aller Punkte von der gedachten<br />

Ausgleichsgeraden ist<br />

N<br />

N<br />

2 2<br />

∑ yi − yˆ<br />

= ∑ yi − b0 + by.<br />

xx<br />

i= 1 i=<br />

1<br />

( ) [ ( )] .<br />

Diese Summe soll minimiert werden. Für diese Aufgabe sind die Methoden der Differentialrechnung<br />

zu verwenden. Es müssen zunächst die partiellen Ableitungen der Summe der<br />

quadratischen Abweichungen gebildet und dann null gesetzt werden. Das so entstehende<br />

Gleichungssystem ist zu lösen. Formelmäßig erhält man<br />

N<br />

N<br />

2 2<br />

∑ i<br />

ˆ ∑ i 0 y.<br />

x<br />

i= 1 i=<br />

1<br />

QS = ( y − y) = ( y − b − b x) ⇒ Min!<br />

N<br />

∂QS<br />

=−2 ⋅∑ ( yi<br />

−b0 −by.<br />

x x)<br />

∂b<br />

0 i=<br />

1<br />

N<br />

∂QS<br />

=−2 ⋅∑ ( yi<br />

−b0 −by.<br />

x x)<br />

⋅x<br />

∂b<br />

yx . i = 1<br />

d. h. man muss das Gleichungssystem<br />

N<br />

∑ i 0 y.<br />

x<br />

i=<br />

1<br />

( y − b − b x) = 0<br />

N<br />

∑ i 0 y.<br />

x<br />

i=<br />

1<br />

( y − b − b x) ⋅ x = 0<br />

lösen.<br />

Das Gleichungssystem kann man umformen zu<br />

N<br />

∑<br />

∑<br />

y = N ⋅ b + b ⋅ x<br />

i 0 y.<br />

x i<br />

i= 1 i=<br />

1<br />

N N N<br />

∑x ⋅ y = b ⋅ ∑x + b ⋅∑x<br />

2<br />

i i 0 i y.<br />

x i<br />

i= 1 i= 1 i=<br />

1<br />

N<br />

Dieses Gleichungssystem nennt man Normal Gleichungs System (NGS) für die unbekannten<br />

Koeffizienten b 0 und b y.x der linearen Gleichung und die bekannten Ausdrücke


266 5 Qualität in der Fertigung<br />

N<br />

N<br />

∑x<br />

∑x<br />

2<br />

i<br />

und .<br />

i<br />

i= 1 i=<br />

1<br />

Dieses einfache NGS löst man am schnellsten mit der Kramer’schen Regel (siehe Bronstein<br />

[1960]).<br />

Die Koeffizientendeterminante des NGS ist<br />

D =<br />

N<br />

N<br />

∑<br />

x<br />

N<br />

∑<br />

i<br />

i=<br />

1<br />

N<br />

∑<br />

i<br />

i= 1 i=<br />

1<br />

x<br />

x<br />

2<br />

i<br />

D 0 ist die Determinante, die sich aus D ergibt, wenn man in dieser die Spalte der Koeffizienten<br />

für das unbekannte b 0 durch die Spalte der Absolutglieder<br />

ersetzt, d. h.<br />

N<br />

∑<br />

i=<br />

1<br />

y und<br />

i<br />

N<br />

∑<br />

i<br />

i=<br />

1<br />

x ⋅ y<br />

i<br />

D<br />

0<br />

=<br />

N<br />

∑<br />

y<br />

N<br />

∑<br />

x<br />

i<br />

i<br />

i= 1 i=<br />

1<br />

N<br />

N<br />

2<br />

∑xi ⋅ yi ∑xi<br />

i= 1 i=<br />

1<br />

Analog erhält man<br />

D<br />

N<br />

∑<br />

i=<br />

1<br />

yx . =<br />

N N<br />

∑<br />

∑<br />

N<br />

y<br />

x x ⋅ y<br />

i i i<br />

i= 1 i=<br />

1<br />

i<br />

.<br />

Damit erhält man für b y.x den Ausdruck<br />

b<br />

N N N<br />

∑ ∑ ∑<br />

N ⋅ x ⋅ y − y ⋅ x<br />

i i i i<br />

Dyx<br />

. A<br />

i= 1 i= 1 i=<br />

1<br />

xy .<br />

yx . = = =<br />

2<br />

D ⎛<br />

N<br />

⎞ A ⋅<br />

2<br />

x Ay<br />

N ⋅∑xi<br />

− ⎜ ∑xi<br />

⎝ ⎟<br />

i=<br />

1 ⎠<br />

Mit den Daten aus obiger Tabelle erhält man die Matrix<br />

.<br />

A<br />

⎛2156.44 2324.68⎞<br />

= ⎜<br />

⎝ 2761.61 ⎟<br />

⎠<br />

und damit<br />

b yx .<br />

2324.68<br />

= = 1.078.<br />

2156.44


5.11 Modelle für die Prozessgleichung<br />

267<br />

b 0 kann man wie folgt berechnen:<br />

b0 = y − byx<br />

. ⋅ x = 35.87 −1.078 ⋅ 58.46 = −27.15<br />

.<br />

Damit lautet die Prozessgleichung für die Länge des Bremsweges in Abhängigkeit von der<br />

Geschwindigkeit<br />

yˆ =− 27.15 + 1.078 ⋅x.<br />

Für den Korrelationskoeffizienten erhält man den Wert<br />

r xy<br />

2324.68<br />

= = 0.952.<br />

2156.44 ⋅ 2761.61<br />

Zur Prüfung der Hypothese, ob der Bremsweg unabhängig von der gefahrenen Geschwindigkeit<br />

ist, muss der t-Test berechnet werden. Man erhält<br />

0.95<br />

tˆ = 8 = 8.6.<br />

2<br />

1−<br />

0.95<br />

Der Tafelwert t α, FG für die Irrtumswahrscheinlichkeit α = 0.05 und 8 FG ist 1.859, d. h.<br />

die aufgestellte Hypothese der Unabhängigkeit muss verworfen werden. Die Länge des<br />

Bremsweges ist abhängig von der gefahrenen Geschwindigkeit.<br />

Die Stichprobenvarianz der einzelnen Messwerte um die Prozessgleichung, d. h. die Restvarianz<br />

kann man wie folgt berechnen:<br />

2<br />

N<br />

= ⋅ ∑ − 2 N<br />

1<br />

−<br />

= 1<br />

/ ⋅ ∑ − 0 − . ⋅ 2<br />

y x i<br />

ˆi i y x<br />

N 2<br />

i= 1<br />

N − 2<br />

i=<br />

1<br />

s ( y y ) ( y b b x ) .<br />

Diese Art der Berechnung ist sehr aufwendig. Daher rechnet man die obige Formel um<br />

und erhält<br />

2 2 2<br />

Y / x y y/<br />

x<br />

s = s ⋅(1 − r ),<br />

wobei r Y/x der einfache Korrelationskoeffizient zwischen der Produktvariable Y und der<br />

Prozessvariable x ist. Nach dieser Formel erhält man die bedingte Stichprobenvarianz<br />

s 2 Y/x = 2.99 bzw. die bedingte Standardabweichung s Y/x = 1.73.<br />

5.11.1.2 Multivariates, multiples lineares Modell mit determinierten Input- und<br />

Prozessvariablen; Y ist ein zufälliger Vektor<br />

Anstelle der einen Produk tvariablen Y müssen wir dem Vektor der m, m ≥ 1 nicht unabhängigen<br />

Produktvariablen Y T = (Y 1 , …, Y m ) betrachten. Mit den Abkürzungen<br />

⎛Y<br />

⎞ ⎛ ⎞<br />

⎛ ⎞<br />

⎛ ⎞<br />

Y = ⎜… ⎟ = ⎜ … ⎟ = … ∈ = ⎜ … ⎟<br />

⎜ ⎟ ⎜ ⎟ ⎜ ⎟<br />

⎝Y<br />

⎠ ⎝ ⎠ ⎝ ⎠<br />

lautet dieses Modell<br />

T<br />

1 βY1.1 … β β<br />

Y1. n Y1.<br />

x<br />

εY1<br />

⎜ ⎟<br />

m×<br />

n<br />

, ΒYx<br />

.<br />

⎜ ⎟ Μ und ε<br />

T<br />

m βYm.1 … β ⎜ ⎟<br />

Ym.<br />

n β<br />

ε<br />

⎝<br />

Ym<br />

Ym.<br />

x ⎠<br />

Y<br />

T<br />

Yx .<br />

= Β ⋅ x + ε


268 5 Qualität in der Fertigung<br />

wobei<br />

Y ~ N m (Β T Y.x x, Σ εε )<br />

ε ~ N m (0, Σ εε ),<br />

Σ<br />

εε<br />

2<br />

⎛ var( ε1) … cov( ε1, εm)<br />

⎞ ⎛ σ1 … σ ⎞<br />

1m<br />

⎜<br />

⎟<br />

= ⎜<br />

…<br />

⎟ = ⎜<br />

… .<br />

⎜<br />

⎟<br />

⎟<br />

⎝cov( ε , ε ) … var( ε ) ⎠ ⎜<br />

⎝σ σ ⎟<br />

⎠<br />

2<br />

m 1 m m1<br />

… m<br />

Y und ε sind unabhängig voneinander. In diesem Modell sind die Modellparameter Β Y.x und<br />

Σ εε unbekannt und müssen mit den Werten einer Stichprobe geschätzt werden.<br />

Das statistische Modell ist gegeben durch<br />

wobei gilt<br />

Y = Β T Y.x x + ε,<br />

⎛Y11 … Y1 N ⎞ ⎛ x11 … x1n<br />

⎞<br />

Y = ⎜ … ⎟, x = ⎜ … ⎟ die Stichprobe und<br />

⎜ ⎟ ⎜ ⎟<br />

⎝Ym1 … YmN ⎠ ⎝xN1<br />

… xNn⎠<br />

⎛ ε11 … ε1N<br />

⎞<br />

ε = ⎜ … ⎟<br />

⎜ ⎟<br />

⎝η<br />

… ε ⎠<br />

m1<br />

In diesem Modell ist<br />

mN<br />

Y ~ N N (Β Y.x T x, Σ YY ⊗ I N ),<br />

wobei ⊗ das Kronecker Produkt der beiden Matrizen Σ YY und I N bezeichnet. Dieses Produkt<br />

ist in diesem Spezialfall<br />

Σ<br />

YY<br />

⎛ΣYY<br />

0 … 0 ⎞<br />

⎜ 0 Σ<br />

⎟<br />

YY … 0<br />

⊗ IN<br />

= ⎜<br />

⎟<br />

⎜ …<br />

⎟<br />

⎜<br />

⎝ 0 0 … Σ ⎟<br />

⎠<br />

YY<br />

eine Block-Diagonalmatrix, die N mal die Kovarianzmatrix der Produktvariable Y enthält.<br />

5.11.2 Lineare Modelle mit stochastischen Input- und Prozessvariablen<br />

Diese Modelle haben formal das selbe Aussehen wie die Modelle mit determinierten Inputund<br />

Prozessvariablen. Trotzdem unterscheiden sich die Modelle wesentlich, vorallem bzgl. der<br />

Verteilungen für die Schätz- und Teststatistiken.<br />

Warum müssen wir Modelle mit stochastischen Input- und Prozessvariablen betrachten?<br />

Sehr häufig ist die Voraussetzung, dass die Input- und Prozessvariablen feste Einstellgrößen<br />

sind, in der Praxis verletzt. Betrachtet man z. B. die Prozessvariable Temperatur bei der Her-


5.11 Modelle für die Prozessgleichung<br />

269<br />

stellung von Hochbrand Porzellan, dann wird diese zwar auf 1400 °C eingestellt, aber an den<br />

verschiedenen Stellen des Ofens und damit für verschiedene Teile des zu brennenden Gutes<br />

im Ofen sind die Temperaturen zufällig unterschiedlich. Der fest eingestellte Parameter wirkt<br />

somit auf das Produkt stochastisch. Daraus folgt, dass neben den bisher genannten Modellen<br />

die Modelle mit stochastischen Input- und Prozessvariablen betrachtet werden müssen.<br />

Es gibt einen weiteren Grund für die Verwendung dieses Modells. Die Inputvariablen sind<br />

Produktvariable eines Vorläuferprozesses und damit natürlich stochastisch.<br />

5.11.2.1 Wie sieht das multiple lineare Modell mit stochastischen Input- und<br />

Prozessvariablen aus und wodurch unterscheidet es sich von dem Modell<br />

mit festen Input- und Prozessvariablen?<br />

Die Ableitung des Modells für diesen praktisch relevanten Fall basiert auf der gemeinsamen,<br />

multivariaten Verteilung für die Input- (Z 1 , …, Z l ), Prozess- (X 1 , …, X n ) und Produktvariablen<br />

(Y 1 , …, Y m ). Im univariaten, multiplen, linearen Modell wird nur eine Produktvariable Y<br />

betrachtet. X und Z können Vektoren von Input- und Prozessvariablen sein.<br />

Wir wollen hier annehmen, dass die gemeinsame Verteilung des Vektors<br />

(Z T , X T , Y) = (X T , Y) ~ N n + 1 (µ, Σ),<br />

wobei die Input- und Prozessvariablen der Einfachheit halber zu dem Vektor X zusammengefasst<br />

werden und Σ als positiv definit vorausgesetzt wird. Mit der Zerlegung des zufälligen<br />

Vektors (Y, X T ) in den Teilvektor der Input- und Prozessvariablen X, d. h. die Ursachen und<br />

die Wirkung Y, erhält man für die Momente µ T = (µ Y , µ T X ) und<br />

⎛<br />

2 T<br />

σ ⎞<br />

Y σY.<br />

X<br />

Σ = ⎜ ⎟<br />

⎝ Σ ⎠<br />

XX<br />

den bedingten Erwartungswert<br />

T −1<br />

T<br />

Y Y. X XX X 0 Y / X<br />

EY [ / X] = μ + σ Σ ( X− μ ) = β + β X<br />

und die bedingte Varianz<br />

2 T −1<br />

Y Y. X XX Y.<br />

X<br />

var[ Y/ X] = σ − σ Σ σ .<br />

In diesen Formeln haben die ei nzelnen Symbole die folgenden Bedeutungen:<br />

σ 2 Y<br />

ist die Varianz der Produktvariablen Y,<br />

σ Y.X ist der Vektor der Kovarianzen zwischen der Produktvariablen und dem Vektor der Inputund<br />

Prozessvariablen X und<br />

Σ XX ist die Kovarianzmatrix für die Input- und Prozessvariable.<br />

Der bedingte Erwartungswert wird auch Regressionsfunktion genannt. Sie sehen erstens den<br />

Unterschied zur Regressionsanalyse mit festen Input- und Prozessvariablen und zweitens die<br />

Möglichkeit der anderen Darstellung in Form der Prozessgleichung<br />

Y = β 0 + β Y/X X + F Y/X ,<br />

wobei β Y/X = σ Y.X Σ –1<br />

YY , β 0 = µ Y – β Y/X µ X und F Y/X = Y – E [Y/X] ~ N 1 (0, σ2 Y/X ) ist der normalverteilte<br />

Anpassungsfehler. Y und F Y/X sind unabhängig voneinander.


270 5 Qualität in der Fertigung<br />

Beispiel 5.11.2: Bremsweg. Prozessgleichung mit mehreren Prozessvariablen<br />

Neben der Produktvariable Y werden die Prozessvariablen<br />

X 1 = Geschwindigkeit [km/h]<br />

X 2 = Profiltiefe [mm]<br />

X 3 = Reaktionszeit [sec]<br />

betrachtet. Die Prozessvariablen sind Zufallsgrößen.<br />

Die Kovarianzmatrix ist<br />

⎛<br />

2<br />

σ ⎞<br />

Y σY.1 σY.2 σY.3<br />

⎜<br />

2<br />

⎟<br />

⎜ σ ⎟ ⎛<br />

2 T<br />

x1 σx1. x2 σx1. x3 σ ⎞<br />

Y σY.<br />

X<br />

Σ = ⎜ ⎟<br />

=<br />

2 ⎜ ⎟<br />

⎝ ⎠<br />

⎜<br />

σx 2 σx 2. x 3<br />

Σ<br />

⎟<br />

XX<br />

⎜<br />

⎝<br />

σ ⎟<br />

⎠<br />

.<br />

2<br />

x 2<br />

Das Modell lautet<br />

Y = β 0 + β Y.1/2, 3 X 1 + β Y.2/1, 3 X 2 + β Y.3/1, 2 X 3<br />

und<br />

var[Y/X] = σ 2 Y/X = σ2 Y – σT Y.X Σ–1 XX σ Y.X ,<br />

wobei<br />

β0 = β T<br />

Y / X ( μY−<br />

μX)<br />

und<br />

T T −1<br />

Y / X=<br />

Y.<br />

X XX<br />

β σ Σ<br />

2<br />

/<br />

bedeuten. Die beiden Modellparameter σ Y X und β Y / X sind unbekannt und müssen mit<br />

einer Stichprobe geschätzt werden.<br />

Die Unterschiede zum Modell mit festen Input- und Prozessvariablen bestehen hauptsächlich<br />

darin, dass<br />

•<br />

•<br />

•<br />

die Modellparameter im Modell mit stochastischen Input- und Prozessvariablen die Parameter<br />

einer bedingten Verteilung sind,<br />

in den Verteilungen der Schätzungen für die unbekannten Modellparameter und<br />

in den Verteilungen der Teststatistiken.<br />

Was ist das Maß der Beherrschbarkeit?<br />

Das Quadrat des multiplen Korrelationskoeffizienten ρ 2 Y/X zwischen Y und der linearen Prozessgleichung<br />

wird Maß der Beherrschbarkeit des Prozesses genannt, denn dieses Maß gibt an, wie<br />

gut die Varianz der Produktvariablen Y durch die Input- und Prozessvariablen erklärt wird.<br />

Der Sprachgebrauch „Maß der Beherrschbarkeit“ wird durch die Beziehung<br />

2 2 2<br />

σ = σ ⋅(1 − ρ )<br />

Y / X Y Y / X<br />

deutlich, in der σ 2 Y die Varianz von Y und ρ2 Y/X den multiplen Korrelationskoeffizienten zwischen<br />

Y und der Prozessgleichung bezeichnen. Man kann von der bedingten Varianz ausgehen und<br />

daraus das Maß der Beherrschbarkeit über die Beziehung


5.11 Modelle für die Prozessgleichung<br />

271<br />

ρ<br />

2 T −1<br />

T<br />

2 σY / X σY. X⋅ΣXX⋅σY.<br />

X βY / X⋅ΣXX⋅βY / X<br />

Y / X= 1 − = =<br />

2 2 2<br />

σY σY σY<br />

ausrechnen.<br />

Sind Y und X unabhängig voneinander, dann ist ρ 2 Y/X = 0 und daraus folgt σ2 Y/X = σ2 Y , d. h. der<br />

Vektor der Input- und Prozessvariable trägt nicht zur Erklärung der Varianz der Produktvariablen<br />

bei.<br />

Sind Y und X mit Wahrscheinlichkeit 1 voneinander linear abhängig, dann ist ρ 2 Y/X = 1 und<br />

somit ist σ 2 Y/X = 0, d. h. alle Punkte Ŷ liegen auf der Ausgleichshyperebene. Die bedingte Varianz<br />

der Produktvariablen unter der Wirkung der Input- und Prozessvariablen ist null, d. h.<br />

die Varianz von Y wird durch die Input- und Prozessvariablen vollständig erklärt.<br />

Beispiel 5.11.3: Bremsweg. Mehrere Prozessvariable<br />

Der Prozess ist das Bremsen eines PKW’s vor einem plötzlich auftauchenden Hindernis.<br />

Die Produktvariable Y ist der Bremsweg in [m]. Die Prozessvariablen sind<br />

X 1 = Geschwindigkeit in [km/h],<br />

X 2 = Gewicht des PKW [kg] und<br />

X 3 = Profiltiefe des Reifens in [mm].<br />

Ein PKW vom selben Typ wurde von ein und denselben Fahrer auf ein und derselben Strasse<br />

unter den gleichen Wetterbedingungen mit verschiedenen Reifen auf unterschiedliche<br />

Geschwindigkeiten beschleunigt und vor dem Hindernis abgebremst. Die Daten dieses<br />

Versuches sind im Internet unter dem Namen 05.11.3 Bremsweg enthalten.<br />

Die statistischen Maßzahlen sind in der Tabelle 5.11.3 enthalten.<br />

Tabelle 5.11.3: Statistische Maßzahlen<br />

Statistische Maßzahlen Y X 1 X 2 X 3<br />

Mittelwert 25,907 49,862 1440,23 3,549<br />

Standardabweichung 0,832 3,276 168,0 0,496<br />

Minimum 23,98 42,60 1040,4 2,165<br />

Maximum 28,11 57,45 1832,8 5,18<br />

Die statistischen Maßzahlen sagen nichts aus über die Abhängigkeitsstruktur zwischen den<br />

Variablen. Man kann aus ihnen nicht ablesen, ob die Vergrößerung der Geschwindigkeit<br />

des PKW zu einem längeren Bremsweg führt.<br />

Um das ablesen zu können müssen wir zunächst die Korrelationsmatrix für diese Variablen<br />

berechnen. Die Werrte stehen in der Tabelle 5.11.4.<br />

Tabelle 5.11.4: Korrelationsmatrix<br />

Korr.Matrix Y X 1 X 2 X 3<br />

Y 1 0,828 0,748 –0,677<br />

X 1 1 0,425 –0,275<br />

X 2 1 –0,437<br />

X 3 1


272 5 Qualität in der Fertigung<br />

Die Korrelationsmatrix sagt uns, dass die Länge des Bremsweges und die Geschwindigkeit<br />

hoch miteinander korreliert sind. Die Länge des Bremsweges hängt aber außerdem von<br />

dem Gewicht und der Profiltiefe ab, wobei die Länge des Bremsweges und die Profiltiefe<br />

negativ korreliert sind, d. h. je tiefer die Profile sind, desto kürzer ist der Bremsweg, oder<br />

anders ausgedrückt, je abgefahrener die Reifen sind, desto länger wird der Bremsweg.<br />

Die Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen unter den<br />

Bedingungen, dass alle anderen Variablen konstant gehalten werden, sind in der Tabelle<br />

5.11.5 enthalten.<br />

Tabelle 5.11.5: Matrix der partiellen Korrelationskoeffizienten<br />

Part.Korr.Matrix Y X 1 X 2 X 3<br />

Y 0,976 0,926 –0,943<br />

X 1 –0,875 0,913<br />

X 2 0,827<br />

X 3<br />

Der partielle Korrelationskoeffizient<br />

r Y.1/2, 3 = 0,976<br />

zwischen der Länge des Bremsweges Y und der Geschwindigkeit X 1 unter der Bedingung,<br />

dass sowohl das Gewicht X 2 als auch die Profiltiefe X 3 konstant gehalten werden, ist größer als<br />

der ursprüngliche einfache Korrelationskoeffizient. Der partielle Korrelationskoeffizient<br />

r 1.2/X, 3 = –0,875<br />

zwischen X 1 und X 2 unter der Bedingung Y und X 3 wird sogar negativ. Das zeigt, dass die<br />

Variablen sehr stark voneinander abhängen. Die partiellen Korrelationskoeffizienten für<br />

die Produktvariable Y mit allen Prozessvariablen liefert eine Rangfolge für den Einfluss der<br />

Prozessvariablen auf die Produktvariable. Den stärksten Einfluss hat die Prozessvariable X 1 ,<br />

gefolgt von der Prozessvariablen X 3 und X 2 . Da alle diese partiellen Korrelationskoeffizienten<br />

groß sind, folgt, dass alle Prozessvariablen einen starken Einfluss auf die Produktvariable<br />

Y haben.<br />

Die Determinante der Korrelationsmatrix R als globales Maß für die Abhängigkeitsstruktur<br />

besitzt den Wert det(R) = 0,00885. Die Kleinheit dieses Wertes zeigt die Straffheit der<br />

Abhängigkeitsstruktur.<br />

Der Grad der Multikollinearität ist der Kehrwert der Determinante der Korrelationsmatrix<br />

nur für die Prozessvariablen. Die Determinante det(R XX ) = 0,655 ist erfreulich groß, d. h.<br />

die Schätzungen für die Koeffizienten der Prozessgleichung werden nicht wesentlich durch<br />

den Grad der Multikollinearität beeinflusst.<br />

Die Folge der Prozessgleichungen für die Produktvariable, in der Tabelle 5.11.6 zusammengestellt,<br />

nacheinander für die Abhängigkeit nur von X 1 , dann in Abhängigkeit von X 1<br />

und X 2 und dann von X 1 , X 2 und X 3 zeigen , dass die multiplen Korrelationskoeffizienten<br />

für die Produktvariable Y in Abhängigkeit von den Prozessvariablen mit zunehmender<br />

Information durch die größer werdende Anzahl von Prozessvariablen größer werden und<br />

die bedingten Standardabweichungen die gegensätzliche Tendenz aufweisen.


5.11 Modelle für die Prozessgleichung<br />

273<br />

Tabelle 5.11.6: Folge der Prozessgleichungen für die zunehmende Anzahl von Prozessvariablen<br />

Absolutglied<br />

X 1 X 2 X 3 R 2 Y/X S Y/X F-Wert<br />

Koeffizienten 15,41 0,2105 – – 0,6861 0,4683 292,9<br />

t-Test 25,07 17,11<br />

Koeffizienten 14,56 0,1583 0,0024 – 0,8774 0,2938 475,9<br />

t-Test 37,3 18,6 14,4<br />

Koeffizienten 18,30 0,1481 0,0017 –0,6198 0,9865 0,09788 3213<br />

t-Test 105,7 51,84 28,2 32,6<br />

Betrachten wir die Prozessgleichung für Y in Abhängigkeit von X 1 allein, dann ist das<br />

Maß der Beherrschbarkeit 0,686 und die bedingte Standardabweichung ist s Y/X = 0,468.<br />

Betrachten wir Y in Abhängigkeit von X 1 , X 2 und X 3 dann ist das Maß der Beherrschbarkeit<br />

R 2 Y/X = 0,986 und die bedingte Standardabweichung ist s Y/X = 0,09788.<br />

Für die Prozessgleichungen in der Anwendung bedeutet die Anforderung, dass das Maß<br />

der Beherrschbarkeit größer als 0,9 sein soll keine Utopie, sondern lediglich die verschärfte<br />

Suche nach Input- und Prozessvariablen, die einen Einfluss auf den oder die Produktvariablen<br />

haben.<br />

Als Prozessverbesserung definierten wir<br />

•<br />

•<br />

die Reduktion der Variabilität der Produktvariablen und<br />

die Steuerung des Prozesses mit der Prozessgleichung, so dass simultan alle relevanten<br />

Kundenanforderungen erfüllt werden.<br />

Diese beiden Anliegen werden durch die Abbildung 5.11.2 und Abbildung 5.11.3 verdeutlicht.<br />

28<br />

27<br />

26<br />

Y<br />

25<br />

24<br />

24.5 25.0 25.5 26.0 26.5 27.0 27.5<br />

Fitted : X1<br />

Abb. 5.11.2: Streuung der Messwerte für Y um die Prozessgleichung mit einer Prozessvariablen


274 5 Qualität in der Fertigung<br />

28<br />

27<br />

26<br />

Y<br />

25<br />

24<br />

24 25 26 27 28<br />

Fitted : X1 + X2 + X3<br />

Abb. 5.11.3: Messwerte für Y um die Prozessgleichung mit drei Prozessvariablen<br />

Diese beiden Abbildungen zeigen deutlich, dass sich die Suche nach der erschöpfenden<br />

Anzahl von Input- und Prozessvariablen lohnt.<br />

5.11.2.2 Das multivariate, multiple, lineare Modell mit stochastischen Input- und<br />

Prozessvariablen<br />

Jedes Produkt wird durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben. Folglich<br />

benötigen wir ein Modell, in dem Y ein Vektor von Produktvariablen ist, der durch Linearkombinationen<br />

in den Input- und Prozessvariablen erklärt werden soll. In diesem Fall betrachten<br />

wir die Zerlegung der Kovarianzmatrix<br />

⎛ΣYY<br />

ΣYX<br />

⎞<br />

Σ = ⎜<br />

⎝Σ<br />

Σ ⎟<br />

⎠<br />

XY<br />

und damit das Modell<br />

XX<br />

Y = β 0 + β T Y/X X + F Y/X ,<br />

wobei<br />

F Y/X ~ N (0, Σ YY/X ) der Vektor der Fehler, β T Y/X = Σ YX Σ–1 XX die Matrix der unbekannten Koeffizienten<br />

des Systems der Prozessgleichungen und<br />

F Y/X = Y – β T Y/X X ~ Σ YY/X<br />

ist. Die bedingte Kovarianzmatrix Σ YY/X wird nach der Beziehung<br />

berechnet.<br />

−1<br />

YY / X = YX ⋅ XX ⋅ XY<br />

Σ Σ Σ Σ


5.11 Modelle für die Prozessgleichung<br />

275<br />

Beispiel 5.11.4: Multivariates multiples Modell mit zwei Produkt- und zwei<br />

stochastischen Prozessvariablen. Bedingte Kovarianz und bedingte Erwartungswerte<br />

Für zwei Produkt- und zwei Input- und Prozessvariablen soll das multivariate multiple<br />

lineare Modell mit stochastischen Input- und Prozessvariablen ausführlich aufgeschrieben<br />

werden. Mit der Zerlegung der Kovarianzmatrix in die Elemente<br />

⎛<br />

2<br />

σ ⎞<br />

Y σ<br />

1 Y1Y σ<br />

2 Y1.1 σY<br />

1.2<br />

⎜<br />

⎟<br />

2<br />

⎛ΣYY ΣYx ⎞ ⎜ σY σ ⎟<br />

2 Y2.1 σY<br />

2.2<br />

Σ = ⎜ ⎟ = ⎜ ⎟<br />

⎝ Σ XX ⎠<br />

2<br />

⎜<br />

σ1 σ12<br />

⎟<br />

⎜<br />

2 ⎟<br />

⎝<br />

σ ⎠<br />

erhalten wir die Matrix der bedingten Erwartungswerte und die bedingte Kovarianzmatrix<br />

2<br />

und<br />

−1<br />

Y. X XX X Y / X X<br />

E [ Y/ X] = Σ Σ ( X − μ ) = : Β ( X − μ )<br />

−1<br />

. . /<br />

var( Y/ X) = ΣYY − ΣY X ΣXX ΣX Y = ΣYY X<br />

Schreiben wir diese Ausdrücke ausführlich auf, dann erhalten wir<br />

2<br />

⎛σY<br />

1.1 σY<br />

1.2 ⎞ 1 ⎛ σ2 −σ ⎞<br />

12 ⎛X1 − μ1⎞<br />

E [ Y/ X]<br />

= ⎜ 2 2 2<br />

σ 2<br />

Y2.1 σ<br />

⎟ ⎜<br />

⎟ ⋅<br />

Y2.2 σ1 σ2 (1 ρ12)<br />

⎜X<br />

12 1 2 μ ⎟<br />

⎝ ⎠ ⋅ − ⎝−σ σ ⎠ ⎝ − 2 ⎠<br />

⎛<br />

2 2<br />

σY 1.1 σ2 − σY 1.2σ12 − σY 1.2σ12 + σ1 σ ⎞<br />

Y1.2<br />

⎜ 2 2 2 2 2 2 ⎟<br />

σ1 ⋅σ2 (1 − ρ12) σ1 ⋅σ2 (1 − ρ12)<br />

=<br />

⎜ ⎟ ⎛X1 − μ1⎞<br />

⋅<br />

⎜ 2 2 2<br />

σY 2.1 σ2 − σY 2.1 σ2 σY 2.2σ1 − σY<br />

2.1 σ<br />

⎟ ⎜<br />

⎝X<br />

12<br />

2 − μ ⎟<br />

2⎠<br />

⎜ 2 2 2<br />

2 2 2<br />

⎝ σ1 ⋅σ2 (1 − ρ12)<br />

σ1 ⋅σ2 (1 − ρ12)<br />

⎟<br />

⎠<br />

⎛βY<br />

1.1/ 2 βY<br />

1.2 /1 ⎞ ⎛X1 − μ1⎞<br />

= ⎜<br />

βY<br />

.1/ 2 β<br />

⎟ ⋅ ⎜<br />

Y .2 /1 X2 μ ⎟<br />

⎝<br />

⎠ ⎝ − 2 ⎠<br />

2 2<br />

Formt man einen Regressionskoeffizienten, z. B. den ersten aus der Matrix der Regressionskoeffizienten<br />

unter Verwendung der Korrelationskoeffizienten um, dann erhält man<br />

β<br />

2<br />

ρY −<br />

1.1 σY σ<br />

1 2 ρY 1.2 σY σ<br />

1 2 ρ12 σ1 σ2 ρY 1.1/2<br />

σY<br />

1<br />

= =<br />

σ ⋅σ (1 − ρ ) σ ⋅(1 − ρ )<br />

Y1<br />

.1/2 2 2 2 2<br />

1 2 12 1 12<br />

einen Quotienten mit dem partiellen Korrelationskoeffizienten im Zähler. Hieraus erklärt<br />

sich der Sprachgebrauch partieller Regressionskoeffizient. Ähnliche Umformungen der<br />

bedingten Kovarianzmatrix liefern<br />

⎛<br />

2<br />

σ<br />

⎞<br />

Y1 / X σY 1Y2<br />

/ X<br />

var( Y/ X) = .<br />

⎜<br />

2<br />

⎝ σ /<br />

⎟<br />

Y X ⎠<br />

2


276 5 Qualität in der Fertigung<br />

Gibt es auch für das multivariate multiple Modell ein Maß der Beherrschbarkeit?<br />

Ja, für das multivariate multiple Modell zur Berechnung des Systems der Prozessgleichungen<br />

benötigen wir ein verallgemeinertes Maß der Beherrschbarkeit. Diese i st der multivariate,<br />

multiple Korrelationskoeffizient<br />

wobei<br />

2<br />

ΣYY<br />

/ X<br />

τY<br />

/ X= 1 − ,<br />

Σ<br />

Σ<br />

und<br />

Σ<br />

YY<br />

YY / X<br />

YY<br />

die Determinanten der bedingten bzw. unbedingten Kovarianzmatrix der Produktvariable<br />

sind. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit zwischen dem Vektor der<br />

Produktvariablen und dem System der Prozessgleichungen.<br />

Beispiel 5.11.5: Multivariates multiples Modell mit zwei Produkt- und zwei<br />

stochastischen Prozessvariablen. Multivariater multipler Korrelationskoeffizient<br />

Für das Beispiel 16 kann man den multivariaten, multiplen Korrelationskoeffizienten<br />

umformen. Man erhält:<br />

τ<br />

2<br />

σY σ<br />

1 Y1Y2/<br />

X<br />

2<br />

Y / X= 1− 2 2 2 2<br />

Σ<br />

σ<br />

/<br />

YY −<br />

1 2/ X σ<br />

YY X<br />

Y2/ X σY 1/ X σY 2/ X σY 1Y2/<br />

X<br />

= 1− = 1−<br />

Σ<br />

2<br />

YY σ<br />

2 2 −<br />

Y σ<br />

1 Y1Y<br />

σ<br />

2<br />

Y σ<br />

1 Y σ<br />

2 Y1Y2<br />

2<br />

σY<br />

2<br />

2 2<br />

(1 − ρY −<br />

1/ X) (1 ρY 1Y2/<br />

X)<br />

= 1 −<br />

2<br />

(1 − ρ )<br />

YY 1 2<br />

Für m = 1 ist τ 2 Y/X gleich ρ2 Y/X .<br />

τ 2 Y/X gibt also auch an, wie gut die verallgemeinerte Varianz des Vektors der Produktvariable<br />

durch die Kovarianzmatrix der Input- und Prozessvariable erklärt wird.<br />

5.11.3 Statistische Modelle mit stochastischen Input- und<br />

Prozessvariablen<br />

Die statist ischen Modelle sehen sehr ähnlich wie die theoretischen Modelle aus. Der Unterschied<br />

besteht darin, dass anstelle der Zufallsgrößen zufällige Stichprobenvektoren, anstelle der<br />

zufälligen Vektoren zufällige Stichprobenmatrizen stehen und anstelle der Modellparameter<br />

die statistischen Schätzungen stehen.<br />

Aus den verschiedenen Modellen erkennt man, dass das lineare Modell mit festen Input- und<br />

Prozessvariablen das bedingte Modell des entsprechenden Modells mit stochastischen Inputund<br />

Prozessvariablen ist. Diese Feststellung ist bedeutsam für die Ableitung der Schätzfunktionen.


5.11 Modelle für die Prozessgleichung<br />

277<br />

Welche Ziele können mit den linearen Modellen erreicht we rden?<br />

Das statistische lineare Modell mit stochastischen Input- und Prozessvariablen liefert uns<br />

• die notwendige Prozessgleichung. Damit können die Produktvariablen zielgerichtet über<br />

die Input- und Prozessvariablen so gesteuert werden, dass<br />

–<br />

–<br />

simultan alle Kundenanforderungen erfüll und<br />

die Varianzen der Produktvariablen reduziert werden können.<br />

• An die Stelle der Streuung der Produktvariablen tritt die bedingten Streuung der Produktvariablen<br />

unter der Bedingung, dass die Input- und Prozessvariablen realisiert sind, d. h.<br />

als Messwerte vorliegen.<br />

Die Bedeutung dieses zweiten Faktes zeigt uns noch einmal die Abbildung 5.11.4. Diese Bedingung<br />

ist Ausdruck der Wirkungsweise des Ursache-Wirkungs-Prinzipes und bezieht die<br />

Informationsmenge ein, die durch die Wirkung der Input- und Prozessvariablen gegeben ist.<br />

Die bedingte Varianz σ 2 Y/X ist stets kleiner oder gleich der unbedingten Varianz σ2 Y für die<br />

Produktvariable Y. Das folgt sofort aus der Formel<br />

2 2 2<br />

Y / x Y Y / x<br />

σ = σ ⋅(1 − Ρ )<br />

in der P 2 Y/x der multiple Korrelationskoeffizient zwischen einer Produktvariablen Y und der<br />

Prozessgleichung ist.<br />

Produktvariable Y<br />

obere Toleranz<br />

Sollwert<br />

untere Toleranz<br />

Prozessvariable X<br />

Abb. 5.11.4: Vergleich der Breiten der Verteilung der Produktvariablen Y und der bedingten Verteilung<br />

von Y unter X


278 5 Qualität in der Fertigung<br />

5.11.4 Wie kann man die Schätzungen für die unbekannten<br />

Modellparameter für die Modelle mit stochastischen Input- und<br />

Prozessvariablen gewinnen?<br />

Das Modell mit stochastischen Input- und Prozessvariablen wurde aus der gemeinsamen multivariaten<br />

Verteilung für die Produkt-, Prozess- und Inputvariablen abgeleitet. Zu diesem Zweck<br />

haben wir angenommen, dass der Vektor mit allen Komponenten multivariat normalverteilt<br />

ist, oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Das bedeutet aber, dass die<br />

analytische Form der Verteilungsdichte bekannt ist. Andererseits haben wir immer wieder darauf<br />

hingewiesen, dass die unbekannten Modellparameter nur mit Hilfe einer Stichprobe geschätzt<br />

werden können. Eine Stichprobe besteht aus N unabhängigen „Beobachtungsvektoren“ für den<br />

Vektor der Produkt-, Prozess- und Inputvariablen.<br />

Damit können wir die sogenannte Likelihood Funktion als Produkt der Verteilungsdichten<br />

N<br />

2 2<br />

Y / X Y / X = ∏ i i Y / X Y / X<br />

i=<br />

1<br />

L( β , σ ) f [( y , x ); β , σ ]<br />

an den Stellen der Beobachtungsvektoren aufschreiben und diesen Ausdruck mit den bekannten<br />

Werten für die Input-, Prozess- und Produktvariablen als Funktion der unbekannten Modellparameter<br />

auffassen. Die Maximierung der Likelihood Funktion liefert Schätzungen für die<br />

unbekannten Modellparameter.<br />

Auch das ist ein heuristisches Prinzip. Es liefert aber praktisch vernünftige Schätzfunktionen<br />

für die unbekannten Modellparameter.<br />

Wir haben die Stichprobe<br />

⎛ X11 … X1n<br />

Y11 … Y1<br />

m ⎞<br />

⎜ X ⎟<br />

21 … X2n<br />

Y21 … Y2m<br />

⎜<br />

⎟<br />

⎜ …<br />

…<br />

⎟<br />

( XY , ) = ⎜ ⎟<br />

⎜<br />

⎟<br />

⎜XN−1.1 … XN−1. n YN−1.1 … YN−1.<br />

m⎟<br />

⎜<br />

⎟<br />

⎝ X … X Y … Y ⎠<br />

N1 Nn N1<br />

Nm<br />

für den multivariaten, multiplen Fall. Die Maximum Likelihood Methode liefert uns die<br />

Schätzfunktionen<br />

⎛<br />

( X , Y )<br />

X Y<br />

N<br />

N<br />

T T 1 T 1 T<br />

= ⎜ ⋅∑<br />

i ⋅∑<br />

i<br />

⎝N<br />

i= 1<br />

N<br />

i=<br />

1<br />

für den Mitt elwertvektor. Für die Schätzfunktion gilt<br />

⎛X<br />

⎞ ⎡⎛μ ⎞ ⎛ ⎞⎤<br />

X 1 ΣXX ΣXY<br />

⎜ ⎟ ∼ Nn+<br />

m⎢⎜ ⎟,<br />

⋅ ⎜ ⎟⎥<br />

⎝Y<br />

⎠ ⎢⎝μ<br />

⎠ N ⎝ Σ ⎠<br />

⎣ Y<br />

YY ⎥⎦<br />

Außerdem erhalten wir die Schätzfunktion<br />

N<br />

∑<br />

A = ( V − V) ( V − V),<br />

i= 1<br />

i<br />

T<br />

i<br />

⎞<br />

⎟<br />


5.11 Modelle für die Prozessgleichung<br />

279<br />

für die Kovarianzmatrix, wobei wir der Einfachheit halber die Input-, Prozess- und Produktvariablen<br />

in V zusammengefasst haben. Die Schätzfunktion A für die Kovarianzmatrix ist Wishart<br />

verteilt, mit N – 1 FG und dem Verteilungsparameter Σ. Hierfür schreiben wir abkürzend<br />

A ~ W n + m (N – 1, Σ).<br />

Die Schätzfunktionen für den Vektor der Erwartungswerte und die Kovarianzmatrix sind<br />

unabhängig voneinander. Die Stichprobenmatrix A wird analog zu Σ in<br />

⎛<br />

2 T<br />

A ⎞<br />

Y AY.<br />

X<br />

A = ⎜ ⎟<br />

⎝ A ⎠<br />

XX<br />

zerlegt.<br />

Mit diesen Größen können wir die Schätzfunktionen für die unbekannten Koeffizienten in den<br />

Prozessgleichungen und die unbekannten bedingten Varianzen (Restvarianzen) aufschreiben.<br />

Wir erhalten<br />

B<br />

T −1<br />

Y/X = Axx<br />

⋅ AY . x<br />

B<br />

T<br />

0 = Y − BY/X<br />

x<br />

1 −1<br />

1 T<br />

1<br />

SYY / X = ( AYY − AYX ⋅AXX ⋅ AXY) = ( AYY<br />

− BY/X ⋅AXX ⋅ BY / X) = ⋅AYY / X.<br />

N N N<br />

Am Beispiel des Plastikgehäuses für den Akku-Bohrschrauber wollen wir alle Schritte ausführlich<br />

demonstrieren.<br />

Beispiel 5.11.6: Akkubohrschrauber. Statistische Prozessanalysen<br />

Das Problem<br />

Bei der M ontage des Akku-Bohrschraubers treten Probleme auf. Diese wurden erstmals<br />

bei der Durchführung einer Montagezeitstudie mit MOST (Maynards Operation Sequence<br />

Technique) deutlich. Als Ursachen hierfür wurden Qualitätsmängel an den Plastikschalen<br />

für den Bohrschrauber erkannt. Einige Schalen ließen sich gut, andere weniger gut montieren.<br />

Für das Plastikgehäuse eines Akku-Bohrschraubers in der Abbildung 5.11.1 wurde<br />

daraufhin ein Produktaudit durchgeführt. Die Daten für die Prozess- und Produktvariablen<br />

sind in der Datei 05.11.6 Akkubohrschrauber im Internet enthalten.<br />

Zu diesem Zweck werden das Plastikschalen durch die Produktvariablen<br />

Y 1 = Thermoschrumpf in [%]<br />

Y 2 = Abweichung in axialer Richtung [mm]<br />

Y 3 = Abweichung von der Parallelität [mm]<br />

Y 4 = Dicke [mm]<br />

parametrisiert. Das ist eine Auswahl und diese erhebt nicht den Anspruch auf Vollständigkeit.<br />

Die gegebenen Toleranzen der Tabelle 5.2.1 wurden mit der statistischen Tolerierung überprüft.<br />

Die statistischen Toleranzen sind in der Tabelle 5.2.4 zusammengestellt.


280 5 Qualität in der Fertigung<br />

Abb. 5.11.5: Akku-Bohrschrauber<br />

Problemdefinition<br />

Das Problem wird mit den uni- und multivariaten Prozessfähigkeitsindizes aus dem Abschnitt<br />

5.2. definiert. Es gilt MC pk = 0,73 mit den berechneten statistischen Toleranzen. Da<br />

dieser Wert kleiner als eins ist, muss der Prozess verbessert werden.<br />

Problemlösung<br />

Die Verbesserung der Produktqualität ist nur durch die Steuerung des Herstellungsprozesses<br />

mit einer Prozessgleichung möglich. Daher müssen wir eine umfassende statistische<br />

Prozessanalyse durchführen, die wesentlichen Input- und Prozessvariablen auswählen und<br />

die Prozessgleichungen für die Produktvariablen berechnen.<br />

Statistische Prozessanalyse<br />

Der Herstellungsprozess für die Plastikgehäuse wird durch die Input- und Prozessvariablen<br />

X 1 = Friktion im Extruder (Reibungszahl µ, dimensionslos)<br />

X 2 = Heiztemperatur [°C]<br />

X 3 = Masse – Volumen – Index (mvi)<br />

X 4 = Dichte<br />

X 5 = Massetemperatur [°C]<br />

beschrieben. Auch das ist nur eine Auswahl.<br />

Modellierung<br />

Das multivariate multiple lineare Modell hat das Aussehen<br />

Y 1 = β 0.1 + β Y1.1/2, 3, 4, 5 X 1 + β Y1.2/1, 3, 4, 5 X 2 + β Y1.3/1, 2, 4, 5 X 3 + β Y1.4/1, 2, 3, 5 X 4 + β Y1.5/1, 2, 3, 4 X 5<br />

Y 2 = β 0.2 + β Y2.1/2, 3, 4, 5 X 1 + β Y2.2/1, 3, 4, 5 X 2 + β Y2.3/1, 2, 4, 5 X 3 + β Y2.4/1, 2, 3, 5 X 4 + β Y2.5/1, 2, 3, 4 X 5<br />

Y 3 = β 0.3 + β Y3.1/2, 3, 4, 5 X 1 + β Y3.2/1, 3, 4, 5 X 2 + β Y3.3/1, 2, 4, 5 X 3 + β Y3.4/1, 2, 3, 5 X 4 + β Y3.5/1, 2, 3, 4 X 5<br />

Y 4 = β 0.4 + β Y4.1/2, 3, 4, 5 X 1 + β Y4.2/1, 3, 4, 5 X 2 + β Y4.3/1, 2, 4, 5 X 3 + β Y4.4/1, 2, 3, 5 X 4 + β Y4.5/1, 2, 3, 4 X 5 .


5.11 Modelle für die Prozessgleichung<br />

281<br />

Die Matrix der Prozessgleichungskoeffizienten wurde nach der Beziehung<br />

−1<br />

Y / X=<br />

Y.<br />

X XX<br />

Β Σ Σ<br />

erhalten, wobei diese Matrizen aus der Zerlegung<br />

⎛σ σ σ σ σ σ σ σ σ<br />

⎜ σ σ σ σ σ σ σ σ<br />

⎜<br />

⎜<br />

σ σ σ σ σ σ σ<br />

⎜<br />

σ σ σ σ σ σ<br />

⎛ΣYY<br />

ΣYX<br />

⎞ ⎜<br />

Σ = ⎜ ⎟ = ⎜<br />

σ σ σ σ σ<br />

⎝ Σ XX ⎠ ⎜<br />

⎜<br />

σX2X2<br />

σX<br />

σ σ<br />

⎜<br />

σ σ σ<br />

⎜<br />

⎜<br />

σ σ<br />

⎜<br />

⎝<br />

σ<br />

Y1Y1 Y1Y2 Y1Y3 Y1Y4 Y1X1 Y1X2 Y1X3 Y1X4 Y1X5<br />

Y2Y2 Y2Y3 Y2Y4 Y2X1 Y2X2 Y2X3 Y2X4 Y2X5<br />

Y3Y3 Y3Y4 Y3X1 Y3X2 Y3X3 Y3X4 Y3X5<br />

stammen. Die bedingte Kovarianzmatrix wird nach der Gleichung<br />

−1<br />

YY / X = YY − YY . X XX X.<br />

YY<br />

Σ Σ Σ Σ Σ<br />

Y4Y4 Y4X1 Y4X2 Y4X3 Y4X4 Y4X5<br />

X1X1 X1X2 X1X3 X1X4 X1X5<br />

2X3 X2X4 X2X5<br />

X3X3 X3X4 X3X5<br />

X4X4 X4X5<br />

X5X5<br />

berechnet. In den linearen Modellen sind die Modellparameter B Y/X und Σ YY/X unbekannt.<br />

Diese müssen aufgrund einer Stichprobe geschätzt werden.<br />

Die Korrelationsmatrix hierfür ist<br />

⎞<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎠<br />

Tabelle 5.11.7: Korrelationsmatrix für den Akku-Bohrschrauber<br />

Y 1 Y 2 Y 3 Y 4 X 1 X 2 X 3 X 4 X 5<br />

Y 1 1 0,036 –0,457 –0,102 –0,136 0,414 0,275 –0,41 0,224<br />

Y 2 1 0,417 –0,042 –0,113 0,081 –0,332 0,108 –0,132<br />

Y 3 1 0,355 –0,133 –0,151 –0,236 0,2 –0,285<br />

Y 4 1 0,387 0,272 0,045 0,257 0,032<br />

X 1 1 0,561 0,346 –0,108 0,319<br />

X 2 1 0,447 –0,371 0,547<br />

X 3 1 –0,878 0,838<br />

X 4 1 –0,782<br />

X 5 1<br />

Diese Korrelationsmatrix entspricht der Zerlegung der Gesamtkorrelationsmatrix R in<br />

die Blöcke<br />

⎛RYY<br />

RYX<br />

⎞<br />

R = ⎜<br />

⎝R<br />

R ⎟<br />

⎠<br />

XY<br />

XX


282 5 Qualität in der Fertigung<br />

R YY = Korrelationsmatrix der Produktvariablen,<br />

R YX = Korrelationsmatrix zwischen den Produkt- und Prozessvariablen,<br />

R XX = Korrelationsmatrix der Prozessvariablen.<br />

Aus der Korrelationsmatrix R YY lesen wir ab, dass die Korrelationskoeffizienten der Produktvariablen<br />

Y 1 mit Y 3 und der Produktvariablen Y 2 mit Y 3 statistisch gesichert von null<br />

verschieden sind.<br />

Aus der Matrix R YX lesen wir ab, dass X 2 mit Y 1 und X 4 mit Y 1 korreliert ist.<br />

Aus R XX lesen wir ab, dass X 3 mit X 4 , X 3 mit X 5 und X 4 mit X 5 hoch korreliert sind und X 1<br />

mit X 2 , X 2 mit X 3 , und X 2 mit X 5 korreliert sind. Die Größen der Korrelationskoeffizienten<br />

entsprechen den Erwartungen der Experten.<br />

Das globale Maß für die Abhängigkeitsstruktur des Plastikgehäuses ist<br />

det(R) = 0.0007809236.<br />

Dieser Wert ist sehr klein, d. h. die Abhängigkeitsstruktur ist eng.<br />

Für später ist es notwendig zu wissen, ob die Produktvariablen, die Prozessvariablen oder<br />

die Produkt- mit den Prozessvariablen stark miteinander korreliert sind. Zu diesem Zweck<br />

berechnen wir die entsprechenden Determinanten der Korrelationsmatrizen. Es gilt<br />

det(R YY ) = 0.4894116,<br />

d. h. das globale Maß für die Straffheit der Abhängigkeitsstruktur der Produktvariablen ist<br />

groß, d. h. die Produktvariablen hängen nur gering voneinander ab.<br />

det(R XX ) = 0.02383498, d. h. die Prozessvariablen hängen stark voneinander ab.<br />

Grafische Abbildungen für das Gehäusebeispiel:<br />

Star Plots für die Produktvariablen in Abbildung 5.11.6<br />

Ein Star Plot ist eine ideale Darstellung für einen multivariaten Datensatz, z. B. für ein Produkt,<br />

aber auch für ein Produkt in Abhängigkeit von seinen Input- und Prozessvariablen.<br />

Jeder Stern visualisiert z. B. ein Produkt.<br />

Jeder Stern besteht aus einer Anzahl von Strahlen, die vom Mittelpunkt aus gezeichnet<br />

werden. Jeder Strahl repräsentiert eine Variable. Auf jeden Strahl wir ein spezieller „Relativwert“<br />

für den entsprechenden Wert der Variablen aufgetragen. Werden z. B. die Gehäuse<br />

durch star plots visualisiert, dann entspricht der Strahl in der 3 00 Position der 1. Produktvariablen<br />

Y 1 = Thermoschrumpf. Der 2. Strahl entgegen dem Uhrzeigersinn entspricht<br />

der 2. Produktvariablen usw. Der kürzeste Strahl entspricht dem kleinsten Wert einer<br />

Produktvariable, der größte dem größten.<br />

Die Achsen der Star Plots sind in den Schlüssel der Abbildung 5.11.7 bezeichnet.<br />

Die N = 113 Star Plots sind sehr verschieden. Betrachtet man z. B. die Stars für die Produkte<br />

2 und 19, dann kann man sich kaum vorstellen, dass diese Produkte gleich sein sollen. Auf<br />

diese Art findet man viele sehr Paare von verschiedenen Stars. Pauschal kann man sagen,<br />

dass die Produkte, beschrieben durch die vier Produktvariablen hinsichtlich eines jeden<br />

Parameters stark streuen.<br />

Eine andere ganz wichtige Abbildung ist das Korrelationsdiagramm. Die Zusammenfassung<br />

mehrerer Korrelationsdiagramme nennt man Draftsman Plots. Diese Darstellungen sind<br />

sehr wichtig, da die paarweisen Abhängigkeit visualisiert werden.


5.11 Modelle für die Prozessgleichung<br />

283<br />

111 112 113<br />

100 101 102 103 104 105 106 107 108 109 110<br />

89 90 91 92 93 94 95 96 97 98 99<br />

78 79 80 81 82 83 84 85 86 87 88<br />

67 68 69 70 71 72 73 74 75 76 77<br />

56 57 58 59 60 61 62 63 64 65 66<br />

45 46 47 48 49 50 51 52 53 54 55<br />

34 35 36 37 38 39 40 41 42 43 44<br />

23 24 25 26 27 28 29 30 31 32 33<br />

12 13 14 15 16 17 18 19 20 21 22<br />

1 2 3 4 5 6 7 8 9 10 11<br />

Abb. 5.11.6 : Star Plots für die Produktvariablen<br />

AXIALITY<br />

PARALLEL<br />

THERMOSHR<br />

THICKNESS<br />

Abb. 5.11.7: Schlüssel für die Star Plots<br />

Draftsman Plots<br />

Die draftsman Plots (Abbildung 5.11.8) zeigen, dass die vier Produktvariablen nicht unabhängig<br />

voneinander sind. Die stärkste Abhängigkeit finden wir zwischen den Produktvariablen<br />

Parallelität und Thermoschrumpf. Diese Abhängigkeit ist negativ.<br />

Jedes Korrelationsdiagramm wird durch einen Korrelationskoeffizienten quantifiziert.


284 5 Qualität in der Fertigung<br />

AXIALITY<br />

PARALLEL<br />

THICKNESS<br />

THERMOSHR<br />

AXIALITY<br />

PARALLEL<br />

Abb. 5.11.8: Draftman Plots für die Produktvariable des Gehäuses<br />

Häufigkeitsverteilungen<br />

Eine Häufigkeitsverteilung ist die grafische Darstellung der Verteilung der Werte einer<br />

Stichprobe für eine Variable. Diese Darstellung wird gern verwendet, um Hypothesen<br />

bzgl. der Verteilung einer Variablen aufzustellen, sofern diese nicht durch irgendwelche<br />

theoretischen Annahmen gefunden werden können. Die Häufigkeitsverteilungen liefern<br />

des weiteren eine erste Information darüber, ob der Stichprobenumfang ausreichend ist<br />

und ob die Anzahl der Klassen in Anhängigkeit davon klein genug gewählt wurde, über den<br />

mittleren Wert, die Streuung und über mögliche Ausreißer. Die Häufigkeitsverteilungen<br />

für das Gehäusebeispiel sind in der Abbildung 5.11.9 dargestellt.<br />

40<br />

Histogram for THERMOSHR<br />

40<br />

Histogram for AXIALITY<br />

frequency<br />

30<br />

20<br />

10<br />

frequency<br />

30<br />

20<br />

10<br />

0<br />

0 0,5 1 1,5 2 2,5 3<br />

THERMOSHR<br />

0<br />

-0,7 -0,3 0,1 0,5 0,9<br />

AXIALITY<br />

frequency<br />

40<br />

30<br />

20<br />

10<br />

Histogram for PARALLEL<br />

frequency<br />

40<br />

30<br />

20<br />

10<br />

Histogram for THICKNESS<br />

0<br />

-1,5 -0,5 0,5 1,5 2,5<br />

PARALLEL<br />

0<br />

2,8 2,9 3 3,1 3,2 3,3 3,4<br />

THICKNESS<br />

Abb. 5.11.9: Häufigkeitsverteilungen für die Produktvariablen


5.11 Modelle für die Prozessgleichung<br />

285<br />

Diese vier Häufigkeitsverteilungen zeigen, dass bzgl. aller vier Produktvariablen die Verteilungshypothese<br />

H 0 : „die Produktvariable sind normalverteilt“ formuliert werden kann.<br />

Die H 0 kann mit verschiedenen Tests geprüft werden.<br />

Hier wurden der χ 2 -Test, der Test von Shapiro-Wilks (W) und der Kolmogorov-Smirnov-<br />

Test (DN) angewandt.<br />

Die berechneten Teststatistiken und Irrtumswahrscheinlichkeiten p dieser Anpassungstests<br />

sind in der Tabelle 5.4.4 zusammen gefasst:<br />

Tabelle 5.11.8: Ergebnisse der Anpassungstests<br />

χ 2 p W p DN p<br />

Thermoschrumpf 22.62 0.42 0.98 0.5 0.052 0.92<br />

Axialität 27.92 0.18 0.98 0.716 0.042 0.985<br />

Parallelität 13.76 0.909 0.983 0.668 0.0488 0.95<br />

Dicke 13.32 0.923 0.981 0.565 0.038 0.996<br />

Die Entscheidung über die Ablehnung oder Annahme der H 0 wird aufgrund der p-Werte<br />

getroffen. Da der kleinste p-Wert > 0.1 ist, können die H 0 mit Wahrscheinlichkeiten, die<br />

größer als 0.9 sind, nicht verworfen werden, d. h. die einzelnen Produktvariable sind, jeder<br />

für sich betrachtet, normal verteilt.<br />

3D Häufigkeitsverteilung<br />

Die 3D (3 dimensionale) Häufigkeitsverteilung fasst die Informationen der Häufigkeitsverteilungen<br />

für zwei Variable und des zugehörigen Korrelationsdiagramms zusammen.<br />

Eine 3D-Häufigkeitsverteilung ist demzufolge eine Häufigkeitsverteilung über einem<br />

Korrelationsdiagramm. In der Abbildung 5.11.10 ist die 3D Häufigkeitsverteilung für den<br />

Thermoschrumpf und die Dicke enthalten.<br />

Frequency<br />

10<br />

6<br />

2<br />

0<br />

0<br />

1<br />

2<br />

3<br />

2.8<br />

3<br />

3.2<br />

3.4<br />

Dicke<br />

Thermoschrumpf<br />

Abb. 5.11.10: 3D Häufigkeitsverteilung für den Akku-Bohrschrauber


286 5 Qualität in der Fertigung<br />

Man erkennt aus dieser Darstellung, dass die Werte in der Ebene mit den Achsen Thermoschrumpf<br />

und Dicke in einem elliptisch umrissenen Gebiet liegen und das „Gebirge“<br />

durch eine 2-dimensionale Normalverteilung angepasst werden kann. Man sieht aber auch,<br />

dass man für eine 3D Häufigkeitsverteilung mehr als die vorliegenden N = 113 Wertesätze<br />

benötigt, um ein klares Bild zu erhalten.<br />

Stichprobenkovarianzmatrix<br />

Die gesamte Stichprobenkovarianzmatrix für alle Variablen wurde in der Tabelle 5.11.9<br />

zusammengestellt.<br />

Tabelle 5.11.9: Stichprobenkovarianzmatrix für den Akku-Bohrschrauber<br />

Thermo Axialit Parallel Dicke Friktion Heiztemp. MVI Dichte Massetemp.<br />

Thermo 0,2249 0,00353 –0,10751 –0,00455 –0,0365 0,97655 0,4792 –0,005321 0,1211<br />

Axialit 0,04206 0,04239 –0,000809 –0,01316 0,08313 –0,2507 0,000605 –0,0309<br />

Parallel 0,24587 0,01653 –0,037465 –0,3723 –0,4309 0,002714 –0,16129<br />

Dicke 0,00882 0,020592 0,12701 0,01546 0,000659 0,003443<br />

Friktion 0,3215 1,584 0,72217 –0,001669 0,206865<br />

Heiztemp. 24,7719 8,19388 –0,05056 3,10952<br />

MVI 13,5408 –0,088371 3,523025<br />

Dichte 0,0007485 –0,024429<br />

Massetemp. 1,304455<br />

Die Berechnung der Schätzungen für B Y/X und Σ YY/X nach den obigen Formeln ergeben<br />

die Resultate:<br />

B<br />

⎛−0.38891 0.068 0.008913 −8.6534 −0.19371<br />

⎞<br />

⎜ 0.02941 0.009073 −0.07755 −6.3397 0.04074 ⎟<br />

= ⋅ = ⎜<br />

⎟<br />

⎜ − 0.04865 0.004145 − 0.001863 − 0.93452 − 0.13828 ⎟<br />

⎜<br />

⎝ 0.003045 0.0050539 0.02557 4.29743 0.001544⎟<br />

⎠<br />

T −1<br />

Y/X Axx<br />

AY . x<br />

T<br />

B0 = (29.022 1.602 22.272 − 3.927)<br />

und<br />

S<br />

YY / X<br />

⎛0.117493 −0.005757 −0.100668 0.001048 ⎞<br />

⎜<br />

0.027342 0.037235 0.00267 ⎟<br />

= ⎜<br />

⎟<br />

⎜ 0.22503 0.018135 ⎟<br />

⎜<br />

⎝<br />

0.00488349⎟<br />

⎠<br />

Aus diesen Ergebnissen kann man die Prozessgleichungen für die verschiedenen Produktvariablen<br />

zusammenstellen, so z. B. für Y 1 :<br />

Y 1 = 29.022 – 0.38891 X 1 + 0.068 X 2 + 0.008913 X 3 – 8.6534 X 4 – 0.19371 X 5


5.11 Modelle für die Prozessgleichung<br />

287<br />

Die Reststreuung ist die Quadratwurzel aus dem 1. Diagonalelement von S YY/X , d. h.<br />

0.117493 = 0.3428.<br />

Diese Resultate erhält man auch, wenn man die Prozessgleichung für jede Produktvariable<br />

einzeln berechnet.<br />

Das multivariate Maß der Beherrschbarkeit hatten wir bei der Betrachtung der Korrelationsanalyse<br />

berechnet. Es galt<br />

τ<br />

2<br />

Y / X<br />

ΣYY<br />

/ X 6.737213333 10^-7<br />

= 1 − = 1 − = 0.9329<br />

Σ<br />

1.004384604 10^-5<br />

XX<br />

d. h. die Variabilität der Produktvariablen wird zu ca. 93 % durch die Prozessvariablen<br />

erklärt.<br />

Prozessgleichungen für die einzelnen Produktvariablen im multivariaten, multiplen<br />

Modell<br />

Im multivariaten, multiplen Modell mit stochastischen Input- und Prozessvariablen erhält<br />

man einen Vektor von Prozessgleichungen, für jede Produktvariable eine. Das Problem<br />

besteht nun aber darin, dass der Prozess nur mit einer optimalen Teilmenge von Inputund<br />

Prozessvariablen gefahren werden kann. Das bedeutet, dass die globale Teilmenge an<br />

wesentlichen Input- und Prozessvariablen für die Vorhersagen gesucht werden muss.<br />

Tabelle 5.11.10: Prozessgleichungen für die einzelnen Produktvariablen<br />

Prozessgleichung f. Y1<br />

-----------------------------------------------------------------------------<br />

Dependent variable: Thermo<br />

-----------------------------------------------------------------------------<br />

Standard<br />

T<br />

Parameter Estimate Error Statistic P-Value<br />

-----------------------------------------------------------------------------<br />

CONSTANT 27,9028 10,1695 2,74377 0,0071<br />

Friktion -0,388912 0,0808537 -4,81007 0,0000<br />

Heiztemp 0,0679991 0,00925225 7,34947 0,0000<br />

MVI 0,00891195 0,0244504 0,36449 0,7162<br />

Dichte -8,65339 2,90976 -2,97392 0,0036<br />

Massetemp -0,193712 0,0581907 -3,32893 0,0012<br />

-----------------------------------------------------------------------------<br />

Analysis of Variance<br />

-----------------------------------------------------------------------------<br />

Source Sum of Squares Df Mean Square F-Ratio P-Value<br />

-----------------------------------------------------------------------------<br />

Model 12,0353 5 2,40707 19,57 0,0000<br />

Residual 13,159 107 0,122981<br />

-----------------------------------------------------------------------------<br />

Total (Corr.) 25,1944 112<br />

R-squared = 47,77 percent<br />

R-squared (adjusted for d.f.) = 45,3294 percent<br />

Standard Error of Est. = 0,350687<br />

Mean absolute error = 0,265689<br />

Durbin-Watson statistic = 2,22739


288 5 Qualität in der Fertigung<br />

Prozessgleichung f. Y2<br />

-----------------------------------------------------------------------------<br />

Dependent variable: Axialit<br />

-----------------------------------------------------------------------------<br />

Standard<br />

T<br />

Parameter Estimate Error Statistic P-Value<br />

-----------------------------------------------------------------------------<br />

CONSTANT 0,763646 4,90555 0,15567 0,8766<br />

Friktion 0,0294221 0,0390021 0,754373 0,4523<br />

Heiztemp 0,00907345 0,00446308 2,033 0,0445<br />

MVI -0,0775608 0,0117944 -6,57609 0,0000<br />

Dichte -6,34085 1,4036 -4,51755 0,0000<br />

Massetemp 0,0407386 0,0280699 1,45133 0,1496<br />

-----------------------------------------------------------------------------<br />

Analysis of Variance<br />

-----------------------------------------------------------------------------<br />

Source Sum of Squares Df Mean Square F-Ratio P-Value<br />

-----------------------------------------------------------------------------<br />

Model 1,64909 5 0,329818 11,53 0,0000<br />

Residual 3,06195 107 0,0286164<br />

-----------------------------------------------------------------------------<br />

Total (Corr.) 4,71104 112<br />

R-squared = 35,0048 percent<br />

R-squared (adjusted for d.f.) = 31,9676 percent<br />

Standard Error of Est. = 0,169164<br />

Mean absolute error = 0,128768<br />

Durbin-Watson statistic = 1,83917<br />

Prozessgleichung f. Y3<br />

-----------------------------------------------------------------------------<br />

Dependent variable: Parallel<br />

-----------------------------------------------------------------------------<br />

Standard<br />

T<br />

Parameter Estimate Error Statistic P-Value<br />

-----------------------------------------------------------------------------<br />

CONSTANT 21,7397 14,074 1,54467 0,1254<br />

Friktion -0,0486358 0,111897 -0,434649 0,6647<br />

Heiztemp 0,00414507 0,0128046 0,323719 0,7468<br />

MVI -0,00187052 0,033838 -0,0552787 0,9560<br />

Dichte -0,935801 4,02693 -0,232386 0,8167<br />

Massetemp -0,138288 0,0805324 -1,71717 0,0888<br />

-----------------------------------------------------------------------------<br />

Analysis of Variance<br />

-----------------------------------------------------------------------------<br />

Source Sum of Squares Df Mean Square F-Ratio P-Value<br />

-----------------------------------------------------------------------------<br />

Model 2,33505 5 0,46701 1,98 0,0870<br />

Residual 25,2033 107 0,235545<br />

-----------------------------------------------------------------------------<br />

Total (Corr.) 27,5384 112<br />

R-squared = 8,47926 percent<br />

R-squared (adjusted for d.f.) = 4,20259 percent<br />

Standard Error of Est. = 0,48533<br />

Mean absolute error = 0,380747<br />

Durbin-Watson statistic = 2,37876


5.11 Modelle für die Prozessgleichung<br />

289<br />

Prozessgleichung f. Y4<br />

-----------------------------------------------------------------------------<br />

Dependent variable: Dicke<br />

-----------------------------------------------------------------------------<br />

Standard<br />

T<br />

Parameter Estimate Error Statistic P-Value<br />

-----------------------------------------------------------------------------<br />

CONSTANT -3,48103 2,07271 -1,67946 0,0960<br />

Friktion 0,00302197 0,0164793 0,18338 0,8548<br />

Heiztemp 0,00505451 0,00188576 2,68036 0,0085<br />

MVI 0,0255782 0,0049834 5,13268 0,0000<br />

Dichte 4,29957 0,593056 7,24985 0,0000<br />

Massetemp 0,00155342 0,0118602 0,130978 0,8960<br />

-----------------------------------------------------------------------------<br />

Analysis of Variance<br />

-----------------------------------------------------------------------------<br />

Source Sum of Squares Df Mean Square F-Ratio P-Value<br />

-----------------------------------------------------------------------------<br />

Model 0,441305 5 0,088261 17,28 0,0000<br />

Residual 0,54664 107 0,00510878<br />

-----------------------------------------------------------------------------<br />

Total (Corr.) 0,987945 112<br />

R-squared = 44,669 percent<br />

R-squared (adjusted for d.f.) = 42,0834 percent<br />

Standard Error of Est. = 0,0714757<br />

Mean absolute error = 0,0554062<br />

Durbin-Watson statistic = 2,10562<br />

Gewisse Unterschiede in den Ergebnissen resultieren z. T. aus Rundungsfehlern und insbesondere<br />

bei den Reststreuungen aus der Tatsache, dass ich S YY/X aus 1/N A YY/X berechnet<br />

habe. Diese Schätzung ist nicht erwartungstreu. Die erwartungstreue Schätzung verwendet<br />

anstelle des Faktors 1/N den Faktor 1/(N – m).<br />

Die Güte des Ausgleichs kann aus<br />

•<br />

•<br />

der bedingten Standardabweichung (Reststreuung) und<br />

dem Maß der Beherrschbarkeit (multipler Korrelationskoeffizient R 2 Yj/X<br />

abgelesen werden.<br />

Für die Produktvariable Y 1 (Thermoschrumpf) liest man ab:<br />

s Y1/X = 0,3506 und R 2 Y1/X = 0.4532. Es gibt hier einen 2. Wert, der „R squared adjusted”<br />

genannt wird. Dieser Wert verwendet die erwartungstreue Schätzung für S 2 Y/X .<br />

Die Programme zur Berechnung der Prozessgleichungen gestatten noch das Zeichnen verschiedener<br />

Sachverhalte. Hier wollen wir nur schauen, wie gut die Residuen ε ˆ<br />

1 = ( 1 − ˆ<br />

i Yi Yi1)<br />

,<br />

i = 1, … N (Abweichungen der Messwerte von den berechneten Werten) durch eine Normalverteilung<br />

angepasst werden können.<br />

Die Abbildung 5.11.11 zeigt, dass die Residuen sehr gut durch eine Normalverteilung<br />

approximiert werden können.


290 5 Qualität in der Fertigung<br />

49<br />

8<br />

Residuals<br />

-0.5 0.0 0.5<br />

60<br />

-2 -1 0 1 2<br />

Quantiles of Standard Normal<br />

Abb. 5.11.11: Residuen ε i1 für die Anpassung von Y 1 durch die Prozessgleichung über den<br />

Quantilen der Normalverteilung<br />

Es bleibt noch die Frage zu klären, wie die Auswahl der wesentlichen Input- und Prozessvariablen<br />

im multivariaten, multiplen Fall zu realisieren ist, denn Fakt ist ja, dass der Prozess nur<br />

mit einer optimalen Teilmenge von Input- und Prozessvariablen für alle Produktvariablen<br />

gesteuert werden kann. Die Antwort auf diese Frage wird bei der Lösung des Problems nach<br />

der Auswahl der wesentlichen Input- und Prozessvariablen gegeben.<br />

5.12 Welche Eigenschaften haben die Schätzungen für die<br />

unbekannten Modellparameter?<br />

Die Eigenschaften für diese Schätzfunktionen werden ste llvertretend für das multivariate,<br />

multiple Modell mit stochastischen Input- und Prozessvariablen aufgeschrieben.<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

Sie sind:<br />

E[B Y/X /X] = E[B Y/X ] = β Y/X ,<br />

d. h. die Schätzfunktion für die Matrix (Vektor) der unbekannten Koeffizienten der Prozessgleichung<br />

ist erwartungstreu.<br />

E[A YY/X /X] = E[A YY/X ] = Σ YY/X (N – n –1)<br />

cov(B Y/X /X) = A –1<br />

XX ⊗ Σ YY/X<br />

und cov(B Y/X ) = (N – n –1) –1 Σ –1<br />

XX ⊗ Σ YY/X<br />

{B (N)<br />

Y/X } N→∞ ist konsistent<br />

B Y/X und S YY/X sind unabhängig<br />

V(B Y/X /X) = N(B Y/X , A –1<br />

XX ⊗ Σ YY/X )<br />

und die unbedingte Verteilung ist eine multivariate t-Verteilung.


5.12 Welche Eigenschaften haben die Schätzungen?<br />

291<br />

Die Beweise für diese Behauptungen findet man in Jahn [1991a].<br />

Vorhersagen für die Werte der Produktvariablen<br />

Die Prozes sgleichung wird für die Steuerung des Prozesses gebraucht. Für die Input- und Prozessvariablen<br />

werden Werte eingesetzt und der oder die Werte für den oder die Produktvariablen<br />

werden ausgerechnet. Diesen Vorgang bezeichnen wir im linearen Modell als „Vorhersage“.<br />

Die vorhergesagten Werte für den oder die Produktvariablen streuen natürlich auch. Daher<br />

müssen wir den Vorhersagefehler berechnen.<br />

Wie kann man den Vorhersagefehler berechnen und wie groß ist der Fehler für diese<br />

Vorhersagen?<br />

Vorhersagen sind hier im Sinne der Extra- oder Interpolation des oder der Produktvariablen<br />

Y aufgrund der Kenntnis der Input- und Prozessvariablen gemeint. Wir betrachten die<br />

Vorhersage gleich für den Vektor von Produktvariablen Y. Für eine Produktvariable gelten<br />

dieselben Formeln.<br />

Den Vektor der Input- und Prozessvariablen, für den wir die „Vorhersage“ berechnen wollen,<br />

bezeichnen wir mit X E . Es muss selbstverständlich gelten, dass<br />

X E ~ N n (µ, Σ XX ) und X E ist unabhängig von X, d. h. von X 1 , …, X N .<br />

Mit diesem Vektor wird ̃ = ̃<br />

T<br />

Y( XE)<br />

YE = B0 + BY / X ⋅ X E .<br />

Die Beurteilung der „Vorhersage“ erfolgt mit den bedingten und unbedingten Vorhersagefehlern.<br />

Der bedingte Vorhersagefehler ist<br />

und<br />

M E[( ̃ ) ( ̃ ) / , X ] MSEP ( ̃ /, )<br />

U<br />

T<br />

Nn , = YE − YE ⋅ YE − YE X E = YE XE<br />

T −1<br />

= ΣYY / X ⋅ (1 + XE ⋅ AXX ⋅ XE)<br />

⎛<br />

⎞<br />

= − ̃ ⋅ − ̃ T<br />

= ̃<br />

n<br />

E[( Y Y ) ( Y Y ) ] MSEP ( Y ) = Σ ⋅ ⎜1 +<br />

⎝<br />

⎟.<br />

N − n −1⎠<br />

N, n E E E E E YY / X<br />

Den Beweis kann man in Jahn [1991b] nachlesen.<br />

Der unbedingte Vorhersagefehler des linearen Modells mit stochastischen Input- und<br />

Prozessvariablen stimmt mit dem Vorhersagefehler des Modells mit festen Input- und<br />

Prozessvariablen überein.<br />

Beispiel 5.12.1: Bremsweg. Vorhersagen<br />

1. Beispiel zum Nachrechnen (05.11.3 Bremsweg)<br />

Die berechnete Prozessgleichung war<br />

Yˆ =− 27.151 + 1.078 ⋅x<br />

Fasst man auch die gefahrene Geschwindigkeit als Zufallsgröße auf, dann erhält man für<br />

dieses Demonstrationsbeispiel den unbedingten „Vorhersagefehler“<br />

U 10,1 = 2.991 (1 + 1/8) = 3.3648


292 5 Qualität in der Fertigung<br />

und damit die „Vorhersagestandardabweichung“<br />

U 10,1 = 3.3648 = 1.83<br />

Wählt man für x E die Werte 45, 50 und 55, dann erhält man hierfür die „vorhergesagten“<br />

Bremswege:<br />

Tabelle 5.12.1: „Vorhersagewerte“ für den Bremsweg bei einer Prozessvariablen und dem<br />

Stichprobenumfang N = 10.<br />

x E<br />

Vorhersage<br />

Konfidenzintervall<br />

ỸE<br />

unten<br />

oben<br />

45 21,3 17,7 24,9<br />

50 26,7 23,1 30,3<br />

55 32,1 28,5 35,7<br />

2. Beispiel aus dem Kapitel 1 (Datei 01.3.6 Bremsweg)<br />

Mit dem Programm Statgraphics Plus 7.0 oder SPLUSWIN erhält man die Prozessgleichung<br />

Y ˆ = − 10.0798 + 0.84465 ⋅ X − 2.18613 ⋅ X + 4.1934 ⋅ X<br />

1 2 3<br />

wobei<br />

X 1 = Geschwindigkeit [km/h]<br />

X 2 = Profiltiefe [mm]<br />

X 3 = Reaktionszeit [sec], anstelle des PKW-Gewichtes<br />

und die bedingte Varianz bzw. die bedingte Standardabweichung<br />

S 2 Y/X = 4.68432 und S Y/X = 2.1643.<br />

Der unbedingte Vorhersagefehler ist<br />

U 33,3 = 4.68432 [1 + 3 / (30 – 3 – 1)] = 5.2248<br />

und die unbedingte Vorhersage-Standardabweichung ist<br />

U 33,3 = 2.2858 .<br />

Das Maß der Beherrschbarkeit des Prozesses „Bremsen vor einem Hindernis“ ist R 2 Y/X<br />

= 0.8667, bzw. nach der Korrektur mit den Freiheitsgraden R′ 2 Y/x = 0.851318, wobei die<br />

Korrektur mit der Formel<br />

R′<br />

N − 1<br />

= 1 − (1 − RY x),<br />

N − n −1<br />

2 2<br />

Y / x<br />

/<br />

vorgenommen wird. Das Maß der Beherrschbarkeit besagt, ca. 86 % der Varianz des Bremsweges<br />

werden durch die drei Prozessvariablen X 1 (Geschwindigkeit), X 2 (Profiltiefe) und<br />

X 3 (Reaktionszeit) erklärt. Verwendet man das Maß der Beherrschbarkeit zur Berechnung<br />

der bedingten Varianz, dann erhält man<br />

S 2 Y/X = 31.50563 (1 – 0.851318) = 4.68432 und damit s Y/x = 2.1643.<br />

also denselben Wert für die bedingte Standardabweichung wie oben.


5.12 Welche Eigenschaften haben die Schätzungen?<br />

293<br />

Wie können Sie Hypothesen über die unbekannten Modellparameter prüfen?<br />

Die unbekannten Modellparameter sind im univariaten multiplen Modell mit stochastischen<br />

Input- und Prozessvariablen<br />

•<br />

•<br />

der Vektor der Koeffizienten der Prozessgleichung β Y/X und<br />

die bedingte Varianz σ 2 Y/X .<br />

Wir wollen Antworten auf die Fragen<br />

1. Welche Input- und Prozessvariable hat einen statistisch gesicherten Einfluss auf die Produktvariable?<br />

2. ist die bedingte Varianz statistisch gesichert kleiner als die Varianz der Produktvariablen<br />

Y?<br />

3. ist das Maß der Beherrschbarkeit statistisch gesichert größer als Null?<br />

Prüfung von Hypothesen über den Vektor der Koeffizienten der Prozessgleichung<br />

Di e Prüfung der Hypothese über den Vektor der Regressionskoeffizienten<br />

H 0 : β Y/X = 0 gegen die alternative Hypothese H 1 : β Y/X ≠ 0 mit dem F-Test<br />

T<br />

ˆ BY / X SXX BY / X N − n −1<br />

F =<br />

2<br />

S / ( n + 1)<br />

Y<br />

X<br />

und P ( Fˆ<br />

≤ F α /H 0) = 1− α , wobei Fˆ ∼ Fn+ 1, N−m−1( α ) wird durch das bekannte „finite<br />

intersection“ Prinzip auf die Prüfung der Einzelhypothesen H 0,j : β Y.j/n – j = β * Y.j/n – j gegen H 1 :<br />

β Y.j/n – j ≠ β * Y.j/n – j zurückgeführt, wobei β* Y.j/n – j gegeben sein möge. Die Teststatistik für eine<br />

bestimmte Input- oder Prozessvariable X j ist<br />

( β − B )<br />

t = ⋅S ⋅ N − n − 1, j = 1, …, n.<br />

Y. j/ n−j Y. j/ n−j<br />

2<br />

j j / n−<br />

j<br />

sY<br />

/ X<br />

Oft wird einfach angenommen, dass β * Y.j/n – j = 0.<br />

Die t-Prüfstatistik kann auch mit der F-Statistik geschrieben werden. Es gilt<br />

2 2 2<br />

Y. j/ n−j Y / X Y / n−j<br />

2 jj<br />

SY / X S<br />

2<br />

1 − RY / X<br />

B ( N − n) ( R − R )( N − n)<br />

Fˆ = =<br />

,<br />

j<br />

wobei S jj die Diagonalelemente von S –1<br />

XX sind. Für diese gilt aber<br />

S<br />

−1<br />

XX<br />

⎧<br />

2 2 −1<br />

j − j/<br />

n−<br />

j<br />

=<br />

[ S (1 R )] , für alle j 1, …,<br />

n<br />

⎪<br />

= ⎨ −Rjk / n- { j,<br />

k}<br />

⎪<br />

, für jk , = 1, …, nj , ≠ k<br />

2 2<br />

⎪⎩<br />

Sj Sk (1 − Rj/ n−j) (1 − Rk/<br />

n−k)<br />

und<br />

2 2 2<br />

j − j/ n−j = j/ n−1<br />

[ S (1 R )] S .


294 5 Qualität in der Fertigung<br />

Varianzanalyse für die berechnete Prozessgleichung<br />

Für die P rüfung der linearen Prozessgleichung, d. h. für die Prüfung der Hypothese, ob wenigstens<br />

eine Input- und/oder Prozessvariable einen statistisch gesicherten Einfluss auf die<br />

Produktvariable hat, wird die Varianzanalyse der<br />

Tabelle 5.12.2 durchgeführt. Diese Analyse basiert auf der Identität<br />

Y − Y = Y − Yˆ<br />

+ Yˆ<br />

− Y<br />

i i i i<br />

nach der die Abweichung einer Beobachtung der Produktvariablen Y i vom Mittelwert Y zerlegt<br />

wird in die Abweichung der Beobachtung Y i von dem mit der Prozessgleichung berechneten<br />

Wert Y<br />

ˆi und die Abweichung Yˆi<br />

− Y der berechneten Werte vom Mittelwert. Werden die<br />

Abweichungen quadriert und über alle Beobachtungen summiert, so erhält man die Zerlegung<br />

der Summe der Abweichungsquadrate der Einzelwerte vom Mittelwert<br />

SAQ = ( Y − Y)<br />

gesamt<br />

N<br />

∑<br />

i=<br />

1<br />

in die beiden Summanden<br />

i<br />

2<br />

1. Summe der Abweichungsquadrate der berechneten Werte vom Mittelwert, SAQ Modell =<br />

N<br />

ˆ 2<br />

( Y − Y ) und<br />

∑<br />

i=<br />

1<br />

i<br />

2. die Summe der Abweichungsquadrate der einzelnen Beobachtungswerte von den berechneten<br />

Werten SAQ = ( Y − Y ˆ )<br />

N<br />

2<br />

.<br />

Fehler<br />

∑<br />

i=<br />

1<br />

i<br />

i<br />

Die Summen der Abweichungsquadrate werden in Varianztabelle Tabelle 5.11.1 zusammen<br />

gestellt.<br />

Tabelle 5.12.2: Varianztabelle für die „Güte“ der Prozessgleichung<br />

Variationsursache<br />

Summe<br />

der quadratischen<br />

Abweichungen<br />

FG<br />

Mittlere Summe<br />

der quadratischen<br />

Abweichungen<br />

F-Quotient<br />

Gesamt<br />

Modell<br />

N<br />

∑<br />

i=<br />

1<br />

N<br />

∑<br />

i=<br />

1<br />

2<br />

( Y − Y)<br />

N – 1<br />

i<br />

2<br />

( Yˆ<br />

− Y)<br />

m<br />

i<br />

N<br />

1<br />

∑ 2<br />

( Yi<br />

− Y)<br />

N − 1<br />

i=<br />

1<br />

Fehler<br />

N<br />

N<br />

2 2<br />

∑ ( Y − − ˆ<br />

i Y) ∑ ( Yi<br />

− Y)<br />

i= 1 i=<br />

1<br />

N<br />

2<br />

= ∑ ( Y − ˆ<br />

i Yi)<br />

i=<br />

1<br />

N – m – 1<br />

N<br />

∑<br />

i=<br />

1<br />

N<br />

∑<br />

i=<br />

1<br />

( Yˆ<br />

− Y)<br />

i<br />

2<br />

( Y − Yˆ<br />

)<br />

i<br />

2<br />

i<br />

= F<br />

Mit der Varianzanalyse kann man auch noch einmal die Bedeutung des Maßes der Beherrschbarkeit<br />

sehr klar erkennen.


5.12 Welche Eigenschaften haben die Schätzungen?<br />

295<br />

Beispiel 5.12.2: Bremsweg. Varianzanalyse<br />

Für das Beispiel erhalten wir mit den Daten aus der Datei 03.5.1 Bremsweg (im Internet)<br />

die Tabelle 5.12.3.<br />

Tabelle 5.12.3: Varianzanalyse für die Prozessgleichung<br />

Variationsursache<br />

Summe<br />

der quadratischen<br />

Abweichungen<br />

FG<br />

Mittlere Summe<br />

der quadratischen<br />

Abweichungen<br />

F-Quotient<br />

Gesamt 913,663 29<br />

Modell 791,871 3 263,957<br />

Fehler 121,7934 26 4,6843 56,35<br />

Der berechnete Wert des F-Testes ist sehr viel größer als der entsprechende Tafelwert<br />

F 0.05; 29,3 = 2.93, d. h. die Hypothese, dass die Varianz der Produktvariablen Y durch die<br />

Input- und Prozessvariablen nicht reduziert wird, muss mit sehr kleiner Irrtumswahrscheinlichkeit<br />

verworfen werden.<br />

Die Modellvarianz kann weiter zerlegt werden. Man erhält die weiterführende Tabelle<br />

5.12.4.<br />

Tabelle 5.12.4: Weiterführende Varianzanalyse<br />

Variationsursache Summe der quadratischen F-Quotient Wahrscheinlichkeit<br />

Abweichungen<br />

Modell 791,871 136,63 0,0000<br />

Geschwindigkeit 639,997 8,14 0,0084<br />

Profiltiefe 38,1208 24,28 0,0000<br />

Reaktionszeit 113,752<br />

Residuum 121,7927<br />

Aus dieser Varianztabelle kann man die Bedeutungen der einzelnen Input- und Prozessvariablen<br />

ablesen. Die Geschwindigkeit ist die wichtigste Prozessvariable. Dieser Parameter<br />

hat den größten F-Wert und die kleinste Irrtumswahrscheinlichkeit.<br />

Die „Vorhersagen“ mit diesem statistischen Modell sind in der Tabelle 5.2.15 enthalten<br />

Tabelle 5.12.5: Vorhersagewerte und Vorhersageintervalle für den Bremsweg<br />

Werte X E für Input- und Prozessvariable Vorhersage V.-Intervall<br />

die Input-<br />

X E,1 X E,2 X E,3 ỸE<br />

45 2 1 27,7 [23,0; 32,5]<br />

50 2 2 32,0 [27,3: 36,6]<br />

55 2 1 36,2 [31,5; 40,8]<br />

Die Vorhersagen mit dem ausführlicheren Modell unterscheiden sich von denen, die mit<br />

dem einfachen Modell gewonnen wurden. Das ist aber klar, denn in dem ausführlicheren<br />

Modell steckt sehr viel mehr Information.


296 5 Qualität in der Fertigung<br />

5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />

In vielen Arbeiten, so z. B. in Johnston [1963], Mason [1975], Harvey [1981], Gunst [1983],<br />

Sen and Srivastava [1990] usw. wird der Einfluss der Multikollinearität auf die Schätzfunktionen<br />

im linearen Modell studiert. Dabei begnügen sich die Autoren häufig mit einer intuitiven<br />

Darstellung des Einflusses der Multikollinearität. Wir wollen hier speziell den Einfluss auf die<br />

Prozessgleichung studieren und ein quantitatives Maß für die Multikollinearität verwenden,<br />

um zu erkennen, wie groß der Einfluss der Multikollinearität ist.<br />

Was ist die Multikollinearität?<br />

Wie können wir die Multikollinearität messen?<br />

Nach Anderson [1984] wird die Variabilität eines zufälligen Vektors X durch die verallgemeinerte<br />

Varianz Σ XX beurteilt. Gleichzeitig gilt aber Σ XX = 0 , wenn mit der Wahrscheinlichkeit 1<br />

lineare Abhängigkeiten zwischen den Input- und/oder Prozessvariablen vorkommen. Hieraus<br />

folgt schon, dass der Begriff verallgemeinerte Varianz viel zu eng gefasst ist, wenn es um den<br />

Grad der Multikollinearität geht, denn durch die Determinante werden sowohl die Varianzen<br />

als auch die Abhängigkeitsstruktur erfasst.<br />

Definition der Multikollinearität: Die Straffheit der Abhängigkeitsstruktur zwischen den<br />

Input- und Prozessvariablen wird Multikollinearität genannt und durch die Determinante der<br />

Korrelationsmatrix beurteilt. Für die Determinante der Korrelationsmatrix R XX gilt<br />

und<br />

Σ<br />

= R ⋅∏σ<br />

2<br />

XX XX j<br />

j=<br />

1<br />

n<br />

R<br />

XX<br />

⎧⎪ 1, falls ρjk<br />

= 0, für alle jk , = 1, …, nj , ≠ k<br />

= ⎨<br />

⎪⎩<br />

0, falls wenigstens ein ρjk<br />

= 1, für j ≠ k, j, k = 1, …,<br />

n<br />

Als Maß für die Multikollinearität verwenden wir daher<br />

δ =<br />

1<br />

R<br />

XX<br />

.<br />

Welchen Einfluss hat die Multikollinearität auf die Prozessgleichung und auf das Maß der<br />

Beherrschbarkeit?<br />

Im Netzwerk von betrieblichen Prozessen wurde deutlich ersichtlich, dass die Inputvariablen<br />

eines Prozesses die Produktvariablen eines Vorläuferprozesses sind. Ein Produkt wurde aber<br />

durch mehrere, nicht unabhängige Produktvariable charakterisiert. Der Vektor der Produktvariablen<br />

ist ein zufälliger Vektor. Der Vektor der Prozessvariablen ist in sehr vielen Fällen<br />

ebenfalls ein zufälliger Vektor. Hieraus folgte ja, dass zur Berechnung der Prozessgleichung das<br />

lineare Modell mit stochastischen Input- und Prozessvariablen zu verwenden ist. D. h. aber<br />

auch, dass die Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen, ausgedrückt<br />

durch deren Korrelations- oder Kovarianzmatrix, die Schätzfunktionen für die unbekannten<br />

Koeffizienten in den Gleichungen beeinflusst. Die Abhängigkeitsstruktur zwischen den Input-<br />

und Prozessvariablen kann sehr unterschiedlich sein. Einerseits kann diese durch einen


5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />

297<br />

großen Korrelationskoeffizienten zwischen zwei Parametern oder andererseits durch mäßig<br />

große Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen und deren<br />

unterschiedliche Vorzeichen geprägt sein.<br />

Diese Feststellungen führen auf drei Probleme, die im Rahmen der Multikollinearitätsproblematik<br />

beantwortet werden müssen.<br />

•<br />

•<br />

•<br />

Wie beeinflusst die Abhängigkeitsstruktur und damit die Multikollinearität die Schätzfunktionen<br />

für die unbekannten Koeffizienten und die bedingte Varianz?<br />

Wie kann die Abhängigkeitsstruktur beurteilt werden?<br />

Wie kann ein großer Grad der Multikollinearität korrigiert werden?<br />

In den meisten Schätzfunktionen für die unbekannten Modellparameter kommt die Inverse<br />

der Kovarianzmatrix vor. Folglich schreiben wir die Inverse elementeweise auf und erhalten<br />

die Darstellung<br />

A<br />

−1<br />

XX<br />

⎧<br />

−2 2 −1<br />

Aj (1 − Rj/<br />

n−<br />

j) , für alle j = 1, …,<br />

n<br />

⎪<br />

−R<br />

j k n j k<br />

= ⎨ jk / m−<br />

j,<br />

k<br />

, für , 1, , ,<br />

1<br />

= …<br />

⎪ ≠<br />

⎡<br />

2 2 2 2<br />

A (1 2<br />

j Ak − Rj/ n−j) ⋅(1 − Rk/<br />

n−k)<br />

⎤<br />

⎪ ⎩⎣<br />

⎦<br />

wobei R jk / n−( j, k)<br />

die Korrelationskoeffizienten der bedingten Verteilung von (X j , X k ) unter<br />

der Bedingung der restlichen Variablen (X 1 , …, X j – 1 , X j + 1 , …, X k – 1 , X k + 1 , …, X n ) d. h. die<br />

partiellen Korrelationskoeffizienten bezeichnen. [n – (j, k)] bezeichnet die Indexmenge der<br />

restlichen Variablen.<br />

Diese zeigt, dass mit zunehmender Strenge der Abhängigkeit innerhalb des Vektors der Inputund<br />

Prozessvariablen der multiple Korrelationskoeffizient zwischen einem beliebigen X j und<br />

einer Linearkombination in den restlichen Input- und Prozessvariablen R 2 j/n – j stets größer wird.<br />

Dadurch wird 1 – R 2 j/n – j immer kleiner und somit das Diagonalelement − −<br />

Aj 2 ⋅(1 − R<br />

2 j/<br />

n−<br />

j)<br />

1<br />

von A –1<br />

XX immer größer.<br />

Für die globale Beurteilung der Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen<br />

benötigt man ein Maß. Zur Ableitung eines solchen betrachtet man den bekannten<br />

Zusammenhang (Muirehead [1982])<br />

T<br />

−1 2<br />

XX X n<br />

P[ X ⋅Σ ⋅ ≤ χ ( α)] = 1 − α,<br />

d. h. mit der Wahrscheinlichkeit 1 – α fällt X in das Innere des Konzentrationsellipsoides<br />

T −1 X ⋅Σ ⋅ X = χ 2 ( α ) mit dem Volumen<br />

XX<br />

n<br />

V<br />

=<br />

1 n<br />

⋅<br />

⋅<br />

⋅ ⋅ ⋅ (<br />

⋅<br />

∏<br />

1<br />

2 2 2<br />

π<br />

n<br />

R<br />

2 n<br />

XX σj χn<br />

α<br />

j=<br />

1<br />

(2 ) [ )]<br />

⎛ 1 ⎞<br />

Γ ⎜ ⎟ ⋅ n<br />

⎝2<br />

⋅ n ⎠<br />

,<br />

falls X ∼ N n (0, Σ XX ). Das Volumen ist nur von R XX abhängig, denn die anderen Variablen<br />

bleiben für diese Betrachtung konstant. Somit sollte sich ein Maß für die Multikollinearität<br />

auf die Determinante beziehen.


298 5 Qualität in der Fertigung<br />

Beispiel 5.13.1: Multikollinearität<br />

Der Einfluss der Multikollinearität auf die Parameter des linearen Modells wird durch ein<br />

Beispiel transparent. Es sei Z ~ N 3 (0, R ZZ ), R ZZ sei positiv definit und<br />

R<br />

ZZ<br />

⎛1<br />

ρY1 ρY2⎞<br />

⎜<br />

⎟ ⎛1<br />

ρY.<br />

X⎞<br />

= 1 ρ12<br />

=<br />

⎜ ⎟ ⎜<br />

⎝ ⎟ .<br />

R XX ⎠<br />

⎝ 1 ⎠<br />

Für diesen einfachen Fall sagt man X T = (X 1 , X 2 ) habe den Grad der Multikollinearität<br />

R<br />

1<br />

− 1<br />

XX = δ =<br />

2<br />

1 − ρ 12<br />

,<br />

wenn<br />

ρ<br />

2<br />

12<br />

=<br />

δ − 1 .<br />

δ<br />

In diesem Fall gilt<br />

⎧<br />

2 2<br />

2 2 ⎪1 − ( ρY1 + ρY2) δ + 2 ⋅ρY1 ⋅ρY2 ⋅ ( δ −1) ⋅δ, falls ρ12<br />

≥ 0<br />

σY / X= σY / X () δ = ⎨<br />

⎪ ⎩ −<br />

2 +<br />

2<br />

1 ( ρY1 ρY2) δ − 2 ⋅ ρY1 ⋅ ρY2 ⋅ ( δ − 1) ⋅ δ, falls ρ12<br />

< 0<br />

Da R ZZ positiv definit vorausgesetzt wurde, gilt<br />

mit<br />

2 2<br />

Y1 Y2 12<br />

ρ < 1, ρ < 1 und ρ ∈( ab , )<br />

2 2 2 2<br />

Y1 Y2 Y1 Y2 Y1 Y2<br />

ab , = ρ ⋅ ρ ± 1 − ρ − ρ + ρ ⋅ρ<br />

.<br />

Nur für ρ Y1 = ρ Y2 erhält man b = 1. Setzt man<br />

⎧ 1<br />

⎪ , füra<br />

≥ 0<br />

A =<br />

2<br />

⎨1<br />

− a<br />

⎪<br />

⎩ 0, für a < 0<br />

und<br />

⎧ 1<br />

⎪ , fürρ<br />

≠<br />

=<br />

2<br />

Y ρ<br />

B ⎨1<br />

− b<br />

⎪∞ ⎩ , fürρY<br />

= ρ<br />

dann ist δ ∈ [A, B] und<br />

bzw.<br />

σ<br />

1 Y2<br />

1 Y2<br />

⎧⎪ 0 füra<br />

≥ 0<br />

( A + 0) = ⎨ ⎪ ⎩1 − ( ρY1 + ρY2) füra<br />

< 0<br />

2<br />

Y / X<br />

2 2


5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />

299<br />

σ<br />

⎧⎪ 0 fürρY<br />

≠ ρY<br />

( B − 0) = ⎨ ⎪ ⎩1 − ρY fürρY = ρY<br />

2 1 2<br />

Y / X<br />

2<br />

2 1 2<br />

Aus Symmetriegründen ist nur der Fall a < 0 < b und ρ 12 < 0 zu untersuchen.<br />

2<br />

Es gilt σ / () δ ist monoton wachsend in (A, δ 0 ] und monoton fallend in [δ 0 , B), wobei<br />

Y<br />

X<br />

⎧<br />

2 2<br />

max( ρY1, ρY2)<br />

⎪<br />

für ρ ≠<br />

2 2<br />

Y ρ<br />

δ0 = ⎨ ρY1 − ρY2<br />

⎪<br />

⎩ ∞ für ρY<br />

= ρ<br />

2<br />

/ ()<br />

1 Y2<br />

1 Y2<br />

2 2<br />

Die Funktion σY<br />

Xδ erreicht ihr Maximum 1−<br />

max( ρY1, ρ Y2)<br />

an der Stelle δ 0 .<br />

Zum Beweis für ρ Y1 ≠ ρ Y2 wird − ( ρY1 + ρY2) δ + 2 ρY1ρY2 ( δ −1) ⋅ δ = : g1( δ ) untersucht.<br />

Zur Abkürzung wird ρ Y12 + ρ Y22 =: c und ρ Y1 ρ Y2 =: d gesetzt. Mit diesen Abkür zungen<br />

gilt<br />

d ⋅(2 δ −1)<br />

g1′<br />

() δ =− c +<br />

.<br />

( δ −1)<br />

⋅δ<br />

2 2 2 2<br />

2 2 2 2 2<br />

Aus g′<br />

() δ = c ⋅( δ − δ) − d (4⋅δ − 4⋅ δ + 1) = 0und c = 4 ⋅ d + ( ρY1 − ρ Y2)<br />

erhält<br />

man<br />

δ<br />

2<br />

d<br />

− δ − = 0<br />

2 2 2<br />

( ρ − ρ )<br />

2<br />

Y1 Y2<br />

und somit<br />

δ<br />

2 2 2 2<br />

ρY1 − ρY2 ± ( ρY1 + ρY2) =<br />

.<br />

ρ − ρ<br />

1/2 2 2<br />

Y1 Y2<br />

Für ρ Y1 = ρ Y2 wird<br />

g = ⋅ ⋅ ⎡ − ⋅ − ⎤<br />

2() δ 2 ρY<br />

1 ⎣<br />

( δ 1) δ δ<br />

⎦<br />

untersucht. Da<br />

2<br />

⎡ 2⋅δ<br />

−1<br />

⎤<br />

g2′ () δ = 2⋅ρY<br />

1 ⎢ −1⎥<br />

⎣ ( δ −1)<br />

⋅δ<br />

⎦<br />

folgt aus g ′2 () δ = 0 , dass keine reelle Lösung existiert.<br />

Zur Demonstration dieser Resultate betrachten wir die Korrelationsmatrix<br />

⎛1 0. 9 0.<br />

6⎞<br />

R = ⎜<br />

⎜<br />

1 ρ ⎟<br />

12 ⎟<br />

⎝ 1 ⎠<br />

für den Vektor (Y, X 1 , X 2 ).


300 5 Qualität in der Fertigung<br />

Die Grenzen des Variationsintervalls für den Korrelationskoeffizienten ρ 12 sind<br />

2 2 2 2<br />

Y1 Y2 Y1 Y2 Y1 Y2<br />

ab , = ρ ⋅ ρ ± 1− ρ − ρ + ρ ⋅ρ<br />

2 2<br />

= 0.9 ⋅ 0.6 ± 1 − 0.9 − 0.6 + 0.81 ⋅ 0.36 = 0.54 ± 0.348<br />

⎧<br />

−4<br />

a R = ⋅ δ a =<br />

⎪0.192, für , mit ′ 4.96 10 und ( ) 1.038<br />

= ⎨<br />

−4<br />

⎪⎩ 0.888, für b, mit R′′<br />

= 4.96 ⋅ 10 und δ( b) = 4.729<br />

Der Grad der Multikollinearität bis zu dem σ 2 Y/X<br />

monoton wächst ist<br />

δ<br />

2 2<br />

ρY1 ρY2<br />

0 2 2<br />

ρY1 − ρY2<br />

max ( , ) 0.81<br />

= = = 1.8.<br />

0.45<br />

Die bedingte Varianz im standardisierten Modell wird nach der Beziehung<br />

−1<br />

2<br />

1 ρ12 ρY<br />

1<br />

Y / X = 1 − ( Y 1 Y 2 ) ⋅ ⋅<br />

1 ρY<br />

2<br />

⎛ ⎞ ⎛ ⎞<br />

σ ρ ρ ⎜<br />

⎝<br />

⎟<br />

⎠<br />

⎜<br />

⎝<br />

⎟<br />

⎠<br />

1 ⎛1<br />

−ρ<br />

⎞ ⎛ρ<br />

⎞<br />

= 1 − ( ρ ) ⋅ ⋅ ⎜ ⋅<br />

⎝<br />

⎟<br />

⎠<br />

⎜<br />

⎝<br />

⎟<br />

⎠<br />

ρ ρ ρ ρ ρ<br />

= 1 −<br />

12 Y1<br />

Y1 ρY2 2<br />

1 − ρ12<br />

1 ρY<br />

2<br />

2 2<br />

Y1 + Y2 − 2 ⋅ Y1 ⋅ Y2 ⋅ 12<br />

2<br />

1 − ρ12<br />

berechnet.<br />

Für a, b, δ 0 und einige weitere Zwischenstellen für den Grad der Multikollinearität erhält<br />

man die folgenden Werte für die bedingte Varianz bzw. bedingte Standardabweichung:<br />

2<br />

Y / X( a) = 0.000515, σ Y/X ( a) = 0.0227,<br />

2<br />

Y / X( 1 = 1.19) = 0.1214, Y/X ( 1 ) = 0.3484,<br />

2<br />

Y / X( 2 = 1.312) = 0.1561, Y/X ( 2 ) = 0.395,<br />

2<br />

Y / X( 3 = 1.33) = 0.16, Y/X ( 3 ) = 0.4,<br />

2 2 2<br />

Y / X 0 = Y/X 0 = Y/X = − Y1<br />

2<br />

Y / X( 4 = 2.5) = 0.1776, Y/X ( 4 ) = 0.4083,<br />

2<br />

Y / X( 5 = 3.249) = 0.118, Y/X ( 5 ) = 0.3435,<br />

2<br />

Y / X( 6 = 4) = 0.0611, Y/X ( 6 ) = 0.2472,<br />

) 0.19,<br />

Y/X<br />

σ<br />

σ δ σ δ<br />

σ δ σ δ<br />

σ δ σ δ<br />

2<br />

σ ( δ ) 0.18999, σ ( δ ) 0.4359, max σ ( δ) 1 max ( ρ , ρY<br />

2 =<br />

2<br />

σY / X( b ) = 0.002346, σ ( ) = 0.0484.<br />

σ δ σ δ<br />

σ δ σ δ<br />

σ δ σ δ<br />

Die Abbildung 5.13.1 zeigt die Werte für die bedingte Standardabweichung über den verschiedenen<br />

Graden der Multikollinearität. Wie berechnet, steigen die Werte der bedingten<br />

Standardabweichung vom kleinst möglichen Grad a bis zum Grad δ 0 der Multikollinearität an<br />

und fallen dann wieder bis zum maximal möglichen Grad b der Multikollinearität.


5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />

301<br />

0.4<br />

0.3<br />

bedStreuung<br />

0.2<br />

0.1<br />

0.0<br />

0 1 2 3 4 5<br />

Det<br />

Abb. 5.13.1: Bedingte Standardabweichung über dem Grad der Multikollinearität<br />

Für höher dimensionale Vektoren (n ≥ 3) von Input- und Prozessvariablen kann man die Abhängigkeit<br />

der bedingten Varianz (Standardabweichung) vom Grad der Multikollinearität δ<br />

nicht mehr analytisch darstellen. Es bleibt hier nur die Möglichkeit, mit Beispielen die Vermutung,<br />

dass bei den höher dimensionalen Fällen die gleiche Tendenz gilt, zu untermauern.<br />

Gibt es einen Zusammenhang zwischen dem Grad der Multikollinearität und der<br />

Konditionszahl?<br />

Um die Auswirkung eines großen δ auf d ie Schätzfunktionen für die unbekannten Parameter<br />

in der Prozessgleichung zu untersuchen, bietet sich die Berechnung der Fehler E an, die bei<br />

der Lösung des Normalgleichungssystems<br />

T<br />

Y / X XX Y.<br />

X<br />

B R = R<br />

entstehen. Um diesen Fehler berechnen zu können, führen wir die Konditionszahl<br />

k<br />

E<br />

=<br />

⎛<br />

⎜<br />

⎝<br />

R<br />

R<br />

XX<br />

XX<br />

n<br />

⎞<br />

⎟<br />

⎠<br />

n<br />

mit<br />

⎛<br />

RXX<br />

= ⎜n + 2∑r<br />

⎝<br />

2<br />

jk<br />

j<<br />

k<br />

⎞<br />

⎟<br />

⎠<br />

1<br />

2<br />

ein. Damit gilt nach Focke [1962]<br />

E<br />

≤<br />

3 ⋅ n a<br />

,<br />

k R<br />

E<br />

XX


302 5 Qualität in der Fertigung<br />

wobei a der Vektor der Abweichungen ist, die man erhält, wenn man die Lösung B Y/X in das<br />

Normalgleichungssystem BY T<br />

/ X RXX = RY.<br />

X einsetzt, d. h. a = BY T<br />

/ X RXX − RY.<br />

X .<br />

Je größer der Grad der Multikollinearität ist, desto größer werden die Fehler. Unter den genannten<br />

Voraussetzungen, dass der zufällige Vektor Z = (Y T , X T ) aus den m Produkt- und n<br />

Input- und Prozessvariablen m + n dimensional normal- oder elliptisch umrissen verteilt und<br />

die gemeinsame Kovarianzmatrix positiv definit ist, gilt für eine Stichprobe<br />

(Y i , X i ), i = 1, …, N<br />

von unabhängigen und identisch nach Z verteilten zufälligen Vektoren mit der Schätzfunktion<br />

N<br />

∑<br />

A = ( Z − Z) ⋅( Z − Z)<br />

ZZ i i<br />

i= 1<br />

für die Kovarianzmatrix und deren Zerlegung<br />

A<br />

ZZ<br />

⎛AYY<br />

AYX<br />

⎞<br />

= ⎜<br />

⎝ A ⎟<br />

⎠ ,<br />

XX<br />

T<br />

die Maximum Likelihood Schätzfunktion MLSF) für die Matrix der Regressionskoeffizienten<br />

wird nach der Beziehung<br />

T T −1<br />

Y / X= YX⋅<br />

XX<br />

B A A<br />

berechnet.<br />

Der Vektor der Absolutglieder besitzt die Darstellung<br />

T<br />

0 = − Y / X ⋅ .<br />

B Y B X<br />

Die MLSF für die bedingte Kovarianzmatrix<br />

−1<br />

YY / X = YY − YX ⋅ XX ⋅ XY<br />

Σ Σ Σ Σ Σ ist<br />

−1<br />

YY / X = YY − XX ⋅ XY<br />

A A A A<br />

bzw. mit der MLSF<br />

S<br />

ZZ<br />

1<br />

= ⋅ A<br />

N − 1<br />

ZZ<br />

−1<br />

YY / X = YY − YX ⋅ XX ⋅ XY.<br />

S S S S S<br />

Für die MLSF haben wir schon gezeigt, dass<br />

E[ BY/ X / X] = E[ BY/ X] = ΒY/<br />

X,<br />

E[ AYY / X / X] = ( N − n −1) ΣYY / X ,<br />

−1 −1<br />

cov [ B / X] = A ⊗ Σ und cov [ B ] = ( N − n −1) ⋅Σ ⋅Σ<br />

.<br />

Y/ X XX YY/ X Y/ X XX YY/<br />

X<br />

Aus diesen Eigenschaften können Sie schon ablesen, dass die Varianzen der MLSF für die<br />

Regressionskoeffizienten immer größer werden, je größer der Grad der Multikollinearität ist,<br />

denn überall dort wo die Inverse Kovarianzmatrix ins Spiel kommt, wirkt der Grad der Multikollinearität.<br />

Das gilt auch für die folgenden Eigenschaften.


5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />

303<br />

•<br />

•<br />

•<br />

die bedingte Verteilung von B Y/X ist N ( ΒY / X, A XX ⊗ ΣYY / X)<br />

,<br />

die unbedingte Verteilung von B Y/X ist eine multivariate t-Verteilung,<br />

( N −1) ⋅ S YY / X ist Wishart verteilt, d. h. Wm ( N − m −1, ΣYY / X).<br />

Außerdem gelten für die bedingten und unbedingten Vorhersagefehler die folgenden Beziehungen.<br />

Der bedingte Vorhersagefehler wird nach der Beziehung<br />

M<br />

−1<br />

Nm = ΣYY X ⋅ + XE ⋅ AXX ⋅ XE<br />

, / (1 )<br />

und der unbedingte nach<br />

U<br />

⎛ n ⎞<br />

= Σ ⋅ ⎜ +<br />

⎝<br />

⎟<br />

N − n −1⎠<br />

Nm , YY/ X 1<br />

berechnet. Aus den Modellparametern bzw. den MLSF und deren Eigenschaften liest man die<br />

Abhängigkeit von A –1<br />

XX und damit vom Grad der Multikollinearität ab.<br />

−1<br />

Beispiel 5.13.2: Einfluss der Multikollinearität. Einfluss auf die Modellparameter<br />

Für n = 4 wird ein Beispiel nach faktoranalytisch folgender Vorschrift konstruiert:<br />

X 1 = ½ (X 2 + X 3 + X 4 )<br />

X 2 = 2 A + U 2<br />

X 3 = –A + 2 U 3<br />

X 4 = A + U 4<br />

wobei A einen gemeinsamen Faktor und U j , j = 2, 3, 4 spezielle Faktoren bezeichnen. Durch<br />

das Einsetzen der falktoranalytischen Annahmen erhält man<br />

X 1 = ½ (U 2 + 2 U 3 + U 4 ) + A.<br />

Die Voraussetzungen an die gemeinsamen und speziellen Faktoren der Faktoranalyse,<br />

E(A) = E(U j ) = 0, und var(A) = var(U j ) = 1, j = 1, 2, 3, 4 ermöglichen die Berechnung der<br />

Varianzen und Kovarianzen zwischen den vier Prozessvariablen X 1 bis X 4 . Man erhält<br />

var(X 1 ) = E [1/4 (U 2 + 2 U 3 + U 4 ) 2 + A 2 + (U 2 + 2 U 3 + U 4 ) A]<br />

= ¼ (1 + 4 + 1) + σ 2 A = 6/4 + 1 = 5/2,<br />

var(X 2 ) = E (2 A + U 2 ) 2 = 5,<br />

var(X 3 ) = E (–A + 2 U 3 ) 2 = 5,<br />

var(X 4 ) = E (A – U 4 ) 2 = 2<br />

cov(X 1 X 2 ) = E (X 1 X 2 ) = E [(1/2 (U 2 + 2 U 3 + U 4 ) + A) (2 A + U 2 )] = 5/2,<br />

cov(X 1 X 3 ) = E (X 1 X 3 ) = E [(1/2 (U 2 + 2 U 3 + U 4 ) + A) (–A + 2 U 3 )] = 1<br />

cov(X 1 X 4 ) = E (X 1 X 4 ) = E [(1/2 (U 2 + 2 U 3 + U 4 ) + A) (A + U 4 )] = 3/2,<br />

cov(X 2 X 3 ) = E (X 2 X 3 ) = E [(2 A + U 2 ) (–A + 2 U 3 )] = – 2,<br />

cov(X 2 X 4 ) = E (X 2 X 4 ) = E [(2 A + U 2 ) (A + U 4 )] = 2,<br />

cov(X 3 X 4 ) = E (X 3 X 4 ) = E [(–A + 2 U 3 ) (A + U 4 )] = – 1.


304 5 Qualität in der Fertigung<br />

Mit den Varianzen und Kovarianzen können die Korrelationskoeffizienten<br />

cov( Xj, Xk)<br />

ρ jk = , j, k= 1, …,4,<br />

j≠<br />

k<br />

1/2<br />

[var( X ) ⋅ var( X )]<br />

j<br />

berechnet werden. Man erhält die Korrelationsmatrix<br />

k<br />

R<br />

XX<br />

⎛ 1 2 2/3 ⎞<br />

⎜1<br />

2 5 5<br />

⎟<br />

⎜ ⎟ ⎛1 0.707 0.282 0.670 ⎞<br />

⎜ −2 2 ⎟<br />

1<br />

⎜ 1 −0.400 0.632 ⎟<br />

= ⎜ ⎟<br />

5 5 = ⎜ ⎟,<br />

⎜ ⎟ ⎜<br />

1 −0.316⎟<br />

⎜<br />

−1<br />

⎟<br />

1<br />

⎜ 1 ⎟<br />

⎜<br />

⎟ ⎝<br />

⎠<br />

⎜<br />

10<br />

⎟<br />

⎝<br />

1 ⎠<br />

wobei die Dezimalbrüche durch die Berechnungen von 3 Stellen nach dem Komma zustande<br />

kommen. Das Wesen dieser Korrelationsmatrix besteht darin, dass der Rang der Korrelationsmatrix<br />

durch das aufgeprägte weiße Rauschen 4 beträgt; ansonsten nur 3! und der<br />

Einfluss des weißen Rauschens mit zunehmender Anzahl von Stellen für die Dezimalbrüche<br />

immer kleiner wird. Aus der zweiten Eigenschaft folgt, dass der Grad der Multikollinearität<br />

durch die Anzahl der Dezimalstellen verändert werden kann. Die Determinante für die<br />

Korrelationsmatrix mit drei Dezimalstellen ist det(R XX ) = 9.66 10 –4 .<br />

Für 4 Stellen nach dem Komma erhält man det(R XX ) = 3.53 10 –5 . Für 6 Dezimalstellen erhält<br />

man den Wert det (R XX ) = 1.306 10 –6 usw. Erweitert man die Korrelationsmatrix R XX mit<br />

3 Dezimalstellen um den Vektor der Korrelationskoeffizienten<br />

ρ T Y.X = (1 0.3 0.3 –0.3 0.65),<br />

dann erhält man eine Korrelationsmatrix für den gemeinsamen Vektor (Y, X T ) von einem<br />

Produkt- und vier Prozessvariablen.<br />

Die inverse Korrelationsmatrix hat die Elemente<br />

⎡ 518.00409761864935308 −366.52374300262834013 −365.67403717048603733 −230.972735572707543<br />

⎤<br />

⎢<br />

−366.52374300262834013 261.13943712283653603 259.13986870735832069 162.4189820616535264<br />

⎥<br />

⎢<br />

⎥<br />

⎢−365.67403717048603733 259.13986870735832069 259.33982968888505582 163.1765940628628639⎥<br />

⎢<br />

⎥<br />

⎣−230.9727355727075434 162.41898206165352646 163.17659406286286398 104.6667398946136903⎦<br />

Mit den Elementen der inversen Korrelationsmatrix kann man die Koeffizienten der Regressionsfunktion<br />

(bedingten Erwartungswertes) berechnen. Man erhält die Funktion<br />

E[Y/X] = 5.014039 X 1 – 3.784914 X 2 – 3.697413 X 3 – 1.485723 X 4<br />

und die bedingte Varianz<br />

σ 2 Y/X = 1 – 0.512241 = 0.487759.<br />

Berechnet man 4 Dezimalstellen der Korrelationsmatrix und rundet auf 3 Stellen, dann<br />

erhält man die inverse Korrelationsmatrix


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

305<br />

⎡ 3903.7774652061360842 −2759.4607872664600142 −2759.9198281797504894 −1744.8306665184492782<br />

⎤<br />

⎢<br />

−1<br />

−2759.4607872664600142 1952.3805292153284385 1951.3032020137744162 1232.3531250988444835<br />

⎥<br />

R XX = ⎢<br />

⎥ ,<br />

⎢ − 2759.9198281797504894 1951.3032020137744162 1952.4272516129524397 1233.6982893435863439 ⎥<br />

⎢<br />

⎥<br />

⎣−1744.8306665184492782 1232.3531250988444835 1233.6982893435863439 781.55050847888419224⎦<br />

die Determinante der Korrelationsmatrix der Prozessvariable det(R XX ) = 1.279 10 –4 , den<br />

bedingten Erwartungswert<br />

E[Y/X] = 37.131019 X 1 – 26.485507X 2 – 26.409275 X 3 – 15.844919 X 4<br />

und die bedingte Varianz<br />

σ 2 Y/X = 1 – 0.817239 = 0.182761.<br />

Die geringfügige Veränderung der einzelnen Elemente der Korrelationsmatrix führt zu<br />

starken Veränderungen der Ergebnisse (Elemente der inversen Korrelationsmatrix und<br />

damit der multiplen Korrelationskoeffizienten, Koeffizienten des bedingten Erwartungswertes,<br />

bedingte Varianz).<br />

Aus dieser Darstellung erkennt man, dass die Fehler mit kleiner werdender Determinante<br />

der Korrelationsmatrix für die Input- und Prozessvariable und damit mit kleiner werdenden<br />

Konditionszahlen größer werden.<br />

5.14 Wie können wir die wesentlichen Input- und<br />

Prozessvariablen auswählen?<br />

In den Regressionsansätzen mit festen oder stochastischen Input- und Prozessvariablen wird<br />

der Zusammenhang zwischen einem (oder mehreren) Produktvariablen Y und den n Inputund<br />

Prozessvariablen X T = (X′, Z) gesucht. Da zu Beginn der Analyse nicht bekannt ist, welche<br />

Input- und Prozessvariablen den (oder die) Produktvariable wesentlich beeinflussen, misst<br />

man nach dem Grundsatz des<br />

Galilei: „Messe alles, und das nicht Messbare mache messbar“,<br />

so viel wie möglich Input- und Prozessvariablen und hofft, dass unter den gemessenen diejenigen<br />

sind, die Y gut erklären. Hinter dieser Formulierung steht die Frage nach der Adäquatheit<br />

des Modells. Hierfür verwenden wir das Maß der Beherrschbarkeit, den F-Test, die t-Tests und<br />

Residualanalysen. Diese Analysen reichen aber nicht aus, den optimalen Ansatz zu finden.<br />

5.14.1 Warum müssen aber nun wieder Input- und/oder Prozessvariablen<br />

aus dem Ansatz gestrichen werden?<br />

Es ist doch offensichtlich, dass mit zunehmender Anzahl von Input- und Prozessvariablen die<br />

Information über Y nicht geringer werden kann. Das ist der Inhalt der Wiener Shannon’sche<br />

Theorie, wonach die Entropie als Maß der Unbestimmtheit einer oder mehrerer Produktvariablen<br />

mit zunehmender Anzahl von Input- und Prozessvariablen desselben Prozesses stets<br />

kleiner wird.


306 5 Qualität in der Fertigung<br />

Trotzdem gibt es verschiedene Gründe für die Notwendigkeit der Auswahl der wesentlichen<br />

Input- und Prozessvariablen . Zwei dieser Gründe sind:<br />

Der Grad der Multikollinearität nimmt mit wachsender Anzahl n von Input- und Prozessvariablen<br />

zu. Daraus folgt aber sofort, dass die Anzahl der redundanten oder unwesentlichen<br />

Input- und Prozessvariablen ebenfalls zunimmt und aufgrund des zunehmenden Grades<br />

der Multikollinearität die numerischen Fehler bei der Lösung des Normalgleichungssystems<br />

größer werden.<br />

Die beiden Terme des unbedingten Vorhersagefehlers (das ist auch der Vorhersagefehler im<br />

2 ⎛ n ⎞<br />

linearen Modell mit festen Input- und Prozessvariablen) UNn , = σY / X ⎜1<br />

+ ⎟ zeigen<br />

⎝ N − n −1⎠<br />

2<br />

unterschiedliches Verhalten. Die Folge { σY / X ( n ) }, n → ∞ ist antiton (monoton nicht wachsend,<br />

wenn die Anzahl der Input- und Prozessvariablen größer wird) und<br />

⎛ n ⎞<br />

⎜1 + , n → ∞<br />

⎝<br />

⎟<br />

N − n −1⎠<br />

ist streng isoton (monoton wachsend). Die Abbildung 5.14.1 zeigt, dass ein p* = p*(N) mit<br />

p* ∈ {0, 1, …, n} gefunden werden kann, für dass p < p* und p > p* U N.p > U N,p* ist. Das p*<br />

wollen wir optimale Anzahl nennen.<br />

Mit den Auswahlverfahren sollen sowohl das p* wie auch die wesentlichen Input- und Prozessvariablen<br />

gefunden werden.<br />

Dabei beinhaltet die Teilmenge der unwesentlichen Input- und Prozessvariablen diejenigen<br />

Variablen, die<br />

•<br />

•<br />

entweder mit den Produktvariablen nicht oder nur sehr gering korreliert<br />

oder aber redundant sind.<br />

Neben der „Vorhersage“ der Produktvariablen aufgrund von Werten für die Input- und<br />

Prozessvariablen ist somit die Auswahl der wesentlichen Input- und Prozessvariablen ein<br />

vorrangiges Ziel der Anwendung der Regressionsanalyse sowohl mit bekannten, festen (nicht<br />

stochastischen) als auch stochastischen Input- und Prozessvariablen.<br />

σ Y/X<br />

<br />

→ ∞<br />

<br />

+ n<br />

1 ,<br />

N − n −1<br />

n<br />

σ Y/X<br />

optimale Anzahl<br />

n<br />

Abb. 5.14.1: Optimale Anzahl p*


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

307<br />

Es ist notwendig an dieser Stelle noch einmal darauf hinzuweisen, dass es zwischen den beiden<br />

Modellen grundsätzliche Unterschiede gibt. Diese sind:<br />

Wird in dem Modell mit festen Input- und Prozessvariablen z. B. X n gestrichen, dann<br />

• verändert sich das Modell<br />

n<br />

T<br />

Yx . , mit<br />

Yj . j<br />

j = 1<br />

Y = β ⋅ x + ε ε = Y −∑ β x<br />

in das Modell<br />

Y<br />

n−1<br />

∑<br />

= β x + ε *,<br />

Y.<br />

j<br />

j = 1<br />

j<br />

in dem E(ε*) verschieden von null ist.<br />

• Im Modell mit stochastischen Input- und Prozessvariablen<br />

Y = β 0 + β Y/X X + F Y/X ,<br />

mit<br />

β T Y/X = σ Y.X Σ–1 YY , β 0 = µ Y – β Y/X μ X und F Y/X = Y – E[Y/X] ~ N 1 (0, σ2 Y/X )<br />

und<br />

Y und F Y/X sind unabhängig voneinander,<br />

gilt auch nach der Streichung des Input- oder Prozessvariables X n , dass<br />

F Y/X = Y – E[Y/X] ~ N 1 (0, σ 2 Y/X ) ist.<br />

Es ist aber klar, in diesem Modell wird σ 2 Y/X größer.<br />

Alle Verfahren zur Auswahl der wesentlichen Input- und Prozessvariablen werden unter der<br />

Bezeichnung Teilmengenregression subl imiert. Die meisten Verfahren entstanden unter der<br />

Annahme, dass die Input- und Prozessvariablen feste Einstellgrößen sind. Diese Annahme<br />

ist – zumindest für die Anwendung der Verfahren zur statistischen Analyse von Prozessen<br />

– nicht gerechtfertigt, denn zumindest die Inputvariablen sind Zufallsgrößen, da sie als<br />

Produktvariablen von Vorläuferprozessen aufgefasst werden müssen. Diese Verfahren, siehe<br />

z. B. Hocking [1972, 1976], Hocking and Leslie [1967], Thompson [1978], Kinal and Lahiri<br />

[1983], Mallows [1966, 1977]Miller [1990] und viele andere, werden nicht im Detail beschrieben,<br />

sondern nur für die Einschätzung des universellen Red-Verfahrens von Jahn [1984,<br />

1991] verwendet.<br />

5.14.2 Welche Verfahren können für die Auswahl optimaler Teilmengen<br />

von „fixen“ Input- und Prozessvariablen verwendet werden?<br />

Für das Modell mit festen Input- und Prozessvariablen (feste Einstellgrößen) wurden in den<br />

letzten Jahren zahlreiche Auswahlverfahren entwickelt. Diese Verfahren lassen sich in drei<br />

Gruppen einteilen.


308 5 Qualität in der Fertigung<br />

1. Berechnungsalgorithmen zum Auffinden der besten Anpassungsteilmengen.<br />

Die se Verfahren basieren entweder auf dem „Kleinst Quadrat Anpassungskriterium“, der<br />

Minimax Anpassung oder der L 1 bzw. L ∞ Anpassung. Bei all diesen Verfahren müssen die<br />

Restsummen der Abweichungsquadrate für alle 2 n – 1 Teilmengen berechnet werden. Das ist<br />

ein Riesenaufwand, vgl. z. B. Edwards and Havra’nek [1987].<br />

2. Vorhersagefehler Minimierungsverfahren.<br />

Der Vorhersagefehler für das Modell mit festen Input- und Prozessvariablen wird genauso<br />

berechnet wie der unbedingte Vorhersagefehler im Modell mit stochastischen Input- und<br />

Prozessvariablen. Auswahlverfahren, die darauf basieren, sind das C p -Verfahren von Mallows<br />

[1973], das PSS von Allen [1971] und das BIC von Schwarz [1978]. Informationstheoretische<br />

Betrachtungen im Zusammenhang mit dem Vorhersagefehler führen auf das AIC von Akaike<br />

[1973, 1976].<br />

An dieser Stelle soll nur das C p Kriterium von Mallows für das lineare Modell mit festen Input-<br />

und Prozessvariablen etwas ausführlicher skizziert werden. Nach obigen Grundanliegen<br />

soll der Vektor x der festen Input- und Prozessvariablen in zwei Teilvektoren zerlegt werden.<br />

Dabei beinhaltet der Teilvektor x(k) die wesentlichen und x(h) die unwesentlichen Input- und<br />

Prozessvariablen, wobei k = (k 1 , …, k p ), mit<br />

mit<br />

k 1 < … < k p die Teilmenge der Indices für die wesentlichen und h = (h 1 , …, h n – p ),<br />

h 1 < … < h n – p die Teilmenge der Indices der unwesentlichen Variablen bezeichnen.<br />

Das Teilmengenregressionsmodell lautet dann<br />

Y = β T Y.k x (k) + ε(k).<br />

Der Vorhersagefehler für dieses Modell ist<br />

N = E[ Y − Yˆ( k)] = + var[ Yˆ( k)] + { E[ Yˆ( k) − Y]}<br />

.<br />

N.<br />

p<br />

2 2 2<br />

σR<br />

Eine Mittelung über die Zeilen der Design Matrix x liefert<br />

N N N N<br />

2 2 2<br />

U ˆ ˆ ˆ<br />

Npi , , = E[ Yi − Yi( k)] = N σR + var[ Yi( k)] + { E[ Yi( k) − Yi]}<br />

i= 1 i= 1 i= 1 i=<br />

1<br />

∑ ∑ ∑ ∑ .<br />

Mallows betrachtet nun das folgende Kriterium<br />

1 ⎛<br />

N<br />

N<br />

ˆ ˆ<br />

2<br />

⎞<br />

Γ p = var [ Y<br />

2<br />

i( k)] { E[ Yi( k) Yi]}<br />

σ<br />

⎜∑<br />

+ ∑ −<br />

R ⎝<br />

⎟<br />

i= 1 i=<br />

1<br />

⎠<br />

1<br />

[ ˆ T T<br />

( ) ˆ T<br />

= E Y k − β<br />

2<br />

Yxk . ( ) x( k)] E[ Y( k) − βYxk<br />

. ( ) x( k)]<br />

+ p .<br />

σR<br />

Den Bias<br />

ˆ T T<br />

[ ( ) ( )] [ ˆ T<br />

E Y k − β x k E Y( k) − β x( k) = SSB]<br />

Yxk . ( ) Yxk . ( )


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

309<br />

kann man ausdrücken durch<br />

xkT ( )<br />

T<br />

xkT ( )<br />

Yxk . ( ) Yxk . ( )<br />

SSE = ⎡Y B ⎤ ⎡Y B ⎤<br />

⎣<br />

−<br />

⎦ ⎣<br />

−<br />

⎦<br />

= RSE (Bezeichnung in manchen Programmen).<br />

Der Erwartungswert von SSE ist E (SSE) = ( N − p) σ R + SSB .<br />

Für die Schätzung von Γ p verwendet Mallows die Statistik<br />

2<br />

( N − p)<br />

σˆ<br />

R<br />

Cp = + 2 p − N ≈ p.<br />

ˆ<br />

2<br />

σ<br />

R<br />

3. Testverfahren<br />

Zu diesen V erfahren gehören die stufenweisen oder schrittweisen Verfahren (Vorwärts- und<br />

Rückwärtsauswahl) von Draper, Smith [1981], Miller [1990] als die bekanntesten. Außerdem<br />

gehören der overall F-Test und der finite intersection Test von Krishnaiah [1982] zu dieser<br />

Gruppe.<br />

Die stufenweisen Verfahren verwenden die F-Statistik<br />

Fˆ<br />

T T −1<br />

T<br />

Y ⋅ Xj ⋅ Xj ⋅ Xj ⋅ Xj<br />

⋅Y ⋅ N −<br />

j =<br />

T T −1<br />

T<br />

Y ⋅[ I − Xj ⋅( Xj ⋅ Xj ) ⋅ Xj]<br />

⋅Y<br />

( ) ( 1)<br />

zur Prüfung der Einzelhypothese H 0,j : β Y/j = 0, für j = 1, …, n, wobei β Y/j aus dem Modell<br />

E[Y] = β Y/j X j kommt. Unter der Normalverteilungsannahme ist F ˆj ∼ F1, N−<br />

1 verteilt.<br />

Wird die H 0, j nicht verworfen, dann wird x j als unwesentlich angesehen. Werden die H 0, j<br />

j = 1, …, n verworfen, dann wird die Input- oder Prozessvariable als wesentlich deklariert, der<br />

max ( Fˆ<br />

ˆ<br />

1, …, Fn<br />

) > F α entspricht. Diese Variable ist dann x [1] . Gilt z. B. max ( F ˆ ˆ<br />

1, …, Fn<br />

) = F1,<br />

dann wird x 1 zur wichtigsten Prozessvariablen erklärt. Ist max ( F ˆ ˆ 1, …, Fn<br />

) ≤ F α , dann wird<br />

keine der Input- und Prozessvariablen als wichtig erkannt und die Analyse ist beendet.<br />

Nach dem Auffinden von x 1 wird die zweitwichtigste Input- oder Prozessvariable gesucht.<br />

Hierzu werden die F-Statistiken<br />

mit<br />

T<br />

Y ⋅ M0. ( 2)<br />

ˆ jk ⋅Y ⋅ N −<br />

Fjk<br />

= , j = 1, …,<br />

n<br />

T<br />

Y ⋅ M Y<br />

jk<br />

T T −1 T T T T −1 T −1<br />

0, jk = [ − k ⋅( k ⋅ k ) ⋅ k] ⋅ j [ j ⋅ j − j ⋅ k ⋅( k ⋅ k ) ⋅ k ⋅ j ] ⋅ j<br />

−1<br />

⎡ X<br />

T T<br />

⎛ k⎞ ⎤ X<br />

T T<br />

⎛ k⎞<br />

= I − ( Xj , Xk ) ⋅ ⎢⎜ ( xk Xj<br />

)<br />

X ⎟ ⋅ ⎥ ⎜<br />

j<br />

X ⎟<br />

j<br />

M I X X X X X X X X X X X X X X<br />

⎢⎣⎝ ⎠ ⎥⎦<br />

⎝ ⎠<br />

berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen, d. h. ist<br />

max ( Fˆ<br />

ˆ<br />

12, …, F1 n)<br />

≤ F1<br />

α , dann ist keine der Prozessvariablen X 2 , …, X n wesentlich und wir sind<br />

fertig. F 1α ist der obere 100α % Punkt der zentralen F-Verteilung. Wenn max ( F ˆ ˆ<br />

12, …, F1 n)<br />

> F1<br />

α ,<br />

dann ist die zu dem Maximum gehörende Variable die zweit wich tigste Input- oder Prozessvariable.<br />

In dieser Weise wird das Verfahren fortgesetzt.<br />

Die F-Statistik ist nichts anderes als der Test zur Prüfung der Hypothese<br />

2


310 5 Qualität in der Fertigung<br />

H 0 : β Y.j = 0 für das klassische Modell E[Y] = β Y.j X j , für j = 1, …, n. Für dieses Modell ist F j<br />

zentral F-verteilt mit (1, N – 1) FG. Wenn H 0 „wahr“ ist, dann ist x j unwichtig. Wenn H 0 nicht<br />

„wahr“ ist, dann bedeutet das jedoch nicht, dass x j im 1. Schritt in die Prozessgleichung einbezogen<br />

wird. In der 1. Stufe, wenn alle Prozessvariablen nicht unwesentlich sind, picken wir<br />

nur die wesentlichste heraus und formulieren keine Aussage über die Auswahl der anderen<br />

Prozessvariablen, die als nicht unwichtig deklariert werden. Das Vorgehen führt somit in einen<br />

Bereich, in dem keine Entscheidung getroffen wird.<br />

Bei diesem Verfahren werden die n Einzelhypothesen individuell und nicht simultan geprüft,<br />

denn der Fehler 1. Art wird in jeder Stufe separat gewählt unter der Bedingung, dass<br />

P[F j ≤ F α/H0,j ] = 1 – α. Nehmen wir nun an, dass für ein beliebiges j das Modell E[Y] = β Y.j X j<br />

nicht korrekt ist, dann ist F nicht zentral F-verteilt mit<br />

(1, N – 1) FG.<br />

Betrachten wir nur einmal in der r-te Stufe das Modell<br />

E[Y] = β Y.1 X 1 + … + β Y.r X r + β Y.j X j für j = r + 1, …, n. Dann gilt auch hier, dass die F-Statistik<br />

diejenige Statistik ist, die zur Prüfung der H 0 unter diesem Modell ist. Damit wird deutlich,<br />

dass auf der (j + 1)-ten Stufe der kritische F j, α Wert gewählt wird, ohne Beachtung der Entscheidungen<br />

in den vorangegangenen Stufen. Nimmt man z. B. die 2. Stufe, dann sollte man die<br />

bedingten Wahrscheinlichkeiten P[F 1j ≤ F 1α /H 0 ; max(F 1 , …, F n ) ≥ F α ] für j = 2, …, n berechnen,<br />

um den Fehler 1. Art für die Prüfung der H 0 für ein gegebenes j anstelle der P[F 1j ≤ F α /H 0 ] zu<br />

bestimmen, denn wir wollen ja zur 2. Stufe übergehen, nur wenn max ( Fˆ<br />

ˆ<br />

12, …, F1<br />

n)<br />

> F α .<br />

Beispiel 5.14.1: Chemischer Prozess. Teilmengenregressionen<br />

Auswahl der wesentlichen Input- und Prozessvariablen nach dem C p -Kriterium von Mallows.<br />

Die Auswahl wird mit dem Datensatz 05.7.1 chem. Prozess demonstriert.<br />

Die Produktvariable ist Y 1 , als Prozessvariablen habe ich aus der Gesamtmenge der Inputund<br />

Prozessvariablen die folgende Teilmenge der Prozessvariablen ausgewählt und mit<br />

den Buchstaben A bis L bezeichnet, da das Programm von Mallows Buchstaben anstelle<br />

von Symbolen erwartet.<br />

X 3 = A<br />

X 4 = B<br />

X 5 = C<br />

X 6 = D<br />

X 7 = E<br />

X 9 = F<br />

X 16 = G<br />

X 17 = H<br />

X 18 = I<br />

X 19 = J<br />

X 20 = K<br />

X 21 = L<br />

Der Stichprobenumfang umfasst N = 107 Beobachtungsvektoren.<br />

Die Anzahl der möglichen Modellansätze ist 2 12 = 4096.<br />

Es ist vollkommen klar, dass ich nicht alle 4096 Detailergebnisse hier darstellen kann. Daher<br />

wähle ich nur eine Teilmenge von Resultaten aus.


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

311<br />

Die Teilmengen mit einer Prozessvariablen sind<br />

Model Results<br />

--------------------------------------------------------------------<br />

Adjusted<br />

Included<br />

MSE R-Squared R-Squared Cp Variables<br />

--------------------------------------------------------------------<br />

47,5433 0,0 0,0 207,759<br />

44,5049 7,27389 6,39078 187,01 A<br />

46,4821 3,15448 2,23214 199,893 B<br />

47,5433 0,943396 0,0 209,731 C<br />

38,1133 20,5909 19,8346 145,359 D<br />

47,5433 0,943396 0,0 207,453 E<br />

30,7136 36,008 35,3986 97,1408 F<br />

45,6049 4,98194 4,07701 194,178 G<br />

26,0692 45,6846 45,1673 66,8763 H<br />

25,4059 47,0667 46,5626 62,5538 I<br />

44,7453 6,77295 5,88507 188,576 J<br />

45,6593 4,86876 3,96275 194,532 K<br />

44,1012 8,11493 7,23983 184,379 L<br />

Teilmengen mit zwei Prozessvariablen<br />

44,9072 7,32686 5,54468 188,844 AB<br />

44,8954 7,35104 5,56933 188,768 AC<br />

36,7184 24,2257 22,7685 135,991 AD<br />

44,9241 7,29186 5,50901 188,953 AE<br />

24,8555 48,7066 47,7202 59,4249 AF<br />

42,5661 12,1581 10,4688 173,734 AG<br />

26,258 45,8124 44,7704 68,4767 AH<br />

25,5116 47,3528 46,3403 63,659 AI<br />

Teilmengen mit drei Prozessvariablen<br />

45,3041 7,40662 4,70972 190,594 ABC<br />

36,8847 24,6144 22,4187 136,776 ABD<br />

45,289 7,43763 4,74164 190,497 ABE<br />

25,0909 48,7188 47,2252 61,3867 ABF<br />

42,9776 12,1617 9,60326 175,723 ABG<br />

26,5118 45,8148 44,2366 70,4692 ABH<br />

25,7582 47,355 45,8216 65,6522 ABI<br />

43,0642 11,9846 9,42104 176,276 ABJ<br />

43,9621 10,1495 7,53251 182,016 ABK<br />

45,3041 7,40662 4,70972 190,594 ABC<br />

36,8847 24,6144 22,4187 136,776 ABD<br />

45,289 7,43763 4,74164 190,497 ABE<br />

25,0909 48,7188 47,2252 61,3867 ABF<br />

42,9776 12,1617 9,60326 175,723 ABG<br />

26,5118 45,8148 44,2366 70,4692 ABH<br />

25,7582 47,355 45,8216 65,6522 ABI<br />

43,0642 11,9846 9,42104 176,276 ABJ<br />

43,9621 10,1495 7,53251 182,016 ABK


312 5 Qualität in der Fertigung<br />

44,1848 9,69442 7,06416 183,439 EKL<br />

22,5179 53,9776 52,6371 44,9394 FGH<br />

21,9735 55,0902 53,7821 41,4596 FGI<br />

28,8272 41,0824 39,3664 85,2701 FGJ<br />

29,5788 39,5463 37,7855 90,0747 FGK<br />

28,2781 42,2048 40,5215 81,7598 FGL<br />

20,0571 59,007 57,813 29,2095 FHI<br />

Teilmengen mit vier Prozessvariablen<br />

31,5516 36,1403 33,636 102,727 ABCD<br />

45,7117 7,48072 3,85251 192,363 ABCE<br />

25,3001 48,7932 46,7851 63,154 ABCF<br />

43,3714 12,2174 8,77489 177,548 ABCG<br />

26,1166 47,1406 45,0677 68,3227 ABCH<br />

25,3429 48,7066 46,6951 63,4247 ABCI<br />

43,4204 12,1182 8,67186 177,858 ABCJ<br />

44,3193 10,2989 6,78124 183,548 ABCK<br />

44,3107 10,3163 6,79932 183,494 ABCL<br />

34,7803 29,6056 26,8451 123,165 ABDE<br />

25,0574 49,2845 47,2957 61,6174 ABDF<br />

35,457 28,2359 25,4216 127,449 ABDG<br />

26,7585 45,8414 43,7175 72,386 ABDH<br />

26,0094 47,3576 45,2932 67,6439 ABDI<br />

36,4121 26,3029 23,4128 133,494 ABDJ<br />

37,1576 24,794 21,8447 138,214 ABDK<br />

Teilmengen mit 5 Prozessvariablen<br />

36,7797 26,2887 22,6396 135,539 ACEGJ<br />

42,5645 14,6951 10,4721 171,799 ACEGK<br />

42,2385 15,3485 11,1578 169,755 ACEGL<br />

22,3575 55,1926 52,9744 45,1393 ACEHI<br />

25,2319 49,432 46,9286 63,1561 ACEHJ<br />

26,149 47,594 44,9996 68,9047 ACEHK<br />

25,6355 48,6232 46,0798 65,6858 ACEHL<br />

24,4621 50,9747 48,5477 58,3311 ACEIJ<br />

25,4623 48,9702 46,444 64,6003 ACEIK<br />

24,7337 50,4303 47,9764 60,0338 ACEIL<br />

42,6308 14,5622 10,3326 172,215 ACEJK<br />

Teilmengen mit 6 Prozessvariablen<br />

26,1567 48,0976 44,9835 69,3295 DEFGKL<br />

17,8856 64,5098 62,3804 17,9989 DEFHIJ<br />

18,375 63,5388 61,3511 21,0359 DEFHIK<br />

16,7221 66,8186 64,8277 10,7779 DEFHIL<br />

21,9859 56,3736 53,756 43,4456 DEFHJK<br />

21,5517 57,2352 54,6693 40,7509 DEFHJL<br />

23,7889 52,7959 49,9637 54,6351 DEFHKL


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

313<br />

Teilmengen mit 7 Prozessvariablen<br />

27,39 46,1938 42,3893 77,284 BCEFGKL<br />

18,0465 64,5487 62,042 19,8774 BCEFHIJ<br />

18,5408 63,5777 61,0023 22,9143 BCEFHIK<br />

16,742 67,1113 64,7858 11,8625 BCEFHIL<br />

22,0387 56,7062 53,645 44,4055 BCEFHJK<br />

21,3412 58,0764 55,1121 40,12 BCEFHJL<br />

23,1807 54,4627 51,2429 51,422 BCEFHKL<br />

Teilmengen mit 8 Prozessvariablen<br />

23,9941 53,341 49,5321 56,9304 ACEFGJKL<br />

17,5608 65,8513 63,0636 17,8034 ACEFHIJK<br />

15,7099 69,4505 66,9566 6,54646 ACEFHIJL<br />

16,7391 67,4492 64,7919 12,8058 ACEFHIKL<br />

20,589 59,9625 56,6942 36,2209 ACEFHJKL<br />

19,9684 61,1693 57,9995 32,4466 ACEFIJKL<br />

Teilmengen mit 9 Prozessvariablen<br />

20,8595 59,8505 56,1253 38,5712 BCEFGIJKL<br />

15,6886 69,8033 67,0015 7,44312 BCEFHIJKL<br />

21,1712 59,2505 55,4696 40,448 BCEGHIJKL<br />

17,1917 66,9102 63,84 16,4915 BCFGHIJKL<br />

17,5588 66,2036 63,0678 18,7015 BDEFGHIJK<br />

15,8758 69,4428 66,6076 8,5704 BDEFGHIJL<br />

16,4236 68,3885 65,4555 11,8678 BDEFGHIKL<br />

21,9824 57,6892 53,7634 45,3311 BDEFGHJKL<br />

21,139 59,3125 55,5374 40,2539 BDEFGIJKL<br />

15,6909 69,7989 66,9967 7,45684 BDEFHIJKL<br />

Teilmengen mit 10 Prozessvariablen<br />

16,5797 68,4171 65,1272 13,7785 BCDEFGHIKL<br />

21,5669 58,9168 54,6373 43,4915 BCDEFGHJKL<br />

20,8591 60,2652 56,1262 39,2742 BCDEFGIJKL<br />

15,8501 69,8069 66,6617 9,43186 BCDEFHIJKL<br />

20,9867 60,022 55,8577 40,0348 BCDEGHIJKL<br />

17,1039 67,4185 64,0246 16,9016 BCDFGHIJKL<br />

15,8428 69,8207 66,6771 9,38847 BCEFGHIJKL<br />

15,8457 69,8152 66,671 9,40572 BDEFGHIJKL<br />

Teilmengen mit 11 Prozessvariablen<br />

15,9586 69,9168 66,4334 11,0881 ABCDEFHIJKL<br />

20,524 61,3108 56,831 38,004 ABCDEGHIJKL<br />

17,2566 67,47 63,7034 18,7405 ABCDFGHIJKL<br />

15,9447 69,9431 66,4628 11,0057 ABCEFGHIJKL<br />

15,9527 69,9279 66,4459 11,0533 ABDEFGHIJKL<br />

15,9463 69,94 66,4594 11,0153 ACDEFGHIJKL<br />

16,0081 69,8236 66,3294 11,3796 BCDEFGHIJKL<br />

Teilmenge mit allen 12 Prozessvariablen<br />

16,1133 69,9449 66,1081 13,0 ABCDEFGHIJKL


314 5 Qualität in der Fertigung<br />

Tabelle 5.14.1: Kleinste C p innerhalb der Teilmengen gleicher Mächtigkeit<br />

Models with Smallest Cp<br />

Model Results<br />

----------------------------------------------------------------<br />

Adjusted<br />

Included<br />

MSE R-Squared R-Squared Cp Variables<br />

----------------------------------------------------------------<br />

15,4953 69,2528 67,408 3,16473 EFHIJL<br />

15,4133 69,7215 67,5806 3,69893 EFHIJKL<br />

15,5857 69,3828 67,218 4,75808 AEFHIJL<br />

15,6116 69,3319 67,1634 4,91743 DEFHIJL<br />

15,6167 69,3218 67,1526 4,94894 BEFHIJL<br />

15,6168 69,3217 67,1526 4,94916 EFGHIJL<br />

15,4847 69,8885 67,4304 5,17655 AEFHIJKL<br />

15,548 69,7653 67,2972 5,5618 BEFHIJKL<br />

15,5531 69,7555 67,2865 5,59256 EFGHIJKL<br />

15,556 69,7497 67,2803 5,61057 DEFHIJKL<br />

15,5592 69,7435 67,2736 5,62989 CEFHIJKL<br />

15,6304 69,9152 67,1238 7,09298 ACEFHIJKL<br />

15,6324 69,9114 67,1197 7,10487 AEFGHIJKL<br />

15,6387 69,8992 67,1063 7,14302 ADEFHIJKL<br />

15,6422 69,8925 67,0991 7,16386 ABEFHIJKL<br />

15,6886 69,8033 67,0015 7,44312 BCEFHIJKL<br />

16,3819 67,4935 65,5431 8,667 EFGHIL<br />

15,7809 69,9388 66,8074 9,01932 ACEFGHIJKL<br />

16,5957 66,7401 65,0935 9,02353 EFHIL<br />

15,7896 69,922 66,7889 9,07166 ABEFGHIJKL<br />

15,7901 69,9212 66,788 9,07414 ADEFGHIJKL<br />

15,7928 69,9159 66,7822 9,09072 ACDEFHIJKL<br />

15,7929 69,9159 66,7822 9,09076 ABCEFHIJKL<br />

16,5026 67,2541 65,2894 9,41573 EFHIKL<br />

16,6609 66,94 64,9564 10,3981 BEFHIL<br />

16,7079 66,8466 64,8574 10,6902 CEFHIL<br />

15,9447 69,9431 66,4628 11,0057 ABCEFGHIJKL<br />

15,9463 69,94 66,4594 11,0153 ACDEFGHIJKL<br />

15,9527 69,9279 66,4459 11,0533 ABDEFGHIJKL<br />

15,9586 69,9168 66,4334 11,0881 ABCDEFHIJKL<br />

16,0081 69,8236 66,3294 11,3796 BCDEFGHIJKL<br />

16,1133 69,9449 66,1081 13,0 ABCDEFGHIJKL<br />

17,6875 64,552 62,7971 15,867 BFHIL<br />

17,8372 64,2519 62,4822 16,8056 EFHIJ<br />

17,848 64,2303 62,4595 16,8731 DFHIL<br />

18,2284 63,4679 61,6594 19,2575 EFHIK<br />

18,6575 62,2376 60,7567 21,1054 FHIL<br />

18,8727 61,8022 60,3042 22,4673 EFHI<br />

19,3647 60,8064 59,2694 25,5817 DFHI<br />

19,3769 60,7817 59,2438 25,6587 FGHI<br />

19,6796 60,1689 58,6069 27,5753 FHIK<br />

20,0571 59,007 57,813 29,2095 FHI<br />

21,5712 55,9124 54,6283 38,8881 FIJ<br />

21,7327 55,5824 54,2887 39,9202 HIL<br />

21,9735 55,0902 53,7821 41,4596 FGI<br />

22,1304 54,7696 53,4522 42,4623 FHJ<br />

22,7717 53,0069 52,1032 45,9754 FI<br />

23,3479 51,818 50,8914 49,6938 FH<br />

23,6865 51,1191 50,1791 51,8795 HI<br />

24,6811 49,0666 48,0871 58,299 GI<br />

24,7316 48,9625 47,981 58,6246 IJ<br />

25,4059 47,0667 46,5626 62,5538 I<br />

26,0692 45,6846 45,1673 66,8763 H<br />

30,7136 36,008 35,3986 97,1408 F<br />

38,1133 20,5909 19,8346 145,359 D<br />

44,1012 8,11493 7,23983 184,379 L<br />

47,5433 0,0 0,0 207,759<br />

----------------------------------------------------------------


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

315<br />

Cp<br />

240<br />

200<br />

160<br />

120<br />

80<br />

40<br />

0<br />

Mallows' Cp Plot for y1<br />

0 3 6 9 12 15<br />

Number of Coefficients<br />

Abb. 5.14.2: C p -Kriterium von Mallows<br />

Die Darstellung des besten (kleinsten) C p innerhalb jeder Teilmenge von Prozessvariablen<br />

gleichen Umfangs ist in der Abbildung 5.14.2 enthalten.<br />

Diese Abbildung zeigt, dass die Mächtigkeit der Teilmenge mit dem kleinsten C p zwischen<br />

n = 6 und n = 8 zu liegen scheint.<br />

Für eine genauere Bestimmung sucht der Computer innerhalb jeder Mächtigkeit der Teilmengen<br />

das kleinste C p . Die Werte sind in der Tabelle 5.14.1 angegeben.<br />

Das Gesamtmodell (das Modell mit allen 12 Prozessvariablen) ist in der Tabelle 5.14.2<br />

enthalten.<br />

Tabelle 5.14.2: Prozessgleichung mit allen Prozessvariablen<br />

Prozessgleichung<br />

-----------------------------------------------------------------------------<br />

Produktvariable: y1<br />

-----------------------------------------------------------------------------<br />

Standard<br />

T<br />

Parameter Estimate Error Statistic P-Value<br />

-----------------------------------------------------------------------------<br />

CONSTANT -408,705 214,545 -1,90499 0,0598<br />

x3 -0,63914 0,852096 -0,750079 0,4551<br />

x4 0,201308 0,523085 0,384847 0,7012<br />

x5 1,92428 18,9108 0,101756 0,9192<br />

x6 1,27445 17,1746 0,0742055 0,9410<br />

x7 -11,723 3,98068 -2,94496 0,0041<br />

x9 0,322213 0,0597561 5,39213 0,0000<br />

x16 -0,0941571 0,845685 -0,111338 0,9116<br />

x17 89,7031 18,5206 4,84342 0,0000<br />

x18 -91,06 17,9793 -5,06472 0,0000<br />

x19 1,07786 0,47749 2,25734 0,0263<br />

x20 3,53736 2,78535 1,26999 0,2072<br />

x21 0,802039 0,23722 3,381 0,0010<br />

-----------------------------------------------------------------------------<br />

Analysis of Variance<br />

-----------------------------------------------------------------------------<br />

Source Sum of Squares Df Mean Square F-Ratio P-Value<br />

-----------------------------------------------------------------------------<br />

Model 3537,88 12 294,824 18,48 0,0000<br />

Residual 1515,41 95 15,9517<br />

-----------------------------------------------------------------------------<br />

Total (Corr.) 5053,3 107<br />

R-squared = 70,0114 percent<br />

R-squared (adjusted for d.f.) = 66,2233 percent<br />

Standard Error of Est. = 3,99396<br />

Mean absolute error = 2,89319<br />

Durbin-Watson statistic = 1,02239


316 5 Qualität in der Fertigung<br />

Das Maß der Beherrschbarkeit für diesen Ansatz ist R 2 Y.X = 0.700 und die Reststandardabweichung<br />

ist s = 3.9939.<br />

Diese Gleichung kann auch in der üblichen Form<br />

y1 = -408,705 - 0,63914*x3 + 0,201308*x4 + 1,92428*x5 + 1,27445*x6 -<br />

11,723*x7 + 0,322213*x9 - 0,0941571*x16 + 89,7031*x17 - 91,06*x18 +<br />

1,07786*x19 + 3,53736*x20 + 0,802039*x21<br />

geschrieben werden.<br />

Verwendet man die optimale Teilmenge {X 7 , X 9 , X 17 , X 18 , X 19 , X 21 } die man nach dem C p<br />

Kriterium von Mallows über alle möglichen Teilmengen von Prozessvariablen aufgefunden<br />

hat, dann erhält man die Prozessgleichung in folgender Tabelle.<br />

Tabelle 5.14.3: Prozessgleichung für die C p optimale Teilmenge von Prozessvariablen<br />

Optimale Prozessgleichung<br />

-----------------------------------------------------------------------------<br />

Produktvariable: Produktvariablee: y1<br />

-----------------------------------------------------------------------------<br />

Standard<br />

T<br />

Parameter Estimate Error Statistic P-Value<br />

-----------------------------------------------------------------------------<br />

CONSTANT -229,092 48,0022 -4,77254 0,0000<br />

x7 -10,9841 2,41239 -4,5532 0,0000<br />

x9 0,278296 0,043022 6,4687 0,0000<br />

x17 90,2917 15,5109 5,82117 0,0000<br />

x18 -92,135 14,6712 -6,28001 0,0000<br />

x19 0,973529 0,332094 2,93148 0,0042<br />

x21 0,824957 0,203737 4,04912 0,0001<br />

-----------------------------------------------------------------------------<br />

Analysis of Variance<br />

-----------------------------------------------------------------------------<br />

Source Sum of Squares Df Mean Square F-Ratio P-Value<br />

-----------------------------------------------------------------------------<br />

Model 3501,64 6 583,607 37,99 0,0000<br />

Residual 1551,65 101 15,3629<br />

-----------------------------------------------------------------------------<br />

Total (Corr.) 5053,3 107<br />

R-squared = 69,2942 percent<br />

R-squared (adjusted for d.f.) = 67,4701 percent<br />

Standard Error of Est. = 3,91956<br />

Mean absolute error = 2,85277<br />

Durbin-Watson statistic = 1,0026<br />

Bemerkung zur Tabelle 5.14.3<br />

Die 1. Spalte der beiden Tabellen beinhaltet die Parameterbezeichnung, die 2. Spalte die<br />

Koeffizienten der Prozessgleichung. Die Prozessgleichung kann auch in der Form<br />

y1 = -229,092 - 10,9841*x7 + 0,278296*x9 + 90,2917*x17 - 92,135*x18 +<br />

0,973529*x19 + 0,824957*x21<br />

geschrieben werden. In der 3. Spalte stehen die Standardabweichungen für die Koeffizienten<br />

der Prozessgleichung. Die 4. Spalte ist für die Werte der t-Statistik


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

317<br />

t<br />

j<br />

BY.<br />

j N − n<br />

= ⋅<br />

jj<br />

S A<br />

R<br />

mit A jj als einem Diagonalelement von A –1<br />

xx reserviert. Die letzte Spalte beinhaltet die berechneten<br />

Irrtumswahrscheinlichkeiten für den t-Test. Sind diese Werte < 0.05, dann ist<br />

der zugehörige Regressionskoeffizient statistisch gesichert von null verschieden, d. h. dann<br />

hat x j einen wesentlichen Einfluss auf Y.<br />

Das Maß der Beherrschbarkeit des vollständigen Ansatzes sinkt durch den Übergang zum<br />

C p -optimalen Ansatz. Die Reststandardabweichung wird geringfügig kleiner. Das liegt aber<br />

offensichtlich an der Anzahl der FG.<br />

Schrittweise Auswahl der unwesentlichen Prozessvariablen nach dem Verfahren von Draper,<br />

Smith<br />

Das schrittweise Verfahren von Draper Smi th wurde von Miller [1984] beschrieben und vorn<br />

in diesem Abschnitt diskutiert.<br />

Beispiel 5.14.2: Chemischer Prozess. Schrittweise Auswahl der unwesentlichen<br />

Prozessvariablen<br />

Das Verfahren liefert die Prozessgleichung<br />

Tabelle 5.14.4: Ergebnis für die Prozessgleichung nach der schrittweisen Auswahl<br />

Prozessgleichung<br />

-----------------------------------------------------------------------------<br />

Produktvariable: y1<br />

-----------------------------------------------------------------------------<br />

Standard<br />

T<br />

Parameter Estimate Error Statistic P-Value<br />

-----------------------------------------------------------------------------<br />

CONSTANT -224,444 49,8182 -4,50527 0,0000<br />

x7 -10,9184 2,42925 -4,49457 0,0000<br />

x9 0,273991 0,0447462 6,12322 0,0000<br />

x17 90,3134 15,5777 5,7976 0,0000<br />

x18 -92,2535 14,7377 -6,25969 0,0000<br />

x19 0,959545 0,335657 2,85871 0,0052<br />

x21 0,838724 0,207968 4,03294 0,0001<br />

-----------------------------------------------------------------------------<br />

Analysis of Variance<br />

-----------------------------------------------------------------------------<br />

Source Sum of Squares Df Mean Square F-Ratio P-Value<br />

-----------------------------------------------------------------------------<br />

Model 3490,06 6 581,676 37,54 0,0000<br />

Residual 1549,53 100 15,4953<br />

-----------------------------------------------------------------------------<br />

Total (Corr.) 5039,59 106<br />

R-squared = 69,2528 percent<br />

R-squared (adjusted for d.f.) = 67,408 percent<br />

Standard Error of Est. = 3,93641<br />

Mean absolute error = 2,86302<br />

Durbin-Watson statistic = 1,00251


318 5 Qualität in der Fertigung<br />

oder wird in der üblichen Weise geschrieben:<br />

y1 = -224,444 - 10,9184*x7 + 0,273991*x9 + 90,3134*x17 - 92,2535*x18 +<br />

0,959545*x19 + 0,838724*x21<br />

Diese Gleichung stimmt mit der C p -optimalen Gleichung überein. Die geringfügigen Abweichungen<br />

sind numerischer Art.<br />

5.14.3 Red-Auswahlverfahren von Jahn<br />

Für das Modell mit stochastischen Input- un d Prozessvariablen wurde von Jahn [1991] das Red<br />

Auswahlverfahren entwickelt. Dieses Verfahren basiert auf der Reduktion der bedingten Varianz<br />

2<br />

σ Y / X durch Hinzunahme weiterer Input- und Prozessvariablen bzw. auf der Reduzierung dieser<br />

Varianz durch Streichen von Input- und Prozessvariablen und realisiert die Anforderungen an<br />

das optimale p* und die dazu gehörende Teilmenge von wesentlichen Input- und Prozessvariablen.<br />

Außerdem liefert dieses Verfahren die „wahre“ Rangfolge der Input- und Prozessvariable<br />

bzgl. ihres Einflusses auf den (die) Produktvariablen.<br />

Zur Untersuchung der durch die Streichung eines Teilvektors bedingten Veränderungen auf die<br />

Modellparameter Regressionskoeffizienten, bedingte Varianz (Restvarianz),„Vorhersagefehler“,<br />

Maß der Beherrschbarkeit des Prozesses und die Teststatistiken, wird von einer beliebigen,<br />

disjunk ten Zerlegung des Vektors X der Input- und Prozessvariable in X T = [X(k) T , X(h) T ],<br />

mit<br />

k = (k 1 , …, k p ), k 1 < k 2 < … < k p und h = (h 1 , …, h n – p ), h 1 < h 2 < … < h n – p<br />

ausgegangen. Damit erhält man die Zerlegung (siehe Glossar) der positiv definiten Kovarianzmatrix<br />

⎛ΣYY ΣYk ΣYh<br />

⎞<br />

Σ = ⎜ Σkk<br />

Σ ⎟<br />

kh ,<br />

⎜ ⎟<br />

⎝<br />

Σ ⎠<br />

hh<br />

wobei die Teilmatrizen die Ordnungen Σ YY : m × m, Σ kk : p × p, Σ hh : (n – p) × (n – p), Σ Yk : m × p,<br />

Σ Yh : m × (n – p) und Σ kh : p × (n – p) haben.<br />

Entsprechend der Kovarianzmatrix kann man die Momente der bedingten Verteilung, den<br />

bedingten Erwartungswert (Regressionsfunktion) und die bedingte Kovarianzmatrix zerlegen.<br />

Man erhält das folgende Ergebnis.<br />

Zerlegungssatz für die Momente einer bedingten Verteilung:<br />

Es sei Z ~ N m + n (0, Σ), Σ > 0 (positiv defi nit).<br />

und<br />

T<br />

T<br />

Yk . / h βYh . / k<br />

E[ Y/ X( k), X( h)] = β ⋅ X( k) + ⋅ X( h)<br />

T<br />

YY / k Y . h / k hh / k Y . h / k YY / X<br />

var [ Y/ X( k), X(<br />

h)] = Σ − β ⋅ Σ ⋅ β : = Σ ,


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

319<br />

wobei<br />

T<br />

Yk . / h = Yk . / h⋅<br />

−1<br />

kk/<br />

h,<br />

T<br />

−1<br />

Yh . / k = Yh . / k⋅<br />

hh/<br />

k,<br />

−1<br />

Yk . / h Yk Yh<br />

−1<br />

hh hk<br />

Yh . / k<br />

hh / k =<br />

Yh<br />

hh −<br />

Yk<br />

hk ⋅<br />

kk<br />

−1<br />

kk ⋅<br />

kh<br />

kh<br />

kk/<br />

h = kk − kh ⋅<br />

−1<br />

hh ⋅ hk<br />

β Σ Σ<br />

β Σ Σ<br />

Σ<br />

Σ<br />

= Σ<br />

= Σ<br />

− Σ<br />

− Σ<br />

⋅ Σ<br />

⋅ Σ<br />

⋅ Σ<br />

⋅ Σ<br />

= cov{[ Y, X( k)]/ X( h)},<br />

= cov{[ Y, X( h)]/ X( k)},<br />

Σ<br />

Σ<br />

Σ<br />

Σ<br />

Σ<br />

Σ<br />

Σ<br />

Σ<br />

Σ<br />

Σ<br />

,<br />

.<br />

Beweis: Jahn [1991].<br />

Dieser Satz besagt, dass eine Regressionsfunktion als Summe zweier bedingter Regressionsfunktionen<br />

darstellbar ist; einmal zwischen Y und X(k) unter der Bedingung X(h) und zum<br />

anderen zwischen Y und X(h) unter der Bedingung X(k). Analog zerfällt die bedingte Kovarianzmatrix<br />

ebenfalls in zwei Bestandteile; einmal die bedingte Kovarianzmatrix des Vektors<br />

der Produktvariable Y unter der Bedingung X(k) und zum anderen in die quadratische Form<br />

T<br />

βYh . / k⋅Σhh/ k⋅β Yh . / k.<br />

Diese Form ist der Anteil, um den die bedingten Varianzen und Kovarianzen von Y unter<br />

der Bedingung X(k) verringert werden, wenn der Teilvektor der Input- und Prozessvariable<br />

X(h) zu dem Teilvektor X(k) hinzu genommen wird. Daher wird die quadratische Form<br />

T<br />

Yh . / k hh/ k Yh . / k<br />

β ⋅Σ ⋅β RED p (h) genannt. Die Umkehr dieser Interpretation ist, Red p (h) ist die<br />

proportionale Vergrößerung der bedingten Varianz z. B. der Produktvariablen Y r , r = 1, …, m<br />

unter der Bedingung X, wenn die Input- und Prozessvariablen X(h) gemeinsam gestrichen<br />

werden.<br />

Was bedeutet die Teilmengenregression?<br />

Die Zerlegung des bedingten Erwartungswertes und der bedingten Varianz dienen dem Auffinden<br />

eines Auswahlverfahrens für eine optimale Teilmenge von Input- und Prozessvariablen<br />

im Sinne der Minimierung des unbedingten Vorhersagefehlers und der Auseinandersetzung<br />

mit der Hocking’schen Teilmengenregression, die z. B. in Hocking and Lesie [1967], Hocking<br />

[1972, 1976], beschrieben wurde.<br />

T<br />

Y / k () Y / k<br />

Y = β ⋅ X k + F<br />

T<br />

1<br />

mit F Y/k ∼ N p (0, Σ YY/k ) und ist unabhängig von X(k), wobei βY / k = ΣY.<br />

k Σkk<br />

− . Der Vergleich der<br />

Teilmengenregression mit dem Zerlegungssatz zeigt eine Übereinstimmung des vollständigen<br />

Ansatzes mit der Teilmengenregression nur für den Fall Σ Yh = 0 und Σ kh = 0. Ist nur Σ kh = 0,<br />

dann gilt<br />

mit<br />

T<br />

T<br />

Y / k () βY / h () Y / X<br />

Y = β ⋅ X k + ⋅ X h + F<br />

Y / X = YY T<br />

/ k − Y / h ⋅ YY / h ⋅ Y / h<br />

var ( F ) Σ β Σ β .<br />

Da diese Fälle bei praktischen Anwendungen erkannt würden, besitzen sie nur theoretisches<br />

Interesse. Über die Auswirkung der Streichung von X(h) aus dem Ansatz gibt der folgende<br />

Satz Auskunf t.


320 5 Qualität in der Fertigung<br />

Satz: Unter den bisherigen Voraussetzungen gilt<br />

und damit<br />

T T T<br />

−1<br />

Y / k = Y. k/ h + Y. h/<br />

k ⋅ hk ⋅ kk,<br />

T<br />

−1<br />

Y / k = Y / X + βY. h/<br />

k ⋅ − Σhk ⋅ Σkk<br />

β β β Σ Σ<br />

F F [ X( h) ]<br />

T<br />

YY/ k = YY/ X + Yh . / k⋅ hh/ k⋅<br />

Yh . / k.<br />

Σ Σ β Σ β<br />

Die Elemente der bedingten Kovarianzmatrix Σ YY/k sind größer als die von Σ YY/X und zwar um<br />

genau die Elemente von Red p (h).<br />

Die Vorhersagefehler der Teilmengenregression sind<br />

und<br />

T<br />

T −1<br />

N. k= ΣYY / k+ βY. h/ k⋅ Σhh/ k⋅βY. h/<br />

k ⋅ + E ⋅ kk⋅<br />

E<br />

M ( ) [1 X () k A X ()] k<br />

U<br />

⎛ p ⎞<br />

= ( + ⋅ ⋅ ) ⋅ ⎜1+<br />

⎝ N − p −1⎟<br />

⎠ .<br />

T<br />

N. k ΣYY / k βY. h/ k Σhh/ k βY. h/<br />

k<br />

Der Vergleich der beiden unbedingten Vorhersagefehler U N.n und U N.k liefert ein erstes Indiz<br />

für die Konstruktion des Auswahlverfahrens, denn die Diagonalelemente der Vorhersagefehlermatrizen<br />

sind die Vorhersagefehler für jede Produktvariable Y j , j = 1, …, m und für diese<br />

genügt es, wenn gilt<br />

mit<br />

n − p<br />

N − n −1<br />

T<br />

Yh . / k⋅ hh/ k⋅ Yh . / k ≤ YY/ X ⋅ .<br />

β Σ β Σ<br />

T<br />

Y ⋅ M0. ( 2)<br />

ˆ jk ⋅Y ⋅ N −<br />

Fjk<br />

= , j = 1, …,<br />

n<br />

T<br />

Y ⋅ M Y<br />

jk<br />

T T −1 T T T T −1 T −1<br />

0, jk = ( − k ⋅( k ⋅ k ) ⋅ k) ⋅ j [ j ⋅ j − j ⋅ k ⋅( k ⋅ k ) ⋅ k ⋅ j ] ⋅ j<br />

−1<br />

⎡ X<br />

T T<br />

⎛ k⎞ ⎤ X<br />

T T<br />

⎛ k⎞<br />

= I − ( Xj , Xk ) ⋅ ⎢⎜ ( Xk Xj<br />

)<br />

X ⎟ ⋅ ⎥ ⎜<br />

j<br />

X ⎟<br />

j<br />

M I X X X X X X X X X X X X X X<br />

⎢⎣⎝ ⎠ ⎥⎦<br />

⎝ ⎠<br />

berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen.<br />

Die Vorhersagefehler sind unbekannt und müssen ebenfalls bestimmt werden. Die ML-Schätzfunktion<br />

für den Vorhersagefehler ist<br />

ˆ 2 ⎛<br />

. / 1 n ⎞<br />

UNn = SY X ⎜ +<br />

⎝<br />

⎟<br />

N − n −1⎠<br />

.<br />

Der Vorhersagefehler kann nun mit der Stichprobenkovarianzmatrix und dem geschätzten<br />

Red nach der Formel<br />

ˆ ˆ<br />

2 ⎛ p ⎞<br />

UNn ′ . = [Red p( h) + ( N − n − 1) SY/<br />

X] ⎜1<br />

+<br />

⎝ N − p −1⎟<br />

⎠<br />

bestimmt werden.


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

321<br />

Bei einem sehr hohen Grad der Multikollinearität δ können Sie anstelle der Stichprobenkovarianzmatrix<br />

besser die Stichprobenkorrelationsmatrix R<br />

ˆ ˆ<br />

2 ⎛ p ⎞<br />

UNn ′′ . = [Red′ p( h) + ( N − n − 1) SY′ / X] ⎜1<br />

+<br />

⎝ N − p −1⎟<br />

⎠<br />

verwenden, wobei ˆRed ′ p( h ) mit den Diagonalelementen der inversen Korrelationsmatrix −1<br />

R XX<br />

2<br />

gebildet wird. Analoges gilt für S′ Y / X .<br />

Die ML-Schätzfunktionen für den unbedingten Vorhersagefehler können umgeschrieben<br />

werden. Man erhält<br />

ˆ ˆ<br />

2 ⎛ p ⎞<br />

UNn ′ . = [Red p( h) + ( N − n − 1) SY/<br />

X] ⎜1<br />

+<br />

⎝ N − p −1⎟<br />

⎠<br />

ˆ<br />

2 N − 1<br />

= [Red p( h) + ( N − n −1) SY / X]<br />

N − p −1<br />

ˆ ˆ<br />

2 ⎛ p ⎞<br />

UNn ′′ . = [Red′ p( h) + ( N − n − 1) SY′ / X) ⎜1<br />

+<br />

⎝ N − p −1⎟<br />

⎠<br />

ˆ<br />

2 N − 1<br />

= [Red′ p( h) + ( N − n − 1) SY′<br />

/ X)<br />

.<br />

N − p −1<br />

N ist konstant, daher kann man die Vorhersage im Sinne des Kriterium von Mallows umschreiben,<br />

d. h. N – 1 weglassen. Damit erhält man<br />

S<br />

n<br />

2 ˆRed ( ) ( 1)<br />

ˆ p h + N − n − SY / X<br />

= UC, N. n =<br />

.<br />

2<br />

( N − p −1)<br />

p* wird dann geschätzt, indem man für alle möglichen Teilmengen das kleinste U ˆ CNn , . sucht.<br />

Das dazu gehörende p bezeichnet man mit ˆp und betrachtet es als Schätzung für p*. Da ˆp eine<br />

Schätzung für p* ist, die aus den Realisierungen der Produktvariablen Y und des Vektors der<br />

Input- und Prozessvariablen X ermittelt wurde, kann anstelle der Optimalität des Verfahrens<br />

nur die asymptotische Optimalität nachgewiesen werden, d. h. es gilt die Wahrscheinlichkeit,<br />

dass<br />

Uˆ<br />

N. pˆ<br />

( N)<br />

⎯⎯⎯⎯⎯→ 1.<br />

U<br />

N−n( N)<br />

→∞<br />

N.<br />

pˆ<br />

( N)<br />

ˆRed ( ) ( ) ( )<br />

2 2 2 2 T<br />

ph = AY / k− AY / X= N − p ⋅ SY / k− N − n ⋅ SY / X= BY. h/ k⋅ Ahh/ k⋅<br />

BY. h/<br />

k<br />

ist die Schätzfunktion für Red p (h). Die Minimierung des unbedingten Vorhersagefehlers beinhaltet<br />

zwei Teilaufgaben, nämlich<br />

•<br />

•<br />

die Bestimmung der optimalen Anzahl der Elemente der Teilmenge und<br />

die Auswahl der wesentlichen Input- und Prozessvariablen.


322 5 Qualität in der Fertigung<br />

Das Red Auswahlverfahren<br />

Da der Term N – 1 in der Formel U ˆ N . p konstant ist, genügt es, den Ausdruck<br />

S<br />

p<br />

2 ˆ<br />

Y / X p<br />

( N − n −1) ⋅ S + Red ( h)<br />

=<br />

( N − p −1) ⋅( N − p −1)<br />

zu minimieren.<br />

Das Red Auswahlverfahren läuft in mehreren Schritten ab.<br />

Im ersten Schritt wird für jede Input- und Prozessvariable<br />

ˆRed ( )<br />

2 2<br />

p j = BY. j/ n−j ⋅ Sj/<br />

n−j<br />

berechnet, wobei die Indexmenge h nur das Element j und demzufolge die Indexmenge k die<br />

restlichen n – j Elementen beinhaltet. S 2 j/<br />

n− jist die Maximum Likelihood Schätzfunktion<br />

für die bedingte Varianz der j ten Input- oder Prozessvariablen unter der Bedingung, dass die<br />

−1<br />

restlichen Input- und Prozessvariablen konstant gehalten werden. Aus der Matrix S XX kann<br />

2<br />

S − j/<br />

n− j abgelesen werden. Analog kann man natürlich auch mit der Korrelationsmatrix R XX<br />

2<br />

rechnen. Durch die Kehrwertbildung erhält man sofort den Wert A j/<br />

n−<br />

j .<br />

B Y.j/n – j ist folglich der j-te Regressionskoeffizient der j-ten Input- oder Prozessvariablen. Dieser<br />

Koeffizient kann nach dem Zerlegungssatz gemäß der Zerlegung<br />

T<br />

T<br />

Y / X = Y. j/ n−j Y. n−j/<br />

j<br />

B ( B , B )<br />

sofort aus dem vollständigen Ansatz abgelesen werden.<br />

Die Minimierung des unbedingten Vorhersagefehlers U ˆ N . p mit Red p (h) erfolgt über die Lösung<br />

der oben genannten zwei Probleme<br />

•<br />

•<br />

Bestimmung des optimalen p ˆ * und<br />

die Auswahl der Input- und Prozessvariablen, die in X(k) zusammengefasst werden und<br />

die U ˆ N . p minimieren.<br />

Weiter oben wurde bereits darauf verwiesen, dass es aufgrund der Konstanz von N ausreichend<br />

ist, S p (h n – p ) zu minimieren. Für den vollen Ansatz gilt<br />

2<br />

Y / X<br />

n −1<br />

S<br />

Sn<br />

=<br />

N −<br />

anstelle von U ˆ Nn . .<br />

Mit den berechneten ˆRed n−<br />

1 ( j ) , j = 1, …, n werden alle Input- und Prozessvariablen in eine<br />

Rangfolge X [1] , …, X [n – p – 1] , X [n – p] , X [n – p + 1] , …, X [n] geordnet, in der X [1] die unwichtigste<br />

Input- oder Prozessvariable ist, da diese beim Streichen den unbedingten Vorhersagefehler<br />

am geringsten vergrößert.<br />

Der Ansatz ohne die unwichtigste Input- oder Prozessvariable<br />

S<br />

( h ) =<br />

n−1 [1]<br />

wird mit S n verglichen.<br />

ˆRed ([1]) ( 1)<br />

( N − n) ⋅( N − n −1)<br />

2<br />

n−1 + N − n − ⋅ SY / X


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

323<br />

Gilt<br />

S<br />

n−1 ≤ Sn,<br />

dann wird X [1] d. h. h [1] = h 1 = ([1]) aus der Analyse entfernt. Im anderen Fall, d. h. falls<br />

Sn− 1 > Sn<br />

, kann der vollständige Ansatz nicht reduziert werden.<br />

Im ˆRed nächsten Schritt ist zu prüfen, ob mit X [1] auch X [2] gestrichen werden kann. Hierfür ist<br />

n− 2 ( h2<br />

) zu berechnen, wobei h 2 = ([1], [2]) die zweielementige Teilmenge der beiden<br />

unwichtigsten Input- und Prozessvariablen ist.<br />

Gilt nun<br />

Red ˆ ( h ) ≤ Red ˆ ([3])<br />

und<br />

S<br />

n−2 2 n−1<br />

n−2 ≤ Sn−1 ,<br />

dann kann die Teilmenge X(h 2 ) T = (X [1] , X [2] ) aus dem Ansatz gestrichen werden.<br />

Gilt dagegen<br />

aber<br />

Red ˆ ( h ) > Red ˆ ([3]),<br />

S<br />

n−2 2 n−1<br />

n−2 ≤ Sn−1 ,<br />

muss man prüfen, ob alle möglichen Zweier-Teilmengen, die alle die 3. Input- oder Prozessvariable<br />

beinhalten, ein kleineres ˆRed n− 2 als ˆRed n− 1([3])<br />

liefern und damit ein kleineres<br />

S ˆ<br />

p [Red n− 2( h2)]<br />

ergeben. In diesem Fall wird das Verfahren fortgesetzt. Andernfalls ist das<br />

Verfahren beendet.<br />

Es gilt<br />

ˆRed 1<br />

.[1]/ [1]<br />

2 ( 2 ) ( .[1]/ [1] , .[2]/ 2] ) −<br />

Y n−<br />

n− h = bY n− bY n− ⋅ S[1].[2]/ n−[1].[2]<br />

⋅ ⎜<br />

⎝b<br />

⎟ ,<br />

Y.[2]/ n−2]<br />

⎠<br />

wobei wiederum die beiden Regressionskoeffizienten b Y.[1]/ n−[1]<br />

und b Y.[2]/ n−2]<br />

aus dem vollständigen<br />

Ansatz abgelesen werden und S [1].[2]/n – [1].[2] entweder aus der inversen Matrix SXX<br />

− 1<br />

abgelesen oder entsprechend durch Invertierung der zerlegten Matrizen gebildet wird.<br />

In dieser Weise wird das Verfahren so lange fortgesetzt, wie<br />

Red ˆ ( h ) ≤ Red ˆ ([ n − p + 1])<br />

und<br />

p n−p n−1<br />

S ( h ) ≤ S ( h )<br />

p n− p p+ 1 n−p−1<br />

gilt, wobei im (n – p)-ten Schritt h n – p = ([1], [2], …, [n – p]). Die Teilmenge h n – p kann in<br />

diesem Fall gestrichen und das Verfahren mit der Erweiterung der Teilmenge h n – p um die<br />

[n – p + 1]-te Input- oder Prozessvariable fortgesetzt werden.<br />

Sind beide Bedingungen nicht erfüllt, dann ist man am Ende des Auswahlprozesses angelangt.<br />

Gilt jedoch<br />

Red ˆ ( h ) > Red ˆ ([ n − p + 1])<br />

p n−p n−1<br />

⎛b<br />


324 5 Qualität in der Fertigung<br />

und<br />

S ( h ) ≤ S ( h ),<br />

p n− p p+ 1 n−p−1<br />

dann ist das Verfahren in der 2. Stufe fortzusetzen.<br />

Wie vorher wird die Teilmenge<br />

([1], …, [n – p], [n – p + 1])<br />

betrachtet. Aus dieser werden alle Teilmengen mit (n – p) Input- und/oder Prozessvariablen,<br />

die alle die [n – p + 1]-te Input- oder Prozessvariable beinhalten, gebildet. Es sind dies die<br />

Teilmengen<br />

(1)<br />

n−<br />

p<br />

(2)<br />

n−<br />

p<br />

( n−<br />

p)<br />

n−<br />

p<br />

h = ([2],[3],…,[ n − p],[ n − p + 1]),<br />

h = ([1],[3],…,[ n − p],[ n − p + 1]),<br />

h = ([1],[2],…,[ n − p −1],[ n − p + 1])<br />

Hierfür werden die ˆRed p( hn − p)<br />

berechnet.<br />

Ist das Kleinste aller bisher berechneten<br />

⎡ ⎛n − p⎞⎤<br />

⎛n − p + 1⎞<br />

⎢1 + ⎜ ⎥ =<br />

, d.h.<br />

⎝ 1 ⎟<br />

⎠<br />

⎜<br />

⎝ 1 ⎟<br />

⎣ ⎦<br />

⎠<br />

⎧<br />

⎛n<br />

− p⎞<br />

⎫<br />

⎪<br />

⎜ 1 ⎟<br />

⎪<br />

⎝ ⎠<br />

⎪ Min Red ˆ ( ), Min [Red ˆ l ⎪<br />

⎨<br />

( )] Red ˆ<br />

p hn−p p hn−p ⎬ ≤ n−p([ n − p + 2]),<br />

⎪<br />

l = 1<br />

⎪<br />

⎪<br />

⎪<br />

⎪⎩<br />

⎪⎭<br />

dann ist die Auswahl beendet und die zugehörige Teilmenge wird gestrichen.<br />

Gilt dagegen<br />

⎧<br />

⎛n<br />

− p⎞<br />

⎫<br />

⎪<br />

⎜ 1 ⎟<br />

⎪<br />

⎝ ⎠<br />

⎪ Min Red ˆ ( ), Min [Red ˆ l ⎪<br />

⎨<br />

( )] Red ˆ<br />

p hn−p p hn−p ⎬ > n−p([ n − p + 2]),<br />

⎪<br />

l = 1<br />

⎪<br />

⎪<br />

⎪<br />

⎪⎩<br />

⎪⎭<br />

dann wird das Verfahren fortgesetzt. Hierzu wird die Teilmenge<br />

hn− p+ 2 = ([1], …,[ n − p + 2])<br />

gebildet. Aus dieser werden alle Teilmengen mit (n – p) Input- und Prozessvariablen, die alle<br />

die [n – p + 2]-te Input- oder Prozessvariable beinhalten, gebildet. Für all diese Teilmengen<br />

werden die Red’s berechnet. Ist das Kleinste aller bisher berechneten


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

325<br />

⎡ ⎛n − p⎞ ⎛n − p + 1⎞⎤<br />

⎛n − p + 2⎞<br />

⎢1<br />

+ ⎜ + ⎥ =<br />

⎝ 1 ⎟<br />

⎠<br />

⎜<br />

⎝ 2 ⎟<br />

⎠<br />

⎜<br />

⎝ 2 ⎟<br />

⎣<br />

⎦<br />

⎠<br />

ˆRed p( hn − p)<br />

kleiner oder gleich ˆRed n−1([ n − p + 3]) , dann hat man die optimale Teilmenge<br />

gefunden und das Verfahren ist beendet.<br />

Andernfalls ist das Verfahren wie bisher beschrieben fortzusetzen. In der q-ten Stufe müssten<br />

⎡ ⎛n − p⎞ ⎛n − p + q −1⎞⎤<br />

⎛n − p + q⎞<br />

⎢1<br />

+ ⎜ + + =<br />

1 ⎟ …<br />

⎥<br />

⎝ ⎠<br />

⎜<br />

⎝ q ⎟<br />

⎠<br />

⎜<br />

⎝ q ⎟<br />

⎣<br />

⎦<br />

⎠<br />

l ˆRed p( hn − p)<br />

berechnet und mit ˆRed n−1([ n − p + q])<br />

verglichen werden. Da q = 1, …, n – p<br />

⎛n⎞<br />

müssten im ungünstigsten Fall ⎜<br />

⎝p⎟<br />

solche Teilmengenuntersuchungen durchgeführt werden.<br />

⎠<br />

Satz: Dieser Algorithmus liefert das Minimum des unbedingten Vorhersagefehlers.<br />

Beweis: siehe Jahn [1991b].<br />

Empfehlungen<br />

Insbesondere im Falle hoch multikollinearer Kovarianzmatrizen sind alle Berechnungen<br />

im standardisierten Modell durchzuführen, d. h. auf der Basis der Korrelationsmatrix. Die<br />

Rechenzei ten werden kürzer und die Ergebnisse wesentlich genauer.<br />

Abbruch des Verfahrens:<br />

Gilt sowohl<br />

Red ˆ ( h ) > Red ˆ ([ n − p + 1])<br />

als auch<br />

p n−p n−1<br />

S ( h ) > S ( h ),<br />

p n− p p+ 1 n−p−1<br />

dann ist das Verfahren beendet und h n – p ist die zu streichende Teilmenge, die U N.n minimiert.<br />

Gilt<br />

Red ˆ ( h ) > Red ˆ ([ n − p + 1])<br />

aber<br />

p n−p n−1<br />

S ( h ) ≤ S ( h ),<br />

p n− p p+ 1 n−p−1<br />

dann ist das Verfahren in der 2. Stufe fortzusetzen. In dieser Stufe werden alle Teilmengen mit<br />

n – p Input- und Prozessvariablen, die alle die [n – p + 1]-te Variable beinhalten, gebildet. Das<br />

Verfahren kann nach der 2. Stufe abgebrochen werden, da der Rechenaufwand sehr hoch wird<br />

und die Verbesserung minimal ist.<br />

Bei sehr hoch multikollinearen Matrizen sollte das Verfahren eventuell nach der 1. Auswahl noch<br />

einmal mit den verbleibenden wesentlichen Input- und Prozessvariablen neu gestartet werden.


326 5 Qualität in der Fertigung<br />

Beispiel 5.14.3: Chemischer Prozess. Red-Auswahlverfahren<br />

Das obige Beispiel ist ein Modell mit stochastischen Input- und Prozessvariablen. Der<br />

vollständige Ansatz mit n = 12 Prozessvariablen liefert das Ergebnis der Tabelle 5.14.5.<br />

Tabelle 5.14.5: Prozessgleichung mit allen Prozessvariablen<br />

Prozessvar. Koeff.Proz.Gleich. t-Wert Irrtumswahrsch. Red(j)<br />

b 0 –408,705 –1,905 0,0598 0<br />

X 3 –0,63914 –0,75 0,455 0,0838<br />

X 4 0,2013 0,385 0,701 0,02208<br />

X 5 1,92428 0,1017 0,919 0,00154<br />

X 6 1,2744 0,0742 0,941 0,00082<br />

X 7 –11,7229 –2,9449 0,00406 1,2929<br />

X 9 0,32221 5,3921 0 4,3345<br />

X 16 –0,094157 –0,1113 0,9116 0,001848<br />

X 17 89,703117 4,8434 0 3,49726<br />

X 18 –91,06 –5,0647 0 3,82416<br />

X 19 1,07785 2,2573 0,0263 0,75965<br />

X 20 3,53736 1,26999 0,20719 0,24045<br />

X 21 0,80203 3,38099 0,001 1,7041<br />

Das Modell mit den wesentlichen Prozessvariablen ist in der Tabelle 5.14.6 enthalten.<br />

Tabelle 5.14.6: Prozessgleichung mit den wesentlichen Prozessvariablen<br />

Prozessvar. Koeff.Proz.Gleich. t-Wert Irrtumswahrsch. Red(j)<br />

b 0 –367,637 –3,029 0,00312 0,0000<br />

X 20 3,14768 1,242 0,217 0,2404<br />

X 19 0,96515 2,913 0,0044 0,75965<br />

X 7 –11,1443 –4,6253 0,00001 1,2929<br />

X 21 0,75278 3,562 0,00057 1,7042<br />

X 17 95,681 5,9554 0,0000 3,4973<br />

X 18 –97,11326 –6,401 0,0000 3,8241<br />

X 9 0,29609 6,54563 0,0000 4,33456<br />

Die F-Statistik hat den Wert 32.956 mit der Irrtumswahrscheinlichkeit p = 2.662e–023. Das<br />

vollständige wird mit dem reduzierten Modell anhand des Maßes der Beherrschbarkeit, des<br />

Vorhersagefehlers und der bedingten Standardabweichung verglichen.<br />

Tabelle 5.14.7: Vergleich des vollständigen und reduzierten Modells<br />

Statistik Vollständiges Reduziertes<br />

Maß d. Beherrschbarkeit 0,7001 0,6976<br />

Vorhersagefehler 3,9939 3,909<br />

Bedingte Standardabw. 3,7633 3,779<br />

FG d. Residuen 95 100


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

327<br />

Der Vergleich mit den „klassischen“ Auswahlverfahren liefert uns die folgenden Resultate:<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

•<br />

Nach dem Red-Auswahlverfahren verbleiben 7 Prozessvariablen im Ansatz.<br />

Die wesentlichen Prozessvariablen nach dem Red-Verfahren sind X 7 , X 9 , X 17 , X 18 , X 19 ,<br />

X 20 und X 21 . Die Prozessvariablen X 3 , X 4 , X 5 , X 6 , X 16 werden als unwesentlich erkannt<br />

und gestrichen.<br />

Die Rangfolge der wichtigen Prozessvariablen nach dem Red-Verfahren ist X [1] = X 9 ,<br />

X [2] = X 18 , X [3] = X 17 , X [4] = X 21 , X [5] = X 7 , X [6] = X 19 , X [7] = X 20 .<br />

Nach den „klassischen“ Verfahren verbleiben 5 Prozessvariablen im Ansatz.<br />

Die wesentlichen Prozessvariablen nach den „klassischen“ Verfahren sind X 7 , X 9 , X 17 , X 18 ,<br />

X 19 und X 21 . Die Prozessvariablen X 3 , X 4 , X 5 , X 6 , X 16 und X 20 werden als unwesentlich<br />

erkannt und gestrichen.<br />

Die Rangfolge ist: X [1] = X 9 , X [2] = X 18 , X [3] = X 17 , X [4] = X 7 , X [5] = X 21 , X [6] = X 19 .<br />

Die Rangfolgen unterscheiden sich.<br />

2<br />

Die Maße der Beherrschbarkeit sind nach der klassischen Auswahl R Y / p = 0.6929 und<br />

nach der Red-Auswahl R 2 Y/p = 0.6976 unterscheiden sich.<br />

Die Reststandardabweichungen nach der klassisch Auswahl S Y/X = 3.919 und nach der<br />

Red-Auswahl s Y/X = 3.779 unterscheiden sich.<br />

Warum unterscheiden sich die „klassischen“ von dem Red-Auswahlverfahren?<br />

Die Ursachen für die Ungleichheit der verschiedenen Verfahren sind:<br />

• Bei den klassischen Verfahren werden alle n Einzelhypothesen des 1. Schrittes individuell,<br />

nacheinander und nicht simultan geprüft, d. h. der Fehler 1. Art wird separat für jede<br />

Einzelhypothese nach<br />

P ( Fˆ<br />

≤ F / H ) = 1−<br />

α<br />

j<br />

α<br />

0. j<br />

gewählt. Das ist nicht korrekt!<br />

• Die univariaten einfachen Modelle E[Y] = β Y/j X j müssen nicht unbedingt „wahr“ sein. In<br />

diesen Fällen ist F ˆj nichtzentral F verteilt mit 1 und (N – 1) FG. Die univariaten Modelle<br />

müssen auch nicht unter Gültigkeit der H 0.j richtig sein. Die Nichtzentralitätsparameter<br />

sind unbekannt.<br />

• Bei der k-ten Entscheidung werden bei den klassischen Verfahren die vorangegangenen<br />

Entscheidungen nicht beachtet.<br />

• Das Red-Auswahlverfahren basiert in natürlicher Weise auf der Verringerung der bedingten<br />

Varianz (Restvarianz) durch Hinzufügen einer neuen Prozessvariablen, oder alternativ, auf<br />

der Vergrößerung der bedingten Varianz durch Streichen einer Prozessvariablen.<br />

• Die bedingte Varianz und die Tests werden unterschiedlich vom Grad der Multikollinearität<br />

beeinflusst.<br />

Nimmt der Unterschied zwischen den beiden Verfahren mit zunehmender Anzahl von<br />

Variablen zu?<br />

Zur Beantwortung dieser Frage betrachten wir das Beispiel des chemischen Prozesses mit einer<br />

größeren Anzahl von Input- und Prozessvariablen.


328 5 Qualität in der Fertigung<br />

Beispiel 5.14.4: Chemischer Prozess. Vergleich von Reduktionsverfahren<br />

Y 1 sei wieder der Anteil der unerwünschten Substanz. Gegeben sind des weiteren p = 11<br />

Input und n = 21 Prozessvariablen. Das Modell nach der schrittweisen Auswahl ist in der<br />

Tabelle 5.14.8 enthalten.<br />

Tabelle 5.14.8: Modell nach der schrittweisen Auswahl<br />

Prozessgleichung<br />

-----------------------------------------------------------------------------<br />

Produktvariable: y1<br />

-----------------------------------------------------------------------------<br />

Standard<br />

T<br />

Parameter Estimate Error Statistic P-Value<br />

-----------------------------------------------------------------------------<br />

CONSTANT 32,7401 13,4005 2,4432 0,0164<br />

x7 -6,31507 1,49519 -4,22359 0,0001<br />

x11 -0,011167 0,00382231 -2,92152 0,0043<br />

x17 5,07868 1,34843 3,76636 0,0003<br />

x21 0,689957 0,12185 5,66233 0,0000<br />

z1 0,752165 0,143026 5,25895 0,0000<br />

z2 2,01531 0,631772 3,18994 0,0019<br />

z3 0,0160964 0,00763823 2,10735 0,0377<br />

z5 0,121066 0,0086293 14,0297 0,0000<br />

z9 -0,0037483 0,00126582 -2,96116 0,0039<br />

z11 0,000460799 0,000129713 3,55245 0,0006<br />

-----------------------------------------------------------------------------<br />

Analysis of Variance<br />

-----------------------------------------------------------------------------<br />

Source Sum of Squares Df Mean Square F-Ratio P-Value<br />

-----------------------------------------------------------------------------<br />

Model 4625,68 10 462,568 104,93 0,0000<br />

Residual 427,621 97 4,40846<br />

-----------------------------------------------------------------------------<br />

Total (Corr.) 5053,3 107<br />

R-squared = 91,5378 percent<br />

R-squared (adjusted for d.f.) = 90,6654 percent<br />

Standard Error of Est. = 2,09963<br />

Mean absolute error = 1,48313<br />

Durbin-Watson statistic = 1,41397<br />

Die Red-Auswahl liefert das Modell in der Tabelle 5.14.9.<br />

Der Vergleich des schrittweisen und des Red-Auswahlverfahrens liefert folgende Ergebnisse:<br />

Nach dem schrittweisen Verfahren werden die Variablen<br />

x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 8 , x 9 , x 10 , x 12 , x 13 , x 14 , x 15 , x 16 , x 18 , x 19 , x 20 , z 4 , z 6 , z 7 , z 10<br />

gestrichen, nach dem Red-Auswahlverfahren werden die Variablen<br />

x 4 , x 5 , x 8 , x 12 , x 13 , x 14 , x 15 , x 16<br />

gestrichen. Die Mengen der unwesentlichen, gestrichenen Variablen sind verschieden.


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

329<br />

Tabelle 5.14.9: Red-Auswahl<br />

Value Std.Error t-value Pr(>|t|) Redn1<br />

b 0 2.027252e+002 2.243049e+002 0.90379 0.36872 0.00000000<br />

z 10 –6.204065e–004 5.822072e–004 –1.06561 0.28969 0.01659399<br />

z 4 1.954888e–001 1.817600e–001 1.07553 0.28525 0.03508154<br />

x 11 –2.643214e–002 1.165562e–002 –2.26776 0.02594 0.03583230<br />

x 6 –7.249619e+000 6.719864e+000 –1.07883 0.28379 0.03744574<br />

v 18 –2.017283e+001 1.669251e+001 –1.20850 0.23029 0.04066924<br />

v 19 3.563528e–001 2.197435e–001 1.62168 0.10867 0.04790650<br />

x 17 2.299280e+001 1.575657e+001 1.45925 0.14827 0.05208574<br />

x 1 1.117445e+000 6.533908e–001 1.71022 0.09096 0.05374786<br />

z 6 –1.495682e–002 1.464805e–002 –1.02108 0.31018 0.05745906<br />

x 7 –7.100759e+000 2.046982e+000 –3.46889 0.00083 0.05826068<br />

z 8 –3.658574e–001 2.529059e–001 –1.44661 0.15177 0.06943185<br />

x 3 –6.214773e–001 5.310112e–001 –1.17037 0.24520 0.07239814<br />

z 7 –5.642632e+001 3.649344e+001 –1.54620 0.12586 0.09617223<br />

x 9 2.859829e–001 1.464424e–001 1.95287 0.05421 0.09727591<br />

x 20 4.399184e+000 2.540006e+000 1.73196 0.08700 0.14827725<br />

z 2 1.457339e+000 6.175290e–001 2.35995 0.02062 0.16755061<br />

z 3 1.739045e–002 7.359728e–003 2.36292 0.02047 0.17278911<br />

z 11 9.192015e–004 3.210841e–004 2.86281 0.00531 0.19585702<br />

x 10 3.788326e–002 1.252605e–002 3.02436 0.00332 0.20522901<br />

z 9 –4.191362e–003 1.502543e–003 –2.78951 0.00655 0.23452021<br />

x 2 –5.915323e+000 2.305041e+000 –2.56625 0.01208 0.26927001<br />

x 21 6.039320e–001 1.607141e–001 3.75780 0.00032 0.28263726<br />

z 1 1.586419 0.38234719 4.14916 8e–005 0.5332058<br />

z 5 0.103754 0.01126534 9.21002 0e+000 1.2338190<br />

F-Statistic: 51.6531840865295 with a p-value of: 3.16569470906557e–040<br />

Statistic Complete_Model Red_Reduction<br />

Rsquared 0.939247 0.9372484<br />

UNn/UNp 4.093372 3.8205083<br />

Sqrt_UNn/UNp 2.023208 1.9546121<br />

RSS 307.002919 317.1021928<br />

syx/syp 1.693867 1.7215028<br />

Residual_df 75 83


330 5 Qualität in der Fertigung<br />

Die Rangfolge für das schrittweise Verfahren ist<br />

Z 5 , X 21 , Z 1 , X 7 , X 17 , Z 11 , Z 2 , Z 9 , X 11 , Z 3<br />

und für das Red-Auswahlverfahren<br />

Z 5 , Z 1 , X 21 , X 2 , Z 9 , X 10 , Z 11 , Z 3 , Z 2 , X 20 , X 9 , Z 7 , Z 6 , X 1 , X 17 , X 19 , X 18 , X 6 , X 11 , Z 4 und Z 10 .<br />

Die Rangfolgen sind verschieden.<br />

Die Maße der Beherrschbarkeit (klassisch R 2 = 0.915, Red R 2 Y/X = 0.937) sind verschieden.<br />

Die Reststreuungen (klassisch s = 2.099, Red s Y/X = 1.72) sind ebenfalls verschieden.<br />

Wir wollen noch ein zweites Beispiel mit einer großen Anzahl von Input- und Prozessvariablen<br />

betrachten, bevor ich meine Schlussfolgerungen ziehe.<br />

Beispiel 5.14.5: Mikroelektronik. Red-Verfahren<br />

Die Herstellung mikroelektronischer Schaltkreise ist kompliziert. Die Anzahl der verschiedenen<br />

Prozesse des Netzwerkes „Herstellung“ ist groß. Die Anzahl der Input- und<br />

Prozessvariablen ist sehr groß.<br />

Wir wollen hier die Ausbeute an mikroelektronischen Schaltkreisen für zwei Netzwerke<br />

betrachten. Im 1. Netzwerk ist die Anzahl der Input- und Prozessvariablen n = 52. Der<br />

Grad der Multikollinearität ist δ = 0.8 10 58 . Im 2. Netzwerk ist n = 45 und δ = 0.2 10 27 . Die<br />

Ergebnisse der schrittweisen Verfahren, des C p von Mollows und des Red Auswahlverfahrens<br />

sind in der folgenden Tabelle zusammengestellt.<br />

Tabelle 5.14.10: Ergebnisse der Auswahl nach dem schrittweisen und Red-Verfahren<br />

n S 2 Y/p R 2 Y/p U N, p p<br />

1. Netzwerk<br />

vollständig 52 0,0017 0,708 0,00404<br />

schrittweise 0,0051 0,12 0,0052 2<br />

Red 0,0022 0,62 0,00306 25<br />

2. Netzwerk<br />

vollständig 45 69,55 0,52 140,7<br />

schrittweise 112,6 0,22 116,5 3<br />

Red 78,9 0,45 94,9 15<br />

Diese Beispiele zeigen:<br />

• Die schrittweisen Auswahlverfahren tendieren zu mächtigeren Auswahlmengen unwesentlicher<br />

Input- und Prozessvariablen, d. h. die Anzahl der wesentlichen Input- und<br />

Prozessvariablen wird zu klein.<br />

• Mit zunehmender Anzahl von Input- und Prozessvariablen werden die klassischen Verfahren<br />

schlechter, da bei diesen die Maße der Beherrschbarkeit zu klein und demzufolge<br />

die Reststandardabweichungen zu groß werden.<br />

• Mit zunehmenden Grad der Multikollinearität werden die klassischen Verfahren<br />

schlechter, da die Reduktion der Dimension des Parameterraumes größer, ja sogar zu<br />

groß wird.


5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />

331<br />

Gibt es Tests zur Prüfung von Hypothesen über Red p (h)?<br />

Ja. Zur Prüfung von Hypothesen über Red p (h) kann man den overall-F-Test, Varianzanalysen<br />

oder Tests zur Prüfung der partiell multiplen Korrelationskoeffizienten verwenden.<br />

Wir wollen die Tests im Einzelnen betrachten.<br />

Test zur Prüfung der Hypothese über Red n – 1 (j)<br />

2 2 2<br />

Aus der Darstellung [Re dn−1 ( j)]<br />

= BY. j/ n−j ⋅S j/<br />

n−j<br />

folgt, dass wir zur Prüfung der<br />

H 0 : Red n – 1 (j) = 0 gegen die Alternative H 1 : Red n – 1 (j) ≠ 0 den F-Test in der Form<br />

ˆ Red n−1( j) ( N − n)<br />

F =<br />

S<br />

2<br />

Y / X<br />

verwenden können. Ist F ˆ ≥ FnN<br />

, −n<br />

() a , dann muss die H 0 zugunsten der H 1 verworfen werden.<br />

Dieser Test ist identisch mit dem F-Test zur Prüfung einer Einzelhypothese über einen<br />

Koeffizienten B Y.j/n – j der Prozessgleichung.<br />

Tests zur Prüfung der Hypothese über Red p (h)<br />

Zur Prüfung dieser Hypothese kann ebenfalls der F-Test verwendet werden.<br />

Die Teststatistik ist<br />

Red ( ) ( )<br />

2 2<br />

T<br />

p h ⋅ N − n ( R / / ) ( ) . / / . / ( )<br />

ˆ( )<br />

Y X − RY k ⋅ N − n BYh kShh kBYh k N − n<br />

Fh = = =<br />

2 2 2<br />

.<br />

( n − p) S (1 − R ) ⋅( n − p) S ( n − p)<br />

Y / X Y / X Y / X<br />

Ist Fh ˆ( ) ≥ F ( )<br />

n−p,<br />

N−n<br />

α , dann muss die H 0 zugunsten der H 1 verworfen werden.<br />

Varianzanalytische Prüfung<br />

Ausgangspunkt für diese Prüfung ist die Teilmengenregression<br />

T<br />

Y = β ⋅ X() k + F .<br />

Y / k Y / k<br />

(1)<br />

Die zu prüfende Hypothese lautet H0 : β Y / k = 0 .<br />

Verlängert man den Vektor der Input- und Prozessvariablen X(k) durch Hinzufügen von<br />

Komponenten aus X(h), die im Vektor X(u) zusammengefasst werden, wobei u = (u 1 , …, u s ),<br />

u 1 < … < u s , s ≤ n – p, dann kann man prüfen, ob die Verkleinerung der Summe der Abweichungsquadrate<br />

um die Prozessgleichung durch Verlängerung des Vektors X(k) null ist. Dieser<br />

Umstand wird durch die Hypothese<br />

(2)<br />

0 β T<br />

Yu . / k ⋅ Σ uu/ k ⋅ β Yu . / k = = p h<br />

H : 0 Red ( )<br />

abgebildet. Zur Prüfung dieser Hypothese wird die folgende Varianztabelle aufgebaut.<br />

In dieser Tabelle bedeuten<br />

T −1<br />

Akk<br />

−1<br />

ATT<br />

H = X() k ⋅ ⋅ X(),<br />

k<br />

p<br />

T<br />

Hs<br />

= T ⋅ ⋅T,<br />

T = X( u) ⋅( I − H ),<br />

A<br />

TT<br />

= T ⋅T<br />

T<br />

p


332 5 Qualität in der Fertigung<br />

Tabelle 5.14.11: Varianztabelle für die Prüfung der H 0 über Red p (h)<br />

Variationsursache Summe der<br />

Abweichungsquadrate<br />

FG<br />

F-Test<br />

Prozessgleichung<br />

in X(k)<br />

Prozessgleichung<br />

in X(k) und X(u)<br />

T<br />

Y ⋅ H ⋅Y<br />

p<br />

p<br />

Y ⋅ H ( )<br />

T<br />

Y ⋅ Hs<br />

⋅Y<br />

s ˆ<br />

p ⋅Y ⋅ N − p<br />

F1<br />

=<br />

T<br />

Y ⋅( I − H ) ⋅Y ⋅ p<br />

T<br />

p<br />

T<br />

Rest Y ⋅( I − Hp<br />

− Hs)<br />

⋅Y<br />

N – p – s<br />

(2) ˆF<br />

Gesamt<br />

T<br />

Y ⋅ Y<br />

und somit<br />

T<br />

⋅ T<br />

T<br />

= A<br />

uu / k ,<br />

so dass<br />

T<br />

Y ⋅ Hs<br />

⋅ Y = ˆRed p( j).<br />

F ˆ ∼ F′<br />

( δ )<br />

mit<br />

1 pN , − p 1<br />

T<br />

βY / k⋅<br />

Akk⋅βY / k<br />

δ1 =<br />

.<br />

2<br />

σ /<br />

Y k<br />

2<br />

Y / k 0<br />

Bei Gültigkeit der H 0 gilt σ Y.k = 0 und damit ρ = , δ 1 = 0 und folglich<br />

ˆ .<br />

F1 ∼ FpN<br />

, − p<br />

Bemerkungen<br />

1. Die Teststatistik F 1 kann man mit multiplen Korrelationskoeffizienten darstellen. Es gilt<br />

2<br />

2<br />

R (<br />

/<br />

1) ( )<br />

Y k ⋅( N − p)<br />

χp<br />

δ ⋅ N − p<br />

1 = = ∼ F<br />

2 2<br />

pN ′, − p δ1<br />

(1 − RY / k)<br />

⋅ p χN−<br />

p ⋅ p<br />

Fˆ ( ).<br />

Für die Prüfung der zweiten Hypothese<br />

ˆ (2) X ⋅ Hs<br />

⋅Y ⋅( N − p − s)<br />

F =<br />

T<br />

Y ⋅( I − H − H ) ⋅Y ⋅ s<br />

verwendet, wobei<br />

T<br />

(2)<br />

F ˆ ∼ FsN , −p−s<br />

( δ2<br />

)<br />

p<br />

s<br />

(2)<br />

H 0 wird die Statistik


5.15 Unter welchen Umständen ist die Annahme der Linearität gerechtfertigt?<br />

333<br />

ist und<br />

T<br />

βYu . / k⋅<br />

Auu/ k⋅βYu . / k<br />

δ2 =<br />

.<br />

2<br />

σ / ,<br />

Y k u<br />

(2)<br />

Für die Gültigkeit der H 0 ist auch diese F-Statistik zentral F verteilt mit den angegebenen<br />

Freiheitsgraden.<br />

2. Wegen der Darstellung<br />

2 2<br />

p h = ρY. h/ k ⋅σY / k<br />

Red ( )<br />

können zur Prüfung von Hypothesen über Red p (h) auch die Tests zur Prüfung von partiell<br />

multiplen Korrelationskoeffizienten verwendet werden.<br />

5.15 Unter welchen Umständen ist die Annahme der<br />

Linearität gerechtfertigt?<br />

Über die Voraussetzung der Linearität in den Modellen für die Proze ssgleichung wird oft und<br />

heftig gestritten. Wir wollen zur Schlichtung des Streits hier von dem Modell mit stochastischen<br />

Input- und Prozessvariablen ausgehen. Für dieses Modell hatten wir vorausgesetzt, dass der<br />

Vektor Z T = (X T , Y T ) der Input-, Prozess- und Produktvariablen entweder multivariat normalverteilt<br />

ist oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Beide Annahmen<br />

sind praktisch relevant.<br />

Im Glossar wurde die bedingte multivariate Normalverteilung mit dem bedingten Erwartungswert<br />

und der bedingten Varianz beschrieben.<br />

Für den Vektor Z gilt unter den beiden Voraussetzungen<br />

−1<br />

Y YX XX X X<br />

E[ Y/ X] = μ + Σ Σ ( − μ ).<br />

Das ist eine lineare Funktion in X. Diese Funktion wird Regressionsfunktion genannt. Für die<br />

bedingte Varianz gilt<br />

−1<br />

YY YX XX XY YY / X<br />

var [ Y/ X] = Σ − Σ Σ Σ = : Σ .<br />

Dieser Ausdruck hängt nicht von X ab.<br />

Damit kann man den für die Anwendungen wichtigen Charakterisierungsatz aufschreiben,<br />

der einen Zusammenhang zwischen der Verteilungsvoraussetzung und der Linearität der<br />

Regressionsfunktion präzisiert.<br />

Wenn der bedingte Erwartungswert eine lineare Funktion in den Variablen unter Bedingung und<br />

die bedingte Varianz unabhängig von X ist, dann ist die zugrunde liegende gemeinsame Verteilung<br />

eine Normalverteilung. Wenn die Verteilung von Z eine multivariate Normalverteilung ist,<br />

dann ist der bedingte Erwartungswert eine lineare Funktion der Variablen unter der Bedingung<br />

und die bedingte Kovarianz ist unabhängig von den Variablen unter der Bedingung.<br />

Aus diesem Satz wird deutlich, dass der Streit entweder auf der Basis des Modells mit festen<br />

Input- und Prozessvariablen oder akademisch geführt wird.


334 5 Qualität in der Fertigung<br />

5.16 Warum muss ein Prozess gesteuert werden und wie<br />

können wir einen Prozess steuern?<br />

Jeder, der sich in sein Auto setzt und die Absicht hat, loszufahren, überlegt sich vorher, wohin<br />

er fahren und welche Strecke er benutzen will. Niemand startet sein Auto, macht die Augen<br />

zu und fährt los! Das Ziel der Autofahrt entspricht dem Sollwert und die zu fahrende Strecke<br />

– entweder über das Gebirge oder durch das flache Land – kann mit der Steuerung eines Prozesses<br />

verglichen werd en. Was jeder mit seinem privaten Fahrzeug macht, kann er auch mit<br />

den betrieblichen Prozessen tun.<br />

In einem heuristisch, d. h. durch Erfahrung gesteuerten oder ungesteuerten Prozess sind<br />

•<br />

•<br />

•<br />

•<br />

die Streuungen der Input-, Prozess- und Produktvariablen in der Regel sehr groß,<br />

die Zielwerte für die Steuerung in Form von Sollwerten und Toleranzgrenzen in der Regel<br />

nicht bekannt,<br />

der Ausschuss sehr hoch, die Kundenanforderungen werden nur mangelhaft erfüllt und<br />

die uni- und multivariaten Prozessfähigkeitsindizes sind in der Regel kleiner als 1.<br />

Die Folge hiervon ist, der Prozess muss verbessert werden, um die Verluste durch mangelhafte<br />

Qualität zu reduzieren. Das ist nur durch die statistische Prozessanalyse mit anschließender<br />

Steuerung des Prozesses möglich.<br />

Die statistische Prozessanalyse liefert uns hierfür die Prozessgleichung mit den wesentlichen<br />

Input- und Prozessvariablen. Die Zielwerte und den Zielbereich für die Steuerung liefert uns<br />

die statistische Tolerierung. In diesem Zusammenhang müssen wir darüber sprechen, dass die<br />

Qualität des Prozesses notwendige Voraussetzung für die Qualität des Produktes ist.<br />

Was ist die Qualität des Prozesses?<br />

Die Qualität des Prozesses ist die Fähigke it des Prozesses, Produkte mit vorgegebenen Eigenschaften<br />

zu produzieren, wobei die vorgegebenen Eigenschaften eines Produktes durch die<br />

Sollwerte und Toleranzgrenzen für die Menge der nicht unabhängigen Produktvariablen spezifiziert<br />

werden. Die Produktion solcher Produkte (materielle Produkte oder Dienstleistungen)<br />

erfordert, dass der dazu gehörende Prozess mit der Prozessgleichung in Richtung der Zielwerte<br />

gesteuert wird, so dass die Werte für die Produktvariablen der produzierten Produkte in dem<br />

durch die Toleranzgrenzen vorgegebenen Zielgebiet liegen.<br />

Die Steuerung besteht nun im wesentlichen darin, solche Werte für die Input- und Prozessvariablen<br />

in die Prozessgleichung einzusetzen, die<br />

• garantieren, dass die Werte für die Produktvariablen in dem gegebenen Zielgebiet liegen<br />

und deren Mittelwerte mit den Sollwerten übereinstimmen,<br />

• zu einer Verringerung der Variation der Produktvariablen von bislang ungesteuerten<br />

Prozessen führen<br />

• und somit simultan alle Kundenanforderungen erfüllt werden.<br />

Die Frage ist nun nur noch,<br />

Wie können wir diese Werte für die wesentlichen Input- und Prozessvariablen finden?<br />

Für die Lösung stehen uns mindestens zwei Wege zur Verfügung.


5.16 Warum und wie muss ein Prozess gesteuert werden?<br />

335<br />

Der 1. Weg führt auf die Berechnung der statistischen Sollwerte und Toleranzgrenzen für die<br />

Input- und Prozessvariablen und der 2. Weg auf die Optimierung des gesamten Prozesses mit<br />

den Methoden der linearen und nichtlinearen Optimierung (vgl. Kapitel 12).<br />

Hauptsächlich befassen wir uns in diesem Kapitel mit dem 1. Weg, da uns dieser die Sollwerte<br />

und Toleranzgren zen für die Inputprodukte liefert. Und diese sind ja notwendige Voraussetzung<br />

für die Realisierung der Kommunikation zwischen den Kunden und Lieferanten.<br />

5.16.1 Statistische Tolerierung der Inputvariablen<br />

Zuerst berechne n wir nach dem bekannten Verfahren der statistischen Tolerierung aus dem<br />

Abschnitt 5.2 die statistischen Sollwerte und Toleranzgrenzen für die wesentlichen Inputvariablen<br />

unter der Bedingung, dass die Werte für die Produktvariablen vorgegeben sind. Danach<br />

berechnen wir die Sollwerte und statistischen Toleranzgrenzen für die Prozessvariablen unter<br />

der Bedingung, dass die Produkt- und Inputvariablen gegeben sind.<br />

Mit einer vorliegenden Stichprobe berechnen wir die Inputgleichungen. Das sind Gleichungen,<br />

in denen die Inputvariablen die abhängigen Zielvariablen sind und die Produktvariablen<br />

als unabhängige Variablen fungieren. In diese Gleichungen setzen wir die Sollwerte und die<br />

Toleranzgrenzen für die Produktvariablen ein, um die Sollwerte und Toleranzgrenzen für die<br />

Inputvariablen zu berechnen.<br />

Für all die Fälle, in denen keine Sollwerte und Toleranzgrenzen für die Produktvariablen<br />

vorhanden sind, verwenden wir die Formeln der statistischen Tolerierung für die Produktund<br />

Inputvariablen und berechnen die statistischen Sollwerte und Toleranzgrenzen für die<br />

Inputvariablen.<br />

Die Berechnungen der statistischen Sollwerte und Toleranzgrenzen für die Input- und Prozessvariablen<br />

unter den entsprechenden Bedingungen werde ich an dem folgenden Beispiel<br />

demonstrieren.<br />

Beispiel 5.16.1: Chemischer Prozess. Statistische Tolerierung der Input- und<br />

Prozessvariablen<br />

Die statistischen Toleranzgrenzen wurden mit dem Prozessspezialisten abgesprochen,<br />

geringfügig korrigiert und in der Tabelle 5.16.1 zusammengefasst.<br />

Tabelle 5.16.1: Statistische Toleranzgrenzen für die Produktvariablen<br />

Produktvariable Untere Toleranz Obere Toleranz<br />

Y 1 0 8<br />

Y 2 1680 1820<br />

Y 3 1902 1920<br />

Y 4 1546 1565<br />

Y 5 8000 10000<br />

Y 6 320 400<br />

Mit den abgestimmten statistischen Toleranzgrenzen wurden die uni- und multivariaten<br />

Prozessfähigkeitsindizes berechnet und in der Tabelle 5.16.2 zusammengestellt.<br />

Die Prozessfähigkeiten sind kleiner als 1; der Prozess muss verbessert werden.


336 5 Qualität in der Fertigung<br />

Tabelle 5.16.2: Uni- und multivariate Prozessfähigkeitsindizes<br />

Produktvariable C p k C pk<br />

Y 1 0,194 3,82 –0,55<br />

Y 2 1,38 0,005 1,375<br />

Y 3 0,315 0,342 0,207<br />

Y 4 0,432 0,038 0,415<br />

Y 5 0,227 0,194 0,183<br />

Y 6 0,217 0,268 0,159<br />

Multivariate Prozessfähigkeiten<br />

MC p 0,65<br />

MC pk 0,038<br />

Die folgenden beiden Abbildungen enthalten die Star Plots für alle Input-, Prozess- und<br />

Produktvariablen und nur für die Inputvariablen, da der Verdacht besteht, dass für die<br />

Inputvariablen weder Sollwerte und Toleranzgrenzen berechnet, noch Eingangsprüfungen<br />

vorgenommen wurden.<br />

100 108<br />

90<br />

80<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

Abb. 5.16.1: Star Plots für die Input-, Prozess- und Produktvariablen<br />

10


5.16 Warum und wie muss ein Prozess gesteuert werden?<br />

337<br />

X11<br />

X17<br />

X18<br />

X19<br />

X20<br />

X21<br />

Z1<br />

Z2<br />

Z3<br />

Z4<br />

Abb. 5.16.2: Schlüssel für die Star Plots<br />

X10<br />

Z5<br />

X9<br />

Z6<br />

X7<br />

Z7<br />

X6<br />

Z8<br />

X3<br />

X2<br />

X1<br />

Y1<br />

Z11<br />

Z10<br />

Z9<br />

Die Star plots zeigen:<br />

•<br />

•<br />

•<br />

•<br />

die Streuungen für die einzelnen Variablen sind sehr groß; man vergleiche z. B. die Stars<br />

55 und 104 miteinander,<br />

der Prozess zeigt ein gewisses „Atmen“, d. h. eine gewisse systematische Veränderung<br />

bis zum Star 50 und dann eine ziemlich rigide Veränderung.<br />

Innerhalb der Gruppen gibt es aber auch noch sehr starke Veränderungen,<br />

die Produktvariable Y 1 (unerwünschtes Nebenprodukt) kommt mal sehr selten, siehe<br />

z. B. die Star Plots 86, 87, 49, 40 und ein anderes Mal sehr häufig vor, siehe z. B. die Star<br />

Plots 90, 91, 10, …<br />

100<br />

90<br />

80<br />

70<br />

60<br />

50<br />

40<br />

30<br />

Abb. 5.16.3: Star Plots für die Input- und Produktvariable Y 1<br />

20<br />

10


338 5 Qualität in der Fertigung<br />

Da die Stars aufgrund der vielen Achsen (Variablen) schwer zu interpretieren sind, weil sowohl<br />

Input-, Prozess- und Produktvariablen dargestellt wurden, wollen wir noch die Inputund<br />

die Produktvariablen allein betrachten, um zu sehen, ob die Inputvariablen ebenfalls<br />

stark streuen und diese Streuungen einen Einfluss auf die Produktvariable Y 1 haben.<br />

Z5<br />

Z4<br />

Z3<br />

Z6<br />

Z2<br />

Z7<br />

Z1<br />

Z8<br />

Y1<br />

Z9<br />

. Z10<br />

Z11<br />

Abb. 5.16.4: Schlüssel für die Star Plots für die Input- und Produktvariablen Y 1<br />

Interpretation der Star Plots für die Input- und die Produktvariablen<br />

Die Inputvariablen schwanken sehr stark. Das Produkt kann daher gar nicht homogen sein,<br />

oder anders gesprochen, das unerwünschte Nebenprodukt kommt mal vor und mal nicht.<br />

Schauen Sie sich nur einmal die Plots mit den Nummern 49 und 91 an, dann sehen Sie die<br />

gewaltigen Unterschiede. Beim Plot Nummer 91 kommt das unerwünschte Nebenprodukt<br />

in hoher Konzentration vor. Beim Plot Nummer 40 kommt das Nebenprodukt praktisch<br />

T2<br />

0 50 100 150<br />

5 10 15 20<br />

Abb. 5.16.5: Multivariate Kontrollkarte für das „Lieferantenprodukt“


5.16 Warum und wie muss ein Prozess gesteuert werden?<br />

339<br />

überhaupt nicht vor. Schon hieraus muss man schließen, dass das unerwünschte Nebenprodukt<br />

im Herstellungsprozess entsteht und dass der Prozess so gesteuert werden kann,<br />

dass das Nebenprodukt nicht mehr vorkommt. Die moderne Industrie muss nach meinem<br />

Dafürhalten anders, präziser arbeiten.<br />

Die multivariate Kontrollkarte für die Inputvariablen mit der berechneten Toleranzgrenze<br />

für das Inputprodukt in der Abbildung 5.16.5 bestätigt unsere Vermutung hinsichtlich der<br />

Inputvariablen, dass für diese nämlich keine Sollwerte und Toleranzgrenzen zu existieren<br />

scheinen.<br />

Das „Lieferantenprodukt“ sind die zusammengefassten Inputvariablen des chemischen<br />

Prozesses. Die Abbildung zeigt ganz deutlich: Die meisten Werte der Teilstichproben liegen<br />

oberhalb der Toleranzgrenze für das „Lieferprodukt“, d. h. die meisten Lieferantenprodukte<br />

sind Ausschuss. Die Input variablen erfüllen offenbar keinerlei Vorgaben. Es muss etwas<br />

getan werden.<br />

Uni- und multivariater Prozessfähigkeitsnachweis für die Inputprodukte<br />

Der Nachweis der simultanen Erfüllung der Kundenanforderungen bzgl. der Lieferantenprodukte<br />

(Menge der Inputvariablen) erfolgt über die Fähigkeiten der Tabelle 5.16.3.<br />

Tabelle 5.16.3: Univariate Prozessfähigkeitsindizes<br />

Inputvariable<br />

untere<br />

Toleranz<br />

obere<br />

Toleranz<br />

Mittel Stabw. C p k C pk<br />

Z 1 19,4 28,6 24,857 1,88 0,815 0,186 0,663<br />

Z 2 0,8 1,2 1,223 0,363 0,183 1,115 –0,021<br />

Z 3 100 160 134,85 40,136 0,249 0,161 0,209<br />

Z 4 0,3 0,4 0,3565 1,1326 0,0147 0,129 0,0128<br />

Z 5 100 180 144,56 51,654 0,258 0,114 0,229<br />

Z 6 90 130 107,93 26,86 0,248 0,103 0,222<br />

Z 7 1,12 1,18 1,13 0,0118 0,846 0,667 0,282<br />

Z 8 9,22 10,78 9,749 0,962 0,27 0,32 0,183<br />

Z 9 1600 1780 1677,25 221,79 0,135 0,142 0,116<br />

Z 10 900 1000 905,68 1147,18 0,0145 0,886 0,0017<br />

Z 11 2500 3300 2991,58 2033,33 0,066 0,229 0,051<br />

Die multivariaten Prozessfähigkeitsindizes sind<br />

MC p = 0.3104<br />

MC pk = 0.0372<br />

Die uni- und multivariaten Prozessfähigkeitsindizes bestätigen die vorangegangene Vermutung.<br />

Sie sind viel kleiner als 1. Die Inputvariablen erfüllen nicht die Anforderungen.<br />

Wie kann man die Werte für die wesentlichen Input- und Prozessvariablen finden, die auf<br />

jeden Fall die genannten Ziele der Reduktion der Variation und der Übereinstimmung<br />

von Mittel- und Sollwerten erfüllen?


340 5 Qualität in der Fertigung<br />

5.16.2 Berechnung der statistischen Sollwerte und Toleranzgrenzen für<br />

die Inputvariablen unter der Bedingung der gegebenen Werte für<br />

die Produktvariablen<br />

Diese Berechnungen werden mit dem linearen Modell mit stochastischen Variablen realisiert,<br />

wobei die Inputvariablen als Zielgrößen fungieren und für die Produktvariablen die<br />

Sollwerte und Toleranzgrenzen eingesetzt werden.<br />

Die so zu berechnenden Gleichungen nennen wir Inputgleichungen.<br />

Nach Diskussion und Abstimmung mit den Prozessexperten erhalten wir die Resultate in<br />

Tabelle 5.16.4.<br />

Tabelle 5.16.4: Statistische Sollwerte und Toleranzgrenzen für die Inputvariablen<br />

Inputvariable Sollwert untere Toleranz obere Toleranz<br />

Z 1 23,57 22,2 24,9<br />

Z 2 0,89 0,11 1,66<br />

Z 3 115,5 46,5 184,6<br />

Z 4 0,014 0 2,59<br />

Z 5 65,6 30,4 100,9<br />

Z 6 101,1 60,4 141,7<br />

Z 7 1,12 1,1 1,14<br />

Z 8 11,3 9,2 13,4<br />

Z 9 1867 1511 2223<br />

Z 10 733 633 933<br />

Z 11 2351 1160 3538<br />

Berechnung der statistischen Toleranzen für die wesentlichen Prozessvariablen<br />

Analog wie vorher werden Einstellgleichungen für die wesentlichen Prozessvariablen<br />

berechnet. In diese werden die Sollwerte und Toleranzgrenzen für die Produktvariablen<br />

und die abgestimmten statistischen Sollwerte und statistischen Toleranzgrenzen für die<br />

Inputvariablen eingesetzt. Damit erhält man die Einstellwerte und zugehörigen statistischen<br />

Toleranzgrenzen für die wesentlichen Prozessvariablen in Tabelle 5.16.5.<br />

Die Kunden haben für die unerwünschte Produktvariable die obere Grenze (oG) für Y 1<br />

vorgegeben. Diese ist oG (Y 1 ) = 8.00 [‰]. Die optimale Einstellung der Input- und wesentlichen<br />

Prozessvariablen für die Erreichung des Zieles: „die Werte von Y 1 dürfen nicht größer<br />

als 8 [‰] sein, sollten aber mehr in der Nähe der Null liegen“ ist durch die statistischen<br />

Sollwerte und Toleranzgrenzen für die Prozessvariablen und die unter den Bedingungen<br />

gegebener Produkt- und Prozessvariablen berechneten Sollwerte und Toleranzgrenzen für<br />

die Inputprodukte gegeben.<br />

Prozessgleichung für den gesteuerten Prozess<br />

Nach der Steuerung mit der Prozessgleichung wurde eine neue Stichprobe gezogen. Die<br />

erneute Berechnung der Prozessgleichung findet sich in Tabelle 5.16.6.<br />

Nach der erneuten Red-Auswahl erhält man die noch einmal reduzierte Prozessgleichung<br />

der Tabelle 5.16.7.


5.16 Warum und wie muss ein Prozess gesteuert werden?<br />

341<br />

Tabelle 5.16.5: Statistische Toleranzgrenzen für die wesentlichen Prozessvariablen<br />

Prozessvariable Sollwert untere Toleranz obere Toleranz<br />

X 1 67,8 66 69,6<br />

X 2 99,7 99,2 100,3<br />

X 3 65,2 63 67,4<br />

X 6 9,7 9,5 9,9<br />

X 7 10 9,4 10,6<br />

X 9 1130 1123 1137<br />

X 10 1060 960 1160<br />

X 11 1500 1400 1600<br />

X 17 2,6 2,5 2,7<br />

X 18 2,7 2,6 2,8<br />

X 19 36 30 42<br />

X 20 38,6 38,1 39,1<br />

X 21 25 17,8 32,2<br />

Tabelle 5.16.6: Prozessgleichung nach der Steuerung<br />

Variable Koeff.Proz.Gleich. Red(j)<br />

b o –273,416 0<br />

X 1 0,32589 0,00137<br />

X 2 –1,08663 0,01091<br />

X 3 –0,20621 0,002856<br />

X 6 –0,595993 0,000465<br />

X 7 –1,36983 0,0152204<br />

X 9 0,261945 0,0047759<br />

X 10 0,114271 0,010079<br />

X 11 –0,0716 0,0073467<br />

X 17 85,48145 0,0024669<br />

X 18 –49,4267 0,0015969<br />

X 19 0,114293 0,00582<br />

X 20 0,635618 0,007018<br />

X 21 0,167596 0,027981<br />

Z 1 0,455685 0,026173<br />

Z 2 1,633097 0,0080945<br />

Z 3 0,0121218 0,005202<br />

Z 4 4,065848 0,002721<br />

Z 5 0,068044 0,07361<br />

Z 6 –0,01391 0,00199<br />

Z 7 –18,1231 0,00493298<br />

Z 8 –0,385073 0,005596<br />

Z 9 –0,006996 0,011288<br />

Z 10 –0,00021174 9,91 E–7<br />

Z 11 0,0015124 3,177 E–3


342 5 Qualität in der Fertigung<br />

Tabelle 5.16.7: Prozessgleichung nach der erneuten Red-Auswahl<br />

Variable Koeff.Proz.Gleich. Red(j)<br />

b 0 –280,853 0<br />

X 1 0,333204 0,001372<br />

X 18 –50,0706 0,001596<br />

Z 6 –0,013221 0,001992<br />

X 17 87,2177 0,002466<br />

Z 4 4,431869 0,002721<br />

X 3 –0,225889 0,0028566<br />

Z 11 0,0013754 0,0031779<br />

X 9 0,259213 0,0047758<br />

Z 7 –18,15834 0,004932<br />

Z 3 0,012232 0,005202<br />

Z 8 –0,381648 0,005596<br />

X 19 0,11539 0,00582<br />

X 20 0,656262 0,007019<br />

X 11 –0,07158 0,007346<br />

Z 2 1,601321 0,0080945<br />

X 10 0,114915 0,010079<br />

X 2 –1,064585 0,010916<br />

Z 9 –0,0072043 0,011288<br />

X 7 –1,470685 0,01522<br />

Z 1 0,462309 0,026173<br />

X 21 0,173212 0,027981<br />

Z 5 0,067565 0,07361<br />

Die erneute Red-Auswahl führte dazu, dass die beiden Variablen X 6 und Z 10 gestrichen<br />

werden konnten. Das Maß der Beherrschbarkeit für die Prozessgleichung des gesteuerten<br />

2<br />

Prozesses ist mit R Y / X = 0,9072 sehr hoch. Die bedingte Standardabweichung (Streuung<br />

um die Prozessgleichung) ist s Y/X = 0,369.<br />

Die graphische Darstellung der Werte für Y 1 vor und nach der Steuerung zeigt die Abbildung<br />

5.16.6<br />

Anteil in ppm<br />

50<br />

45<br />

y1(gesteuert)<br />

40<br />

35<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

1 51 101 151 201<br />

Messwertsatz<br />

y1(ungesteuert)<br />

Abb. 5.16.6: Werte für die Produktvariable Y 1 vor und nach der Steuerung mit der Prozessgleichung


5.16 Warum und wie muss ein Prozess gesteuert werden?<br />

343<br />

Die Prozessverbesserung ist enorm. Hinsichtlich der Mittelwerte beträgt die Verbesserung<br />

ca. 450 %! Oder anders ausgedrückt, der Anteil des unerwünschten Nebenproduktes wird<br />

auf ca. 1/5 reduziert.<br />

Der Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen erfolgt<br />

durch uni- und multivariate Prozessfähigkeitsindizes.<br />

Tabelle 5.16.8: Univariate Prozessfähigkeiten für den gesteuerten Prozess<br />

Produktvariable C p k C pk<br />

Y 1 1,099 0,0048 1,094<br />

Y 2 1,005 0,0015 1,003<br />

Y 3 1,0086 0,027 1,004<br />

Y 5 1,0676 0,009 1,0579<br />

Y 6 1,072 0,0113 1,06<br />

Die multivariaten Prozessfähigkeitsindizes sind<br />

MC p = 1,182<br />

MC pk = 1,173.<br />

Das Maß der Beherrschbarkeit und die Prozessfähigkeitsindizes zeigen, dass der Prozess beherrscht<br />

wird und fähig ist, Produkte mit den geforderten Eigenschaften zu produzieren.<br />

Die Inputvariablen erfüllen ebenfalls simultan die Anforderungen, wie die uni- und multivariaten<br />

Prozessfähigkeitsindizes der folgenden Tabelle zeigen.<br />

Tabelle 5.16.9: Univariate Prozessfähigkeitsindizes für die Inputvariablen nach der Steuerung<br />

Inputvariable C p k C pk<br />

Z 1 1,041 0,0075 1,034<br />

Z 2 0,957 0,025 0,933<br />

Z 3 0,993 0,0047 0,998<br />

Z 4 1,103 0,0056 1,097<br />

Z 5 1,0778 0,0052 1,072<br />

Z 6 1,0294 0,0055 1,072<br />

Z 7 0,991 0,0001 0,99<br />

Z 8 0,937 0,01 0,927<br />

Z 9 0,959 0,0073 0,953<br />

Z 10 1,035 0,0099 1,024<br />

Z 11 0,976 0,0008 0,975<br />

Die multivariaten Prozessfähigkeitsindizes für die Lieferantenprodukte sind<br />

MC p = 1,027<br />

MC pk = 1,017.<br />

Auch die Lieferantenprodukte haben sich verbessert. Die Qualität der Lieferantenprodukte,<br />

ausgedrückt durch die multivariaten Prozessfähigkeitsindizes ist geringfügig größer als 1,<br />

kann also noch etwas verbessert werden.<br />

Die uni- und multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die<br />

Prozessvariablen sind in folgender Tabelle dargestellt.


344 5 Qualität in der Fertigung<br />

Tabelle 5.16.10: Univariate Prozessfähigkeitsindizes<br />

Prozessvariable C p k C pk<br />

X 1 0.38 0.025 0.37<br />

X 2 0.84 0.083 0.77<br />

X 3 0.619 0.026 0.60<br />

X 6 1.11 0.11 0.98<br />

X 9 0.20 0.4 0.12<br />

X 10 0.12 0.003 0.12<br />

X 11 0.12 0.11 0.105<br />

X 17 0.05 0.12 0.045<br />

X 18 0.049 0.18 0.04<br />

X 19 1.31 0.097 1.18<br />

X 20 0.937 0.048 0.89<br />

X 21 0.98 0.12 0.85<br />

Die multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die Prozessvariablen<br />

sind<br />

MC p = 0.9399<br />

MC pk = 0.0798.<br />

Die Einstellung der Prozessvariablen ist nicht in Ordnung. Mit den berechneten Einstellwerten<br />

für die Prozessvariablen erhält man die Fähigkeitsindizes der Tabelle 5.16.11.<br />

Tabelle 5.16.11: Univariate Prozessfähigkeitsindizes für die Prozessvariablen<br />

Prozessvariable C p k C pk<br />

X 1 0.48 0.008 0.48<br />

X 2 0.98 0.14 0.84<br />

X 3 0.68 0.00 0.68<br />

X 6 1.21 0.05 1.15<br />

X 9 0.26 0.004 0.26<br />

X 10 0.15 0.005 0.15<br />

X 11 0.12 0.01 0.12<br />

X 17 0.033 0.004 0.03<br />

X 18 0.03 0.03 0.03<br />

X 19 0.89 0.01 0.88<br />

X 20 0.86 0.05 0.81<br />

X 21 1.22 0.005 1.22<br />

Die multivariaten Prozessfähigkeitsindizes für die Prozessvariablen sind<br />

MC p = 0.992<br />

MC pk = 0.8226.<br />

Die Qualität des Prozesses muss weiter verbessert werden. Die Zentrierung ist in Ordnung,<br />

die Reduktion der Variabilität der Prozessvariablen ist nicht ausreichend. Die Entscheidung<br />

muss aber das Management fällen, da die weitere Verbesserung Kosten verursacht.


5.16 Warum und wie muss ein Prozess gesteuert werden?<br />

345<br />

Die Verbesserung des Prozesses durch die Steuerung mit der Prozessgleichung kann durch<br />

die multivariate Regelkarte für die „Produkte“ in Abbildung 5.16.7 sichtbar gemacht<br />

werden. Auch die Verbesserung der Lieferantenprodukte durch die Steuerung des Lieferantenprozesses<br />

mit den berechneten Sollwerten und Toleranzgrenzen als Zielgebiet kann<br />

visualisiert werden.<br />

T2<br />

0 1 2 3 4 5<br />

0 10 20 30 40<br />

Abb. 5.16.7: Multivariate Kontrollkarte für die Produkte des gesteuerten Prozesses<br />

Alle Produkte liegen unterhalb der Toleranzgrenze für das Produkt. Der Prozess ist in Ordnung,<br />

d. h. die Produkte erfüllen simultan alle relevanten Kundenanforderungen.<br />

Die multivariate Kontrollkarte für die Lieferantenprodukte ist in der Abbildung gegeben.<br />

T2<br />

0 1 2 3 4 5 6<br />

0 10 20 30 40<br />

Abb. 5.16.8: Kontrollkarte für die gesteuerten Lieferantenprodukte<br />

Bei dieser Karte liegen zwei Stichproben oberhalb der Kontrollgrenze. Der Lieferantenprozess<br />

muss noch weiter verbessert werden.


346 5 Qualität in der Fertigung<br />

5.17 Zusammenfassung der Produktvariablen<br />

Welches Problem soll mit der Zusammenfassung gelöst werden?<br />

Wiederholt habe ich darauf hingewiesen, dass<br />

• ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben wird,<br />

• sich die Produktvariablen mitunter bzgl. ihrer Zielstellung gegensätzlich verhalten, d. h. die<br />

eine Produktvariable muss eventuell maximiert, die andere minimiert werden,<br />

• der Prozess zur Herstellung eines Produktes aber nur nach dem Zielwert einer Produktvariablen<br />

gesteuert werden kann,<br />

• die Steuerung nur mit einer optimalen Teilmenge von Input- und Prozessvariablen möglich<br />

ist und<br />

• nur mit einer optimalen Einstellung für die Input- und Prozessvariablen vorgenommen<br />

werden kann.<br />

Aus diesen Feststellungen folgt, dass für die Ermittlung der einen optimalen Teilmenge von<br />

Input- und Prozessvariablen und die Berechnung der optimalen Einstellung, die Produktvariablen<br />

zusammengefasst werden müssen.<br />

Diese Zusammenfassung kann natürlich nicht auf der Addition basieren, denn die Produktvariablen<br />

haben verschiedene Dimensionen und sind nicht unabhängig voneinander.<br />

Wie können die verschiedenen Produktvariablen zusammengefasst werden?<br />

Um diese Frage beantworten zu können, müssen wir einige Sachverhalte aus der Schätztheorie<br />

wiederholen.<br />

Es liege wieder eine Stichprobe X 1 , …, X N für den zufälligen Vektor X T = (X 1 , …, X n ) vor. Der<br />

T<br />

Vektor der Mittelwerte X = ( X 1 ,…, X n ) ist n-dimensional normalverteilt mit dem Erwartungswert<br />

μ T = (µ 1 , …, µ n ) und der Kovarianzmatrix N –1 Σ. Wir symbolisieren diese Tatsache<br />

−1<br />

durch X ∼ Nn<br />

( μ, N Σ)<br />

.<br />

Die Schätzfunktion N S ist Wishart verteilt mit den Verteilungsparametern Σ und N – 1, wobei<br />

S die Stichprobenkovarianzmatrix bezeichnet. Die Wishart Verteilung ist eine multivariate<br />

Verallgemeinerung der χ 2 Verteilung. Diesen Sachverhalt kürzen wir durch die Symbolik<br />

N S ~ W n (Σ, N – 1) ab.<br />

Analog wie im univariaten Fall gilt auch im multivariaten Fall, dass X und N S unabhängig<br />

voneinander sind. Mit diesen Bezeichnungen gilt,<br />

T<br />

−1 2<br />

( N −1)( X − μ) S ( X − μ) = T .<br />

T 2 bezeichnet die Hotelling Statistik und leistet genau das von uns Gewünschte. Wir verwenden<br />

also die T 2 -Statistik für die Zusammenfassung der m, m ≥ 1 Produktvariablen zu einer neuen<br />

univariaten Statistik in der Form<br />

2 T −1<br />

T i i i<br />

= ( X − X) S ( X − X).<br />

Die T 2 -Statistik von Hotelling ist die multivariate Verallgemeinerung des Quadrates der univariaten<br />

t 2 -Statistik.


5.17 Zusammenfassung der Produktvariablen<br />

347<br />

Beispiel 5.17.1: Karosseriebau. Zusammenfassung der Produktvariablen<br />

Die m = 14 nicht unabhängigen Produktvariablen Y 1 , …, Y 14 werden zu „Produkten“ über<br />

die T 2 -Statistik von Hotelling zusammengefasst. Die Werte für diese Statistik werden in<br />

der Abbildung 5.17.1 dargestellt.<br />

80<br />

Produkte<br />

60<br />

40<br />

20<br />

0<br />

0 40 80 120 160 200 240<br />

Messwertsätze<br />

Abb. 5.17.1: Produkte für die Karosserievariablen<br />

Es ist, so glaube ich, sofort einzusehen, dass sich die univariaten T 2 i-Werte leichter einschätzen<br />

lassen als die Matrix der m = 14 mal N Einzelwerte.<br />

Große Werte können vorkommen, weil<br />

•<br />

•<br />

entweder ein Einzelwert für eine Produktvariable sehr groß wird oder<br />

die Werte für mehrere oder alle Produktvariablen an den Grenzen der statistischen<br />

Konfidenzintervalle liegen.<br />

Für die T 2 -Statistik gilt des weiteren<br />

T<br />

2<br />

( N − 1) n<br />

≥ F<br />

N − n<br />

nN , −n ( α ).<br />

Mit dieser Eigenschaft kann die T 2 -Statistik von Hotelling verwendet werden, um verschiedene<br />

Hypothesen über den Vektor X bzw. X zu prüfen.<br />

Außerdem gilt<br />

T 1 1<br />

i −<br />

−<br />

i i i<br />

E[( X − X) S ( X − X)] = Sp{ E[ X − X) ( X − X) S ]] = n.<br />

Diese Eigenschaft ist bei vielen praktischen Anwendungen nachteilig. So kann man aufgrund<br />

dieser Eigenschaft die T 2 -Statistik nicht verwenden, um die Prozessverbesserung nachzuweisen,<br />

indem man die Produktvariablen Y 1 , …, Y m vor und nach der Prozessverbesserung zu den<br />

Produkten zusammenfasst.<br />

Übung Kneterprozess<br />

Probleme<br />

In einem Unternehmen der Kunststoffindustrie gibt es Probleme mit den Knetern.<br />

Die ex- und internen Kundenanforderungen sind nur in einem Lastenheft verbal hinterlegt.<br />

Die Kunden der Kneterprodukte sind unzufrieden, können aber ihre Unzufriedenheit nicht<br />

quantitativ belegen. Die Streuungen der einzelnen Produktvariablen sind nachweisbar zu groß.<br />

Der Messwertaufwand ist für die vorliegenden Resultate zu hoch.


348 5 Qualität in der Fertigung<br />

Prozessbeschreibung<br />

Die Inputprodukte werden durch k = 14 Inputvariablen, der Prozess wird durch n = 21 Prozessvariablen<br />

und die Produkte werden durch m = 16 Produktvariablen beschrieben.<br />

Die Visualisierung einer Stichprobe von N = 155 Wertesätzen für die Produktvariablen liefert<br />

die Star Plots der Abbildung 5.17.2. Diese bestätigen die großen Streuungen der einzelnen<br />

Variablen. Die Stars variieren in ihrer Form sehr stark, zeigen aber auch gewisse periodische<br />

Schwankungen, deren Ursache wir nicht kennen.<br />

Die Zusammenfassung der Produktvariablen liefert die Abbildung 5.17.4.<br />

Die Zusammenfassung der Inputvariablen liefert die Abbildung 5.17.5.<br />

Der Vergleich der beiden Abbildungen zeigt einen deutlichen Zusammenhang zwischen den<br />

Input- und Produktvariablen. Daraus folgt, dass die Ursache für das Problem in der Kommunikation<br />

zwischen dem Kunden- und Lieferantenprozess zu liegen scheint.<br />

144 150<br />

131<br />

118<br />

105<br />

92<br />

79<br />

66<br />

53<br />

Abb. 5.17.2: Star Plots für die Kneterprodukte


5.17 Zusammenfassung der Produktvariablen<br />

349<br />

MISCH05.Y5<br />

MISCH05.Y4<br />

MISCH05.Y7<br />

MISCH05.Y8<br />

MISCH05.Y2<br />

MISCH05.Y1<br />

MISCH05.Y10<br />

MISCH05.Y12<br />

MISCH05.Y14<br />

Abb. 5.17.3: Schlüssel für die Star Plots<br />

T-Squared<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

Multivariate Control Chart<br />

0 30 60 90 120 150<br />

Observation<br />

Abb. 5.17.4: Zusammenfassung der Produktvariablen<br />

UCL = 25,37<br />

T-Squared<br />

30<br />

25<br />

20<br />

15<br />

10<br />

5<br />

0<br />

zusammengefasste Inputparameter<br />

0 30 60 90 120 150<br />

Observation<br />

UCL = 20,38<br />

Abb. 5.17.5: Zusammenfassung der Inputvariablen<br />

Für die statistische Prozessanalyse habe ich für Sie eine Auswahl für die Input-, Prozess- und<br />

Produktvariablen getroffen, damit Sie mit den beiliegenden Programmen arbeiten können.<br />

Diese sind:<br />

•<br />

•<br />

zwei Rohstoffe, die durch Z 13 und Z 14 beschrieben werden,<br />

die drei Prozessvariablen<br />

X 4 Masse [kg]<br />

X 10 Drehzahl [U/min]<br />

X 12 Mischzeit [min]<br />

und die beiden


350 5 Qualität in der Fertigung<br />

• Produktvariablen mit den Sollwerten und Toleranzgrenzen<br />

Y 9 Rheo Wert (Soll = 0,6, T u = 0,59, T o = 0,61)<br />

Y 12 Dichte (Soll = 1,05, T u = 1,024, T o = 1,076).<br />

Führen Sie bitte eine umfassende statistische Prozessanalyse mit den Zwischenergebnissen<br />

•<br />

•<br />

•<br />

•<br />

Definition des Problems,<br />

Quantifizierung der Abhängigkeitsstruktur,<br />

Berechnung der Prozessgleichungen,<br />

Steuerung des Prozesses mit der Prozessgleichung<br />

durch.<br />

5.18 Kalibrierung<br />

Die pra ktische Erfahrungen – nicht immer positiv – eines Labors zur Untersuchung von Bodenproben<br />

mit der DIN ISO 8466-2 „Kalibrierstrategie für nichtlineare Kalibrierfunktionen<br />

zweiten Grades“, Auftraggebern und Gutachtern für die Verfahrensetablierung, veranlassten<br />

uns, diesen Beitrag aufzunehmen.<br />

Das Problem aus dem Zusammenspiel der Kombattanten besteht häufig in der Vorgabe einer linearen<br />

Kalibrierung durch die Verfahrensetablierung, obwohl der Sachverhalt nichtlinear ist.<br />

Zur Lösung dieses Problems muss dafür Sorge getragen werden, dass obige Norm unbedingt<br />

angewandt wird. Dazu sind einige Verbesserungen erforderlich, die wir im Folgenden diskutieren<br />

wollen.<br />

Messwerte und Entscheidungen<br />

Eine umweltbelastende Konsequenz der industriellen Ansiedlungen sind kontaminierte Böden.<br />

Diese müssen gereinigt und in den Kreislauf zurückgeführt werden. Dazu sucht der Besitzer<br />

des Bodens durch Ausschreibung einen Sanierer. Zur Konkretisierung der Ausschreibung und<br />

für den Nachweis der simultanen Erfüllung aller relevanten Kunden – Besitzer und Gesetzgeber<br />

– Anforderungen schaltet der Sanierer ein Labor und falls erforderlich einen Gutachter ein. Das<br />

Labor ermittelt für die kontaminierten Böden nach einer entsprechenden Parametrisierung<br />

die Istwerte für die festgelegten Variablen.<br />

In diesem Zusammenhang ist die Kalibrierung von grundlegender Bedeutung, da die Konzentrationen<br />

bestimmter Substanzen nicht direkt gemessen werden können. Es lässt sich nur eine<br />

Funktion Y (Kalibrierfunktion) der Konzentration X, Y = f(X) messen. Der Funktionstyp und<br />

die Koeffizienten der Funktion sind unbekannt und müssen so genau wie möglich bestimmt<br />

werden. Hierfür werden Daten für Standardproben gewonnen. Die Konzentration X i wird<br />

vorgegeben und die Funktion der Konzentration Y i , i = 1, …, N wird gemessen. Die Werte Y i<br />

nennt man der Einfachheit halber Messwerte der Variablen. Bei den praktischen Problemen<br />

gewinnt man die Messwerte Y i und will durch einen Umkehrschluss X = g(Y) die Konzentration<br />

der Verbindung bestimmen. Die Funktion g(X) nennt man Analysefunktion.<br />

Vom Kunden (Gesetzgeber, Besitzer, Weiterverwerter, …) werden die Anforderungen an den<br />

weiter zu verwertenden Boden gestellt. Das Labor hat nach der Reinigung der Böden die


5.18 Kalibrierung<br />

351<br />

Kundenanforderungen<br />

Kundenanforderungen<br />

Gesetzgeber<br />

N<br />

kontaminierter<br />

Boden<br />

Sanierung<br />

gereinigter<br />

Boden<br />

E<br />

J<br />

Verbringung<br />

In den Kreislauf<br />

zurückgeführt<br />

Bodenvariablen Prozessvariablen Bodenvariablen Prozessvariablen Bodenvariablen<br />

Labor<br />

Labor<br />

Messwertermittlung<br />

Nachweis der Erfüllung<br />

Messwertermittlung<br />

Nachweis der Erfüllung<br />

Abb. 5.18.1: Netzwerk der Prozesse für die Bodensanierung<br />

Werte für die Variablen erneut zu bestimmen und den Nachweis zu führen, dass simultan alle<br />

relevanten Anforderungen durch den gereinigten Boden erfüllt werden. Das Zusammenspiel<br />

der Prozesse und Verantwortlichen wird durch das abgebildete Netzwerk der Prozesse mit<br />

Kommunikation dargestellt.<br />

Nach dieser Abbildung sind die folgenden Fehlentscheidungen möglich:<br />

Tabelle 5.18.1: Entscheidungen und Fehlentscheidungen<br />

Boden<br />

Entscheidungen<br />

A Anforderungen nicht erfüllt B Anforderungen erfüllt<br />

kontaminiert Ja Fehlentscheidung 1<br />

saniert Fehlentscheidung 2 ja<br />

Die Fehlentscheidung 1 besagt, dass ein kontaminierter Boden in den Kreislauf zurückkommt<br />

und die Umwelt weiter schwer belastet. Durch das Zurückholen und erneute Reinigen des Bodens<br />

entsteht ein enormer Verlust für den Kunden. Die Fehlentscheidung 2 verlangt, dass ein<br />

ausreichend sanierter Boden erneut saniert wird und daher ein Verlust für die Bodensanierer<br />

entsteht.<br />

Die Wahrscheinlichkeiten für Fehlentscheidungen müssen minimiert werden, um Verluste zu<br />

vermeiden oder zumindest ebenfalls zu minimieren.<br />

Hierfür stehen uns aber nur zwei Möglichkeiten zur Verfügung. Der erste Weg bedeutet Investitionen<br />

in neue Geräte. Der zweite Weg verlangt geistige Investition, um die Gesetzmäßigkeiten<br />

der Sanierung und den simultanen Nachweis der Erfüllung aller relevanten Anforderungen im<br />

Sinne der DIN ISO Norm zu erkennen und auszunutzen. Damit wird deutlich, dass der erste<br />

Weg nur dann beschritten werden darf, wenn der zweite nicht mehr weiter führt, zumal in der<br />

Regel die materiellen Investitionen ausgeschöpft sind.


352 5 Qualität in der Fertigung<br />

Beispiel 5.18.1: Kalibrierung. Linear<br />

Für die Kalibrierung liegen die Messwerte M 1 und die Konzentrationen vor. Die Darstellung<br />

dieser Wertepaare enthält die Abbildung 5.18.2.<br />

Werden die Punkte durch eine lineare Kalibrierfunktion angepasst, dann erhält man die<br />

Abbildung 5.18.3.<br />

Die Kalibriergerade hat die Koeffizienten<br />

Y = M 1 = b 0 + b Y/X X = –44611 + 1,36577 Konzentration.<br />

Zur Beurteilung der Kalibrierfunktion werden das Quadrat des Korrelationskoeffizienten<br />

2<br />

r Y / X = 0.9935 und die Reststandardabweichung S Y/X = 37540 angegeben.<br />

Der quadrierte Korrelationskoeffizient ist ein Maß für die lineare Abhängigkeit zwischen<br />

den Messwerten Y und der Konzentration X und gibt an, zu wieviel Prozent die Varianz der<br />

Messwerte Y durch die Konzentration erklärt wird. Dieser Koeffizient ist erfreulicherweise<br />

überaus groß, d. h. ca. 99.3 % der Varianz der Messwerte werden durch die Konzentration<br />

(X 100000)<br />

15<br />

12<br />

9<br />

M1<br />

6<br />

3<br />

0<br />

0 0,2 0,4 0,6 0,8 1<br />

Konzentration<br />

Abb. 5.18.2: Statistischer Zusammenhang zwischen den Messwerten M 1 und den Konzentrationen<br />

(X 100000)<br />

15<br />

12<br />

9<br />

M1<br />

6<br />

3<br />

0<br />

0 0,2 0,4 0,6 0,8 1<br />

Abb. 5.18.3: Anpassung der Messwerte durch eine lineare Kalibrierfunktion<br />

Konzentration


5.18 Kalibrierung<br />

353<br />

erklärt. Die Reststandardabweichung ist die Standardabweichung der Messwerte um die<br />

Kalibriergerade. Diese kann nach der einfachen Beziehung<br />

2 2 2<br />

Y / X = Y − Y / X<br />

S S (1 R )<br />

berechnet werden.<br />

Die quadratische Kalibrierfunktion ist<br />

2 2<br />

Y = M1 + b0 ′ + bY′ / X X + bY′<br />

/ XX X = 6398,8 + 991257 Konz + 383015 Konz<br />

Das Quadrat des (in diesem Falle multiplen) Korrelationskoeffizienten ist<br />

2<br />

Y<br />

R / X = 0.9987.<br />

Würde man aufgrund des Korrelationskoeffizienten entscheiden, ob die lineare Kalibrierung<br />

ausreichend ist, so würde man – wie so häufig – entscheiden, dass die lineare Kalibrierung<br />

ausreicht. Aber berechnet man die Reststandardabweichung, dann erhält man den Wert<br />

S Y/X = 16325.<br />

Das ist eine Verbesserung von mehr als 220 %!<br />

Die Darstellung der quadratischen Kalibrierfunktion ist in der Abbildung 5.18.4 zu sehen.<br />

(X 100000)<br />

15<br />

12<br />

9<br />

M1<br />

6<br />

3<br />

0<br />

0 0,2 0,4 0,6 0,8 1<br />

Abb. 5.18.4: Quadratische Kalibrierfunktion mit dem 95 % Konfidenzintervall<br />

Konzentration<br />

Auswirkungen des linearen und quadratischen Ansatzes auf die Kalibrierfunktion<br />

Für die Bestimmung der unbekannten Konzentration einer Substanz wird die Analysefunktion<br />

X =g(Y) verwendet. Diese Funktion wird in den verschiedenen Standards als Umkehrfunktion<br />

der Kalibrierfunktion bestimmt. Das ist nicht zulässig, da der Zusammenhang zwischen den<br />

Messwerten M 1 und der Konzentration stochastisch und damit nicht eineindeutig ist. Es ist<br />

besser allgemein anzunehmen, dass<br />

(Y, X) ~ N 2 (µ, Σ),<br />

wobei µ T = (µ Y , µ X ) und<br />

⎛<br />

2<br />

σY<br />

σ ⎞<br />

Σ = ⎜ ⎟.<br />

⎝ σ ⎠<br />

YX<br />

2<br />

X


354 5 Qualität in der Fertigung<br />

Da zu Beginn der Analysen alles unbekannt ist, verwendet man Standardproben und bestimmt<br />

hierfür für vorgegebene Konzentrationen die Messwerte.<br />

Unter dieser Annahmen kann man mit derselben Methode und denselben Werten die Analysefunktion<br />

X = g(Y) bestimmen.<br />

Mit dieser Funktion kann der Nachweis über das Vorhandensein einer Verbindung geführt<br />

werden. Darüber hinaus kann aber auch die Konzentration (Gehalt) einer Verbindung bestimmt<br />

werden.<br />

Die Chemiker sind an weiteren Charakteristika interessiert. Zu diesen gehören der kritische<br />

Wert einer Messgröße, die Nachweisgrenze, die Erfassungsgrenze und die Bestimmungsgrenze.<br />

Diese Charakteristika hängen natürlich ganz stark vom Kurventyp der Kalibrier- bzw.<br />

Analysefunktion ab und können daher auch als Entscheidung für den einen oder anderen<br />

Funktionstyp dienen.<br />

Der kritische Wert der Messgröße Y we ist darauf hin, dass mit vorgebbarer Wahrscheinlichkeit<br />

die Substanz vorhanden ist.<br />

Der kritische Wert muss berechnet werden. Als Modell wird die Breite des „Prognoseintervalls“<br />

an der Stelle X = 0 (Konzentration ist gleich null) verwendet.<br />

Für den Vergleich der verschiedenen Typen der Kalibrierfunktion werden die Prognosevarianz<br />

und damit die Prognoseintervallbreite für den linearen und quadratischen Fall berechnet.<br />

Für die lineare Kalibrierfunktion erhält man aus den Berechnungen die Schätzung für die<br />

Prognosevarianz<br />

⎛<br />

ˆvar [ Yˆ<br />

( X )]<br />

⎜<br />

1<br />

2<br />

2 1 ( XE<br />

− X)<br />

E = SY /<br />

⎜<br />

X + +<br />

N<br />

⎜ N<br />

2<br />

⎜ ∑ ( Xi<br />

− X)<br />

⎝<br />

i=<br />

1<br />

und damit die halbe Breite des Prognoseintervalls<br />

⎞<br />

⎟<br />

⎟<br />

⎟<br />

⎟<br />

⎠<br />

ˆ 1 ( XE<br />

− X)<br />

YE + tFG, α ⋅ SY / X ⋅ 1 + +<br />

.<br />

N<br />

N<br />

2<br />

( X − X)<br />

∑<br />

i=<br />

1<br />

i<br />

In diesen Darstellungen ist X E die Konzentration für die man die Prognose berechnen möchte<br />

und Y ˆ ˆ( E = Y XE)<br />

.<br />

Für die quadratische Kalibrierfunktion gilt<br />

2<br />

ˆ 2 ⎡ 1<br />

T −1<br />

⎤<br />

ˆvar( YE) = SY / X ⎢<br />

1 + + ( XE − X) AXX ( XE<br />

− X)<br />

⎣ N<br />

⎥<br />

⎦<br />

und damit<br />

1<br />

Y t S X X A X X<br />

N<br />

ˆ T −1<br />

E + FG, α ⋅ Y / X ⋅ 1 + + ( E − ) XX ( E − ).


5.18 Kalibrierung<br />

355<br />

Beispiel 5.18.2: Kalibrierung. Vorhersageintervall<br />

Für die lineare Kalibrierfunktion erhält man das Prognoseintervall für die Stelle X E = 0<br />

ˆ 1 ( XE<br />

− X)<br />

YE + tFG, α ⋅ SY / X ⋅ 1 + + = − 44611 ± 97845,<br />

N<br />

N<br />

2<br />

( X − X)<br />

∑<br />

i=<br />

1<br />

d. h. die halbe Breite des Prognoseintervalls ist 97845.<br />

Der kritische Messwert für die lineare Kalibrierfunktion ist<br />

i<br />

2<br />

1 X<br />

Yk = b0 + tFG, α ⋅ SY / X ⋅ 1 + + = − 44611 + 97845 = 53234.<br />

N<br />

N<br />

2<br />

( X − X)<br />

∑<br />

i=<br />

1<br />

Für die quadratische Kalibrierfunktion erhalten wir<br />

i<br />

2<br />

1<br />

Y t S X X A X X<br />

N<br />

ˆ T −1<br />

E + FG, α ⋅ Y / X ⋅ 1 + + ( E − ) XX ( E − ) = 6398.8 ± 44542<br />

d. h. die halbe Breite des Prognoseintervalls 44542 ist sehr viel kleiner als bei der linearen<br />

Kalibrierfunktion.<br />

Der Wert Y ˆ( X E = 0) entspricht dem Wert b 0 in den Kalibrierfunktionen.<br />

Der kritische Messwert für die quadratische Kalibrierfunktion ist<br />

1<br />

T −1<br />

Yk = b0 + tFG, α ⋅ SY / X ⋅ 1 + + ( XE − X) AXX ( XE<br />

− X) = 6398 + 44542<br />

N<br />

= 50940.<br />

Beispiel 5.18.3: Nachweisgrenze<br />

Die Nachweisgr enze ist die Konzentration, die dem kritischen Wert des Messwertes entspricht.<br />

Im linearen Fall erhält man für die Funktion X = g(Y) die halbe Breite des Prognoseintervalls<br />

ˆ 1 ( YE<br />

− Y)<br />

XE + tFG, α ⋅ SX / Y ⋅ 1 + +<br />

N<br />

N<br />

( Y − Y)<br />

und damit die Nachweisgrenze<br />

∑<br />

i=<br />

1<br />

1 ( Yk<br />

− Y)<br />

XNG = tFG, α ⋅ SX / Y⋅ 1 + + = 0.069987.<br />

N<br />

N<br />

2<br />

( Y − Y)<br />

∑<br />

i=<br />

1<br />

i<br />

i<br />

2<br />

2<br />

2


356 5 Qualität in der Fertigung<br />

Im quadratischen Fall erhält man<br />

1<br />

X b t S Y Y A Y Y<br />

N<br />

ˆ T −1<br />

E = 0′ + FG, α ⋅ X / Y ⋅ 1 + + ( E − ) YY ( E − )<br />

und die Nachweisgrenze<br />

1<br />

T −1<br />

XNG = tFG, α ⋅ SX / Y⋅ 1 + + ( YE− Y) AYY ( YE− Y) = 0.05696.<br />

N<br />

Die Nachweisgrenze für den quadratischen Ansatz liegt ungefähr bei nur 80 % des linearen<br />

Ansatzes.<br />

Beispiel 5.18.4: Erfassungsgrenze<br />

Diese Grenze bezei chnet die kleinste Konzentration bei der mit vorgebbarer Wahrscheinlichkeit<br />

der Nachweis der Substanz möglich ist.<br />

Für den linearen Fall erhält man für die vorgebbare Wahrscheinlichkeit β = α die Erfassungsgrenze<br />

1 ( Yk<br />

− Y)<br />

XEG = XNG + tFG, α ⋅ SX / Y⋅ 1 + + = 0.1399.<br />

N<br />

N<br />

2<br />

( Y − Y)<br />

Für den quadratischen Fall gilt<br />

1<br />

T −1<br />

XEG = XNG + tFG, α ⋅ SX / Y⋅ 1 + + ( YE− Y) AYY ( YE− Y) = 0.11392.<br />

N<br />

∑<br />

i=<br />

1<br />

i<br />

2<br />

Beispiel 5.18.5: Bestimmungsgrenze<br />

Für diese Grenze mus s die relative Ergebnisunsicherheit, die sich aus der halben Breite des<br />

Prognoseintervalls für die Konzentration X und der Bestimmungsgrenze X BG sowohl für<br />

den linearen<br />

t<br />

1<br />

⋅ S ⋅ 1 + +<br />

N<br />

FG, α X / Y<br />

X<br />

als auch quadratischen Fall<br />

BG<br />

2<br />

( Yi<br />

− Y)<br />

N<br />

2<br />

∑ ( Yi<br />

− Y)<br />

i=<br />

1 ΔXBG<br />

XBG<br />

= = V (lin)<br />

r<br />

tFG, α ⋅ SX / Y⋅ 1<br />

T −1<br />

1 + + ( Yi− Y) AYY ( Yi<br />

N<br />

− Y)<br />

X<br />

BG<br />

ΔXBG<br />

= = Vr<br />

(quad)<br />

X<br />

BG<br />

ergibt, bestimmt werden. Dieser Quotient soll nun mit vorgegebener Wahrscheinlichkeit<br />

α einen vorher definierten Wert k annehmen, z. B. k =3. Symbolisch kann man hierfür<br />

schreiben P (V r ≥ k) = α.


5.18 Kalibrierung<br />

357<br />

In die Formeln für die Prognoseintervalle muss anstelle des beliebigen Messwertes Y i der<br />

Messwert an der Stelle der Bestimmungsgrenze eingesetzt werden. Dieser Wert ist aber unbekannt.<br />

Folglich müsste man ein approximatives Verfahren entwickeln oder eine Schätzung<br />

einsetzen. Als Schätzung wird nach dem HBU Standard der Wert Y BG = k ΔY BG verwendet.<br />

Hierfür gilt P (ΔX BG ≥ k X BG ) = α.<br />

Formt man nun die Quotienten V r um, dann erhält man für den linearen Fall die Bestimmungsgrenze<br />

1 ( k ⋅YNG<br />

− Y)<br />

XBG = k ⋅tFG, α ⋅ SX / Y⋅ 1 + + = 0.167822<br />

N<br />

N<br />

2<br />

( Y − Y)<br />

bzw. für den quadratischen Fall die Grenze<br />

∑<br />

i=<br />

1<br />

1<br />

T −1<br />

XBG = k ⋅tFG, α ⋅ SX / Y⋅ 1 + + ( k ⋅YNG− Y) AYY<br />

( k ⋅YNG<br />

− Y) = 0.065005.<br />

N<br />

Auch hier sieht man wieder die Verbesserung um ca. 250 % beim Übergang vom linearen<br />

zum quadratischen Ansatz.<br />

Schlussfolgerungen<br />

Wenn der Zusammenhang zwischen der Konzentration und dem Messwert nichtlinear ist, dann<br />

muss mit der nichtlinearen Kalibrierfunktion gearbeitet werden, da ansonsten der Verlust an<br />

Genauigkeit (Reststandardabweichung) zu groß wird und damit der kritische Messwert, die<br />

Nachweis-, Erfassungs- und Bestimmungsgrenzen zu ungenau – ebenfalls zu hoch – bestimmt<br />

werden. Die Verschlechterungen können in der Regel nicht durch die materielle Investition in<br />

Geräte aufgefangen werden und sind außerdem sehr teuer.<br />

Die DIN ISO Norm 8466-2: 2000-09 sollte mit den hier vorgestellten Verfahren vervollständigt<br />

werden, damit das Konfliktpotential bei der Ausschreibung zwischen den Kombattanten<br />

im Sinne einer klaren Entscheidung aufgrund eindeutiger statistischer Ergebnisse reduziert<br />

werden kann.<br />

In diesem Zusammenhang sollten auch die Konfliktpotentiale, die auf der Bestimmung der<br />

Kalibrierfunktion mit Wiederholungen und der Rekalibrierung basieren, diskutiert und beseitigt<br />

werden.<br />

i<br />

2

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!