Praxisleitfaden Qualität - M-QM
Praxisleitfaden Qualität - M-QM
Praxisleitfaden Qualität - M-QM
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Praxisleitfaden</strong> Qualität<br />
Walter Jahn, Lorenz Braun<br />
Prozessoptimierung mit multivariater Statistik in 150<br />
Beispielen<br />
ISBN 3-446-40616-6<br />
Leseprobe<br />
Weitere Informationen oder Bestellungen unter<br />
http://www.hanser.de/3-446-40616-6 sowie im Buchhandel
5 Qualität in der Fertigung<br />
Dieses Kapitel ist zweifelsfrei für den Nutzer aus der Fertigung das wichtigste, da in diesem<br />
grundsätzliche Fragen, wie z. B.<br />
• Was ist Qualität?<br />
• Was besagen die Bezeichnungen Produktqualität, Prozessqualität und Lieferantenqualität?<br />
• Wie kann die Qualität für Vergleiche messbar gemacht werden?<br />
• Wie können Sie die Kundenanforderungen spezifizieren?<br />
• Was ist Fähigkeit?<br />
• Wie können Sie die Fähigkeit ermitteln?<br />
• Wie können Sie aufgrund der Fähigkeiten entscheiden?<br />
• Welche Entscheidungsmöglichkeiten haben Sie?<br />
• Was heißt Prozessverbesserung?<br />
• Was ist eine Prozessgleichung?<br />
• Wie können Sie mit der Prozessgleichung die Prozesse steuern?<br />
• Wie können Sie die Ergebnisse der statistischen Prozessanalyse und Steuerung der Prozesse<br />
in die Praxis überführen?<br />
beantwortet werden.<br />
Zur Beantwortung dieser und zahlreicher anderer Fragen müssen wir strukturiert vorgehen,<br />
um die komplizierte Materie für Sie so aufzubereiten, damit Sie die Methoden zur notwendigen<br />
Lösung Ihrer betrieblichen Probleme anwenden und vor allem deren Ergebnisse zum Nutzen<br />
für das Unternehmen interpretieren können.<br />
5.1 Was ist ein Produkt ?<br />
Das Ergebnis jeder Tätigkeit und jedes (Herstellungs- oder Dienstleistungs-) Prozesses ist ein<br />
Produkt.<br />
Das Produkt kann z. B. ein Nahrungsmittel sein, oder es ist ein Teil für die Weiterverwendung<br />
in umfassenderen Produkten, wie z. B. der Motor für ein Auto usw. Das Produkt kann aber<br />
auch eine Dienstleitung, z. B. eine Taxi-Fahrt oder die Bestellung von Materialien für die Herstellung,<br />
der Vertrieb der Produkte usw. sein.<br />
Jedes Produkt wird auf einem Markt realisiert, d. h. angeboten und gekauft. Aber damit ein<br />
Produkt gekauft wird, muss es Anforderungen von Kunden erfüllen. Diese Anforderungen werden<br />
häufig durch Eigenschaften charakterisiert, so z. B. muss ein PKW modern sein, geringen<br />
Benzinverbrauch haben, ständig einsatzbereit sein. Die Eigenschaften werden z. B. auch für<br />
Produktweiterentwicklungen durch die WAS Fragen ermittelt.
156 5 Qualität in der Fertigung<br />
Eigenschaften sind aber häufig nicht oder nicht einfach zu messen. Daher müssen die Eigenschaften<br />
parametrisiert werden. Oft sind die Parameter physikalisch, chemisch, biologisch oder<br />
ökonomisch stetig messbare Variablen. Der Spritverbrauch beim PKW ist ein physikalisch<br />
messbarer Parameter. Die Eigenschaft „modern“ muss aber erst noch in solche Parameter<br />
übersetzt werden. Modern könnte sich auf die Elektronik im PKW beziehen und die Motorsteuerung<br />
oder die Klimaanlage betreffen. Diese Aggregate können dann durch eine Vielzahl<br />
von Variablen parametrisiert werden.<br />
Die Ausprägungen der Variablen, d. h. welche Werte sollen die Variablen annehmen, werden<br />
unter der Frage WIE z. B. bei QFD charakterisiert.<br />
Die immense Vielzahl verschiedener Produkte, die unterschiedlichen Anforderungen an die<br />
Produkte und die zahlreichen Weiterverwendungen der Produkte zwingen uns dazu, eine<br />
Ordnung in diese riesige Menge und den unterschiedlichen Sprachgebrauch zu bringen.<br />
Daher vereinbaren wir, dass ein Produkt durch m, m ≥ 1 Produktvariable Y 1 , …, Y m beschrieben<br />
wird.<br />
Die Produktvariablen sind Realisierungen von Zufallsgrößen. Das wird deutlich, wenn wir uns<br />
ein konkretes Produkt anschauen.<br />
Beispiel 5.1.1: Ziegelsteinherstellung. Nicht unabhängige Zufallsgrößen<br />
Ein Ziegelstein besteht aus einer Mischung aus Lehm, Kalk, Feldspat und gewissen Additiven.<br />
Die Verteilung der Komponenten wird auch nach sehr langer Mischzeit nicht völlig<br />
homogen sein.<br />
Die geformten Ziegelsteine werden in Stapeln auf Paletten geschichtet und langsam durch<br />
einen Brennofen gefahren.<br />
Das heterogene Gemisch aus verschiedenen Komponenten, die unterschiedliche Lage eines<br />
Ziegelstein im Stapel, die unterschiedlich lange Dauer der Ofenreise und die damit verbundene<br />
unterschiedliche Temperaturkapazität pro Stein führen dazu, dass die Produktvariablen<br />
des Ziegelsteins, wie die Bruchfestigkeit, die geometrischen Abmessungen, das Gewicht usw.<br />
selbst für eine „gleichbehandelte“ Charge in gewissen Grenzen schwanken. Die Messwerte<br />
für die Produktvariablen sind zufallsbehaftet, d. h. die Messwerte haben einen mehr oder<br />
weniger großen zufälligen Fehler.<br />
Die Produktvariablen sind nicht unabhängig voneinander, sondern sie sind mehr oder weniger<br />
stark miteinander korreliert. Diesen Sachverhalt können Sie sich anhand der Abbildung 5.1.1<br />
verdeutlichen.<br />
r 12<br />
Y 2 ±Δ Y 2<br />
Y 1<br />
r 23<br />
r 13<br />
Y 3<br />
Abb. 5.1.1: Korrelative Abhängigkeiten für Produktvariable
5.1 Was ist ein Produkt?<br />
157<br />
Diese Abbildung zeigt Ihnen, dass sich z. B. die Veränderung des Wertes von Y 2 um den Betrag<br />
ΔY 2 sowohl auf Y 1 als auch auf Y 3 auswirken kann. Die „Größe“ dieser Abhängigkeiten,<br />
besser der Grad der linearen Abhängigkeiten zwischen jeweils zwei Zufallsvariable wird durch<br />
den Korrelationskoeffizienten r jk , j, k = 1,2,3 gemessen. Das sind dimensionslose Zahlen, die<br />
zwischen –1 und +1 liegen. Sind zwei Variablen unabhängig voneinander, dann ist der Korrelationskoeffizient<br />
gleich null.<br />
Beispiel 5.1.2: Dämpfung der Motorvibration. Abhängigkeiten<br />
Für die Dämpfung der Motorvibration werden Hydrolager verwendet. An diesem Produkt<br />
werden viele Produktvariablen gemessen. Wir wollen hier nur die beiden Produktvariablen<br />
Y 1 = dynamische Steifigkeit [N/mm] und Y 2 = Phasenverschiebung [Φ] betrachten Mit den<br />
Daten aus einer großen Stichprobe wurde die dreidimensionale Häufigkeitsverteilung in<br />
Abbildung 5.1.2 gezeichnet.<br />
Was können Sie aus der Abbildung 5.1.2 ablesen?<br />
•<br />
•<br />
•<br />
Die Werte für die beiden Produktvariable streuen sehr stark. Das ist ein Ausdruck für<br />
den zufälligen Charakter der Produktvariablen.<br />
Es gibt viele Ausreißer.<br />
Die Grundfläche der Häufigkeitsverteilung, d. h. die Punktwolke für die Messwertpaare,<br />
ausgedrückt durch das Streudiagramm in Abbildung 5.1.3, ist offensichtlich nicht kreisförmig,<br />
sondern elliptisch umrissen. Das zeigt Ihnen, dass die beiden Produktvariablen<br />
nicht unabhängig voneinander sind.<br />
Abb. 5.1.2: Dreidimensionale Häufigkeitsverteilung für zwei Produktvariablen eines Hydrolagers
158 5 Qualität in der Fertigung<br />
250<br />
CDYN<br />
200<br />
150<br />
100<br />
0 10 20 30 40 50 60<br />
PHASE<br />
Abb. 5.1.3: Streudiagramm für die hydraulischen Motorlager<br />
Aus Abbildung 5.1.2 und Abbildung 5.1.3 müssen Sie die Schlussfolgerungen ziehen,<br />
dass<br />
• die Daten aufbereitet werden müssen; Ausreißer sind zu erkennen und zu eliminieren,<br />
• jeder Prozess zu Herstellung eines Produktes gesteuert werden muss, um die vielen<br />
Ausreißer zu vermeiden und die Streuung zu reduzieren.<br />
Für die Steuerung benötigen Sie Zielwerte und zulässige Streuintervalle für die Produktvariablen<br />
und eine Prozessgleichung.<br />
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in<br />
Ordnung sind oder verbessert werden müssen?<br />
Die konkreten Produktdarstellungen zeigen Ihnen, dass<br />
• jedes Produkt durch die Angabe von Sollwerten und Toleranzgrenzen für alle nicht unabhängigen<br />
Produktvariablen präzisiert werden muss – man spricht in diesem Zusammenhang<br />
von der Spezifizierung aller relevanten Kundenanforderungen und<br />
• ein Kriterium gesucht wird, nach dem entschieden wird, ob ein Produkt simultan alle<br />
relevanten Kundenanforderungen erfüllt oder der Prozess verbessert werden muss.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
159<br />
5.2.1 Was ist ein modernes Produktaudit ?<br />
Audits im Qualitätsmanagement sind durch die Unternehmensleitung initiierte, systematische<br />
und unabhängige Qualitätsprüfungen, um festzustellen, ob die qualitätsbezogenen Tätigkeiten<br />
den geplanten Anforderungen entsprechen, ob diese Anforderungen tatsächlich verwirklicht<br />
sind und ob sie geeignet sind, die Ziele zu erreichen (Linß [2005, 393]). Nach Linß wird in<br />
Systemaudits, Produktaudits und Prozessaudits unterschieden.<br />
Durch das Produktaudit soll nach ISO 9000: 2000 ff. und Linß [2004, 394] die Übereinstimmung<br />
der Ausführung von Produkten mit den festgelegten Qualitätsforderungen untersucht<br />
und beurteilt werden.<br />
Die beiden Seiten eines Audits, nämlich die<br />
•<br />
•<br />
Anforderungen und<br />
der Istzustand eines Produktes<br />
müssen quantifiziert werden. Das Gleiche gilt für die Beurteilung der Übereinstimmung, damit<br />
z. B. Übereinstimmungen verglichen werden können, um festzustellen, ob Verbesserungsmaßnahmen<br />
wirksam waren. Zu diesem Zweck zählen wir zum „modernen“ Produktaudit<br />
die Aktivitäten:<br />
1. Zusammenstellung der (ex- und/oder internen) Kundenanforderungen zu einem Kunden-<br />
Anforderungs-Profil (KAP),<br />
2. Parametrisierung der Kundenanforderungen durch die Produktvariablen,<br />
3. Datensammlung für alle Produktvariablen,<br />
4. Zusammenstellung der Sollwerte und Toleranzgrenzen; falls erforderlich muss die statistische<br />
Tolerierung für alle nicht unabhängigen Produktvariablen durchgeführt werden,<br />
5. Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen mit<br />
6. korrigierten univariaten und multivariaten Prozessfähigkeitsindizes,<br />
7. Entscheidung aufgrund der Indizes für<br />
– Prozessverbesserung im Sinne der<br />
–<br />
–<br />
–<br />
·<br />
·<br />
Reduktion der Variabilität mindestens einer Produktvariablen,<br />
Übereinstimmung der Mittel- mit den Sollwerten,<br />
neue statistische Tolerierung,<br />
Kontrolle des Prozesses mit den uni- und/oder multivariaten Kontrollkarten,<br />
Investitionen in Maschinen, Anlagen, Mitarbeiter, Methodik usw.<br />
5.2.1.1 Was beinhaltet das Kunden-Anforderungs-Profil (KAP)?<br />
Ein (in- oder externer) Kunde, der eine Dienstleistung oder das materielles Produkt eines Vorläuferprozesses<br />
benötigt, stellt Anforderungen an das Produkt und seine zu gewährleistenden<br />
Funktionen. Die Anforderungen werden häufig in Form von Eigenschaften formuliert.<br />
Über die Kundenanforderungen wird das Produkt definiert.
160 5 Qualität in der Fertigung<br />
Beispiel 5.2.1: Kunststoffscheiben. Definition von Kundenanforderungen<br />
Problem:<br />
Die Glasscheiben in einem PKW sollen durch Kunststoffscheiben auf Basis von Polycarbonat<br />
mit Hartbeschichtung ersetzt werden, um das<br />
•<br />
•<br />
•<br />
zukünftige Design von Scheiben und Karosserie durch ganzheitliches Design und<br />
Konstruktion zu revolutionieren.<br />
die Sicherheitsaspekte zu verbessern,<br />
das Gewicht zu reduzieren usw.<br />
Aus der Analyse der Marktsituation sollen unter Beachtung der KAP der europäischen<br />
Automobilhersteller nachfolgenden Studien<br />
1. über die Machbarkeit und<br />
2. internationalen Verfügbarkeit der Prozesse<br />
erarbeitet werden.<br />
Hierbei sollen die globalen Ziele<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
Verbesserung der Sicherheit gegen Einbruch,<br />
Reduktion des Gewichts,<br />
Verbesserung des Komfort (Geräuschdämpfung, thermische Eigenschaften)<br />
Verbesserung des Schutzes gegen Unfälle, Überfälle usw.,<br />
Erhöhung der Verschleißfestigkeit (Kratzfestigkeit, …)<br />
Verbesserung der Formgebung/Design und Konstruktion,<br />
Erhaltung der optischen Eigenschaften des Glases,<br />
Erhöhung der Wirtschaftlichkeit bei den Herstellern und<br />
Verbesserung der Instandhaltungsfreundlichkeit<br />
verfolgt werden.<br />
Die globalen Ziele werden auf geforderte Eigenschaften und auch schon geforderte Parameter<br />
zurückgeführt und im Kunden-Anforderungs-Profil (KAP) zusammengefasst.<br />
Unter einem Parameter wollen wir hier eine messbare Variable verstehen.<br />
Zu den Eigenschaften gehören z. B.<br />
•<br />
•<br />
die Zähigkeit<br />
diese kann parametrisiert werden durch die physikalischen Variablen<br />
–<br />
–<br />
–<br />
–<br />
Biegefestigkeit,<br />
Schlagfestigkeit,<br />
Bruchfestigkeit,<br />
E-Modul<br />
• Beständigkeit der Oberfläche nach dem Verkleben,<br />
–<br />
–<br />
Temperaturbereich,<br />
Medien,
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
161<br />
–<br />
–<br />
–<br />
Luftfeuchte,<br />
NaCl bzw. CaCl-Lösungen,<br />
Tenside<br />
• Verformbarkeit,<br />
–<br />
–<br />
–<br />
–<br />
Spannungs- Verformungs- Verhalten mit der<br />
Normalspannung,<br />
Tangentialspannung,<br />
Scherspannung<br />
• optische Eigenschaften,<br />
–<br />
–<br />
–<br />
–<br />
–<br />
–<br />
Trübung<br />
Lichtreflektion,<br />
Lichttransmission,<br />
Verzerrung,<br />
Brechungsindex,<br />
Lichtdurchlässigkeit<br />
• Oberflächeneigenschaften<br />
–<br />
–<br />
–<br />
–<br />
–<br />
–<br />
–<br />
Farbe<br />
Verfärbung,<br />
Schlierenbildung,<br />
Glanz,<br />
Beschichtungsdefekte,<br />
Abriebfestigkeit,<br />
Kratzfestigkeit<br />
• Thermisches Verhalten<br />
–<br />
–<br />
–<br />
–<br />
Wärmedämmung,<br />
Wärmedurchgang,<br />
Wärmeausdehnung,<br />
Überwölbung<br />
Anforderungen in Parameterform sind z. B.<br />
•<br />
•<br />
•<br />
•<br />
•<br />
Steifigkeit,<br />
Gewicht,<br />
Lebensdauer,<br />
geometrische Maße, wie z. B. Scheibendicke, Kantenrundung,<br />
Oberflächenspannung,<br />
und vieles mehr.<br />
Die Parametrisierung führt zur Benennung der Produktvariablen. Hier einige Beispiele:<br />
Y 1 = Biegefestigkeit<br />
Y 2 = Bruchfestigkeit (gleiche Bruchfestigkeit über einem großen Temperaturbereich)<br />
Y 3 = Formbarkeit<br />
Y 4 = Lichtdurchlässigkeit (Transparenz)<br />
Y 5 = Elastizitätsmodul<br />
Y 6 = Einbaustabilität<br />
Y 7 = Geräuschdämpfung
162 5 Qualität in der Fertigung<br />
Y 8 = Kratzfestigkeit<br />
Y 9 = Witterungsbeständigkeit<br />
Y 10 = Korrosionsbeständigkeit<br />
Y 11 = Gewicht<br />
Y 12 = Reflexion der Wärmestrahlung<br />
Y 13 = Wirtschaftlichkeit, Preis<br />
Y 14 = Abriebfestigkeit<br />
Y 15 = optische Verzerrung<br />
und viele mehr.<br />
Die Produktvariable sind mit Sicherheit nicht unabhängig voneinander.<br />
Alle Eigenschaften müssen parametrisiert werden. Das ist bisher nicht gelungen. Ursachen<br />
hierfür sind:<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
fehlende Gewissheit über die Vollständigkeit der Eigenschaften und damit der Parametrisierung,<br />
fehlende Invarianz der vom Kunden beschriebenen Eigenschaften,<br />
mehrere Eigenschaften sind Funktionen von diversen anderen Parametern.<br />
Diese Funktionen sind mitunter kompliziert.<br />
Keine klare Trennung von Eigenschaften, Parametern und deren Prüfungen.<br />
Die bisher parametrisierten Eigenschaften sind unvollständig spezifiziert.<br />
Die Sollwerte liegen z. T. als Bereiche und nur selten als Zahlen vor, Toleranzgrenzen fehlen<br />
grundsätzlich.<br />
Dieses Beispiel demonstriert, das die Zusammenstellung des KAP eine wichtige und auch<br />
komplizierte Aufgabe ist, an der verschiedene Experten zusammenarbeiten sollten.<br />
5.2.1.2 Wie kann man die parametrisierten Kundenanforderungen statistisch<br />
tolerieren?<br />
Bei der Definition des Produktaudits wird auf die beiden Seiten, nämlich die<br />
•<br />
•<br />
Anforderungen und<br />
den Istzustand eines Produktes<br />
hingewiesen. Hier wollen wir uns damit befassen, wie<br />
•<br />
•<br />
gegebene CAD Toleranzen zu überprüfen sind oder<br />
diese beim Fehlen von Sollwerten und Toleranzgrenzen berechnet werden können.<br />
Die Frage der statistischen Tolerierung ist bedeutsam, da die Produktvariablen in der Regel<br />
nicht unabhängig, sondern im Gegenteil sehr häufig sehr stark miteinander korreliert sind. Die<br />
meisten – bisher bekannten – statistischen Tolerierungsverfahren basieren auf dem Faltungssatz<br />
für Zufallsgrößen. Dieser setzt die Unabhängigkeit der Zufallsgrößen voraus. Wie wir bei der<br />
Korrelationsanalyse im Abschnitt 5.6 sehen, wird die Straffheit einer Abhängigkeitsstruktur<br />
durch die Determinante der Korrelationsmatrix beurteilt.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
163<br />
Bei einem Autobauer sollten für den Karosseriebau die Toleranzen vieler Maße überprüft<br />
werden, da es Probleme bei der Montage gab. Zur Auswahl standen<br />
•<br />
•<br />
das Maßkettenkonzept nach dem Faltungssatz und<br />
die statistische Tolerierung von Jahn.<br />
Als Entscheidungskriterium wählte ich die Determinante der Korrelationsmatrix.<br />
Für ca. 60 Produktvariable galt Det(R YY ) = 1.28 10 –135 . Dieser Wert liegt sehr viel näher an<br />
der Null als an der für das Maßkettenkonzept geforderten 1! Das Maßkettenkonzept muss<br />
zugunsten der statistischen Tolerierung von Jahn verworfen werden.<br />
Problem<br />
Ein Kunde kommt mit seinem Wunsch nach einem bestimmten Produkt zu einem Unternehmen.<br />
Z. B. ein Autobauer möchte ein Dämpfungssystem (Motorlager) von seinem Lieferanten. Der<br />
Kunde formuliert seine Anforderungen an die Eigenschaften des Motorlagers hinsichtlich<br />
der Vibration, des Fahrverhaltens und der Dämmung des Geräuschpegels. Der Hersteller des<br />
Dämpfungssystems (der Lieferant) akzeptiert den Wunsch, parametrisiert die Eigenschaften,<br />
z. B. in die Produktvariablen statische und dynamische Steifigkeiten, Phasenverschiebung,<br />
Ausreißkräfte usw., spezifiziert die Produktvariablen in Form von Sollwerten und Toleranzgrenzen<br />
für die Produktentwicklung mit Hilfe eines CAD Systems oder des Maßkettenkonzeptes.<br />
Für die Herstellung sind diese Toleranzen in der Regel nicht geeignet. Hierfür sollten<br />
aufgrund der Abhängigkeitsstruktur der Produktvariablen die Maßtoleranzen zumindest<br />
durch die statistische Tolerierung für alle relevanten Produktvariablen überprüft werden. Die<br />
statistischen Toleranzen für eine Pilotfertigung oder für Vorläuferprodukte werden mit dem<br />
Kunden abgestimmt, denn die Anforderungen können zu einem Widerspruch innerhalb der<br />
Maßkettentoleranzen oder zwischen den Maßketten- und statistischen Toleranzen führen, wie<br />
auch im vorliegenden Fall, zu einer hohen Steifigkeit der Gummimischung für das Fahrverhalten<br />
und einer niedrigen Steifigkeit für die Geräuschdämmung. Die statistischen Toleranzen<br />
werden als Toleranzen anerkannt und die Produkte werden produziert. Der Produzent für<br />
das Motorlager liefert die Produkte und weist nach, dass die geforderte Qualität im Sinne der<br />
simultan Erfüllung aller relevanten Kundenanforderungen geliefert wird. Danach stellt er die<br />
Rechnung und verlangt sein Geld.<br />
Das Problem beinhaltet zwei zu lösende Teilprobleme:<br />
•<br />
•<br />
Tolerierung der nicht unabhängigen Produktvariable für die Entwicklung und Fertigung,<br />
Nachweis der simultanen Erfüllung aller spezifizierten relevanten Kundenanforderungen.<br />
Problemlösung<br />
Bisheriges Kernstück einer funktions-, fertigungs- und montagegerechten Tolerierung ist die<br />
Maßkettentheorie . Sie ist die Lehre von der funktionsgerechten Bemessung aneinander gereihter<br />
Maße, deren Toleranzen sich summieren. Die Maßkette ist eine Aneinanderreihung von<br />
zusammenwirkenden Einzelmaßen und dem von ihnen abhängigen Schlussmaß. Sie bildet bei<br />
schematischer Darstellung einen geschlossenen Linienzug (eine Masche). Die Maße (Einzelmaße<br />
– Schlussmaß) sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette mit<br />
Schlussmaß ist ihre Geschlossenheit. Bei der Berechnung von Maßketten (Toleranzketten) ist zu
164 5 Qualität in der Fertigung<br />
beachten, dass die Einzelmaße unterschiedlichen Systemen angehören können, und zwar dem<br />
herzustellenden Gerät, dem Werkstück, der Bearbeitungseinheit aus Maschine, Vorrichtung,<br />
Werkzeug usw. Die Maßkette schafft Voraussetzungen zur Festlegung der Abmessungen der<br />
Einzelteile und des Gerätes, der Einzeltoleranzen, der Bearbeitungsfolge, der Arbeitszugaben<br />
usw. Die Toleranzkettentheorie ist die Lehre von der möglichen Größe und Lage der Toleranz<br />
(Schlusstoleranz) des funktionsbestimmenden resultierenden Maßes (Summenmaß) einer<br />
Maßkette. Unter Funktionssicherheit wird dabei die Einhaltung der für ein Erzeugnis vorgegebenen<br />
Funktionsfehlergrenzen für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen<br />
verstanden. Innerhalb dieser Grenzen ist das Produkt funktionstüchtig. Die Funktionstoleranz<br />
ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten aller die<br />
Funktionstüchtigkeit beschreibenden Eigenschaften eines Produktes. Die Herstellungstoleranz<br />
ist die Differenz zwischen dem oberen und unteren erreichten Grenzwert bei der Herstellung<br />
mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigprodukte. Die Maßtoleranz ist die<br />
Differenz zwischen dem zulässigen Größt- und Kleinstmaß. Die Messtoleranz ist die Differenz<br />
zwischen der zulässigen oberen und unteren Abweichung des Messwertes von der Messgröße.<br />
Sie entspricht der zulässigen Fehlergrenze der Messung.<br />
Die Bedeutung der Tolerierung liegt in<br />
• der Gewinnung von Zielwerten und den zugehörigen Intervallen für die Steuer- und Regelung<br />
von Prozessen und<br />
• der Ableitung von Genauigkeitsintervallen (Toleranzintervallen) für die Input- und Prozessvariablen.<br />
Wie wird eine Maßkette berechnet?<br />
Das Nennmaß N 0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen<br />
Maßkettengliedern additiv aus den Nennmaßen N j der m Einzelmaße<br />
N<br />
0<br />
m<br />
= ∑kj<br />
N<br />
j=<br />
1<br />
j<br />
zusammen, wobei die k j die Richtungskoeffizienten sind, siehe z. B. Hofmann [1986]. Diese<br />
Koeffizienten nehmen die Werte +1 oder –1 an, je nachdem, ob der Einfluss des Einzelmaßes auf<br />
das Schlussmaß positiv oder negativ ist. Positive Einzelmaße bewirken bei ihrer Vergrößerung<br />
oder Verkleinerung eine gleichsinnige Veränderung des Schlussmaßes. Der Richtungskoeffizient<br />
ist der Maßkette zu entnehmen.<br />
Wie wird eine Toleranzkette berechnet?<br />
Sind die Toleranzen der Einzelmaße und die Kleinstspiele S kj gegeben, so beträgt nach Hofmann<br />
[1986] die Schlusstoleranz T 0 des Schlussmaßes<br />
0<br />
m−e m<br />
∑ j ∑ kj<br />
j= 1 j= m− e+<br />
1<br />
T = T + S<br />
Hieraus können die Einzeltoleranzen T j berechnet werden.<br />
.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
165<br />
Unterscheidet sich die Tolerierung für die Produktentwicklung von der für die Fertigung?<br />
Dem Maßkettenkonzept soll die statistische Tolerierung gegenüber gestellt werden, denn<br />
•<br />
•<br />
die Produktvariablen der gefertigten Produkte sind Zufallsgrößen und<br />
die Zufallsgrößen sind nicht unabhängig voneinander.<br />
Das Maßkettenkonzept auf die Fertigung angewandt, basiert auf der Faltung von Zufallsgrößen<br />
und setzt Unabhängigkeit voraus. Diese Voraussetzung ist aber nur selten erfüllt. Daher wollen<br />
wir uns mit einer Möglichkeit der statistischen Tolerierung befassen, die auch bei korrelierten<br />
Produktvariablen richtige Resultate liefert.<br />
Die statistische Tolerierung quantifiziert das „Können des Prozesses“. Folglich müssen die<br />
statistischen Toleranzgrenzen für alle relevanten Produktvariablen mit den Experten der Produktentwicklung<br />
abgestimmt werden, damit aus den statistischen allgemeingültige Toleranzen<br />
werden.<br />
Für die Berechnung der multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten<br />
Potentials des Prozesses, Produkte mit vorgegebenen Eigenschaften zu produzieren (Qualität),<br />
benötigen wir, neben dem Können des Prozesses, die Möglichkeit des Vergleiches des Soll- und<br />
Istzustandes der Fertigung für den multivariaten Fall.<br />
Der Vektor der Produktvariablen sei wieder Y T = (Y 1 , …, Y m ). Dieser Vektor sei m-dimensional<br />
normal verteilt Y ~ N m (µ, Σ YY ), wobei die Kovarianzmatrix Σ YY positiv definit sein soll oder die<br />
Verteilung von Y gehöre zur Familie der elliptisch umrissenen Verteilungen.<br />
5.2.1.3 Auf welchem Prinzip basiert die statistische Tolerierung ?<br />
Der Vektor Y wird in die beiden Teile<br />
Y T = (Y j , Y T m – j )<br />
zerlegt.<br />
Die einzelnen Produktvariablen sind nicht unabhängig voneinander, sondern durch die<br />
Abhängigkeitsstruktur, ausgedrückt durch die folgende partitionierte Kovarianzmatrix des<br />
aufgespalteten Vektors der Produktvariablen, miteinander verbunden.<br />
Die Kovarianzmatrix der Produktvariablen ist<br />
⎛<br />
2<br />
σ<br />
⎞<br />
j σj.<br />
m−<br />
j<br />
ΣYY<br />
= ⎜ ⎟.<br />
⎝ Σm−j.<br />
m−j⎠<br />
Die Realisierungen (Messwertvektoren) des normal verteilten Vektors der Produktvariablen<br />
sind Punkte im m-dimensionalen euklidischen Raum und liegen wegen der Verteilungsvoraussetzung<br />
innerhalb eines Hyperellipsoides. Das sieht man, wenn man den Exponent der<br />
multivariaten Normalverteilung<br />
1 ⎧ 1<br />
T −1<br />
⎫<br />
f( y; μΣ , YY ) = ⋅ exp ⎨− ⋅( Y − μ) ⋅Σ ⋅( − )<br />
1<br />
YY Y μ⎬<br />
⎩ 2<br />
⎭<br />
2 ⋅ π ⋅ Σ 2<br />
gleich einer Konstanten setzt, z. B.<br />
YY<br />
T −1<br />
Y − ⋅ YY ⋅ Y − = c1−α<br />
( μ) Σ ( μ ) . (1)
166 5 Qualität in der Fertigung<br />
Dann ist das die Gleichung für ein Hyperellipsoid mit dem Mittelpunkt µ, wobei 1 – α die<br />
Wahrscheinlichkeit ist, mit der die Punkte innerhalb des Hyperellipsoides liegen. Das Hyperellipsoid<br />
beschreibt das Können des Prozesses. Die Form des Hyperellipsoides wird durch die<br />
Abhängigkeitsstruktur bestimmt. Diese wiederum haben wir durch den Grad der Multikollinearität<br />
−1<br />
YY<br />
δ = R (2)<br />
charakterisiert.<br />
Zunehmender Grad der Multikollinearität führt zu größeren Diagonalelemente der inversen<br />
Korrelationsmatrix,<br />
R<br />
−1<br />
YY<br />
⎧<br />
2 −1<br />
(1 − ρj/<br />
m−<br />
j) , für alle j = 1, …,<br />
m<br />
⎪ −ρ<br />
= ⎨ jk / m−( j, k)<br />
, j, k 1, , ,<br />
1<br />
= … m j<br />
⎪ ≠<br />
⎡<br />
2 2<br />
(1 − ρ<br />
2<br />
j/ m−j) (1 − ρk/<br />
m−k)<br />
⎤<br />
⎪ ⎩ ⎣<br />
⎦<br />
wobei ρ 2 j/m – j das Quadrat des multiplen Korrelationskoeffizienten zwischen Y j und einer Linearkombination<br />
in den restlichen (Y 1 , …, Y j – 1 , Y j + 1 , …, Y m ) = Y m – j ist. ρ jk/m – (j, k) sind die<br />
partiellen Korrelationskoeffizienten zwischen Y j und Y k unter der Bedingung der restlichen<br />
Produktvariablen.<br />
Zumindest einige der multiplen Korrelationskoeffizienten für beliebige Y j in Abhängigkeit von<br />
den Linearkombinationen in den anderen Produktvariablen werden mit wachsendem δ größer.<br />
Damit werden die Differenzen 1 – ρ 2 j/m – j kleiner und somit die Quotienten (1 – ρ2 j/m – j )–1<br />
größer. Das heißt aber nicht anderes, als dass sich ein oder mehrere Produktvariablen sehr gut<br />
durch andere darstellen lassen. Sind die zugehörigen multiplen Korrelationskoeffizienten groß<br />
genug, dann sagt man, diese Produktvariablen sind redundant.<br />
Beachtet man noch den dritten Fakt, dass die Längen der Hauptachsen des Hyperellipsoides<br />
gleich L j sind, mit<br />
2<br />
j λj χm<br />
,1 −α<br />
L = 2⋅ ⋅ für j = 1, … m<br />
wobei λ j die Eigenwerte der Kovarianzmatrix Σ YY sind, dann sieht man, dass mit zunehmendem<br />
Grad der Multikollinearität das Hyperellipsoid einer „Zigarre“ immer ähnlicher und zumindest<br />
die 1. Hauptachse des Ellipsoides immer länger wird.<br />
Ist der Grad der Multikolinearität δ = 1, dann sind die Produktvariablen nach der obigen<br />
Beziehung unkorreliert und das Hyperellipsoid wird zu einer Hyperkugel.<br />
Bei vielen Anwendungen ist für jede Produktvariable Y j , j = 1, …, m ein Toleranzintervall<br />
gegeben. Inwieweit bei deren Festlegungen die Abhängigkeitsstruktur zwischen den Produktvariablen<br />
beachtet wurde, muss in jedem konkreten Fall hinterfragt werden. In der Regel wird<br />
das nicht der Fall sein. In diesen Fällen müssen die Toleranzgrenzen aufgrund der statistischen<br />
Kenntnisse über den Prozess zumindest überprüft, meist jedoch neu berechnet und mit den<br />
Konstrukteuren abgestimmt werden. Sind die Toleranzgrenzen aus technischer Sicht bindend,<br />
dann könnte das kartesische Produkt dieser Toleranzintervalle, das ist dann ein Hyperkubus für<br />
den gemeinsamen Toleranzbereich, gebildet werden. Die Forderung der simultanen Erfüllung<br />
aller relevanten Kundenanforderungen bedeutet geometrisch, dass das Hyperellipsoid mit<br />
vorgebbarer Wahrscheinlichkeit in diesem Hyperkubus enthalten sein muss, d. h.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
167<br />
⎡<br />
m ⎤<br />
T −1<br />
P⎢( Yj − μj) ⋅ ΣYY ⋅( Yj − μj) ∈X( To, j − Tu,<br />
j) ⎥ = 1 − α.<br />
⎢⎣ j = 1 ⎥⎦<br />
(5)<br />
Die Frage ist nun,<br />
5.2.1.4 Wie können unter der Bedingung (1) die Toleranzintervalle für jede<br />
einzelne Produktvariable unter Beachtung der Abhängigkeitsstruktur<br />
statistisch bestimmt werden?<br />
So, dass das kartesische Produkt der einzelnen Toleranzintervalle die Bedingung (2) erfüllt.<br />
Y 2 (Produktvariable)<br />
Abb. 5.2.1: Toleranzgebiet und Streuungsellipse<br />
Y 1 (Produktvariable)<br />
Die Lösung dieses Problems ist:<br />
Wie aus der Abbildung ersichtlich ist, müssen hier im 2-dimensionalen Fall die Tangenten an<br />
die Ellipse, parallel zu den beiden Achsen der Produktvariable, bestimmt werden. Im m-dimensionalen<br />
Fall müssen die Tangentialhyperebenen an das Hyperellipsoid bestimmt werden.<br />
Für diese Konstruktion ist das nachfolgende Theorem von ausschlaggebender Bedeutung.<br />
Satz 1 (Jahn): Die Projektionen der Ellipse bzw. des Hyperellipsoides auf die Koordinatenachsen<br />
haben die Längen<br />
2<br />
j ≤ j/ m−j = j/ m−j,<br />
Y σ σ<br />
wobei σ 2 j/m – 1 die bedingte Varianz der j-ten Komponente von Y unter der Bedingung der<br />
Konstanz der restlichen Komponenten des Vektors der Produktvariable ist, wobei m – j = m – 1<br />
wieder die Indexmenge {1, …, j – 1, j + 1, …, m} bezeichnet.<br />
Den Beweis für diesen überaus wichtigen Satz findet man auf der beiliegenden CD.
168 5 Qualität in der Fertigung<br />
Bemerkungen:<br />
1. Das Theorem ist für die Berechnung der statistischen Toleranzgrenzen über die Momente<br />
der bedingten Verteilung von Y j unter der Bedingung Y m – j = y m – j d. h. konstant, überaus<br />
bedeutsam.<br />
Korollar 1 (Jahn): Die oberen und unteren statistischen Toleranzgrenzen für die einzelnen,<br />
nicht unabhängigen Produktvariablen können nach den Beziehungen<br />
USL<br />
LSL<br />
2 2<br />
j = μj + χm,1 −α<br />
⋅σj/<br />
m−j<br />
2 2<br />
j = μj − χm,1 −α<br />
⋅σj/<br />
m−j<br />
berechnet werden, wobei χ 2 m,1 – α das 1 – α Quantil der Chi Quadrat Verteilung mit m<br />
Freiheitsgraden ist.<br />
2. Die statistischen Toleranzgrenzen USTL und LSTL (upper and lower tolerance limits)<br />
beschreiben das “Können” des Prozesses. Diese Grenzen sind daher unbedingt mit den<br />
Konstrukteuren abzustimmen.<br />
Korollar 2 (Wang et. al[1999]): Die statistischen Toleranzgrenzen werden nach den Beziehungen<br />
und<br />
USL<br />
LSL<br />
berechnet.<br />
2 −1 2<br />
χm,1−α<br />
⋅ SY−1. Y−1 χm,1<br />
−α<br />
⋅ SYY<br />
j = μj + = μ<br />
1<br />
j +<br />
−<br />
Det( SYY ) Det( SY −1. Y −1)<br />
Det( ) Det( )<br />
2 −1 2<br />
χm,1−α<br />
⋅ SY−1. Y−1 χm,1<br />
−α<br />
⋅ SYY<br />
j = μj − = μ<br />
1<br />
j −<br />
−<br />
Det( SYY ) Det( SY −1. Y −1)<br />
Det( ) Det( )<br />
Korollar 3 (Jahn):<br />
Die bedingten Stichprobenvarianzen S 2 j/m – j können auch aus den Diagonalelementen der<br />
inversen Kovarianzmatrix berechnet werden. Es gilt<br />
S<br />
−1<br />
YY<br />
⎧⎡<br />
−<br />
⋅ − ⎤<br />
− = − =<br />
⎣ 2 2 1 -2<br />
Sj (1 Rj/ m j) Sj/<br />
m j, für j 1, …,<br />
m<br />
⎦<br />
⎪ S ⋅S ⋅ R<br />
k<br />
= ⎨ j k jk/ m−<br />
j,<br />
k<br />
− , für j ≠<br />
⎪ 1<br />
⎪ ⎡<br />
2 2<br />
(1 − R − ⋅ − − ⎤ 2<br />
j/ m j) (1 Rk/<br />
m k)<br />
⎩<br />
⎣<br />
⎦
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
169<br />
Beispiel 5.2.2: Akkubohrschrauber. Statistische Tolerierung<br />
Die Produktvariablen und der Sollzustand für dieses Beispiel sind in der Tabelle 5.2.1<br />
zusammengestellt.<br />
Tabelle 5.2.1: Sollzustand für die Plastikschalen<br />
Parameter Sollwert Toleranzgrenzen<br />
Y 1 = Thermoschrumpf 1,1 0,2 2<br />
Y 2 = Axialität 0 –0,3 0,3<br />
Y 3 = Dicke 3,1 2,9 3,3<br />
Y 4 = Parallelität, 0 –0,6 0,6<br />
Für die Berechnung der statistischen Toleranzgrenzen benötigen wir die Stichprobenkovarianzmatrix<br />
und deren Inverse. Beide Matrizen sind in Tabelle 5.2.2 und Tabelle 5.2.3<br />
enthalten.<br />
Tabelle 5.2.2: Kovarianzmatrix für die Produktvariablen<br />
Thermoschrumpf Axialität Dicke Parallel<br />
Thermoschrumpf 0,22495 0,00353 –0,00455 –0,10751<br />
Axialit 0,00353 0,04206 –0,00081 0,04239<br />
Dicke –0,00455 –0,00081 0,00882 0,01654<br />
Parallel –0,10751 0,04239 0,01654 0,24588<br />
T u<br />
T o<br />
Tabelle 5.2.3: Inverse Kovarianzmatrix<br />
Thermoschrumpf Axialität Dicke Parallel<br />
Thermoschrumpf 62.301 –44.043 –42.555 37.697<br />
Axialit –44.043 334.037 173.955 –88.554<br />
Dicke –42.555 173.955 1.394.678 –142.413<br />
Parallel 37.697 –88.554 –142.413 82.002<br />
Mit den Elementen der inversen Kovarianzmatrix kann man nach Korollar 1 die statistischen<br />
Toleranzgrenzen für die vier Produktvariablen berechnen. In der Tabelle 5.2.4 sind<br />
die Werte zusammengestellt.<br />
Tabelle 5.2.4: Sollwerte und statistische Toleranzgrenzen<br />
Sollwert<br />
±Toleranz<br />
Thermoschrumpf 1,1 ±1,62<br />
Axialität 0 ±0,7<br />
Dicke 3,1 ±0,34<br />
Parallelität 0 ±1,4<br />
Mit den statistischen Toleranzgrenzen können wir die univariaten und multivariaten Prozessfähigkeitsindizes<br />
berechnen (vgl. Abschnitt 5.2.1.6 und 5.2.1.7).
170 5 Qualität in der Fertigung<br />
5.2.1.5 Wie kann man das „Produkt“ statistisch tolerieren?<br />
Wir stellten bereits fest, dass ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen<br />
Y 1 , …, Y m beschrieben wird.<br />
Wir forderten auch schon, dass ein Prozess so gesteuert werden muss, dass simultan alle Kundenanforderungen<br />
erfüllt werden. Wir wissen auch, dass ein Prozess nur<br />
•<br />
•<br />
•<br />
•<br />
mit einer Einstellung der Input- und Prozessvariablen,<br />
mit einer optimalen Teilmenge von Input- und Prozessvariablen,<br />
entweder mit Blick auf eine Produktvariable oder einer geschickten Zusammenfassung<br />
aller Produktvariablen gesteuerten werden kann und<br />
dass wir hierfür entweder den Sollwert und die Toleranzgrenzen für die eine Produktvariable<br />
oder die vereinigten Sollvorgaben für das „Produkt“ als Ziele für die Steuerung<br />
benötigen.<br />
Die vereinigten Sollvorgaben wollen wir Toleranzbereich für das Produkt nennen und deren<br />
Grenze Toleranzgrenze für das Produkt (TG Prod ) nennen.<br />
Σ<br />
*<br />
YY<br />
In dem Ausdruck Σ ∗ YY<br />
⎛T , − , ⎞ ⎛ o, − u, ⎞<br />
= diag ⎜ oj T uj T<br />
⎝<br />
⎟ diag<br />
6 ⎠<br />
⎜ j T<br />
R<br />
j<br />
YY<br />
⎝ 6<br />
⎟<br />
⎠<br />
bezeichnen R YY die Abhängigkeitsstruktur und T o T = (T o,1 … T o,m ) bzw. T u T = (T u,1 … T u,m ) die<br />
Vektoren der oberen bzw. unteren Toleranzgrenzen für alle relevanten Produktvariablen. Die<br />
Korrelationsmatrix muss aus einer großen Stichprobe geschätzt werden.<br />
Unter diesen Annahmen gilt<br />
T * −1<br />
o ΣYY<br />
o Prod<br />
c* = ( T − M) ( ) ( T − M) = TG .<br />
TG Prod ist die Toleranzgrenze für das Produkt T 2 , d. h. die über T 2 zusammengefassten Produktvariablen.<br />
Die Toleranzgrenze (TG Prod ) für das Produkt hängt ab von<br />
1. der Abhängigkeitsstruktur R YY – über die theoretische Kovarianzmatrix Σ * YY ,<br />
2. die Toleranzgrenzen für die einzelnen Produktvariablen und<br />
3. den Vektor der Sollwerte.<br />
Mit der berechneten Toleranzgrenze TG Prod wird die simultane Erfüllung aller relevanten Kundenanforderungen<br />
geprüft. Die Gleichung für T 2 ist auch bekannt als Mahalanobis Abstand.<br />
5.2.1.6 Univariate Prozessfähigkeitsindizes<br />
W as heißt „ein Prozess ist fähig“?<br />
Die Fähigkeit i st das inhärente Potential eines Prozesses, Produkte mit vorgegebenen Eigenschaften<br />
zu produzieren. Die Anwendung auf betriebliche Prozesse bedeutet,<br />
• dass für eine, mehrere oder alle Produktvariablen Toleranzgrenze vorliegen, die den „vorgegebenen<br />
Eigenschaften“ entsprechen und
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
171<br />
• impliziert, dass geprüft werden kann, ob die produzierten Produkte den vorgegebenen<br />
Eigenschaften entsprechen.<br />
In der Folge werden wir uns ausführlich mit<br />
•<br />
•<br />
den univariaten und<br />
multivariaten Prozessfähigkeitsindizes<br />
befassen.<br />
Wie kann die Eigenschaft „ein Prozess ist fähig“ nachprüfbar formuliert und quantifiziert<br />
werden?<br />
Für die Beantwortung der Frage stellen wir zunächst alles zusammen, was uns bekannt ist. Die<br />
Produktvariable sei Y. T o und T u seien die gegebenen Toleranzgrenzen und M sei der Soll wert.<br />
Die Produktvariable Y sei normal verteilt mit dem geforderten Erwartungswert µ = Sollwert<br />
= M und der zulässigen Standardabweichung<br />
σ<br />
T<br />
− T<br />
6<br />
Zul = o u .<br />
Dieser Ausdruck ist das Ergebnis der 3 σ-Regel, die besagt, dass im Intervall µ – 3 σ ≤ Y ≤ µ + 3 σ<br />
ca. 99.73 % aller Einzelwerte der vorausgesetzten Normalverteilung mit dem Erwartungswert<br />
µ und der Standardabweichung σ liegen.<br />
Die Produktion liefert Produkte an denen nach einer zufälligen Auswahl die Werte Y i , i = 1, …, N<br />
gemessen werden, wobei N den Stichprobenumfang bezeichnet.<br />
Es ist nun zu prüfen, ob die Stichprobe mit den spezifizierten Kundenanforderungen in Form<br />
des Sollwertes und der Toleranzgrenzen übereinstimmt. Hierfür können statistische Hypothesentests<br />
verwendet werden.<br />
• Die Nullhypothese H 0 : σ 2 = σ 2 zul gegen die Alternative H 1 : σ2 ≠ σ 2 zul kann mit dem F-Test<br />
Fˆ<br />
2 2<br />
σzul ( To − Tu<br />
)<br />
= =<br />
2 2<br />
σ 36 ⋅ S<br />
• und die Hypothese H 0 : µ = M gegen H 1 : µ ≠ M kann mit dem Abweichungstest<br />
Y − M<br />
zˆ = N −1.<br />
σ<br />
zul<br />
geprüft werden.<br />
Die beiden Tests wurden formalisiert, so dass wir Ausdrücke für die univariaten Prozessfähigkeitsindizes<br />
erhalten.<br />
Wie können Sie die univariate Prozessfähigkeitsindizes für eine Produktvariable berechnen?<br />
Eine Produktvariable wird mit Y bezeichnet, deren Verhalten durch die Verteilungsfunktion<br />
(Vf)Y ~ P(Y ≤ y) = F(y) oder falls sie existiert durch die Verteilungsdichte (Vd) f(y) charakterisiert<br />
wird. Durch die Prozessfähigkeiten wird beurteilt, ob die statistische Breite von f(y)
172 5 Qualität in der Fertigung<br />
vollständig oder nur z. T. innerhalb des Toleranzintervalls liegt. Die statistische Breite wird<br />
nach der 3 σ-Regel berechnet.<br />
Bevor wir eine Formel für den Vergleich zwischen der Toleranzbreite und Breite der Verteilungsdichte<br />
angeben, sollen noch einige wichtige Begriffe erläutert und präzisiert werden.<br />
Häufig wird der Ausdruck, „der Prozess wird beherrscht“ ver wendet und durch die Zeitinvarianz<br />
der Verteilung erklärt, wobei darauf hingewiesen wird, dass die zeitlichen Veränderungen<br />
eine Verschiebung der Verteilung auf der Achse der Produktvariablen, eine Änderung der<br />
Streuung oder eine Änderung der Form der Verteilung sein kann, siehe z. B. Rinne, Mittag<br />
[1999]).<br />
An dieser Stelle muss darauf hingewiesen werden, dass der Prozess zur Herstellung eines Produktes<br />
durch die Häufigkeitsverteilung einer Produktvariablen beurteilt werden soll. Das ist<br />
nur bedingt möglich. Die Beherrschbarkeit eines Prozesses wird durch die folgende Definition<br />
präzisiert.<br />
Definition: Die Aufschlüsselung der Varianz der Produktvariablen Y durch die in der Prozessgleichung<br />
vorkommenden Input- und Prozessvariablen wird durch das Maß der Beherrschbarkeit<br />
gemessen.<br />
Diese Definition ist notwendig, denn die Produktvariable Y ist Ergebnis des Wirkens eines<br />
Prozesses, die Produktvariable ist eine Zufallsgröße und die Verteilung der Produktvariablen<br />
kann nur nach dem Ursache-Wirkungs-Prinzip über die Veränderung der Input- und Prozessvariablen<br />
verändert werden. Ein beherrschter Prozess bedeutet, dass er so gesteuert werden<br />
muss, dass alle spezifizierten Kundenanforderungen an das Produkt simultan erfüllt werden,<br />
d. h. der Vektor der Mittelwerte der gemessenen Werte für die Produktvariablen Y 1 , …, Y m<br />
muss im statistischen Sinne mit dem Vektor der Sollwerte M 1 , …, M m übereinstimmen, die<br />
Variabilität des Vektors der Produktvariablen muss so klein sein, dass die Verteilung innerhalb<br />
des Toleranzbereiches liegt und die Verteilung muss zeitlich stabil bleiben, d. h. die Mittelwertvektoren<br />
und die Stichprobenkovarianzmatrizen zeitlich aufeinanderfolgender Stichproben<br />
dürfen keinen Trend besitzen.<br />
Für die Überprüfung der statistischen Beherrschbarkeit eines Prozesses müssen wir die Maße<br />
der Beherrschbarkeit und die uni- und multivariaten Prozessfähigkeitsindizes berechnen.<br />
Die uni- und multivariaten Prozessfähigkeitsindizes als Ausdruck des inhärenten Potential<br />
eines Prozesses, Produkte mit den durch die Toleranzgrenzen für alle relevanten Produktvariablen<br />
vorgegebenen Eigenschaften zu produzieren, werden als Entscheidungskriterium<br />
für die Notwendigkeit der Prozessverbesserung im Sinne der Reduktion der Variabilität der<br />
Produktvariablen und damit der Vergrößerung des Maßes der Beherrschbarkeit verwendet.<br />
Die Maße der Beherrschbarkeit dienen ebenfalls für die Entscheidung zur Prozessverbesserung<br />
im Sinne der Suche nach weiteren Input- und Prozessvariablen, die die Variabilität der<br />
Produktvariablen besser erklären.<br />
Bei der Festlegung der CAD Toleranzgrenzen unterscheiden wir die Möglichkeiten, die in der<br />
Abbildung dargestellt sind.<br />
• Einseitige Tolerierung, d. h. es gibt nur eine obere T o oder untere T u Toleranzgrenze.<br />
• Auf die Angabe des Sollwertes wird in diesen Fällen häufig verzichtet. Wir müssen prüfen,<br />
ob das sinnvoll ist, denn der Sollwert wird als Zielwert für die Steuerung des Prozesses<br />
benötigt.<br />
• Zweiseitige Tolerierung. Hier müssen wir zwischen dem symmetrischen und unsymmetrischen<br />
Fall unterscheiden.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
173<br />
Fall 1<br />
Fall 2<br />
Fall 3<br />
Abb. 5.2.2: Toleranzintervalle<br />
Die Toleranz wird nun wie folgt definiert:<br />
Δ<br />
T u Sollwert T o<br />
Produktvariable Y<br />
⎧To<br />
− Sollwert, bei Vorgabe von To<br />
⎪<br />
Sollwert − Tu, bei Vorgabe von T<br />
⎪<br />
u<br />
⎪T − T bei Vorgabe von T und T<br />
=<br />
o u<br />
o u<br />
⎨ ,<br />
⎪ 2<br />
⎪ − Tu To −<br />
Tu To<br />
⎪<br />
⎩<br />
min{(Soll ),( Soll)}, bei gegebenen und und<br />
asymmetrischer Tolerierung<br />
Für den Toleranzbereich schreiben wir in der Regel [T o , T u ] = T o – T u = 2 Δ.<br />
Im symmetrischen Fall gilt<br />
To<br />
+ Tu<br />
Sollwert = = Toleranzmittelwert.<br />
2<br />
Zweiseitige Toleranzgrenzen – die Produktvariable ist normal verteilt<br />
Der Sollzustand für die Produktvariable Y wird durch<br />
•<br />
•<br />
den Sollwert M und die<br />
Toleranzgrenzen<br />
–<br />
–<br />
T u untere Toleranzgrenze<br />
T o obere Toleranzgrenze<br />
definiert.<br />
Der Prozess sei optimal eingestellt. An zufällig ausgewählten Produkten wird die normal<br />
verteilte Produktvariable Y gemessen. Die Messwerte sind Y 1 , …, Y N , wobei N der Stichprobenumfang<br />
ist.<br />
Visuell kann der Istzustand mit dem Sollzustand verglichen werden, indem man schaut, ob<br />
die Häufigkeitsverteilung der Messwerte, wie die Durchmesser der gedrehten Welle in der<br />
Abbildung 5.2.3, innerhalb der eingezeichneten Toleranzgrenzen liegt und der Mittelwert der<br />
Wellendurchmesser im statistischen Sinne mit dem Sollwert übereinstimmt. Bei der Welle in
174 5 Qualität in der Fertigung<br />
Häufigkeiten<br />
50<br />
Sollwert<br />
T o<br />
T u<br />
-3s<br />
40<br />
30<br />
+3s<br />
20<br />
10<br />
0<br />
19.8 19.9 20 20.1 20.2<br />
Wellendurchmesser [mm]<br />
Abb. 5.2.3: Häufigkeitsverteilung der Durchmesser einer Welle<br />
Abbildung 5.2.3 liegt die ±3 S Breite der Häufigkeitsverteilung vollständig im Toleranzintervall.<br />
Die univariate Prozessfähigkeit als Quotient der Toleranzbreite zur Breite der Häufigkeitsverteilung<br />
muss größer als 1 sein. Es wird kein Ausschuss produziert. Der Sprachgebrauch „im<br />
statistischen Sinn“ soll jeweils deutlich machen, dass wir es mit stochastischen Sachverhalten<br />
zu tun haben. Hieraus folgt, dass alle Aussagen mit einer Unschärfe versehen sind, die der<br />
Streuung von Variablen adäquat sind.<br />
Der zahlenmäßige Vergleich zwischen dem Soll- und Istzustand basiert auf einem Charakterisierungssatz,<br />
nach dem eine Normalverteilung vollständig durch den Mittelwert y<br />
und die Standardabweichung s beschrieben wird. Die Schätzfunktionen y für den Erwartungswert<br />
und s 2 für die Varianz sind unabhängig voneinander. Nach der 3 σ-Regel erhält<br />
man mit der Irrtumswahrscheinlichkeit α = 0.0027 die Breite der Häufigkeitsverteilung<br />
y + 3 ⋅ s −[ y − 3 ⋅ s] = 6⋅<br />
s .<br />
Die einfache Prozessfähigkeit C p (siehe Bhote [1990], Omnias [1992], Rinne, Mittag [1999])<br />
vergleicht die Sollbreite (T o – T u ) mit der Breite 6 · s der Häufigkeitsverteilung:<br />
Toleranzbreite<br />
was der Kunde fordert To<br />
− Tu<br />
Cp<br />
= = =<br />
(1)<br />
Breite der Häufigkeitsverteilung was der Kunde erhält 6 ⋅ s<br />
Wenn C p < 1, dann ist die Breite der Häufigkeitsverteilung größer als die Toleranzbreite.<br />
Produkte mit Werten für den Produktvariable, die nicht den Anforderungen genügen sind<br />
die Folge.<br />
Wenn C p > 1, dann ist die Breite der Häufigkeitsverteilung kleiner als die Toleranzbreite, d. h.<br />
die Häufigkeitsverteilung passt vollständig in das Toleranzintervall.<br />
Aber trotzdem kann Ausschuss produziert werden. Das liegt daran, dass bisher nur das<br />
Streuverhalten des Produktes mit der Toleranzbreite verglichen wurde. Nach dem Charakterisierungssatz<br />
muss in diesen Vergleich die Abweichung zwischen dem Soll- und Mittelwert<br />
einbezogen werden. Hierzu muss der Korrekturfaktor
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
175<br />
k =<br />
y − M<br />
1 ⋅ ( To<br />
− T ) u<br />
2<br />
(2)<br />
berechnet werden, mit dem C p zu<br />
C pk = (1 – k) C p (3)<br />
korrigiert wird. Diese Darstellung setzt voraus, dass der Sollwert in der Mitte des Toleranzintervalls<br />
liegt und bewertet die Abweichungen vom Sollwert.<br />
Ist C pk < 1, dann wird Ausschuss produziert, der Prozess muss verbessert werden, siehe Juran<br />
[1990]. Ist C pk > 1, dann genügen die Produkte der durch den Sollwert und die Toleranzgrenzen<br />
spezifizierten Anforderung.<br />
Welche Entscheidungen aufgrund der univariaten Prozessfähigkeitsindizes können Sie treffen?<br />
Die besprochenen möglichen Entscheidungen aufgrund der Prozessfähigkeiten werden durch<br />
die Abbildung 5.2.4 visualisiert.<br />
Damit kann man sagen, die Fähigkeit beschreibt das inhärente Potential eines Prozesses, Produkte<br />
oder Dienstleistungen zu produzieren, die spezifizierten Anforderungen genügen.<br />
Daten<br />
T u M T o T u M T o T u M T o<br />
Cp ≤ 1 Cp > 1 Cp > 1<br />
Cpk ≤1 Cpk < 1 Cpk > 1<br />
Prozessverbesserung<br />
oder Überprüfung der<br />
Tolerierung<br />
SPC<br />
Reduktion der<br />
Streuung<br />
Justierung<br />
Abb. 5.2.4: Entscheidungen aufgrund der Prozessfähigkeiten<br />
Beispiel 5.2.3: Wellendurchmesser. Univariate Prozessfähigkeit<br />
Eine zu drehende Welle soll den Solldurchmesser M = 12.5 [mm] und die Toleranzen<br />
T u = 12.35 [mm] und T o = 12.65 [mm] haben. Eine Stichprobe von N = 130 Wellen ergab<br />
die statistischen Maßzahlen<br />
Y = 12,499 [mm] und s = 0,05012 [mm].
176 5 Qualität in der Fertigung<br />
Setzt man diese Größe in die Formeln für die Prozessfähigkeitsindizes ein, dann erhält<br />
man<br />
C p = 1,00, k = –0,01 und C pk = 0,99.<br />
Die Häufigkeitsverteilung liegt vollständig im Toleranzintervall, darf aber nicht hin- und<br />
herbewegen. Nach der Abbildung 5.2.4 muss der Prozess verbessert werden, um zu garantieren,<br />
dass kein Ausschuss produziert wird.<br />
Bemerkung zu den univariaten Prozessfähigkeitsindizes<br />
Die univariaten Prozessfähigkeitsindizes besitzen die äquivalente Darstellung<br />
und<br />
C<br />
p<br />
To<br />
− T<br />
=<br />
6 S<br />
u<br />
⎧To<br />
− Y Y − Tu⎫<br />
Cpk = Min ⎨ , ⎬ = Min { Clo, Cpu},<br />
⎩ 3S<br />
3S<br />
⎭<br />
wobei C po die Prozessfähigkeit für die obere und C pu für die untere einseitige Toleranzgrenze<br />
bezeichnen.<br />
Diese Darstellung bewertet eindeutig die Abweichungen von den Toleranzgrenzen und ist<br />
insbesondere dann zu empfehlen, wenn die Streuung der Produktvariablen sehr groß ist, oder<br />
die Verteilung der Werte der Produktvariablen nahe bei einer Toleranzgrenze liegt.<br />
Sind Rückschlüsse von den Fähigkeiten auf den Ausschussanteil möglich?<br />
Bei der Antwort auf diese Frage sind einige Aspekte zu beachten.<br />
Prozessfähigkeiten und Verlustfunktion<br />
Die ökonomisch en Kennzahlen werden über die Verlustfunktion bewertet, wobei der ökonomische<br />
Verlust einer produzierten Einheit durch den Abstand seines Wertes für die Produktvariablen<br />
vom Sollwert entsteht. Der erwartete Verlust ist dann im Grunde genommen eine<br />
Kennzahl für die Fähigkeit.<br />
Erste Hinweise auf diese Problematik finden sich bereits bei den British Standards 2564 aus<br />
dem Jahre 1955 und bei Juran [1974] in seinem Quality Control Handbook.<br />
L(y)<br />
1<br />
Abb. 5.2.5: Verlustfunktion<br />
Tu Sollwert To Y
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
177<br />
Um diese Zusammenhänge zu verdeutlichen, betrachten wir zunächst einmal den Ausschussanteil<br />
p.<br />
Zu p gehört die binäre Verlustfunktion<br />
⎧0, für Y ∈[ To<br />
− Tu]<br />
Ly ( ) = ⎨<br />
⎩ 1, für Y ∉[ To<br />
− Tu]<br />
Diese Verlustfunktion ist ein Sprungfunktion. Das zeigt die Abbildung 5.2.5.<br />
Besitzt Y die Vd f(y) und die Vf F(y), dann erhält man den erwarteten Verlust<br />
∞<br />
∫<br />
E[ L( Y)] = L( y) ⋅ f( y)dy<br />
−∞<br />
∫<br />
= 0 ⋅ f( y)dy + 1 ⋅ f( y)dy<br />
y∈TB<br />
= P( Y∉ TB) = : p<br />
∫<br />
y∉TB<br />
wobei [T o – T u ] =: TB.<br />
Für die zweiseitige Betrachtung erhält man<br />
p = 1 – P(T u ≤ Y ≤ T o ) = 1 – F(T o ) + F(T u ) = p o + p u .<br />
Für die einseitige Betrachtung erhält man<br />
bzw.<br />
p = P(Y > T o ) = 1 – F(T o )<br />
p = P(Y < T u ) = F(T u ).<br />
Diese Betrachtung über die traditionelle Verlustfunktion hat wesentliche Nachteile. Zum einen<br />
drückt sie nur den Verlust des Produzenten aus, obwohl der Konsument natürlich ebenfalls<br />
durch die nicht zielwertkonformen Produkte Verluste erleidet. Zum anderen ist der Verlauf<br />
dieser Verlustfunktion in keiner Weise plausibel. Betrachten wir z. B. ein Produkt, dessen Wert<br />
für die Produktvariable in unmittelbarer Nähe der oberen oder unteren Toleranzgrenze, aber<br />
noch innerhalb des Toleranzintervalls liegt, so wird der Verlust mit 0 bewertet. Für einen anderen<br />
Wert, der sich vom vorangegangenen nur ganz wenig unterscheidet, aber außerhalb des<br />
Toleranzbereiches liegt, wird der Verlust 1 angenommen.<br />
Taguchi hat diesen Missstand durch die Einführung der quadratischen Verlustfunktion korrigiert.<br />
Danach ist ein Produkt umso besser, je näher der Wert seines Produktvariables am<br />
Sollwert liegt. Je größer die Differenz zwischen Soll- und Istwert ist, desto größer ist der Verlust<br />
über die gesamte Lebenszeit des Produktes.<br />
Für die zweiseitige Tolerierung lautet die Taguchi-Verlustfunktion<br />
L T (y) = c (y – M Y ) 2 ,<br />
wobei M Y der Sollwert für die Produktvariable Y und c ein Proportionalitätsfaktor sind. Analog<br />
kann man die Verlustfunktion für einseitige Tolerierung aufschreiben.
178 5 Qualität in der Fertigung<br />
Für den Erwartungswert der Verlustfunktion – das Risiko – erhält man mit der Vd f(y)<br />
∞<br />
∫<br />
∞<br />
2 2<br />
y ∫ μy μY Y<br />
−∞<br />
∞ ∞ ∞<br />
∫<br />
2 2<br />
μY μY Y ∫ μY μY Y ∫<br />
−∞ −∞ −∞<br />
E[ L( y)] = c ⋅( y − M ) ⋅ f( y)d y = c ⋅ [( y − ) + ( − M )] f( y)dy<br />
−∞<br />
⎧⎪<br />
⎫⎪<br />
= c ⋅⎨<br />
( y− ) f( y)dy+ 2 ⋅( −M ) ⋅ ( y− ) ⋅ f( y)d y+ ( −M ) ⋅ f( y)dy⎬<br />
⎪⎩<br />
⎪⎭<br />
= c ⋅ { σ + ( − ) }<br />
2 2<br />
μY<br />
MY<br />
Das ist der bekannte mittlere quadratische Fehler (engl. mean square error), der z. B. für die<br />
Güte einer Schätzfunktion verwendet wird. Der Term (µ Y – M Y ) 2 ist der quadratische Bias.<br />
Damit werden die zwei Hauptaufgaben aus der Abbildung zur Entscheidung mit den Prozessfähigkeiten<br />
noch einmal verdeutlicht. Der Bias gibt die Abweichung des Mittelwertes vom<br />
Sollwert an. Ist ein Bias vorhanden, dann muss der Prozess neu zentriert werden, sodass diese<br />
Abweichung null wird. Ist die Streuung so groß, dass die „Schwänze“ der Verteilung über die<br />
Toleranzgrenzen hinausragen, dann muss der Prozess so verbessert werden, dass die Streuung<br />
kleiner wird.<br />
Prozessfähigkeit nach Taguchi auf der Grundlage der Verlustfunktion<br />
Nach Rammelmüller [1993] und Taam [1993] können die univariaten Prozessfähigkeitsindizes<br />
auch wie folgt geschrieben werden<br />
To<br />
− Tu<br />
T − T 6 S Cp<br />
C = = =<br />
D<br />
wobei<br />
o u<br />
pm<br />
2 2<br />
1<br />
6 S + ( Y − M)<br />
⎡<br />
2<br />
( Y − M)<br />
⎤2<br />
⎢1<br />
+<br />
2 ⎥<br />
1<br />
2 2<br />
⎡ ( Y − M)<br />
⎤<br />
D = ⎢1<br />
+<br />
2 ⎥<br />
⎣ S ⎦<br />
⎣ S ⎦<br />
die Abweichung des Mittelwertes der Werte für die Produktvariable vom Sollwert M misst.<br />
Beispiel 5.2.4: Wellendurchmesser. Prozessfähigkeit nach Taguchi<br />
Verwenden Sie die Angaben für den Soll- und Istzustand von oben und setzen diese Werte<br />
in die Formeln für die Taguchi Fähigkeiten ein, dann erhalten Sie die Werte D = 1.000199<br />
und C pm = 0,9998. Diese Werte stimmen mit den Werten von oben überein. Damit ist auch<br />
die zu fällende Entscheidung dieselbe.<br />
Welche Schlüsse können Sie aus den verschiedenen univariaten Prozessfähigkeitsindizes für<br />
die praktische Anwendung ziehen?<br />
C p beschreibt das Verhältnis von Spezifikationsbreite zur Breite der Verteilung der Messwerte für<br />
die Produktvariable. Je größer C p wird, desto weniger streuen die Werte für die Produktvariable.<br />
Bei C p = 1 stimmt die 6 s Breite der Häufigkeitsverteilung mit der Toleranzbreite überein.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
179<br />
C pk wächst für jedes konstante σ linear mit der Annäherung des Mittelwertes Y an den Sollwert.<br />
Das heißt aber, ein Mittelwert Y nahe beim Sollwert wird genauso bewertet wie ein Mittelwert<br />
nahe einer der Toleranzgrenzen. Daraus folgt für die Anwendung, dass ein großer C pk -Wert<br />
mitunter zu wenig über die Zentriertheit des Prozesses aussagt.<br />
C pm beinhaltet sowohl die Streuung der Produktvariablen, wie auch die Zentriertheit ( Y − M )<br />
der Verteilung der Produktvariablen auf den Sollwert. C pm = 1 besagt, dass Y innerhalb der mittleren<br />
Drittels von (T o – T u ) liegt. Hieraus folgt, der Index C pk sollte durch C pm ersetzt werden.<br />
Das ist ein positiver Beitrag zur Diskussion, welcher Philosophie bei der Kontrolle von Prozessen<br />
zu folgen ist,<br />
•<br />
•<br />
dem Nachweis der Erfüllung der spezifizierten Kundenanforderungen oder<br />
der Erfüllung gewisser statistischer Gesetzmäßigkeiten.<br />
Im Kapitel 6 wird diese Diskussion noch einmal aufgegriffen.<br />
Prozessfähigkeit und Ausfallrate<br />
Wir betrachten nur die univariate Produktvariable Y mit dem Sollzustand M = Sollwert und<br />
der unteren T u und oberen T o Toleranzgrenze.<br />
[T o – T u ] ist das Toleranzintervall. Falls der Wert Y i eines Produktes für die Produktvariable<br />
Y innerhalb des Toleranzintervalls liegt, d. h. falls Y i ∈ [T o – T u ], dann sagen wir das Produkt<br />
ist konform zur Spezifikation. Wenn Y i ∉ [T o – T u ], dann sagen wir, das Produkt ist nicht<br />
konform zur Spezifikation.<br />
Die Wahrscheinlichkeit dafür, dass ein Messwert Y i , i = 1, …, N von Y außerhalb der Toleranzgrenzen<br />
liegt, ist<br />
p = 1 – F(T o ) + F(T u ).<br />
Die Fähigkeit des Prozesses ist eine Funktion der Ausfallrate, d. h.<br />
p = P( Y ∈[ To<br />
− Tu]) = 1 − ∫ f( y)d y.<br />
[ To−Tu]<br />
Prozesse mit kleinem p werden fähig genannt. Wie klein p sein muss, um einen Prozess als<br />
fähig zu charakterisieren ist das Anliegen des Qualitätsverantwortlichen des Unternehmens. In<br />
der Praxis hat sich die Forderung p < 0.0027 für fähige Prozess bewährt. Es muss aber darauf<br />
verwiesen werden, dass eine solche Forderung von den Herstellungskosten abhängig ist und<br />
daher nur akademischen Charakter hat.<br />
Setzen wir noch voraus, dass Y ~ N (µ, σ 2 ) gilt, dann erhalten wir für das einseitig nach oben<br />
begrenzten Toleranzintervall<br />
∞<br />
⎧<br />
2<br />
1 ⎪ ( y − μ)<br />
⎫⎪<br />
po = P( Y > To) = ∫ exp⎨−<br />
2 ⎬d y.<br />
σ 2 π ⎪⎩<br />
2 σ ⎪⎭<br />
To<br />
Hierfür können wir nach der Standardisierung der Zufallsgröße Y und deren Toleranzgrenzen<br />
auch schreiben<br />
∞<br />
o − μ o − μ μ − o<br />
⎛ T ⎞ ⎛T ⎞ ⎛ T ⎞<br />
po = P ⎜Z > ⎟ = = − ⎜ ⎟ =<br />
⎝ ⎠ ∫ Φ()d z z 1 Φ Φ<br />
⎝ ⎠<br />
⎜<br />
⎝<br />
⎟.<br />
σ ω σ ⎠<br />
To<br />
−μ<br />
σ
180 5 Qualität in der Fertigung<br />
Hieraus folgt,<br />
p o = 1 – Φ (3 C po ) = Φ (–3 C po ).<br />
Ein analoger Ausdruck ist der Ausschussanteil bei dem einseitig unten begrenzten Toleranzintervall.<br />
Das p ist nun leider unbekannt. Daher betrachten wir für eine Stichprobe die Schätzung<br />
N<br />
1<br />
Fˆ( y ) = ∑I ( Yi<br />
< y )<br />
N<br />
i=<br />
1<br />
für unbekannte Verteilungsfunktion F, wobei I (Y i < y) die Indikatorfunktion<br />
⎧1, falls Yi<br />
< y<br />
I( Yi<br />
< y)<br />
= ⎨<br />
⎩0, falls Yi<br />
≥ y<br />
bezeichnet.<br />
Damit erhalten wir<br />
1<br />
pˆ = 1 − Fˆ( T ) + Fˆ( T ) = 1 − I( T ≤ Y ≤ T )<br />
und die Schätzungen<br />
bzw.<br />
und<br />
∑<br />
o u u i o<br />
N<br />
i=<br />
1<br />
̃ ⎛T − ⎞ ⎛ − ⎞<br />
= − ⎜ o Y Y T<br />
p 1 Φ ⎟ + Φ<br />
⎝ ⎠<br />
⎜ u<br />
s ⎝ s<br />
⎟<br />
⎠<br />
p̃<br />
Tu<br />
⎛ u − ⎞ ⎛ − ⎞<br />
= ⎜ ⎟<br />
̃<br />
o<br />
Φ<br />
T Y , pT<br />
= Φ<br />
T Y<br />
o<br />
⎝ s ⎠<br />
⎜<br />
⎝ s<br />
⎟<br />
⎠<br />
p̃ = p̃ + p̃<br />
T .<br />
u To Damit können wir für den Prozessfähigkeitsindex schreiben<br />
N<br />
⎛Y − Tu<br />
⎞ ⎛To<br />
− Y ⎞ 1<br />
−1 −<br />
= ⎜ ⎟ ⎜ ⎟ = − ̃<br />
1<br />
C ̃<br />
pk min , min { Φ ( pT<br />
), Φ ( p )}<br />
u<br />
T .<br />
o<br />
⎝ s ⎠ ⎝ s ⎠ 3<br />
Beispiel 5.2.5: Fähigkeiten und Ausfallrate<br />
Y ~ N(0, σ 2 ). Der Sollzustand für diese Produktvariable ist<br />
Sollwert M = 0,<br />
T u = –0,3<br />
T o = 0,3.<br />
Da s und p unbekannt sind, ziehen wir eine Stichprobe vom Umfang N = 113.<br />
Mit den Werten dieser Stichprobe berechnen wir den Mittelwert = 0,00968 und die Standardabweichung<br />
s = 0,20509.<br />
Damit berechnen wir die statistischen 3 s-Grenzen [–0,605596, 0,624958].<br />
Die univariaten Prozessfähigkeitsindizes sind C p = 0,49, k = 0,03 und C pk = 0,47.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
181<br />
Damit gilt<br />
To − Y 0,3 − 0,00968<br />
= = 1,415<br />
s 0,20509<br />
und<br />
Y<br />
− Tu 0,00968 − ( −0,3)<br />
= = 1,51<br />
s 0,20509<br />
Aus einer Tafel mit den Werten der standardisierten Normalverteilung erhalten wir für<br />
diese beiden Zahlen die Werte<br />
F(1,42) = 1 – 0,92219 = 0,0778<br />
und<br />
F(1,51) = 1 – 0,934478 = 0,0655.<br />
Oberhalb der oberen Toleranzgrenze T o liegen 7,78 % aller Einzelwerte und unterhalb der<br />
unteren Toleranzgrenze liegen 6,55 % der Werte.<br />
Zusammenfassend können sagen, bei der univariaten Prozessfähigkeit C pk = 0,47 liegen ca.<br />
14,3 % aller Werte außerhalb der Toleranzen.<br />
Bei einer Prozessfähigkeit C pk = 0,8 lägen nur noch ca. 1,4 % außerhalb der Toleranzgrenzen.<br />
Hieraus lesen wir ab, dass die Vergrößerung der Prozessfähigkeit um ca. 58 % eine Verringerung<br />
des Ausschusses von ca. 90 % zur Folge hat.<br />
Beispiel 5.2.6: Wellendurchmesser. Ausfallrate<br />
Die Prozessfähigkeit C p = 1 zeigt, dass kein Messwert für die gefertigten Wellen außerhalb<br />
des Toleranzintervalls liegt, d. h. die Anteil der Messwert oberhalb der oberen Toleranzgrenze<br />
ist null und der Anteil der Messwerte unterhalb von T u ist ebenfalls null.<br />
Wenn wir allerdings diese Anteile nach obiger Formel schätzen, dann erhalten wir die<br />
Werte:<br />
•<br />
•<br />
geschätzter Anteil oberhalb der oberen Toleranzgrenze ist 1296 [ppm]<br />
geschätzter Anteil unterhalb der unteren Toleranzgrenze ist 1472 [ppm]<br />
Zusammen ergibt das einen Anteil außerhalb des Toleranzintervalls von 2768 [ppm].<br />
Voraussetzungen für die Durchführung von Fähigkeitsnachweisen<br />
Wie jedes mathematische oder mathematisch statistisches Verfahren ist die Durchführung von<br />
Prozessfähigkeitsnachweisen an Voraussetzungen geknüpft. Diese betreffen<br />
•<br />
•<br />
•<br />
•<br />
•<br />
die Fähigkeit des Mitarbeiters,<br />
die Fähigkeit des Messprozesses,<br />
die Fähigkeit der Prozesse, Maschinen und Anlagen,<br />
Verteilung der Produktvariablen,<br />
die Prozessbeherrschung.
182 5 Qualität in der Fertigung<br />
Wenn Sie die Fähigkeit des Messprozesses oder der Maschinen untersuchen wollen, verweise<br />
ich Sie auf das Buch von Rinne, Mittag [1999]. Dort werden diese Verfahren sehr ausführlich<br />
beschrieben.<br />
Wenn Sie Hypothesen über die zugrunde liegende Verteilung der Produktvariablen Y prüfen<br />
wollen, verweise ich Sie auf die einschlägigen Bücher über die univariate Statistik von Schwarze<br />
[1997], Lehnen, Wegmann [1985], Rinne, Mittag [1999] u. a.<br />
In der Literatur, so z. B. auch bei Rinne und Mittag, wird auf die Bedeutung der Stabilität der<br />
„Verhältnisse in der Produktion“ hingewiesen und erklärt, dass damit die zeitliche Konstanz<br />
der Verteilung der Produktvariablen gemeint ist.<br />
Braucht man die Stabilität für die Interpretation der Prozessfähigkeitsindizes?<br />
Ich meine nicht, denn die Stabilitätsanforderung müsste vor der Fähigkeitsanalyse überprüft<br />
werden. Erst nachdem nachgewiesen wurde, dass ein Prozess fähig ist, sollten Regelkarten<br />
eingeführt werden. Andererseits wird behauptet, die Stabilität mit Regelkarten nachzuweisen.<br />
Das sieht aus, wie eine Katze, die sich in den Schwanz beißt.<br />
Die Toleranzgrenzen liegen fest. Jedes Produkt, dessen Wert für die Produktvariable außerhalb<br />
des Toleranzintervalls liegt, ist Ausschuss. Der Grund, warum das Produkt Ausschuss ist, ist<br />
zwar interessant, aber erst bei der Ursachenforschung und nicht bei der Definition der Fähigkeiten.<br />
Der Begriff Stabilität sorgt immer wieder für Irritationen, so z. B. in den Arbeiten von<br />
Stark [1999] und Kaiser, Nowack [1999]. In diesen Arbeiten will man neue Gesichtspunkte<br />
für die univariaten Fähigkeitsberechnungen und Kontrollkartentechniken ableiten, lässt aber<br />
die spezifizierten Kundenanforderungen außer acht und bezieht nur statistische Aspekte ein.<br />
Das ist nicht zulässig.<br />
Können wir auch univariate Prozessfähigkeitsindizes berechnen, wenn die Produktvariable<br />
nicht normal verteilt ist?<br />
Ja. Wir betrachten als Benchmark den Fall, die<br />
Produktvariable Y ist binomial verteilt.<br />
Die Produktvariable Y kann nur zwei verschiedene Werte annehmen, z. B.<br />
Y<br />
⎧0, wenn das Produkt n. i. O.<br />
= ⎨<br />
⎩ 1, wenn das Produkt i. O.<br />
wie z. B. bei der Wareneingangsprüfung.<br />
Die Wahrscheinlichkeiten für diese beiden Fälle seien P(Y = 0) = p und P(Y = 1) = 1 – p. Die<br />
Ausschusswahrscheinlichkeit p ist unbekannt und wird mit einer Stichprobe von N Werten,<br />
die ja nur 0 oder 1 sein können, bestimmt.<br />
Die Wahrscheinlichkeit dafür, dass in der Stichprobe vom Umfang N k Produkte defekt sind,<br />
ist durch die folgende Formel gegeben,<br />
⎛<br />
N<br />
⎞ ⎛N<br />
⎞<br />
P ⎜∑<br />
yi<br />
= k⎟<br />
= ⎜ ⎟ p ⋅(1 − p)<br />
⎝ ⎠ ⎝ k ⎠<br />
i=<br />
1<br />
wobei k zwischen 0 und N liegt.<br />
k N−k
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
183<br />
Die Häufigkeiten für die verschiedenen k, d. h. für k = 0, k = 1, … werden durch die Häufigkeitsverteilung<br />
visualisiert und durch das Einzeichnen des Sollwertes p und der Toleranzgrenzen<br />
p u und p o mit dem Sollzustand verglichen. Die Binomialverteilung wird ebenfalls vollständig<br />
durch den Mittelwert<br />
Y = pˆ und die Standardabweichung s =<br />
pˆ<br />
(1 − pˆ)<br />
N<br />
charakterisiert. Damit können die obigen Formeln 1, 2 und 3 zur Berechnung der Prozessfähigkeitsindizes<br />
verwendet werden. Man erhält<br />
p −<br />
−<br />
o p<br />
pˆ<br />
p<br />
u<br />
Cp = , k = und Cpk = (1 − k) ⋅Cp.<br />
6 ⋅ s 1<br />
( po<br />
− pu)<br />
2<br />
Wir betrachten noch den etwas selteneren Fall,<br />
die Produktvariable Y ist nach Poisson verteilt.<br />
Bei dieser Verteilung sind Mittelwert und Standardabweichung gleich, d. h. es gilt Y = λ und<br />
s = λ . Hiermit sind wiederum die Formeln 1, 2 und 3 von oben anwendbar.<br />
Müssen Sie etwas über die Verteilungen der Prozessfähigkeitsindizes wissen?<br />
Ja, den n die univariaten Prozessfähigkeitsindizes sind Zufallsgrößen. Das wird deutlich, wenn<br />
Sie beachten, dass diese von Y und s abhängen. Y und s sind aber Zufallsgrößen, denn diese<br />
hängen wiederum nur von den Stichprobenwerten Y 1 , …, Y N ab.<br />
Aus der Verteilung der Prozessfähigkeitsindizes können Sie die Konfidenzintervalle für die<br />
Indizes berechnen.<br />
Wozu benötigen Sie die Konfidenzintervalle für die Prozessfähigkeitsindizes?<br />
Die Prozessfähigkeitsindizes sind Zufallsgrößen. Sie schwanken von Stichprobe zu Stichprobe,<br />
obwohl die Produktionsbedingungen gleich sind. Ist die ursprüngliche Streuung groß, so kann<br />
das zu Fehlentscheidungen führen. Daher wollen wir Ihnen mit den Konfidenzintervallen ein<br />
Instrument in die Hand geben, um die Unsicherheit zu quantifizieren.<br />
Für die Ableitung der Konfidenzintervalle benötigen wir die Verteilung der Indizes. Um diese<br />
berechnen zu können, fasse ich die bisherigen Ergebnisse zusammen.<br />
Unter der Voraussetzung Y ∼ N (μ, σ 2 ) gilt<br />
1.<br />
Y<br />
⎛<br />
2<br />
σ ⎞<br />
∼ N ⎜μ<br />
, ⎟ , wobei N der Stichprobenumfang ist<br />
⎝ N ⎠<br />
2.<br />
( N −1)<br />
⋅ s<br />
σ<br />
2<br />
2<br />
2<br />
∼ χ , falls Y 1 , …, Y N unabhängig nach N (0, 1) verteilt sind<br />
3. Y und s 2 sind unabhängig voneinander verteilt und
184 5 Qualität in der Fertigung<br />
4.<br />
Y − μ<br />
⋅<br />
σ<br />
( N −1)<br />
( N −1)<br />
N<br />
⋅ s<br />
2<br />
⋅σ<br />
2<br />
Y − μ<br />
= ⋅ N ∼ t<br />
s<br />
N −1<br />
5. Konfidenzintervall für σ 2 ist durch<br />
2 2<br />
( N −1) ⋅ s 2 ( N −1)<br />
⋅ s<br />
≤ σ ≤<br />
2 2<br />
χ<br />
χ<br />
α<br />
α<br />
1−<br />
2 2<br />
gegeben. Daraus folgt<br />
( N −1) ⋅ s 2 ( N −1)<br />
⋅ s<br />
≤ σ ≤<br />
2 2<br />
χ<br />
χ<br />
R<br />
2 2<br />
L<br />
,<br />
wobei R den rechten Schwanz und L den linken Schwanz der χ 2 -Verteilung bezeichnen.<br />
Beweise: siehe z. B. Schmetterer [1956, S 131].<br />
In<br />
C<br />
p<br />
To<br />
− T<br />
=<br />
6 ⋅ s<br />
u<br />
sind T o und T u fest. Nur s ist eine Zufallsgröße. Damit erhält man für C p das Konfidenzintervall:<br />
C<br />
≤ κ<br />
≤ C<br />
p p p<br />
mit<br />
wobei<br />
1 1<br />
Cp = Cp ⋅ und Cp = Cp<br />
⋅<br />
b<br />
b<br />
u<br />
o<br />
N − 1<br />
bo, α =<br />
2<br />
χ α<br />
N −1,1−<br />
2<br />
N − 1<br />
bu, α =<br />
2<br />
χ α<br />
N −1, 2<br />
κ<br />
p<br />
To<br />
− T<br />
=<br />
6 ⋅ σ<br />
u<br />
In ähnlicher Weise kann man ein Konfidenzintervall für C pk berechnen. Ausgangspunkt ist die<br />
Darstellung von C pk in der Form
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
185<br />
C<br />
pk<br />
1<br />
T ( o u )<br />
o Y Y T<br />
⋅ T − T − Y − M<br />
⎧ − − u⎫<br />
= Min , 2<br />
⎨<br />
⎬ =<br />
.<br />
⎩ 3⋅ s 3⋅ s ⎭<br />
3⋅<br />
s<br />
Die Konfidenzintervalle für µ und σ 2 sind:<br />
und<br />
s ⋅t s ⋅t<br />
Y − ≤ μ ≤ Y +<br />
N<br />
N<br />
α<br />
α<br />
N−1, N−1,<br />
2 2<br />
2 2<br />
( N −1) ⋅ s 2 ( N −1)<br />
⋅ s<br />
≤ σ ≤<br />
χ<br />
χ<br />
α<br />
α<br />
N−1,1− N−1,<br />
2 2<br />
Indem man die Konfidenzintervalle für µ und σ 2 in die Formel für C pk einsetzt, erhält<br />
man das Konfidenzintervall für C pk mit der unteren Intervallgrenze C pk<br />
C<br />
pk<br />
=<br />
t α ⋅ s<br />
1<br />
N −1, ⋅ ( T − − − 2<br />
o Tu<br />
) Y − M<br />
2<br />
N<br />
3 ⋅ s ⋅<br />
N − 1<br />
χ<br />
2<br />
α<br />
N −1, 2<br />
.<br />
Zur Abkürzung setzen wir<br />
und<br />
a<br />
b<br />
α<br />
α<br />
N −1, 2<br />
: = ,<br />
N<br />
=<br />
t<br />
N − 1<br />
o. α 2<br />
χ α<br />
N −1,1−<br />
2<br />
N − 1<br />
bu, α =<br />
2<br />
χ α<br />
N −1, 2<br />
Damit erhält man<br />
C<br />
pk<br />
1 1<br />
⋅( To − Tu) − Y − M − aα<br />
⋅ s ⋅( To − Tu)<br />
− Y − M<br />
=<br />
2<br />
=<br />
2<br />
aα<br />
−<br />
3⋅ s ⋅b 3⋅ s ⋅b 3⋅b<br />
1 a 3 ⋅Cpk<br />
− a<br />
α<br />
= Cpk<br />
⋅ − =<br />
b 3⋅b 3⋅b<br />
u, α u, α u, α<br />
u, α u, α u, α<br />
α<br />
.
186 5 Qualität in der Fertigung<br />
Analog erhält man für die obere Intervallgrenze Cpk<br />
3 ⋅ Cpk<br />
+ aα<br />
Cpk<br />
=<br />
3 ⋅ bo,<br />
α<br />
so dass<br />
⎛3⋅Cpk<br />
− aα<br />
3⋅ Cpk<br />
+ aα<br />
⎞<br />
P ⎜<br />
≤ κpk<br />
≤ ⎟ = 1 − α.<br />
⎝ 3⋅b<br />
3⋅b<br />
⎠<br />
u, ε<br />
o, ε<br />
Beispiel 5.2.7: Akkubohrschrauber. Konfidenzintervalle für C p und C pk<br />
Die Sollvorgaben für die Produktvariable Y 2 Produktvariable sind<br />
M 2 = 0 [mm]<br />
T u,3 = –0.3 [mm]<br />
T o,3 = 0.3 [mm]<br />
Aus der Stichprobe von N = 113 vermessenen Gehäusen erhält man die statistischen Maßzahlen<br />
für den Istzustand<br />
Y 2 = 0.0099 [mm]<br />
s 2 = 0.204 [mm]<br />
Damit erhält man<br />
C<br />
k<br />
p<br />
0.6<br />
= = 0.49<br />
6 ⋅ 0.204<br />
0.0099<br />
= =<br />
0.3<br />
C pk = 0.474.<br />
0.033<br />
Die Konfidenzintervalle zu C p und C pk sollen für die Irrtumswahrscheinlichkeit α = 0.05<br />
bestimmt werden. Dazu muss man die Koeffizienten a α und b o , α und b u , α berechnen.<br />
a<br />
α<br />
t<br />
N<br />
α<br />
−1, = 2 1.9814<br />
= = 0.18639<br />
N 113<br />
mit<br />
und<br />
t 112,0.025 = 1.9814<br />
N − 1 112<br />
= = = 0.92998<br />
129.5<br />
bo, α 2<br />
χ α<br />
N −1,1−<br />
2<br />
und<br />
N − 1 112<br />
= = = 1.22842<br />
χ α<br />
74.22<br />
N −1, 2<br />
bu, α 2
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
187<br />
mit<br />
χ<br />
χ<br />
2<br />
112,0.975<br />
2<br />
112,0.025<br />
= 129.5<br />
= 74.22<br />
Damit erhält man<br />
P( Cp ≤ κp ≤ Cp) = 1−<br />
α<br />
P (0.3989 ≤ κ ≤ 0.5268) = 0.95<br />
und<br />
p<br />
P( Cpk ≤ κpk ≤ Cpk<br />
) = 1−<br />
α<br />
P (0.335 ≤ κ ≤ 0.577) = 0.995<br />
pk<br />
Die berechneten Prozessfähigkeiten und deren Konfidenzintervalle zeigen, dass der Prozess<br />
zur Herstellung der Plastikschalen verbessert werden muss.<br />
Zusammenstellung der Eigenschaften des univariaten Prozessfähigkeitsindizes C p<br />
•<br />
•<br />
Der einfache Prozessfähigkeitsindex C p ist eine streng monoton fallende Funktion von σ.<br />
Die Funktion C p ist konvex, d. h.<br />
dC p To<br />
− Tu<br />
1<br />
=− =− C<br />
2<br />
dσ<br />
6 ⋅ σ σ<br />
p<br />
Die grafische Darstellung von C p ist in der Abbildung 5.2.6 enthalten<br />
5<br />
Cpj<br />
0.33333<br />
0.2 s j<br />
3<br />
Abb. 5.2.6: C p in Abhängigkeit von σ<br />
Die Elastizität der Funktion C p wird nach der Beziehung<br />
dC<br />
Cp<br />
η( Cp) = = −1<br />
dσ<br />
σ<br />
p
188 5 Qualität in der Fertigung<br />
berechnet. Dieser Ausdruck bedeutet, C p ist isoelastisch, d. h. eine Vergrößerung von σ um 1 %<br />
führt zu einer Verkleinerung von C p von 1 %.<br />
•<br />
•<br />
Die Anforderung an C p lautet nach Montgomery [1996], S. 446 C p > 1.33.<br />
Die Aussagen über C p betreffen die Verbindung zum Gutanteil der Produktion oder zur<br />
Ausschussquote. Diese können erst nach der Korrektur mit dem Korrekturfaktor k formuliert<br />
werden, da eine Verteilung, insbesondere die Normalverteilung, durch die beiden<br />
Momente Mittelwert und Standardabweichung vollständig charakterisiert wird.<br />
• Die Schätzfunktion für C p , hier mit<br />
ˆ To<br />
− Tu<br />
Cp<br />
=<br />
6 ⋅ s<br />
Ĉp<br />
bezeichnet, ist<br />
• Die Verteilung von C p ist unter der Annahme Y ~ N(μ, σ 2 ) eine χ 2 N – 1 Verteilung mit<br />
N – 1 FG. Die Schätzfunktion Ĉ p ist asymptotisch erwartungstreu und MSE-konsistent<br />
• Das Konfidenzintervall für C p ist<br />
⎛⎧<br />
2 2<br />
χ<br />
⎫⎞<br />
α χ α<br />
⎜<br />
⎪<br />
− − −<br />
⎪⎟<br />
⎜⎨<br />
ˆ N 1, N 1,1<br />
2 2<br />
P Cp<br />
⋅ ≤ Cp<br />
≤ ⎬⎟<br />
= −<br />
⎪ −1 −1<br />
⎪<br />
1 α<br />
N<br />
N<br />
⎜<br />
⎝⎪<br />
⎪⎟<br />
⎩<br />
⎭⎠<br />
• Ein Test zur Prüfung der Hypothese H 0 : C<br />
χ<br />
N − 1<br />
2 0<br />
= C p ⋅<br />
2<br />
χ α<br />
N −1,1−<br />
2<br />
p<br />
0<br />
p<br />
≤ C gegen die Alternative H 1 : C<br />
p<br />
0<br />
p<br />
> C ist<br />
Die Hypothese H 0 bedeutet, der Prozess ist nicht fähig. C p bezeichnet die Vorgabe des<br />
0<br />
Unternehmens bzgl. der Prozessfähigkeit, z. B. den Wert c p = 1.33 .<br />
• Für den Korrekturfaktor k erhält man die Resultate<br />
μ − M<br />
k =<br />
1 ( To<br />
− T ) u<br />
2<br />
k = 0 ⇔ µ = M<br />
k = 1 ⇔ µ = T o oder µ = T u<br />
0 < k < 1 ⇔ µ ∈ {( T o , T u ) \ {M}}<br />
k > 1 ⇔ µ ∉ [T u , T o ]<br />
lim k =∞<br />
μ →±∞<br />
k ist eine lineare Funktion von µ, wie die Abbildung 5.2.7 zeigt.<br />
k ist nur von µ abhängig. Die Funktion k ist nicht monoton.<br />
K ist linear fallend für µ < M und linear wachsend für µ > M.<br />
k ist somit ein dimensionsloses Maß für die Dezentrierung, bzw. 1 – k ist ein Maß für die<br />
Zentrierung des Prozesses auf den Sollwert M.<br />
0
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
189<br />
0.6667<br />
0.8<br />
0.6<br />
k i<br />
0.4<br />
0.2<br />
0<br />
-2 -1 0 1 2<br />
m i<br />
Abb. 5.2.7: Darstellung von k<br />
Eine Schätzfunktion für k ist<br />
kˆ<br />
=<br />
Y − M<br />
1 ( To<br />
− Tu<br />
)<br />
2<br />
mit<br />
2<br />
k ˆ ∼ N1<br />
( μk<br />
, σk<br />
),<br />
μ<br />
k<br />
2 2<br />
μ − M<br />
2 σY<br />
σY<br />
= und σk<br />
= = .<br />
1 N<br />
( T −<br />
−<br />
⋅<br />
o Tu ) ( To Tu<br />
)<br />
N Δ<br />
2 2<br />
Die Schätzfunktion ˆk ist verzerrt. k wird systematisch zu groß geschätzt. Die Schätzfunktion<br />
ist aber asymptotisch erwartungstreu, d. h. der Bias konvergiert mit dem Stichprobenumfang<br />
N gegen null.<br />
Für die Ableitung eines Tests zur Prüfung von Hypothesen über k muss ˆk etwas umgeformt<br />
werden.<br />
Es gilt<br />
ˆ Y − M k − μk<br />
μk<br />
k = : Z = = σk<br />
+ .<br />
Δ σ σ<br />
Der Ausdruck<br />
k − μk<br />
U = ∼ N (0, 1)<br />
σ<br />
k<br />
Für den 2. Ausdruck kann man schreiben<br />
k<br />
k<br />
δ<br />
2<br />
2 2<br />
2 2<br />
⎛μ ⎞ ⎛ − ⎞<br />
k μY<br />
M Δ k N<br />
= ⎜ ⎟ = ⎜ ⎟ =<br />
2<br />
⎝σ ⎠ ⎝σ / N ⎠ σ<br />
k Y Y<br />
Der Ausdruck (U + δ) 2 ~ χ 2 (1; δ 2 ), d. h. das Quadrat der Summe der beiden Summanden U und<br />
δ 2 ist nichtzentral χ 2 verteilt mit einem Freiheitsgrad und dem Nichtzentralitätsparameter δ 2 .
190 5 Qualität in der Fertigung<br />
Mit diesen Darstellungen erhält man das Schwankungsintervall für ˆk<br />
σ Y<br />
χ<br />
⎛Δ ⎞ ˆ σ ⎛Δ<br />
⎞ .<br />
Δ N<br />
2 2 2 2<br />
2 k N Y 2 k N<br />
α ⎜ ⎟ ≤ k ≤ χ<br />
2 1−<br />
α ⎜ 2 ⎟<br />
2<br />
⎝ σY<br />
⎠ Δ N<br />
2<br />
⎝ σY<br />
⎠<br />
Setzt man in den Nichtzentralitätsparameter ein hypothetisches k 0 ein, dann kann man das<br />
Intervall als Test verwenden.<br />
Vorstellung von C pk :<br />
Die Verbindung zwischen C pk und der Ausschussquote bzw. dem Anteil der guten Produktion<br />
(Gutanteil) ist gegeben durch<br />
⎛To<br />
− μY<br />
⎞ ⎛Tu<br />
− μY<br />
⎞<br />
Q = P({ Tu<br />
≤ Y ≤ To})<br />
= Φ⎜ ⎟ − Φ<br />
⎝ σ ⎠<br />
⎜<br />
⎝ σ ⎟<br />
⎠<br />
Löst man C p nach σ auf, dann erhält man<br />
⎛ To<br />
− μY<br />
⎞ ⎛ Tu<br />
− μY<br />
⎞<br />
Q = Φ⎜6⋅Cp<br />
⎟ − Φ⎜6⋅Cp<br />
⎝ T − T ⎠ ⎝ T − T ⎟<br />
⎠<br />
o u o u<br />
Y<br />
Hieraus kann man zunächst ablesen, dass C p allein zur Beschreibung der Ausschusses oder<br />
alternativ dazu des Gutanteils nicht ausreicht.<br />
Die Verwendung von<br />
liefert<br />
To + Tu To − T<br />
μY<br />
= + κ u , mit κ ∈R<br />
2 2<br />
Q = Q( C , κ) = Φ[3 ⋅(1 − κ) C ] − Φ[ −3 ⋅ (1 + κ) C ].<br />
p p p<br />
Sind k und C p bekannt, dann ist die zweiseitige Ausschussquote eindeutig durch<br />
d. h.<br />
bestimmt.<br />
P = 2 − Φ[3 ⋅ C (1 + k)] − Φ[3 ⋅C (1 − k)]<br />
p<br />
⎛ 1 + k ⎞<br />
P = 2 − Φ(3 Cpk<br />
) + Φ⎜3Cpk<br />
⎝<br />
⎟<br />
1 − k ⎠<br />
p<br />
Y<br />
Korrigierter Prozessfähigkeitsindex C pk<br />
min ( To<br />
− μY; μY<br />
− Tu)<br />
Δ − μY<br />
− M<br />
Cpk<br />
= = = (1 − k)<br />
C<br />
3σ<br />
3σ<br />
Y<br />
C pk soll möglichst groß sein, denn große C pk garantieren geringe Ausschussquoten.<br />
Y<br />
p<br />
C<br />
pk<br />
⎧ Cpo<br />
für μY<br />
< M<br />
⎪<br />
= ⎨Cp<br />
fürμY<br />
= M<br />
⎪<br />
⎩Cpu<br />
fürμY<br />
> M
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
191<br />
μY<br />
− Tu<br />
To<br />
− μY<br />
wobei Cpu<br />
= und Cpo<br />
= .<br />
3 ⋅ σY<br />
3 ⋅ σY<br />
Die Funktion C pk = C pk (µ Y , σ Y ) besitzt bezüglich der Argumentvariablen die Eigenschaften<br />
max<br />
C ( μY; σY) = C ( M; σY)<br />
= C<br />
μ ∈ R<br />
μ<br />
Y<br />
Y<br />
pk pk p<br />
lim<br />
C −∞<br />
→±∞<br />
pk ( μY; σY)<br />
und bzgl. der Variablen σ<br />
und<br />
⎧∞ für Tu<br />
< μY<br />
< To<br />
lim<br />
⎪<br />
C ( μY; σY) = ⎨0 fürμY = T oderμY<br />
= T<br />
σ → 0<br />
⎪<br />
⎩ −∞ für μY<br />
< Tu<br />
oder μY<br />
> T<br />
Y<br />
pk u o<br />
lim<br />
C =<br />
→∞<br />
pk ( μY; σY) 0.<br />
σ<br />
C pk > η, wenn der Streubereich [μ Y – 3 η σ Y ; μ Y + 3 η σ Y ] vollständig im Toleranzbereich<br />
[T u ; T o ] enthalten ist. Hieraus folgt, dass C pk > 1, wenn [μ Y – 3 σ Y ; μ Y + 3 σ Y ] vollständig in<br />
[T u ; T o ] liegt.<br />
Die partiellen Ableitungen von C pk nach µ Y und σ Y sind<br />
⎧ 1<br />
− für μY<br />
> M<br />
∂Cpk<br />
⎪ 3 σY<br />
= ⎨<br />
∂μY<br />
⎪<br />
1<br />
für μY<br />
< M<br />
⎪⎩ 3 σY<br />
∂C<br />
∂σ<br />
pk<br />
Y<br />
1<br />
=− C<br />
σ<br />
Y<br />
pk<br />
.<br />
Hiermit können die Elastizitäten berechnet werden Es gilt<br />
η σ<br />
∂Cpk<br />
Cpk<br />
( Cpk<br />
) = : = −1<br />
∂σ<br />
σ<br />
Y<br />
d. h. bzgl. σ Y ist C pk eine isoelastische Funktion.<br />
Y<br />
⎧ μ<br />
−<br />
Y<br />
∂Cpk<br />
Cpk<br />
⎪ Δ − μY<br />
− M<br />
ημ<br />
( Cpk<br />
) = : = ⎨<br />
∂μY<br />
μY<br />
⎪<br />
μ +<br />
Y<br />
⎪ ⎩ Δ − μY<br />
− M<br />
ist nicht eindeutig, so dass bzgl. µ Y keine Aussage über die Elastizität formuliert werden kann.<br />
Die Darstellung von C pk ist in der Abbildung 5.2.8 zu sehen.<br />
o
192 5 Qualität in der Fertigung<br />
4<br />
3<br />
2<br />
40<br />
20<br />
10<br />
0<br />
1<br />
0<br />
10<br />
20<br />
30<br />
Abb. 5.2.8: Darstellung des korrigierten Prozessfähigkeitsindexes<br />
Die Schätzfunktion für C pk ist<br />
Cˆ<br />
pk<br />
0.5 ( To<br />
− Tu)<br />
− Y − M<br />
= = (1 − k)<br />
Cˆ<br />
s<br />
3 Y<br />
p<br />
Die Verteilungsdichte für Ĉ pk ist recht kompliziert. Diese wurde von Chou, Owen [1989]<br />
abgeleitet. Hier soll auf die Wiederholung der Darstellung verzichtet werden, da deren Angabe<br />
keinen praktischen Nutzen zeigt.<br />
Prozessfähigkeitsindex C pm nach Taguchi<br />
Ausgangspunkt für diese Darstellung ist die Variabilität τ 2 von Y bzgl. des Sollwertes M, d. h. die<br />
Beziehung E [(Y – M) 2 ] = σ 2 Y + (µ Y – M) 2 =: τ 2 , in der σ 2 Y die Varianz um den Erwartungswert<br />
µ Y und der zweite Term den quadratischen Bias angibt. Da σ ≤ τ mit der Gleichheit nur für<br />
µ Y = M, gilt selbstverständlich C pm ≤ C p . Genauer kann man schreiben<br />
C pm = σ Y / τ C p .<br />
Die grafische Darstellung von C pm ist in der Abbildung 5.2.9 enthalten.<br />
Die beiden Graphen für C pk und C pm unterscheiden sich vor allem hinsichtlich der nichtlinearen<br />
Abhängigkeit des Indexes C pm von µ Y und σ Y .
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
193<br />
2<br />
1.5<br />
1<br />
30<br />
40<br />
20<br />
10<br />
10<br />
0.5<br />
0 0<br />
Abb. 5.2.9: Darstellung des Prozessfähigkeitsindexes nach Taguchi<br />
20<br />
5.2.1.7 Was sind multivariate Prozessfähigkeitsindizes?<br />
Problem<br />
Ein Prozess wird fähig genannt, wenn er konsequent Produkte produziert, dessen Produktvariablen<br />
innerhalb des Spezifikationsbereiches liegen. Ein Produkt wird durch m, m ≥ 1 nicht<br />
unabhängige Produktvariable Y 1 , …, Y m beschrieben. Der rechteckige Spezifikations- oder<br />
Toleranzbereich ist<br />
m<br />
TB : = { Y : Y ∈R<br />
und Y ∈ [ T , T ] für j = 1, …, m}.<br />
j u, j o, j<br />
Manchmal ist TB durch ein Hyperellipsoid oder ein anderes Gebilde spezifiziert.<br />
Ein Maß für die Fähigkeit des Prozesses, der aufgrund aller relevanten, nicht unabhängigen<br />
Produktvariablen beurteilt werden soll, wird multivariater Prozessfähigkeitsindex genannt und<br />
mit MC p (einfacher) bzw. MC pk (korrigierter) bezeichnet. Das Problem besteht nun darin,<br />
die multivariaten Prozessfähigkeitsindizes zu bestimmen und Entscheidungen aufgrund der<br />
multivariaten Prozessfähigkeitsindizes zu treffen.<br />
Sind die Entscheidungsmöglichkeiten analog denen der univariaten Prozessfähigkeitsindizes?<br />
In der neueren Literatur gibt es einige Ansätze für multivariate Prozessfähigkeitsindizes, so wie<br />
diese in den Arbeiten von Chan, Chen, Spiring [1988], Taam et al. [1993], Wang et al. [2000],<br />
Jahn [1997].<br />
Die Notwendigkeit für die Ableitung von Formeln soll an Beispielen mit unterschiedlicher<br />
Abhängigkeitsstruktur betrachtet werden.
194 5 Qualität in der Fertigung<br />
Beispiel 5.2.8: Simulationen. Maßzahlen und univariate Fähigkeiten<br />
Es wird der zweidimensionale Fall mit den beiden Produktvariablen Y 1 und Y 2 betrachtet.<br />
Der Y sei normal verteilt mit dem Vektor der Erwartungswerte µ T = (µ 1 , µ 2 ) und der<br />
Kovarianzmatrix<br />
Σ<br />
YY<br />
⎛<br />
2<br />
σ ⎞<br />
1 σ12<br />
= ⎜<br />
2<br />
⎟.<br />
⎝ σ ⎠<br />
2<br />
Die Sollwerte seien M T = (5.0, 5.0),<br />
und die unteren und oberen Toleranzgrenzen seien<br />
T o T = (7.5, 7.5)<br />
T u T = (2.5, 2.5).<br />
Für die beiden Fälle werden Stichproben mit den sehr großen Stichprobenumfängen<br />
N 1 = N 2 = 5000 simuliert.<br />
Für den unkorrelierter Fall erhält man die Schätzungen r 12 = –0.0078,<br />
S YY<br />
⎛0.6261 −0.0053 ⎞<br />
= ⎜<br />
⎝<br />
⎟,<br />
0.7395 ⎠<br />
und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.5.<br />
Tabelle 5.2.5: Univariate Prozessfähigkeitsindizes für den unkorrelierten Fall<br />
T u T o Mittel Stdabw. C p k C pk<br />
Y 1 2,5 7,5 5,505 0,7913 1,053 0,202 0,8401<br />
Y 2 2,5 7,5 4,288 0,86 0,969 0,2846 0,6933<br />
Für den extrem hoch korrelierten Fall erhält man die Schätzungen r 12 = 0.9987,<br />
S YY<br />
⎛0.6591 0.70827 ⎞<br />
= ⎜<br />
⎝<br />
⎟,<br />
0.76344⎠<br />
und die univariaten Prozessfähigkeitsindizes der Tabelle 5.2.6.<br />
Tabelle 5.2.6: Univariate Prozessfähigkeitsindizes für den hoch korrelierten Fall<br />
T u T o Mittel Stdabw. C p k C pk<br />
Y 1 2,5 7,5 5,4904 0,8122 1,0261 0,1962 0,8248<br />
Y 2 2,5 7,5 4,2899 0,8732 0,9544 0,2841 0,6833<br />
Aus den Tabellen liest man ab, dass sich die statistischen Maßzahlen für den unkorrelierten<br />
und hoch korrelierten Fall im statistischen Sinne nicht unterscheiden und die Kovarianzmatrizen<br />
und damit natürlich die Korrelationsmatrizen sich wesentlich unterscheiden.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
195<br />
Sind der unkorrelierte und hoch korrelierte Fall aber bzgl. der simultanen Erfüllung der<br />
Kundenanforderungen beider Produktvariablen als gleich anzusehen?<br />
Zur Beantwortung dieser Frage müssen weitere Charakteristika berechnet werden. Zu diesen<br />
zählen die Eigenwerte, die Längen der Hauptachsen der Streuungsellipsen, in deren Inneren<br />
alle Punkte (Y i1 , Y i2 ), i = 1, …, N mit der Wahrscheinlichkeit 1 – α = 0.0027 liegen und die<br />
Projektionen der Hauptachsen auf die Achsen der Produktvariablen.<br />
Längen der Hauptachsen der Ellipse :<br />
Für die Kovarianzmatrix Σ YY können wir die Eigenwerte über die charakteristische Gleichung<br />
det(S YY – λ I) = 0,<br />
d. h.<br />
2<br />
1 s12<br />
2<br />
21 s2<br />
s − λ<br />
s<br />
− λ<br />
= 0<br />
berechnen.<br />
Wir erhalten die quadratische Gleichung<br />
2 2 2 2 2 2 2 2 2<br />
1 − λ 2 − λ − 12 = λ − λ 1 + 2 + 1 2 − 12<br />
2<br />
λ λ Sp SYY<br />
SYY<br />
( s )( s ) s ( s s ) ( s s s )<br />
= − ⋅ ( ) + det( ) = 0<br />
Beispiel 5.2.9: Simulationen. Eigenwerte und Längen der Hauptachsen<br />
Hieraus können wir für beide Fälle die Eigenwerte für den<br />
unkorrelierten Fall<br />
λ 1 = 0.73975 und λ 2 = 0.62585 und den<br />
hoch korrelierten Fall<br />
λ 1 = 1.42092 und λ 2 = 0.0006178<br />
berechnen.<br />
Die Eigenwerte unterscheiden sich wesentlich.<br />
Mit den Eigenwerten können wir die Längen der Hauptachsen der Streuungsellipsen nach<br />
der Formel<br />
L<br />
j<br />
= 2 λ ⋅c,<br />
j<br />
berechnen, wobei<br />
c<br />
=−2⋅ln(2⋅π<br />
⋅h<br />
⋅ 1 −ρ12<br />
2 ).<br />
Die maximale Höhe h max der Vd ist Φ (0, 0). Die Höhe der Vd für eine vorgegebene Wahrscheinlichkeit<br />
α ist<br />
1 1<br />
h α = 0.0027 = = = 0.083367<br />
2π det( Σ YY ) 11.995087
196 5 Qualität in der Fertigung<br />
Hieraus folgt<br />
c<br />
2 π ⋅0.0027 ⋅ det( ΣYY<br />
)<br />
=−2⋅ln(2⋅π<br />
⋅ h0.0027<br />
det( ΣYY<br />
) =−2ln<br />
2π<br />
det( Σ )<br />
2<br />
1 −α,<br />
m<br />
=− 2 ln( α) =− 2 ln(0.0027) = 11.82973 = χ .<br />
YY<br />
Die Längen der Hauptachsen der Ellipsen für die beiden Fälle sind<br />
L<br />
L<br />
1,unkorr<br />
2,unkorr<br />
= 0.73975 ⋅ 11.82973 = 2 ⋅ 2.95822 = 5.9164<br />
= 0.62585 ⋅ 11.82973 = 2 ⋅ 2.72096 = 5.4419<br />
und<br />
L<br />
L<br />
1,hochkorr<br />
2,hochkorr<br />
= 2 ⋅ 1.42092 ⋅ 11.82973 = 2 ⋅ 4.09989 = 8.19978,<br />
= 2 ⋅ 0.0006178 ⋅ 11.82973 = 2 ⋅ 0.08548 = 0.17097<br />
Die Projektionen der ersten beiden Hauptachsen auf die Koordinaten- (Toleranz-) Achsen<br />
ergibt<br />
P 1 = 4.18<br />
P 2 = 5.798.<br />
Die Flächeninhalte der beiden Ellipsen sind<br />
für den unkorrelierten Fall F unkorr = 25.287 und<br />
für den hoch korrelierten Fall F hoch korr = 1.101.<br />
Aus dem Beispiel 5.2.9 erkennt man, dass im Falle der Unkorreliertheit die Ellipse im Toleranzgebiet<br />
liegen würde, wenn die Abweichung zwischen den Soll- und Mittelwerten klein<br />
genug wäre.<br />
Im Falle der starken Korreliertheit ragt die Ellipse auch für den Fall kleiner Abweichungen<br />
zwischen den Soll- und Mittelwerten über das Toleranzgebiet hinaus.<br />
Das bedeutet aber, dass in dem unkorrelierten Fall der Prozess hinsichtlich des<br />
Streuungsverhaltens fähig und im korrelierten Fall nicht fähig ist.<br />
Dieses Verhalten wird durch die univariaten Prozessfähigkeitsindizes nicht wider gespiegelt.<br />
Daher ist die Verallgemeinerung der uni- auf die multivariaten Prozessfähigkeitsindizes notwendig.<br />
Die nachfolgende Abbildung verdeutlich diesen Schluss geometrisch.<br />
In Abbildung 5.2.10. werden die beiden Grundflächen der schwach und hochkorrelierten<br />
Verteilung in einer Grafik in Bezug auf den<br />
•<br />
•<br />
gemeinsamen Sollzustand (M T = (5; 5) und T T = (T o,1 – T u,1 ; T o,2 – T u,2 ) = (5; 5) und<br />
T<br />
den Mittelpunkt Y = ( Y 1 Y 2 ) dargestellt.<br />
Wir können aus dieser Abbildung folgende Sachverhalte ablesen:<br />
1. Für den unkorrelierten Fall liegt die Streuungsellipse in Sollwertlage, d. h. mit dem Mittelpunkt<br />
M vollständig innerhalb des Toleranzrechteckes mit den Diagonalen der Länge<br />
7.071.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
197<br />
T o2 = 7,5<br />
M 2 = 5<br />
Y2<br />
T u,2 = 2,5<br />
T u.1 = 2,5 M 1 = 5<br />
Y1<br />
T 0,1 = 7,5<br />
Abb. 5.2.10: Streuungsellipsen für den schwach und hoch korrelierten Fall im Toleranzgebiet<br />
2. Die Streuungsellipse für den hoch korrelierten Fall ragt auch in der Sollwertlage über das<br />
Toleranzgebiet hinaus.<br />
3. Die Streuungsellipsen in Mittelwertlage ragen in beiden Fällen über die Toleranzgrenzen<br />
hinaus, d. h. die zu beiden Verteilungen gehörenden Prozesse liefern Ausschuss. Die Prozesse<br />
sind nicht fähig.<br />
Diese Abbildung wird durch die Streuungsellipsen der Abbildung 5.2.11 und Abbildung 5.2.12<br />
für den unkorrelierten und hoch korrelierten Fall bestätigt.<br />
Die Abbildungen bestätigen die obigen Aussagen, dass mit größer werdenden Korrelationskoeffizienten<br />
der Anteil der Punkte außerhalb des Toleranzgebietes größer wird und dass<br />
dadurch die multivariaten Prozessfähigkeitsindizes kleiner werden und deren Berechnung<br />
notwendig ist.<br />
8<br />
6<br />
4<br />
Y2<br />
2<br />
0<br />
2 3 4 5 6 7 8<br />
Y1<br />
Abb. 5.2.11: Streudiagramm für den unkorrelierten Fall
198 5 Qualität in der Fertigung<br />
8<br />
6<br />
4<br />
Y2<br />
2<br />
0<br />
2 3 4 5 6 7 8<br />
Y1<br />
Abb. 5.2.12: Streudiagramm für den hoch korrelierten Fall<br />
Vor der Ableitung neuer multivariater Prozessfähigkeitsindizes (multivariate process capability<br />
indices) MC p und MC pk werden die folgenden Voraussetzungen und Anforderungen gestellt:<br />
• Die Produktivität eines Unternehmens ist wesentlich von dem Niveau der im Unternehmen<br />
angewendeten Methoden für die Strukturierung des Unternehmens, die statistische Prozessanalyse<br />
und die Entscheidungsfindung für die Prozessverbesserung, die Tolerierung oder<br />
Überprüfung der Toleranzen mit multivariaten statistischen Methoden auf der Grundlage<br />
der Prozessfähigkeiten abhängig.<br />
• Jedes Produkt wird durch mehrere (m ≥ 1) Produktvariablen Y 1 , …, Y m beschrieben. Die<br />
Produktvariablen sind nicht unabhängig voneinander.<br />
Der Sollzustand wird durch<br />
•<br />
•<br />
den Vektor der Sollwerte M T = (M 1 , …, M m ) und<br />
die Vektoren der Toleranzgrenzen T T o = (T o1 , …, T om ) und TT u = (T u1 , …, T um )<br />
und der Istzustand durch<br />
•<br />
•<br />
den Vektor der Mittelwerte Y = ( Y 1 … Y m ) und<br />
die positiv definite Stichprobenkovarianzmatrix S YY<br />
T<br />
beschrieben.<br />
Was ist Qualität? (Wir müss en hier von Produktqualität sprechen)<br />
Die Qualität eines Produktes wird durch die simultane Erfüllung aller relevanten Kundenanforderungen<br />
definiert. Für den Vergleich ist es notwendig, dass<br />
• die relevanten Kundenanforderungen unter Beachtung der Abhängigkeitsstruktur zwischen<br />
den Produktvariablen durch Sollwerte und Toleranzgrenzen spezifiziert werden müssen.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
199<br />
• Zum anderen ist es ebenfalls notwendig, den Istzustand für alle relevanten, nicht unabhängigen<br />
Produktvariablen durch die m-dimensionale Häufigkeitsverteilung, bzw. durch die<br />
Angabe des Mittelwertvektors und der Stichprobenkovarianzmatrix S YY zu erfassen.<br />
• Über den Vergleich von Soll- und Istzustand muss die Qualität quantifiziert werden, um<br />
sinnvolle Entscheidungen treffen zu können.<br />
Die multivariaten Prozessfähigkeitsindizes quantifizieren die Qualität<br />
• Der Vektor der Produktvariable Y sei entweder<br />
gemeinsam normal verteilt, d. h. Y ~ N m (µ, Σ YY ), Σ YY > 0<br />
oder die gemeinsame Verteilung gehört zur Klasse der elliptisch umrissenen Verteilungen.<br />
• Die multivariaten Prozessfähigkeitsindizes sollen Eigenschaften haben, die analog zu denen<br />
der univariaten Prozessfähigkeitsindizes sind. Insbesondere sollen die multivariaten<br />
Prozessfähigkeitsindizes als Entscheidungsgrundlage für<br />
–<br />
–<br />
–<br />
die Prozessverbesserung im Sinne der Reduktion der Variabilität der Produktvariable,<br />
falls MC p < 1,<br />
der Justierung des Prozesses, falls MC p > 1 und MC pk < 1,<br />
der Überprüfung oder Neuberechnung der Toleranzgrenzen, falls MC p < 1 und die<br />
Differenz zwischen MC p und MC pk sehr groß ist,<br />
dienen.<br />
–<br />
–<br />
–<br />
–<br />
–<br />
–<br />
–<br />
–<br />
Der multivariate Prozessfähigkeitsindex MC p , der das Streuverhalten des zufälligen Vektors<br />
der Produktvariablen im Vergleich zum Toleranzbereich beurteilt, muss 1 sein, falls<br />
das Streuungsellipsoid den Toleranzbereich an allen Koordinatenebenen berührt,<br />
MC pk ≤ MC p für K ≥ 0.<br />
K ist nichtlinear von Y − M abhängig,<br />
die Form des Ellipsoids oder Hyperellipsoids der Realisierungen des Vektors der Produktvariablen<br />
ist vom Grad der Multikollinearität δ =<br />
1<br />
abhängig.<br />
Je größer der Grad der Multikollinearität ist, desto kleiner wird die kleinste Hauptachse<br />
des Hyperellipsoides.<br />
MC p muss folglich ebenfalls von δ abhängen.<br />
MC p soll für verschiedene Toleranzbereiche<br />
m<br />
· unabhängige Spezifikationsbereiche ( T − T )<br />
∏ oj<br />
uj<br />
j=<br />
1<br />
R YY<br />
· abhängige Spezifikationsbereiche (T o – M) T A (T o – M)<br />
gelten.<br />
Sind die Produktvariablen unabhängig voneinander, kann die Benferoni Ungleichung angewandt<br />
werden, um sicher zustellen, dass dieselbe Wahrscheinlichkeit α für alle Produktvariablen<br />
gilt. Außerdem kann in diesem Fall die multivariate Prozessfähigkeit durch das Produkt über<br />
alle Prozessfähigkeiten für jeden Produktvariable<br />
m<br />
MPC′ = ∏C<br />
p p, j<br />
j=<br />
1<br />
abgeschätzt werden.
200 5 Qualität in der Fertigung<br />
Sind die Produktvariablen nicht unabhängig voneinander, dann sind sie korreliert. Die<br />
Abhängigkeitsstruktur zwischen den Produktvariablen, ausgedrückt durch die Korrelationsoder<br />
Kovarianzmatrix, muss berechnet werden. In diesen Fällen liefern die Produkte über die<br />
einfachen Prozessfähigkeitsindizes unsinnige Ergebnisse.<br />
Was müssen wir tun, um im multivariaten Fall den Soll- mit dem Istzustand vergleichen zu<br />
können?<br />
Im univariaten Fall haben wir Intervalle (Breite des Toleranzintervalls und Breite der Häufigkeitsverteilung)<br />
miteinander verglichen.<br />
Im zweidimensionalen Fall könnten wir Flächen – die Streuungsellipse und den Toleranzbereich<br />
– miteinander vergleichen. Das hieße, dass wir im m-dimensionalen Fall Volumen<br />
vergleichen müssten.<br />
Welche Zahl können wir für m = 2 einer Fläche zuordnen?<br />
Die Flächeninhalte des Kreises und der Ellipse mit dem Flächeninhalt des Toleranzbereiches<br />
zu vergleichen, ergäbe für den unkorrelierten Fall den Wert<br />
Toleranzbereich 25<br />
= =<br />
Streuungsbereich 25.287<br />
und für den hoch korrelierten Fall<br />
Toleranzbereich 25<br />
= =<br />
Streuungsbereich 1.101<br />
0.988<br />
22.706.<br />
Dieser Vergleich macht keinen Sinn, denn die Abbildungen 5.14 und 5.15 zeigen, dass<br />
•<br />
•<br />
•<br />
Die „Ecken“ des Toleranzbereiches durch den Prozess nicht belegt werden können,<br />
der Streuungskreis für den unkorrelierten Fall und<br />
die Streuungsellipse für den hoch korrelierten Fall<br />
über die Toleranzgrenzen hinausragen.<br />
An dieser Stelle möchte ich Ihnen die Frage stellen, warum sind Schießscheiben rund?<br />
Natürlich weil die Trefferbilder eines jeden Schießgerätes kreisförmig umrissen sind. Die Ecke<br />
eines rechteckigen Zielgebietes zu treffen ist genauso schwierig, wie in das Zentrum zu treffen,<br />
ja man kann sagen, jeder Eckpunkt ist der Mittelpunkt eines Vierteilkreises. Da der Flächenvergleich<br />
kein Ergebnis liefert, müssen wir uns etwas anderes überlegen.<br />
Wir können die Definition des univariaten Prozessfähigkeitsindex auch anders interpretieren,<br />
indem wir fragen, wie groß ist der Abstand zwischen der oberen und unteren Toleranzgrenze<br />
relativ zur Standardabweichung der betrachteten Produktvariablen?<br />
Das würde bedeuten, dass wir die Abstände zwischen Punkten in beliebig dimensionalen Räumen<br />
unter Beachtung der Abhängigkeitsstruktur zwischen den Produktvariablen betrachten<br />
und nach passenden Abstandsdefinitionen suchen.<br />
Im Kapitel 10 über die Klassifikationsverfahren, speziell bei der Einführung der Clusteranalyse,<br />
werden einige Abstandsdefinitionen eingeführt und betrachtet. Der für die Ableitung der<br />
multivariaten Prozessfähigkeitsindizes passende Abstandsbegriff ist der
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
201<br />
Mahalanobis Abstand<br />
Der gewichtete A bstand zwischen den beiden Vektoren z. B. Y 1 und Y 2 mit den Gewichten, die<br />
durch die inversen Kovarianzmatrix geliefert werden, ist durch<br />
T<br />
1 2 1 2<br />
T −1<br />
1 2 ΣYY<br />
1 2<br />
D = ( Y − Y ) A( Y − Y )<br />
= ( Y − Y ) ⋅ ⋅( Y − Y )<br />
definiert, wobei die Gewichtsmatrix A durch die inverse Kovarianzmatrix ersetzt wird. Ist<br />
Σ YY unbekannt, so wird sie durch die Stichprobenkovarianzmatrix S YY ersetzt. Sind die Stichprobenkovarianzmatrizen<br />
von Y 1 und Y 2 verschieden, so kann man S YY durch die gemittelte<br />
(pooled) Kovarianzmatrix ersetzen.<br />
Nehmen wir wie oben an, dass der zufällige Vektor Y der Produktvariablen Y 1 , …, Y m m-dimensional<br />
normal verteilt ist, dann hat er die Verteilungsdichte<br />
1 ⎧ 1<br />
⎫<br />
f ( y; , ) exp ( Y ) ( Y ) ⎬,<br />
⎭<br />
T −1<br />
Y μΣ = ⋅ ⎨− − μY ⋅ΣYY ⋅ − μ<br />
m<br />
Y<br />
1 ⎩ 2<br />
(2 π)<br />
2 ⋅ ΣYY<br />
2<br />
wobei Σ YY eine positiv definite Kovarianzmatrix ist. Diesen Sachverhalt kürzen wir durch<br />
Σ YY > 0 ab. In dieser Darstellung erkennen wir, dass die quadratische Form im Exponenten<br />
der m-dimensionalen Normalverteilung mit den Abweichungen der Messwertvektoren Y i vom<br />
T −1<br />
i YY i<br />
Erwartungswertvektor µ genau ein Mahalanobis Abstand D = ( Y − μ) Σ ( Y − μ ) ist, der<br />
den „gewichteten“ Abstand einer Zufallsgröße Y i von ihrem Erwartungswert misst.<br />
Das wollen wir uns für die Definition der multivariaten Prozessfähigkeitsindizes zunutze<br />
machen.<br />
Neue Definition der multivariaten Prozessfähigkeitsindizes<br />
Beim Übergang von d en univariaten zu den multivariaten Prozessfähigkeitsindizes müssen<br />
wir anmerken, dass sich von Stichprobe zu Stichprobe mit den Vektoren der Einzelwerte<br />
Y i , i = 1, …, N auch die Vektoren der Mittelwerte Y und die Stichprobenkovarianzmatrizen<br />
ändern können. Die einzige nahezu unveränderliche „Größe“ ist die Korrelationsmatrix für<br />
die Produktvariablen.<br />
Bedingte Prozessfähigkeitsindizes<br />
Infolgedessen suchen wir den mit der Stichprobenkovarianzmatrix gewichteten Abstand<br />
zwischen dem Vektor der Abweichungen des Einzelwertes Y i vom Vektor der Mittelwerte. Das<br />
wäre der mittlere Mahalanobis Abstand<br />
1<br />
N<br />
N<br />
∑<br />
i=<br />
1<br />
Nun gilt aber<br />
T −1<br />
i − SYY i<br />
( Y Y) ( Y − Y).<br />
⎡ ⎛<br />
N<br />
−<br />
⎞⎤<br />
⎧<br />
N<br />
E 1 1 1<br />
−<br />
⎫<br />
⎢ ⎜ − − ⎟⎥ = ⎨ ⎡<br />
1<br />
Sp ∑ ( ∑ − − ⎤<br />
⎣ ⎦⎬<br />
⎢⎣<br />
⎝<br />
Y T<br />
T<br />
i Y ) SYY ( i ) Sp YY ( i )( i )<br />
N<br />
Y Y i= 1 ⎠⎥⎦<br />
⎩N<br />
E S Y Y Y Y<br />
i=<br />
1<br />
⎭<br />
n<br />
= = const<br />
N
202 5 Qualität in der Fertigung<br />
Zudem muss dieser Abstand relativ zu dem gewichteten Abstand zwischen den Vektoren der<br />
oberen Toleranzgrenzen und den Sollwerten<br />
−1<br />
YY<br />
( T − M) S ( T − M)<br />
o<br />
T<br />
o<br />
betrachtet werden.<br />
Dieser Abstand kann auch mit dem Spurkriterium in den Ausdruck<br />
⎡ m ( T − ⎤<br />
−1 ⎡<br />
−1<br />
o, j M )<br />
T<br />
T<br />
j<br />
( T − − = − − ⎤<br />
o M) SYY<br />
( To M) Sp<br />
⎣<br />
( To M)( To<br />
M)<br />
SYY<br />
⎦<br />
= ⎢∑<br />
⎥<br />
⎢⎣j<br />
= 1<br />
Sj/<br />
m−<br />
j ⎥⎦<br />
umgeformt werden. Die Summanden dieser Summe sehen aus wie die einfachen Prozessfähigkeitsindizes<br />
mit den bedingten anstelle der einfachen Standardabweichungen. Für die einzelnen<br />
Produktvariablen kann die Formel<br />
( To, j − Tu,<br />
j)<br />
MCp() j = , ∀ j = 1, …,<br />
m<br />
6 ⋅ S<br />
j/<br />
m−<br />
j<br />
als einfacher bedingter oder multivariater Prozessfähigkeitsindex für die j-te Produktvariable<br />
verwendet werden. Der Korrekturterm für die Messung der Abweichung des Mittelwertes vom<br />
Sollwert ist<br />
Mj − E( Yj / Ym−<br />
j)<br />
kj<br />
= 2 , ∀ j = 1, …, m.<br />
T − T<br />
o, j u, j<br />
Der korrigierte bedingte (oder multivariate) Prozessfähigkeitsindex für die j-te Produktvariable<br />
ist<br />
MC () j = [1 − k MC ()]. j<br />
pk<br />
j<br />
p<br />
Die bedingten Prozessfähigkeitsindizes hängen noch über die bedingte Varianz von der Kovarianzmatrix<br />
ab. Daher ist es sinnvoll, noch ein globales Maß für die multivariate Prozessfähigkeit<br />
auszurechnen.<br />
Multivariate Prozessfähigkeitsindizes<br />
Wir gehen wieder vom univariaten Prozessfähigkeitsindex C p aus und schreiben den in der<br />
Form<br />
To<br />
− Tu<br />
1 1<br />
Cp<br />
= ⋅ = σ*<br />
6 S S<br />
wobei<br />
T<br />
o<br />
− T<br />
6<br />
u<br />
= σ*<br />
die maximale Streuung für die Produktvariable ist, die garantiert, dass die Häufigkeitsverteilung<br />
für die Werte der Produktvariablen innerhalb des Toleranzintervalls liegt. Ist S > σ*, dann ist<br />
C p < 1. Diesen Ausdruck für C p wollen wir auf den multivariaten Fall verallgemeinern.<br />
Eine Möglichkeit der Verallgemeinerung wäre die Bildung des verallgemeinerten Varianzquotienten<br />
* −1<br />
( Σ S ).<br />
YY<br />
YY<br />
2
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
203<br />
Dieser Ausdruck oder gewisse Funktionale davon scheinen nicht geeignet zu sein. Daher wählen<br />
wir für den multivariaten Prozessfähigkeitsindex den Quotient zweier quadratischer Formen.<br />
Die quadratische Form im Zähler ist die schon betrachtete<br />
−1<br />
YY<br />
( T − M) S ( T − M).<br />
o<br />
T<br />
o<br />
Die im Nenner stehende zweite quadratische Form wird mit der so genannten „theoretischen“<br />
*<br />
*<br />
Kovarianzmatrix Σ YY anstelle der Stichprobenkovarianzmatrix S YY gebildet. Σ YY wird aus der<br />
Korrelationsmatrix, den Toleranzgrenzen und Sollwerten für alle m Produktvariablen berechnet.<br />
Mit diesen Überlegungen erhält man für die Vektoren der oberen Toleranzgrenzen<br />
T<br />
o o,1 o, m<br />
T = ( T … T )<br />
und der Sollwerte<br />
T<br />
den Ausdruck<br />
wobei<br />
M = ( M 1 … M m )<br />
MC<br />
Σ<br />
T -1<br />
o − SYY o −<br />
p =<br />
T * −1<br />
o − ΣYY<br />
o<br />
( T M) ( T M)<br />
( T M) ( ) ( T − M)<br />
⎛ − ⎞ ⎛ − ⎞<br />
= diag ⎜ T M ⎝<br />
⎟ R diag<br />
⎠<br />
⎜ T M<br />
YY<br />
⎝<br />
⎟<br />
3 3 ⎠<br />
* o o<br />
YY<br />
die theoretische Kovarianzmatrix und R YY die Korrelationsmatrix des Vektors Y T = (Y 1 , …, Y m )<br />
der m, m ≥ 1 Produktvariablen ist.<br />
Für schiefsymmetrische Toleranzgrenzen verwendet man<br />
MC<br />
T −1<br />
o o − SYY<br />
o −<br />
p =<br />
T * −1<br />
o − ΣYY<br />
o<br />
( T M) ( T M)<br />
( T M) ( ) ( T − M)<br />
MC<br />
T −1<br />
u ( M − Tu) SYY<br />
( M − Tu)<br />
p =<br />
T * −1<br />
M − Tu<br />
ΣYY<br />
M − Tu<br />
( ) ( ) ( )<br />
Der Korrekturterm wird nach der Formel<br />
MC<br />
T −1<br />
u − u SYY<br />
p =<br />
T * −1<br />
− u ΣYY<br />
( M T ) ( M − Tu<br />
)<br />
( M T ) ( ) ( M − T )<br />
berechnet. Damit wir der korrigierte multivariate Prozessfähigkeitsindex<br />
MCpk = MCp / K<br />
berechnet.<br />
Die Entscheidung wird entsprechend den Größen von MC p und MC pk vorgenommen.<br />
u
204 5 Qualität in der Fertigung<br />
Daten<br />
T u 2<br />
T u 2<br />
T u 2<br />
M 2<br />
M 2<br />
M 2<br />
T l 2<br />
Y 2<br />
T l 1 M 1 T u 1 Y 1<br />
T l 2<br />
Y 2<br />
T l 1 M 1 T u 1 Y 1<br />
T l 2<br />
Y 2<br />
T l 1 M 1 T u 1 Y 1<br />
MC p < 1 MC p > 1 MC p > 1<br />
MC pk < 1 MC pk < 1 MC pk >1<br />
Prozessverbesserung<br />
Kontrolle des Prozesses<br />
Reduktion der<br />
Variation<br />
Justierung des<br />
Prozesses<br />
Abb. 5.2.13: Entscheidungen aufgrund der multivariaten Prozessfähigkeitsindizes<br />
Gilt MC p < 1 (bzw. 1.33), dann ragt die multivariate Häufigkeitsverteilung der Produktvariablen<br />
an einer, mehreren oder allen Rändern über den Toleranzbereich hinaus. Ausschuss wird<br />
produziert. Der Prozess muss so verbessert werden, dass die Variabilität der Produktvariablen<br />
kleiner wird. Das kann nur über die Steuerung des Prozesses mit den Sollwerten und Toleranzgrenzen<br />
als Zielwerte für die Produktvariablen erreicht werden. In diesem Fall ist auch<br />
MC pk < 1, da K > 0 ist.<br />
Gilt MC p > 1 (bzw. 1.33) und MC pk < 1 (bzw. 1.33), dann weicht der Vektor der Mittelwerte<br />
zu stark vom Vektor der Sollwerte ab. Die multivariate Häufigkeitsverteilung der Produktvariablen<br />
kann über den Toleranzbereich hinausragen. Das bedeutet aber, dass trotz MC p > 1<br />
(bzw. > 1.33) Ausschuss produziert wird. Der Prozess muss verbessert werden, so dass die<br />
Mittel- und Sollwerte übereinstimmen.<br />
Gelten sowohl MC p > 1 und MC pk > 1 (bzw. > 1.33), dann ist der Prozess fähig, Produkte<br />
mit den durch Sollwerte und Toleranzgrenzen vorgegebenen Eigenschaften zu produzieren.<br />
In diesem Fall muss der Prozess mit den multivariaten Kontrollkarten des Kapitels 6 ständig<br />
überwacht werden. Die Entscheidungen werden durch die Abbildung 5.2.13 visualisiert.<br />
Was besagen die Begriffe Produktqualität, Lieferantenqualität und Prozessqualität?<br />
Die bedingten und multivariaten Prozessf ähigkeitsindizes sind auf die Produkte, die Inputoder<br />
Lieferantenprodukte und die Prozesse anwendbar. In jedem Falle müssen die Sollzustände,<br />
ausgedrückt durch Sollwerte und Toleranzgrenzen, für die nicht unabhängigen Variablen mit<br />
den Istzuständen, ausgedrückt durch die Schätzungen für die Mittelwertvektoren und Kovarianzmatrizen,<br />
verglichen werden.<br />
Für die Anwendung der multivariaten Prozessfähigkeitsindizes MC p und MC pk auf die Produkte,<br />
Prozesse und Lieferantenprodukte wollen wir die folgenden Bezeichnungen einführen.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
205<br />
•<br />
•<br />
•<br />
•<br />
•<br />
PC p und PC pk werden für die Messung der simultanen Erfüllung aller relevanten Kundenanforderungen<br />
verwendet. Diese Fähigkeitsindices wollen wir Produktfähigkeiten nennen.<br />
Die Produktfähigkeit PC pk misst die Produktqualität.<br />
LC p und LC pk werden für die Beurteilung der Input- oder Lieferantenprodukte verwendet.<br />
Die Lieferantenfähigkeit LC pk misst die Lieferantenqualität.<br />
ProzC p und ProzC pk wollen wir für die Beurteilung der Prozesse verwenden.<br />
Die Prozessfähigkeit ProzC pk misst die Prozessqualität.<br />
Die Lieferanten- und Prozessqualität sind die notwendigen Voraussetzungen für die Produktqualität.<br />
Mitunter, wenn keine Verwechslungen möglich sind, werden aber die übergeordneten Bezeichnungen<br />
MC p und MC pk verwendet.<br />
An mehreren Beispielen wollen wir jetzt demonstrieren, wie die multivariaten Prozessfähigkeitsindizes<br />
zu interpretieren sind.<br />
Beispiel 5.2.10: Demonstrationsbeispiel. Multivariate Fähigkeiten<br />
Für fünf Produktvariable mit den Sollwerten und Toleranzgrenzen der folgenden Tabelle<br />
Tabelle 5.2.7: Sollzustand Demonstrationsbeispiel<br />
Produktvariable Sollwert untere<br />
Toleranzgrenze<br />
obere<br />
Toleranzgrenze<br />
Y 1 7,5 5,7 9,3<br />
Y 3 128 113 143<br />
Y 3 65 56 74<br />
Y 4 1,2 1,05 1,35<br />
Y 5 1,8 0,3 3,3<br />
und eine gegebene Korrelationsmatrix R YY wurden zwei Stichproben erzeugt.<br />
Die Stichprobenkovarianzmatrix der einen Stichprobe ist<br />
S YY<br />
und die der zweiten<br />
S YY<br />
⎛0,502067 3,042725 0,546106 0,0160155 0,147379 ⎞<br />
⎜<br />
29,794251 3,073832 0,140759 1,768678 ⎟<br />
⎜<br />
⎟<br />
(1) = ⎜ 11,653298 0,127856 0,991572 ⎟<br />
⎜<br />
0,0021438 0,0153684⎟<br />
⎜<br />
⎟<br />
⎝<br />
0,185228 ⎠<br />
⎛0,346178 2,356153 0,481964 0,014896 0,161749 ⎞<br />
⎜<br />
26,378731 3,025746 0,147258 2,095516⎟<br />
⎜<br />
⎟<br />
(2) = ⎜ 9,128812 0,122732 1,047801⎟.<br />
⎜<br />
0,0025146 0,020078⎟<br />
⎜<br />
⎟<br />
⎝<br />
0,268881⎠
206 5 Qualität in der Fertigung<br />
Die theoretische Kovarianzmatrix ist<br />
*<br />
Σ YY<br />
⎛0,36 2,360133 0,40639 0,014645 0,144981 ⎞<br />
⎜ 25 2,47446 0,139237 1,882212⎟<br />
⎜<br />
⎟<br />
= ⎜ 9 0,121336 1,012367 ⎟.<br />
⎜<br />
0,0025 0,01928 ⎟<br />
⎜<br />
⎟<br />
⎝<br />
0,25 ⎠<br />
*<br />
Sie sehen, die Stichprobenkovarianzmatrix S YY (2) unterscheidet sich von Σ YY sehr viel<br />
weniger als S YY (1). Folglich müssen die multivariaten Prozessfähigkeitsindizes der zweiten<br />
Stichprobe in der Nähe von 1 liegen und die der 1. Stichprobe kleiner sein. Die Prozessfähigkeitsindizes<br />
der ersten Stichprobe sind<br />
Tabelle 5.2.8: Fähigkeiten der Stichprobe 1<br />
Univariate Capabilities:<br />
LSL USL Mean Stdv C p k C pk<br />
Y 1 5.70 9.30 7.8634 0.7086 0.8468 0.2019 0.6758<br />
Y 2 113.00 143.00 129.6605 5.4584 0.9160 0.1107 0.8146<br />
Y 3 56.00 74.00 64.8889 3.4137 0.8788 0.0123 0.8680<br />
Y 4 1.05 1.35 1.2015 0.0463 1.0799 0.0102 1.0689<br />
Y 5 0.30 3.30 1.8390 0.4304 1.1618 0.0260 1.1316<br />
Multivariate Capabilities:<br />
PC p : 0.658<br />
D: 1.2892 PC pm : 0.5104<br />
und die der zweiten<br />
Tabelle 5.2.9: Fähigkeiten der Stichprobe 2<br />
Univariate Capabilities:<br />
LSL USL Mean Stdv C p k C pk<br />
Y 1 5.70 9.30 7.5328 0.5884 1.0198 0.0182 1.0012<br />
Y 2 113.00 143.00 128.3841 5.1360 0.9735 0.0256 0.9486<br />
Y 3 56.00 74.00 64.9522 3.0214 0.9929 0.0053 0.9876<br />
Y 4 1.05 1.35 1.2009 0.0501 0.9971 0.0057 0.9914<br />
Y 5 0.30 3.30 1.8220 0.5185 0.9643 0.0147 0.9501<br />
Multivariate Capabilities:<br />
PC p : 0.9735<br />
K: 0.014 PC pk : 0.9599<br />
D: 1.0238 PC pm : 0.9509
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
207<br />
Der multivariate Prozessfähigkeitsindex MC p , der eine Aussage über das Streuverhalten<br />
gestattet, liegt bei der zweiten Stichprobe nahe an der 1 und bei der ersten Stichprobe ist<br />
er bedeutend kleiner als 1.<br />
1<br />
Der Mittelwert der Eigenwerte von ( Σ * SYY<br />
− ) als Test für die Gleichheit von Kovarianzmatrizen<br />
ist für die 1. Stichprobe 1,772 und für die 2. Stichprobe 0,989. Hieraus folgt, dass bei der<br />
1. Stichprobe die theoretische Kovarianzmatrix ungleich der Stichprobenkovarianzmatrix<br />
ist. Im zweiten Fall stimmen die Kovarianzmatrizen fast überein.<br />
Beispiel 5.2.11: Dämpfung der Motorvibration. Multivariate Fähigkeiten<br />
Das Hydrolager wurde durch die beiden Produktvariablen<br />
Y 1 = Phasenverschiebung [Φ] und<br />
Y 2 = dynamische Steifigkeit [N/mm]<br />
beschrieben. Die dreidimensionale Häufigkeitsverteilung und das Streudiagramm sind in<br />
Abbildung 5.1.2 und Abbildung 5.1.3 dargestellt.<br />
Die Sollvorgaben sind<br />
Tabelle 5.2.10: Sollvorgaben für die Produktvariable Phasenverschiebung und Steifigkeit<br />
Phasenverschiebung<br />
dyn. Steifigkeit<br />
Sollwert 43 185<br />
untere Toleranzgrenze 36 140<br />
obere Toleranzgrenze 48 230<br />
Die Kennzahlen für den Istzustand nach der Ausreißererkennung mit dem aerk-Kriterium<br />
und Elimination sind in der Tabelle 5.2.11 zusammengestellt.<br />
Tabelle 5.2.11: Istzustand<br />
Phasenverschiebung<br />
dyn. Steifigkeit<br />
Minimum 2.90 119.92<br />
Mittelwert 42.526 196.587<br />
Standardabweichung 2.83727 8.193489<br />
Maximum 60.00 272.79<br />
Tabelle 5.2.12: Univariate Prozessfähigkeitsindizes<br />
Phasenverschiebung<br />
dyn. Steifigkeit<br />
C p 0.7049 1.8307<br />
K 0.0877 0.2575<br />
C pk 06431 1.3593<br />
Hier hat man den Fall, dass eine Produktvariable eine univariate Prozessfähigkeit hat, die<br />
größer ist als 1.33 und eine, deren Fähigkeit kleiner als 1.33 ist.
208 5 Qualität in der Fertigung<br />
Wie soll man entscheiden?<br />
Die multivariaten Prozessfähigkeitsindizes müssen berechnet werden.<br />
Wir erhalten die Werte<br />
MC p = 1.375<br />
MC pk = 1.057.<br />
Da der korrigierte multivariate Prozessfähigkeitsindex kleiner als 1.33 ist, muss der Prozess<br />
verbessert werden, sodass vor allem die Streuung der dynamische Steifigkeit Y 2 kleiner<br />
wird.<br />
Beispiel 5.2.12: Akkubohrschrauber. Prozessfähigkeiten<br />
Für das Plastikgehäuse des Akku-Bohrschraubers haben wir vorn die statistischen Toleranzgrenzen<br />
berechnet. Die statistischen Toleranzgrenzen unterscheiden sich von den gegebenen<br />
CAD Toleranzen. Mit den statistischen Toleranzgrenzen haben wir die Fähigkeiten berechnet<br />
und in der Tabelle 5.2.13 zusammengestellt.<br />
Tabelle 5.2.13: Univariate Prozessfähigkeitsindizes Beispiel Akkubohrschrauber<br />
Variable Toleranzgrenzen Mittelwert Stabw. C p k C pk<br />
untere obere<br />
Thermoschrumpf –0,52 2,72 1,5152 0,4743 1,138 0,256 0,847<br />
Axialität –0,7 0,7 0,0097 0,205 1,138 0,014 1,122<br />
Parallelität –1,4 1,4 0,0788 0,496 0,941 0,056 0,888<br />
Dicke 2,76 3,44 3,137 0,094 1,207 0,108 1,076<br />
Die multivariaten Prozessfähigkeitsindizes sind:<br />
MC p 1,0963<br />
D 1,4317<br />
MC pk 0,766<br />
Da MC pk < 1 ist, muss der Prozess so verbessert werden, dass die Streuungen für die Produktvariablen<br />
kleiner werden.<br />
Der Vektor der Produktvariablen kann aber auch der allgemeineren Klasse der elliptisch<br />
umrissenen Verteilung en zugeordnet werden, zu der natürlich auch die Normalverteilungen<br />
gehören. Diese Klasse ist durch die Verteilungsdichte charakterisiert<br />
1<br />
−<br />
⎡<br />
T −1<br />
Y μΣ = ΣYY 2 − μY ⋅ΣYY ⋅ − μY<br />
f ( y; , ) g ⎤<br />
⎣<br />
( Y ) ( Y )<br />
⎦<br />
,<br />
wobei g eine nicht wachsende Funktion ist. Wählt man für g die Funktion<br />
m 1<br />
− − ⋅u<br />
2 2<br />
gu ( ) = (2 π)<br />
⋅e<br />
dann erhält man die Verteilungsdichte der m-dimensionale Normalverteilung. Der Exponent<br />
T −1<br />
Y YY Y Y<br />
( Y − μ ) ⋅Σ ⋅( − μ )<br />
der multivariaten normalen oder elliptisch umrissenen Dichte spezifiziert die Gleichung<br />
eines Hyperellipsoides im m-dimensionalen Raum, wenn er gleich einer beliebigen positiven<br />
Konstante c gesetzt wird.
5.2 Wie können Sie entscheiden, ob Ihre Prozesse in Ordnung sind?<br />
209<br />
Beispiel 5.2.13: Karosseriebau. Multivariate Fähigkeiten<br />
An einer Karosserie wurden nach dem Tür-, Heckklappen- und Motorhaubeneinbau m = 73<br />
Produktvariable, wie Spaltmaße, Symmetrien, Parallelitäten, Längen, Höhen, Distanzen<br />
usw. gemessen. Der Stichprobenumfang betrug N = 228.<br />
Der Grad der Multikollinearität war sehr hoch, d. h. die Determinante der Korrelationsmatrix<br />
der Produktvariablen nahm den überaus kleinen Wert Det(R YY ) = 2,2 10 –135 an. Aus<br />
der Analyse wurden über das Red-Auswahlverfahren und die multiple Korrelationsanalyse<br />
p = 59 Produktvariable gestrichen.<br />
Die übrig gebliebenen Produktvariablen wurden neu mit Y 1 , …, Y 14 nummeriert.<br />
Die gegebenen Toleranzen für alle Produktvariablen wurden nach der arithmetischen<br />
Tolerierung berechnet. Diese setzt aber die Unabhängigkeit der Produktvariablen, d. h.<br />
Det(R YY ) ≅ 1 voraus. Der tatsächliche Wert für die Determinante der Korrelationsmatrix<br />
liegt aber sehr viel näher an Null als an der Eins! Hieraus folgt, dass auf alle Fälle das Ergebnis<br />
der gegebenen Tolerierung infrage gestellt werden muss.<br />
Die statistischen Toleranzgrenzen wurden berechnet und in der Tabelle 5.2.14 zusammengestellt.<br />
Tabelle 5.2.14: Produktvariable mit den statistischen Maßzahlen und den Toleranzgrenzen<br />
Produktvar. Mittelwert Standardabw. T u T o Dimension<br />
Y 1 0,51 0,4435 –0,924 1,944 mm<br />
Y 2 –0,5144 0,1904 –1,172 0,142 mm<br />
Y 3 –0,3546 0,0512 –0,528 –0,182 mm<br />
Y 4 –0,211 0,5532 –0,638 0,216 mm<br />
Y 5 1,558 0,1154 1,016 2,1 mm<br />
Y 6 –0,1112 0,088 –0,576 0,353 mm<br />
Y 7 1,671 0,115 1,188 2,154 mm<br />
Y 8 –0,0916 0,1305 –0,802 0,62 mm<br />
Y 9 0,0171 0,0615 –0,208 0,242 mm<br />
Y 10 –0,1681 0,0841 –0,498 0,162 mm<br />
Y 11 –0,1603 0,0566 –0,464 0,143 mm<br />
Y 12 –0,5871 0,0814 –0,865 –0,309 mm<br />
Y 13 –0,0445 0,1017 –0,292 0,203 mm<br />
Y 14 –15,525 0,8507 –19,919 –11,131 mm<br />
Die berechneten statistischen Toleranzgrenzen wurden mit dem Vertragspartner abgestimmt<br />
und akzeptiert.<br />
Mit den berechneten Toleranzgrenzen wurde die uni- und multivariaten Prozessfähigkeitsindizes<br />
berechnet und in Tabelle 5.2.15 zusammengestellt.<br />
Nur eine der univariaten, korrigierten Prozessfähigkeitsindizes ist kleiner als 1 und fünf<br />
sind kleiner als 1.33. Für die Entscheidung, ob der Prozess verbessert werden muss, ist die<br />
Berechnung der multivariaten Prozessfähigkeitsindizes unerlässlich.
210 5 Qualität in der Fertigung<br />
Tabelle 5.2.15: Univariate Prozessfähigkeiten für die wesentlichen Produktvariablen<br />
Prod.Par. C p k C pk<br />
Y 1 1,0778 0,0003 1,0775<br />
Y 2 1,15 0,001 1,1489<br />
Y 3 1,1483 0,0023 1,1458<br />
Y 4 1,5436 0,0001 1,5436<br />
Y 5 1,5653 0,0001 1,5652<br />
Y 6 1,7585 0,0006 1,7573<br />
Y 7 1,3993 0,0001 1,3993<br />
Y 8 1,8158 0,0008 1,8143<br />
Y 9 1,2187 0,0004 1,2183<br />
Y 10 1,3081 0,0004 1,3076<br />
Y 11 1,7863 0,0006 1,7852<br />
Y 12 1,1382 0,0002 1,1377<br />
Y 13 0,8108 0,0002 0,8107<br />
Y 14 1,7216 0,0001 1,7215<br />
Die multivariaten Prozessfähigkeitsindizes sind<br />
PC p = 1,5518<br />
PC pk = 1,5517<br />
Die multivariaten Prozessfähigkeitsindizes besagen, der Prozess ist in Ordnung. Trotzdem<br />
muss der Prozess mit den multivariaten Kontrollkarten kontinuierlich überprüft werden.<br />
5.3 Vergleich verschiedener Tolerierungsverfahren<br />
an 6- und 5-dimensionalen Beispielen<br />
Für die Tolerierung gibt es, wie wir gesehen haben, verschiedene Herangehensweisen. Einmal<br />
die Art der Tolerierung, die von Technikern eingeführt wurde und den technischen Aspekt in<br />
den Vordergrund stellt. Mathematisch basiert diese Art der Tolerierung auf dem Fehlerfortpflanzungsgesetz<br />
und letztlich auf der Faltung voneinander unabhängiger Zufallsgrößen.<br />
Die andere von Jahn eingeführte multivariate statistische Tolerierung basiert auf den Tatsachen,<br />
dass<br />
•<br />
•<br />
•<br />
•<br />
•<br />
es nicht nur Montageprozesse gibt,<br />
das Produkt eines jeden (Herstellungs- oder Service-) Prozesses durch m,<br />
m ≥ 1 nicht unabhängige Produktvariable Y 1 , …, Y m beschrieben wird,<br />
die Produktvariablen Realisierungen von Zufallsgrößen sind und<br />
die Sollwerte und Toleranzgrenzen für jeden Prozess Zielwerte der Steuer- und Regelung<br />
sind.
5.3 Vergleich verschiedener Tolerierungsverfahren<br />
211<br />
5.3.1 Charakteristische Zusammenhänge zwischen Funktionssicherheit<br />
und Toleranz aus Sicht der Techniker<br />
Hoffmann [1986] definiert einige bedeutende Grundlagen, wie z. B.<br />
•<br />
•<br />
•<br />
•<br />
•<br />
die Funktionssicherheit ist die Einhaltung der für ein Erzeugnis vorgegebenen Funk tionsfehlergrenzen<br />
für Grund- und Zusatzfehler unter vorgegebenen Einsatzbedingungen.<br />
Innerhalb der Funktionsfehlergrenzen ist das Erzeugnis funktionstüchtig.<br />
Funktionstoleranz ist die Differenz zwischen den oberen und unteren zulässigen Grenzwerten<br />
aller die Funktionstüchtigkeit beschreibenden Eigenschaften eines Erzeugnisses.<br />
Die Herstellungstoleranz ist Differenz zwischen dem oberen und unteren erreichten<br />
Grenzwert bei der Herstellung mehrerer gleichartiger Einzelteile, Baugruppen oder Fertigerzeugnisse.<br />
Die Maßtoleranz ist die Differenz zwischen dem zulässigen Größt- und Kleinstmaß.<br />
Die Messtoleranz ist die Differenz zwischen der zulässigen oberen und unteren Abweichung<br />
des Messwertes von der Messgröße. (Fehlergrenze der Messung).<br />
Die Funktionstoleranz ist in der Regel größer als die Maßtoleranz. Die Herstellungstoleranz und<br />
die Messtoleranz sind bei beherrschter Produktion grundsätzlich kleines als die Maßtoleranz.<br />
Die verschiedenen Toleranzen müssen für ein Projekt optimiert werden, denn<br />
•<br />
•<br />
kleiner werdende Toleranzen führen zu höheren Fertigungs- und Prüfkosten,<br />
größer werdende Toleranzen führen zu höheren Kosten für Nacharbeit und zusätzlichen<br />
Leistungen bei der Montage (Siehe Beispiel Akku-Bohrschrauber – MOST: Maynard Operation<br />
Sequence Technic, Zeitmessungen bei der Montage).<br />
Grundsätzlich ist anzustreben, die Produktion zu „entfeinern“, d. h. die Herstellungstoleranzen<br />
so groß wie möglich zu machen. Andererseits ist erwiesen, dass die Verringerung des spezifischen<br />
Aufwandes an vergegenständlichter und lebendiger Arbeit nur durch eine Einengung vor allem<br />
der Herstellungs-, aber auch der Funktions- und Messtoleranzen möglich ist. Gründe für das<br />
Nichterreichen der Fertigungssollmaße können sein:<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
Ungenauigkeiten der Maschinen, Werkzeuge, Vorrichtungen,<br />
Verschleiß der Maschinen, Werkzeuge und Vorrichtungen,<br />
Einstellfehler an Maschinen, Werkzeugen und Vorrichtungen,<br />
elastische Verformungen durch Spann- und Schnittkräfte,<br />
Verformungen durch Temperatureinfluss,<br />
zufällige Fehler.<br />
Was muss alles gemessen werden?<br />
Die Produktvariablen Y 1 , …, Y m , (nach Hoffmann [1986] die Werkstückabmessungen), die<br />
Input- und Prozessvariable (nach Hoffmann: Werkzeugeinstellung, Verschleiß, Schnittkräfte,<br />
Drehzahl, Drehmoment, Spannkräfte, Temperaturen, …) und die noise Variablen müssen<br />
gemessen werden, wenn eine vernünftige Tolerierung bewerkstelligt werden soll.
212 5 Qualität in der Fertigung<br />
Wie werden Maß- und Toleranzketten aufgebaut?<br />
Wie üblich benötigen wir einige neue Definitionen, bevor wir mit dem Aufbau der Maßketten<br />
beginnen können.<br />
Maßkette<br />
Lehre von der funktionsgerechten Bemessung aneinander gereihter Maße, deren Werte sich<br />
summieren. Die Maßkette ist eine Aneinanderreihung von zusammenwirkenden Einzelmaßen<br />
und dem von ihnen abhängigen Schlussmaß. Die Maßkette bildet einen Linienzug, d. h. eine<br />
Masche. Die Einzelmaße sind die Glieder der Maßkette. Eine Grundeigenschaft der Maßkette<br />
ist ihre Geschlossenheit.<br />
Bei der Berechnung der Maßketten ist zu beachten, dass die Einzelmaße aus unterschiedlichen<br />
Systemen stammen können, und zwar dem herzustellenden Gerät (Produkt), dem Werkstück<br />
(Input) oder der Werkzeugmaschine, Vorrichtung, Werkzeug (Prozess). Die in Klammern<br />
stehenden Bezeichnungen stellen die Verbindung zu meiner viel allgemeineren Theorie der<br />
Tolerierung dar.<br />
Zur Berechnung der Maßkette werden für die Einzelmaße M j , j = 1, …, m die Nennmaße N j ,<br />
und die dazu gehörenden Toleranzmittenabmaße E Cj , oder Erwartungsabmaße E Ej bestimmt.<br />
Auftretende Spiele werden mit der halben Größe des Kleinstspiels ½ S kj wie Einzelmaße behandelt.<br />
Für das Schlussmaß M 0 bestimmt man das Nennmaß N 0 und die zugehörige Toleranz<br />
E C0 , oder das Erwartungsabmaß E E0 . Ist die Schlusstoleranz eine Passtoleranz oder ein Spiel,<br />
so wird das Toleranzmittenabmaß E C0 oder das Erwartungsabmaß E E0 durch das mittlere oder<br />
halbe Größtspiel ½ S g0 gebildet.<br />
Es werden die folgenden Bezeichnungen verwendet:<br />
Nennmaß<br />
= N ist das Maß auf das die Maßkette bezogen wird,<br />
Einzelmaß<br />
= M j (mitunter sind Einzel- und Nennmaße gleich),<br />
Istmaß<br />
= I ist das Maß des gefertigten Werkstücks,<br />
Größtmaß<br />
= G ist das zulässiges Maximum des Istmaßes,<br />
Kleinstmaß<br />
= K ist das zulässiges Minimum des Istmaßes,<br />
Toleranzmittenmaß = C ist der arithmetische Mittelwert aus Größt- und Kleinstmaß,<br />
Erwartungsmaß = E ist der arithmetische Mittelwert aus eine Serie von Istmaßen,<br />
Istabmaß<br />
= A j ist die Differenz zwischen Ist- und Nennmaß,<br />
Oberes Abmaß = ES ist die Differenz zwischen Größt- und Nennmaß,<br />
Unteres Abmaß = El ist die Differenz zwischen Kleinst- und Nennmaß,<br />
Toleranzmittenabmaß = E C ist die Differenz zwischen Toleranzmittenmaß und Nennmaß,<br />
Erwartungsabmaß = A E ist die Differenz zwischen Toleranzmitten- und Nennmaß,<br />
Maßtoleranz, Toleranz = T ist die Differenz zwischen Größt- und Kleinstmaß,<br />
Spiele<br />
= S ist die halbe Größe des Kleinstspiels = 1/2 S kj , sie werden wie<br />
Einzelmaße behandelt,<br />
Anzahl der Spiel- und Übergangspassungen = e<br />
Koeffizient der relativen c j = 2 s j / T j Standardabweichung,<br />
Koeffizient der relativen a j = (A Ej – E Cj ) / T j und die Asymmetrie.
5.3 Vergleich verschiedener Tolerierungsverfahren<br />
213<br />
5.3.2 Berechnung von Maß- und Toleranzketten für vollständige<br />
Austauschbarkeit<br />
Maßketten<br />
Das Nennmaß N 0 des Schlussmaßes setzt sich für lineare Maßketten mit parallelen Maßkettengliedern<br />
additiv aus den Nennmaßen N j der j = 1, …, m Einzelmaße M j zusammen.<br />
N<br />
0<br />
m<br />
= ∑ kj<br />
Nj,<br />
j=<br />
1<br />
wobei k j den Richtungskoeffizient des j-ten Einzelmaßes auf das Schlussmaß bezeichnet. Dieser<br />
Koeffizient ist gleich +1, wenn der Einfluss des Einzelmaßes positiv ist. Positive Einzelmaße<br />
bewirken bei ihrer Vergrößerung oder Verkleinerung eine gleichsinnige Veränderung des<br />
Schlussmaßes.<br />
Ist das Nennmaß N 0 des Schlussmaßes bekannt und sind die Nennmaße N j der Einzelmaße<br />
unbekannt, so ergibt sich für das j-te Nennmaß die Berechnungsformel<br />
⎛<br />
⎞<br />
N N k N k N ⎟<br />
⎠<br />
j−1<br />
m<br />
1<br />
j = ⎜ 0 −∑<br />
l j −∑<br />
l j<br />
kj ⎝ l= 1 l=<br />
1<br />
wobei j = 1, …, m die Laufvariable und m die Anzahl der Einzelmaße ohne Schlussmaß ist. Sind<br />
die Toleranzmittenabmaße E Cj der Einzelmaße gegeben und soll aus denen das Toleranzmittenabmaß<br />
E C0 des Schlussmaßes berechnet werden, so ist unter Beachtung aller e Spiel- und<br />
Übergangspassungen die funktionell mindestens erforderliche Spiel- und Übergangspassung<br />
1<br />
E = k E − S ,<br />
C0<br />
zu berechnen.<br />
m−e m<br />
∑<br />
∑<br />
j Cj kj<br />
j= 1<br />
2<br />
j= m−e−1<br />
Toleranzketten<br />
Sind die Einzeltoleranzen T j , j = 1, …, m der Einzelmaße und die Kleinstwerte der Spiel- und<br />
Übergangspassungen gegeben, so beträgt die Schlusstoleranz T 0 des Schlussmaßes<br />
T = T + S ,<br />
0<br />
m−e<br />
m<br />
∑ j ∑ kj<br />
j= 1 j= m−e−1<br />
wobei e die Anzahl der Spiel- und Übergangspassungen ist. S kj bezeichnet das Kleinstspiel des<br />
Maßes j. Die Einzeltoleranz T j des j-ten Einzelmaßes resultiert aus<br />
j−1<br />
m−e m<br />
j = 0 −∑ l − ∑ l − ∑ kj<br />
l= 1 l= j+ 1 j= m− e+<br />
1<br />
T T T T S<br />
Dieser Ausdruck ist für m > 1, e > 1 unbestimmt. Daher wird zunächst für jedes Einzelmaß<br />
eine durchschnittliche Einzeltoleranz<br />
⎛<br />
m<br />
T 1<br />
= ⎜ T − ∑<br />
m<br />
S<br />
⎞<br />
⎟<br />
0<br />
kj<br />
− e ⎝ j= m−e−1<br />
⎠<br />
berechnet. Anschließend werden auf dieser Grundlage die Einzeltoleranzen berechnet.
214 5 Qualität in der Fertigung<br />
Beispiel 5.3.1: Einfaches Getriebe. Maßketten<br />
Ein einfaches Getriebe wird durch die folgende Skizze beschrieben.<br />
M 5 M 1 M 2<br />
M 4 M 3<br />
M 0<br />
Abb. 5.3.1: Schematische Darstellung des einfachen Getriebes<br />
Die Maßkette für das einfache Getriebe besteht aus 6 Gliedern, die sich aus m = 5 Einzelmaßen<br />
und dem Schlussmaß zusammensetzt. Der Konstrukteur gab die Nennmaße N j ,<br />
j = 1, …, 5 für die einzelnen Glieder vor. Die Richtungskoeffizienten resultieren aus dem<br />
Verlauf der Maßkette und sind k 1 = +1, k 2 = +1, k 3 = –1, k 4 = –1, k 5 = –1 und k 0 = –1.<br />
Die Werte für die Nennmaße N j , Toleranzen T j , Richtungskoeffizienten k j , Toleranzmittenabmaße<br />
E Cj und der Einzelmaße M j sind aus der folgenden Wertetabelle zu entnehmen.<br />
Tabelle 5.3.1: Wertetabelle für die Tolerierung in [mm]<br />
j N j T j k j E Cj M j + T j , – T j oder ±T j<br />
0 0 0,15 –1 0,105 0 0,18<br />
0,03<br />
1 25 0,033 1 0,035 25 0,0515<br />
0,0185<br />
2 40 0,04 1 0,04 40 0,06<br />
0,02<br />
3 2,5 0,015 –1 0 2,5 ±5700,0<br />
4 60 0,047 –1 –0,03 60 –0,0065<br />
–0,0535<br />
5 2,5 0,015 –1 0 2,5 ±5700,0
5.3 Vergleich verschiedener Tolerierungsverfahren<br />
215<br />
Die M j bedeuten hierbei<br />
M<br />
j<br />
⎧⎪ E<br />
= Nj<br />
+ ⎨<br />
⎪⎩<br />
E<br />
Cj<br />
Cj<br />
+ 0.5 Tj<br />
.<br />
− 0.5 T<br />
j<br />
Das Nennmaß des Schlussgliedes ist N 0 = 25 + 40 –2.5 – 60 – 2.5 = 0 [mm]. Die Summe der<br />
Einzeltoleranzen T j ergibt die Schlusstoleranz<br />
T 0 = 0.033 + 0.04 + 0.015 + 0.047 + 0.015 = 0.15 [mm].<br />
Um den freien Lauf der Getriebewelle im Gehäuse zu gewährleisten, soll das untere Abmaß<br />
mindestens ej u0 = 0.03 [mm] betragen. Das Toleranzmittenabmaß des Schlussmaßes muss<br />
dann mindestens E C0 = ej u + 0.5 T 0 = (0.03 + 0.075) [mm] = 0.105 [mm] sein. Das Toleranzmittenabmaß<br />
des Schlussmaßes ist<br />
E C0 = k 1 E C1 + k 2 E C2 +k 4 E C4 = (+1) 0.035 + (+1) 0.04 + (–1) – 0.03 = 0.105 [mm].<br />
Mit der Schlusstoleranz T 0 0.15 [mm] und dem Toleranzmittenabmaß E C0 lassen sich schließlich<br />
die oberen und unteren Abmaße es o0 = 0.18 [mm] und es u0 = 0.03 [mm]berechnen. Das axiale<br />
größte Spiel beträgt S g = 180 [µm] und das axiale kleinste Spiel S k = 30 [µm].<br />
Warum habe ich bisher die technische Tolerierung nicht verstanden?<br />
Warum fiel es mir schwer, diese Art der Tolerierung zu verallgemeinern?<br />
Weil:<br />
• drei- oder zweidimensionale Gebilde der Einfachheit wegen auf den R 1 (den eindimensionalen<br />
Vektorraum) reduziert wurden, obwohl das nicht unbedingt einzusehen ist und<br />
• daher die Metrik nicht verallgemeinerungsfähig ist.<br />
5.3.3 Verallgemeinerung der Tolerierung<br />
Für die Verallgemeinerung der Tolerierung wird der reelle Vektorraum benötigt, um z. B. dreidimensionale<br />
Gebilde auch dreidimensional behandeln zu können. Ein Getriebe z. B. ist nun<br />
einmal ein dreidimensionales Gebilde. Die Reduktion der Dimension des Raumes auf die Ebene<br />
oder wie bei der Tolerierung durch Maß- und Toleranzketten auf den R 1 hat offensichtlich nur<br />
den Zweck der Vereinfachung.<br />
Der reelle Vektorraum<br />
Für die Definition von Vektoren benötigt man den Vektorraum. Wir wollen hier den dreidimensionalen<br />
realen physikalischen Anschauungsraum R 3 , indem wir alle uns befinden, betrachten.<br />
Ein Element dieses Raumes, ein Punkt in diesem Raum wird durch ein dreier- Tupel (x 1 , x 2 , x 3 )<br />
reeller Zahlen charakterisiert. Mit diesen reellen Zahlen kann man rechnen.<br />
Sind (x 1 , x 2 , x 3 ) und (y 1 , y 2 , y 3 ) solche drei-Tupel reeller Zahlen, so werde deren Summe durch<br />
(x 1 , x 2 , x 3 ) + (y 1 , y 2 , y 3 ) = (x 1 + y 1 , x 2 + y 2 , x 3 + y 3 ) erklärt. Die Summe ist wieder ein drei-Tupel<br />
reeller Zahlen. Ist λ ∈ R 1 und (x 1 , x 2 , x 3 ) ∈ R 3 , so ist λ (x 1 , x 2 , x 3 ) = (λ x 1 , λ x 2 , λ x 3 ) ∈ R 3 .<br />
Da die Rechenoperationen dadurch entstanden sind, dass einfach die Operationen des Rechnens<br />
mit reellen Zahlen auf die Komponenten (x 1 , x 2 , x 3 ) des R 3 übertragen wurden, so übertragen<br />
sich auch deren Rechenregeln. Wählt man einen Punkt 0 zum Nullpunkt, so kann man alle
216 5 Qualität in der Fertigung<br />
Punkte als Ortsvektoren bezüglich null auffassen, kann sie mit reellen Zahlen multiplizieren<br />
und wie im Kräfteparallelogramm addieren. Dadurch erhält man einen Vektorraum.<br />
Definition: Ein Tripel (V, +, ⋅) bestehend aus einer Menge V, einer Addition und einer Multiplikation<br />
heißt ein reeller Vektorraum.<br />
Die Physiker verstehen unter Vektoren etwas anderes als die Mathematiker. Daher soll der<br />
Gesichtspunkt der Physiker in den Blickpunkt gerückt werden, denn die Tolerierung fällt im<br />
weitesten Sinne in das Gebiet der Physiker. Nach diesem Gesichtspunkt werden Vektoren durch<br />
ihre Größe (quantity), Richtung (direction) und ihren Betragt (magnitude) erklärt. Der Betrag<br />
eines Vektors, die Norm z. B. aus dem R 3 wird durch<br />
2 2 2<br />
1 2 3<br />
x = x + x + x<br />
definiert. (Das ist der Satz des Pythagoras.) Für zwei Vektoren x 1 , x 2 ∈ R 3 nennt man die Zahl<br />
〈x 1 , x 2 〉 = x 11 x 21 + x 12 x 22 + x 31 x 23 das Skalarprodukt v on x 1 und x 2 . Einen reellen Vektorraum<br />
mit einem Skalarprodukt nennt man einen euklidischen Vektorraum.<br />
Der Winkel zwischen den beiden Vektoren x 1 und x 2 wird durch<br />
x1,<br />
x2<br />
α ( x1, x2) = arccos<br />
für x 1 ≠ 0 und x 2 ≠ 0<br />
x1 x2<br />
,<br />
berechnet.<br />
Mit dieser Definition kann die Orthogonalität zw ischen Vektoren definiert werden. Ein r-Tupel<br />
von Vektoren (x 1 , …, x r ) ∈ R n heißt orthogonal, wenn x = 1, j = 1, … r und 〈x j , x k 〉 = δ jk .<br />
Beispiel 5.3.2: Einfaches Getriebe. Ortsvektoren<br />
Wir betrachten wieder das Getriebebeispiel. Es wird das Koordinatensystem x 1 , x 2 eingeführt<br />
und als Benchmark für alle Punkte betrachten wir die beiden Ortsvektoren, die wir<br />
mit m 1 und m 2 bezeichnen.<br />
j<br />
x 2<br />
M 6<br />
M 5<br />
M 1 M 2<br />
m 2<br />
m 1<br />
M 4<br />
0<br />
x 1<br />
M 3<br />
M 0<br />
Abb. 5.3.2: Getriebe mit zwei Ortsvektoren anstelle der üblichen Bemaßung
5.3 Vergleich verschiedener Tolerierungsverfahren<br />
217<br />
Ortsvektoren ordnen jedem Punkt M j der Ebene (des Raumes) die Verschiebung<br />
m j = M j – 0, j = 1, …, n<br />
zu.<br />
Aus der Abbildung und der Wertetabelle kann man ablesen, das z. B.<br />
m 1 = (M 2 , M 6 ) T = (40, 40) T<br />
m 2 = (M 3 , M 6 ) T = (65, 40) T .<br />
Damit erhalten wir<br />
m<br />
⎛65⎞ ⎛40⎞ ⎛25⎞<br />
− m = ⎜ ⎟ − ⎜ ⎟ =<br />
⎝40⎠ ⎝40⎠ ⎜<br />
⎝ 0 ⎟<br />
⎠<br />
2 1<br />
Auf diese Art kann man alle Punkte einer Abbildung (einer Ebene oder eines Raumes) als<br />
Ortsvektoren darstellen und die Abstände durch Bildung der Differenzen von Vektoren ermitteln.<br />
Ein weiterer wesentlicher Begriff ist die Linearkombination von Vektoren. Sind x 1 , …, x r Vektoren<br />
aus dem n-dimensionalen Euklidischen Vektorraum R n , dann nennt man λ 1 x 1 + … + λ r<br />
x r = y eine Linearkombination, wobei λ j ∈ R 1 . Die Menge aller Linearkombinationen heißt<br />
lineare Hülle des r-Tupels von Vektoren.<br />
Ein r-Tupel x 1 , …, x r von Vektoren aus dem Euklidischen Vektorraum heißt linear abhängig,<br />
wenn einer dieser Vektoren aus den anderen linear kombiniert werden kann. Diesen linear<br />
kombinierten Vektor kann man dann ohne Schaden für die lineare Hülle weglassen. Mit dieser<br />
Definition kann man natürlich auch die lineare Unabhängigkeit definieren. V sei wieder ein Vektorraum,<br />
x 1 , …, x r ∈ V. Dieses r-Tupel heißt linear unabhängig, wenn eine Linearkombination<br />
von x 1 , …, x r nur dann null sein kann, wenn alle Koeffizienten verschwinden, d. h. wenn aus<br />
λ 1 x 1 + … + λ r x r = 0<br />
stets folgt, dass λ 1 = … = λ r = 0. Man kann auch sagen, (x 1 , …, x r ) ist genau dann linear unabhängig,<br />
wenn keiner dieser Vektoren Linearkombination der übrigen ist.<br />
Sei jetzt y = λ 1 x 1 + … + λ n x n eine Linearkombination von n Vektoren aus dem Euklidischen<br />
Vektorraum. Damit bilden wir das Skalarprodukt mit dem Vektor x, d. h.<br />
⎛y1<br />
⎞<br />
n<br />
x, y = ( x … x ) ⎜… ⎟ = a x x + … + a x x = a x x<br />
1 n 1 1 1<br />
n n n j j j<br />
⎜ ⎟<br />
j=<br />
1<br />
⎝yn<br />
⎠<br />
⎛a1 … 0 ⎞ ⎛x1⎞<br />
= ( x ⎜ ⎟ ⎜ ⎟<br />
1 … xn) 0 … 0 … .<br />
⎜ ⎟ ⎜ ⎟<br />
⎝ 0 … a ⎠ ⎝x<br />
⎠<br />
n<br />
Eine solche Form nennt man quadratische Form und sc hreibt abkürzend dafür<br />
x T A x = Q A (x).<br />
n<br />
∑
218 5 Qualität in der Fertigung<br />
Beispiel 5.3.3: Quadratische Form<br />
Betrachten wir (x 1 , x 2 ) ∈ R 2 ,<br />
Fall 1:<br />
⎛1 0⎞<br />
A = ⎜<br />
⎝0 1 ⎟ , dann ist die quadratische Form<br />
⎠<br />
⎛1 0⎞ ⎛x1⎞ ⎛x1⎞<br />
2 2<br />
QA( x) = ( x1 x2) ⎜ = ( x1 x2) = x1 + x2.<br />
⎝0 1⎟ ⎠<br />
⎜<br />
⎝x<br />
⎟<br />
⎠<br />
⎜<br />
⎝x<br />
⎟<br />
⎠<br />
2 2<br />
In diesem Falle gilt QA ( x ) = x .<br />
Betrachten wir den konkreten Vektor x T = (x 1 , x 2 ) = (0.8, 0.3), dann gilt<br />
⎛1 0⎞ ⎛0.8⎞ (0.8 0.3) ⎜ ⎟ ⎜ ⎟ = 0.73 und 0.73 = 0.854.<br />
⎝0 1⎠ ⎝0.3⎠<br />
Fall 2:<br />
⎛1<br />
c ⎞<br />
Es sei A = ⎜ ⎟, c ≤ 1, so dass A positiv definit ist. In diesem Fall gilt<br />
⎝c<br />
1⎠<br />
⎛1<br />
c⎞ ⎛x1⎞ ⎛x1⎞<br />
QA( x) = ( x1 x2) ⎜ ⎟ ⎜ ⎟ = ( x1 + c x2 c x1 + x2)<br />
⎝c 1⎠ ⎝x ⎠<br />
⎜<br />
⎝<br />
⎟<br />
2 x2⎠<br />
2 2<br />
= x + 2 c x x + x .<br />
Hieraus folgt<br />
1 1 2 2<br />
2 2<br />
1 1 2 2<br />
x + 2 c x x + x<br />
ist die Länge des Vektors x, wenn die Komponenten von x nicht linear unabhängig voneinander<br />
sind.<br />
Betrachten wir anstelle der Einheitsmatrix die positiv definite Matrix<br />
⎛ 1 0.6⎞<br />
A = ⎜<br />
⎝0.6 1 ⎟<br />
⎠<br />
dann erhält man für die quadratische Form<br />
⎛ 1 0.6⎞ ⎛0.8⎞ ⎛0.8⎞<br />
(0.8 0.3) ⎜ ⎟ ⎜ ⎟ = (0.8 + 0.18 0.18 + 0.3)<br />
⎝0.6 1 ⎠ ⎝0.3⎠ ⎜<br />
⎝0.3⎟<br />
⎠<br />
= 0.928 und 0.928 = 0.9633.<br />
Die beiden Längen des Vektors x sind je nachdem, ob die Matrix eine Diagonal- oder vollständige<br />
Matrix ist, verschieden.<br />
Erinnern wir uns daran, dass bei der Konstruktion von Produkten, insbesondere Montageprodukten,<br />
Toleranzketten verwendet werden können, diese aber nicht auf alle Produkte,<br />
z. B. chemische Produkte und die Fertigung übertragen werden können, dann sind weitere<br />
Verallgemeinerungen notwendig.
5.3 Vergleich verschiedener Tolerierungsverfahren<br />
219<br />
Insbesondere nach der Herstellung der Produkte können die Messwerte für die verschiedenen<br />
Produktvariablen nicht mehr als beliebige reelle Zahlen, sondern müssen als Realisierungen<br />
von Zufallsgrößen angesehen werden.<br />
5.3.3.1 Statistische Tolerierung<br />
Der Ausgangspunkt bei dieser Art der Tolerierung ist, dass die Einzelmaße Y 1 , …, Y m unabhängig<br />
und identisch nach F j (y j ) j = 1, …, m verteilt sind. Die Toleranzen T o,j und T u,j , j = 1, …, m<br />
sind entweder unbekannt oder sollen mit den Maßen, an gefertigten Produkten gemessen,<br />
überprüft werden. Sind die Zufallsgrößen außerdem normal verteilt mit den Erwartungswerten<br />
µ j und σ j 2 , dann gilt, die Summenvariable<br />
m<br />
Y = ∑ Yj<br />
j=<br />
1<br />
ist normal verteilt mit den beiden Momenten<br />
m<br />
m<br />
2 2<br />
∑ j ∑ j<br />
j= 1 j=<br />
1<br />
μ = μ und σ = σ .<br />
Sind die Einzelmaße nicht normal verteilt, dann folgt aus dem zentralen Grenzwertsatz der<br />
Wahrscheinlichkeitsrechnung, dass die Summenvariable approximativ normal verteilt ist,<br />
ebenfalls mit den Summenmomenten.<br />
Nach der 3 σ-Regel liegen mit der Wahrscheinlichkeit 1 – α = 1 – 0.0027 = 0.9973 fast alle<br />
Realisierungen einer normal verteilten Zufallsgröße im Intervall µ ± 3 σ. Hieraus folgt die<br />
Toleranzbreite T o – T u sollte 6 σ sein.<br />
Die Toleranzkette kann unter diesen Voraussetzungen nach der Formel<br />
m<br />
T = 6 ∑ S<br />
j=<br />
1<br />
j<br />
berechnet werden, wobei die S j die Stichprobenstandardabweichungen für die Einzelmaße M j ,<br />
j = 1, …, m sind.<br />
Beispiel 5.3.4: Einfaches Getriebe. Tolerierung<br />
Fall 1: Wir nehmen an, dass Y 1 , …, Y 6 unabhängig voneinander sind. An N Getrieben<br />
wurden die obigen Maße gemessen. Die statistischen Maßzahlen sind<br />
Tabelle 5.3.2: Statistische Maßzahlen für die Maße des Getriebes<br />
Y 0 Y 1 Y 2 Y 3 Y 4 Y 5<br />
Min: –6,6976445 2498,2527947 3998,0283577 249,3489343 5997,5019191 249,4489296<br />
Mean: 0,1312104 2499,9594152 4000,0388603 250,0179791 5999,9552836 249,9896311<br />
Max: 6,3486367 2501,4088584 4002,4427941 250,5956959 6001,6589824 250,5393647<br />
Std.Dev.: 2,3978975 0,6064117 0,7160356 0,2388075 0,7569649 0,2253856<br />
Die Korrelationsmatrix zur Überprüfung der Voraussetzung der Unabhängigkeit ist in der<br />
Tabelle 5.3.3 zusammengestellt.
220 5 Qualität in der Fertigung<br />
Tabelle 5.3.3: Korrelationsmatrix für die 6 Maße des Getriebes<br />
Y 0 Y 1 Y 2 Y 3 Y 4 Y 5<br />
Y 0 1 0,1388 0,0211 0,005 –0,0144 –0,0351<br />
Y 1 1 –0,1343 –0,065 –0,0746 0,028<br />
Y 2 1 0,0246 0,1598 –0,0264<br />
Y 3 1 –0,0264 –0,0899<br />
Y 4 1 0,0213<br />
Y 5 1<br />
Die Korrelationskoeffizienten für alle Paare von Maßen sind sehr klein. Das globale Maß<br />
für die Korreliertheit ist det (R) = 0.9150239. Die univariate statistische Tolerierung kann<br />
angewandt werden. Wir erhalten die Toleranzgrenzen in der Tabelle 5.3.4.<br />
Tabelle 5.3.4: Toleranzgrenzen nach der univariaten statistischen Tolerierung<br />
Variable Mittelwert 6* Stabw. Zielwert Toleranzgrenze<br />
untere<br />
obere<br />
Y 0 0,1312 14,3874 0 –10,6188 10,6188<br />
Y 1 2499,95 3,6385 2500 2497,35 2502,65<br />
Y 2 4000,04 4,2962 4000 3996,86 4003,14<br />
Y 3 250,02 1,4328 250 248,94 251,06<br />
Y 4 5999,95 4,5418 6000 5996,67 6003,33<br />
Y 5 249,9896 1,3523 250 248,996 251,004<br />
Für das Schließmaß T 0 erhalten wir nach der obigen Formel (6* Sigma)<br />
T 0 = 3.6385 + 4.2962 + 1.4328 + 4.5418 + 1.3523 = 15.2616,<br />
d. h. in etwa den mit CAD geplanten Wert von 15, bzw. nach Division durch 100 den Wert<br />
T 0 = 0.1526. Die Vergleiche der uni- und multivariaten statistischen und CAD Tolerierung<br />
sind in der Tabelle 5.3.5 enthalten. Der Einfachheit halber wurden in diese Tabelle nur die<br />
Toleranzbreiten (nach Division durch 100) aufgenommen.<br />
Tabelle 5.3.5: Vergleich der der statistischen Toleranzbreiten und der CAD Toleranzbreiten<br />
Maß Statistische Tolerierung CAD Toleranzen<br />
univariat<br />
multivariat<br />
6* s j T o – T u T o – T u<br />
Y 0 0,1438 0,2123 0,15<br />
Y 1 0,0364 0,053 0,033<br />
Y 2 0,0429 0,0627 0,04<br />
Y 3 0,0143 0,0212 0,015<br />
Y 4 0,0454 0,0665 0,047
5.3 Vergleich verschiedener Tolerierungsverfahren<br />
221<br />
Die Unterschiede resultieren aus den Standardabweichungen, die z. T. doch etwas größer<br />
sind als (T o – T u )/6 und den doch vorhandenen, wenn auch kleinen Korrelationskoeffizienten.<br />
Fall 2: Korrelierter Fall<br />
Für den korrelierten Fall erhalten wir die statistischen Maßzahlen der Tabelle:<br />
Tabelle 5.3.6: Statistische Maßzahlen für die Maße des Getriebes<br />
Y 0 Y 1 Y 2 Y 3 Y 4 Y 5<br />
Min: –6,5002924 2498,1719699 3998,1664578 249,402514 5998,1848565 249,3888472<br />
Mean: –0,1628116 2499,9900478 3999,9855229 249,989664 5999,9347344 250,0006535<br />
Max: 6,0165154 2501,5162199 4001,8814676 250,525068 6002,2974761 250,6449878<br />
Std.Dev.: 2,3576676 0,5884604 0,6832856 0,240879 0,8346444 0,2479773<br />
Die statistischen Maßzahlen unterscheiden sich nicht wesentlich von denen des Falles 1.<br />
In der Tabelle 5.3.7 steht die Korrelationsmatrix.<br />
Tabelle 5.3.7: Korrelationsmatrix<br />
Y 0 Y 1 Y 2 Y 3 Y 4 Y 5<br />
Y 0 1 0,4212 0,3697 0,856 0,5342 0,7047<br />
Y 1 1 0,1977 0,3841 0,2669 0,0732<br />
Y 2 1 0,1893 0,1479 0,2386<br />
Y 3 1 0,3767 0,5799<br />
Y 4 1 0,1817<br />
Y 5 1<br />
Die Korrelationsmatrix zeigt einige sehr große Korrelationskoeffizienten. Die Annahme<br />
der Unabhängigkeit ist nicht mehr gerechtfertigt. Das globale Maß der Korreliertheit ist<br />
det(R) = 0.04598723.<br />
Die statistische Tolerierung liefert die Werte der Tabelle 5.3.8.<br />
Tabelle 5.3.8: Uni- und multivariate statistische Toleranzen<br />
Variable Mittelwert Stabw. Zielwert Toleranzgrenzen<br />
untere<br />
obere<br />
Y 0 –0,1628 14,146 0 –3,522 3,522<br />
Y 1 2499,99 3,5308 2500 2497,766 2502,234<br />
Y 2 3999,986 4,0997 4000 3997,293 4002,707<br />
Y 3 249,9897 1,4453 250 249,4806 250,5194<br />
Y 4 5999,9347 5,0079 6000 5997,117 6002,883<br />
Y 5 250,0007 1,4879 250 249,3086 250,6914
222 5 Qualität in der Fertigung<br />
Tabelle 5.3.9: Vergleich der statistischen und CAD Toleranzbreiten<br />
Maß Statistische Tolerierung CAD Toleranzen<br />
univariat<br />
multivariat<br />
6* s j T o – T u T o – T u<br />
Y 0 0,1415 0,0704 0,15<br />
Y 1 0,0353 0,0447 0,033<br />
Y 2 0,04099 0,0541 0,04<br />
Y 3 0,0144 0,0103 0,015<br />
Y 4 0,05 0,0577 0,047<br />
Y 5 0,0149 0,0138 0,015<br />
Die univariate statistische Toleranzkettenformel liefert für die Schließtoleranz den Wert<br />
T 0 = 0.1556. Die multivariate statistische Tolerierung liefert im korrelierten Fall schmalere<br />
Toleranzbreiten für die Einzelmaße. Die 6* S Toleranzen sind wiederum ähnlich denen im<br />
unkorrelierten Fall. Das ist nicht verwunderlich, wirken sich doch in der Regel die korrelativen<br />
Abhängigkeiten nicht auf die Standardabweichungen der Einzelmaße aus.<br />
Die multiplen Korrelationskoeffizienten für die Einzelmaße sind:<br />
R 2 0/1,2,3,4,5 = 0.8888, R2 1/0,2,3,4,5 = 0.28132, R2 2/0,1,3,4,5 = 0.21746,<br />
R 2 3/0,1,2,4,5 = 0.76823, R2 4/0,1,2,3,5 = 0.40528 und R2 5/0,1,2,3,4 = 0.61256.<br />
Aus diesen Korrelationskoeffizienten liest man ab, dass sich das Schließmaß T 0 am besten<br />
aus den anderen Maßen ableiten lässt, oder anders gesprochen, die anderen Maße haben<br />
einen großen Einfluss auf das Schließmaß. Folglich ist die Differenz zwischen der uni- und<br />
multivariaten Berechnung für dieses Maß am größten.<br />
5.3.3.2 Übung<br />
Ein Produkt wird durch m nicht unabhängige Produktvariable Y 1 , …, Y m beschrieben. Der Vektor<br />
der Produktvariable Y T = (Y 1 , …, Y m ) ist ein zufälliger Vektor. Die Verteilung des zufälligen<br />
Vektors Y gehöre zur Klasse der m-dimensionalen Normalverteilungen Y ~ N m (µ, Σ YY ), wobei<br />
Σ YY positiv definit sein möge. Das von Ihnen zu untersuchende Produkt ist ein Tippgeber, der<br />
in automatischen Schaltgetrieben benötigt wird.<br />
Tabelle 5.3.10: Sollzustand für den Tippgeber<br />
Variable Sollwert Toleranzgrenzen<br />
Y 1 14,23 ±0,05<br />
Y 2 6,45 ±0,05<br />
Y 3 0,55 ±0,15<br />
Y 4 0,55 ±0,15<br />
Y 5 2,25 ±0,15<br />
Y 6 2,25 ±0,15
5.3 Vergleich verschiedener Tolerierungsverfahren<br />
223<br />
Diese müssen verschiedene Funktionen, wie z. B. die automatische Rückstellung in die<br />
„=“ Position, geräuscharmes Schalten usw. realisieren. Die Tippgeber werden durch sechs<br />
Produkt variablen charakterisiert. Der Sollzustand wird durch die Werte der Tabelle 5.3.10<br />
beschrieben.<br />
Problem<br />
Der Kunde ist mit der Qualität der Tippgeber nicht zufrieden.<br />
Was müssen Sie tun?<br />
Sie müssen das Problem definieren.<br />
Wie definieren Sie das Problem?<br />
Dazu müssen Sie eine Stichprobe von Tippgebern zufällig der Fertigung entnehmen und die<br />
Werte für die Produktvariablen messen.<br />
Die Werte für den Tippgeber sind in der Datei Ü5.3 enthalten.<br />
Für Sie habe ich die Daten dieser Datei als Star Plots visualisiert (siehe auch Seite 282).<br />
46<br />
40<br />
30<br />
20<br />
10<br />
1<br />
Abb. 5.3.3: Star Plots für die Tippgeber
224 5 Qualität in der Fertigung<br />
Y3<br />
. Y2<br />
Y4<br />
Y1<br />
Y5 Y6<br />
Abb. 5.3.4: Schlüssel für die Star Plots der Tippgeber<br />
In der Abbildung 5.3.5 habe ich für Sie noch die Korrelationsdiagramme dargestellt.<br />
Y2<br />
Y3<br />
Y4<br />
Y5<br />
Y6<br />
Y1<br />
Y2 Y3 Y4 Y5<br />
Abb. 5.3.5: Korrelationsdiagramme für die Tippgeber<br />
Welche Schlüsse ziehen Sie aus den beiden Abbildungen?<br />
Definieren Sie bitte das Problem und überprüfen Sie die gegebene Tolerierung mit den beigefügten<br />
Programmen.<br />
Was müssen Sie tun, um das Problem zu lösen?<br />
5.4 Warum sollen Sie die Prozessdarstellung wählen?<br />
Sie haben anerkannt, dass jede Tätigkeit und jedes (materielle und/oder immaterielle) Produkt<br />
das Ergebnis eines Prozesses ist. Jetzt müssen Sie mir weiter folgen und den zugehörigen Prozess<br />
strukturieren. Die Produktvariablen sind Funktionen der Input-, Prozess- und Störvariablen<br />
und können nach dem Ursache-Wirkungs-Prinzip nur über diese Variablen verändert werden.
5.4 Warum sollen Sie die Prozessdarstellung wählen?<br />
225<br />
äußere Variable (Störvariable)<br />
Inputs Prozess Produkt<br />
Inputvariable Prozessvariable Produktvariable<br />
Ursachen<br />
Wirkungen<br />
Abb. 5.4.1: Prozessdarstellung<br />
Die Inputvariablen, wie Material, Maschinen, Anlagen, Zusatzstoffe und auch die Fähigkeiten<br />
der Mitarbeiter fließen mit ihren Eigenschaften in den Prozess hinein.<br />
Die Produktvariablen müssen die spezifizierten Kundenanforderungen erfüllen. Über die Veränderung<br />
der Prozessvariablen muss aus den gegebenen Inputvariablen das Produkt mit seinen<br />
geforderten Eigenschaften entstehen. Damit dieses spannende Zusammenspiel zwischen den<br />
Variablen klappt, müssen die Inputvariablen, die ja Produktvariablen von Vorläuferprozessen<br />
sind, ebenfalls die spezifizierten Anforderungen des Prozesses erfüllen. Die spezifizierten Anforderungen<br />
kann man beim Eintreffen der Inputs überprüfen (Wareneingangsprüfung) oder<br />
man vereinbart in einem Dialog mit den Lieferanten, dass die Inputs mit ihren entsprechenden<br />
uni- und multivariaten Fähigkeitsnachweisen geliefert werden.<br />
Die Werte für die Prozessvariablen kann man auch nicht beliebig einstellen, da auf dieser Basis<br />
bestimmt nicht das Produkt mit den geforderten Eigenschaften entsteht. Der Prozess muss mit<br />
einer Prozessgleichung so gesteuert werden, dass bei Kenntnis der Inputvariablen das geforderte<br />
Produkt herauskommt.<br />
Beispiel 5.4.1: Drehen einer Welle. Prozessdarstellung<br />
Aus einem Rundstahl soll eine Welle gedreht werden. Die Welle soll Kundenanforderungen<br />
erfüllen. Zu diesen gehören die Maßhaltigkeit, die Rundheit, die Konizität und gewisse<br />
Festigkeitseigenschaften.<br />
Die Inputs sind der Rundstahlrohling, die Eigenschaften der Drehmaschine, der Kühlmittelstand<br />
usw. Zu den Prozessvariablen zählen die Drehgeschwindigkeit, die Kühlmitteltemperatur,<br />
die Standzeit der Schneidwerkzeuge usw. Die Menge der Produktvariablen umfasst<br />
die Maßhaltigkeit, die Rundheit der Welle, d. h. die Differenz zweier Durchmesser vorn<br />
und hinten an der Welle gemessen usw. Die Prozessdarstellung ist in der Abbildung 5.4.2<br />
enthalten.<br />
Fordert der Kunde vom Lieferanten (Dreherei) eine Welle z. B. mit einem spezifizierten<br />
Elastizitätsmodul [N/m 2 ], so muss der Wellenhersteller bei seinem Lieferanten für die<br />
Rohlinge diese Eigenschaft anfordern, denn beim Drehen wird der Elastizitätsmodul kaum<br />
verändert.
226 5 Qualität in der Fertigung<br />
äußere Variable (Störvariable)<br />
Rundstahl,<br />
Kühlflüssigkeit, Drehen einer Welle Welle<br />
Schneidwerkzeug, ..<br />
Inputvariable Prozessvariable Produktvariable<br />
Drehgeschwindigkeit<br />
Rundheit<br />
Standzeit<br />
Rundheit<br />
Konizität<br />
Temp. Kühlflüssigkeit<br />
Konizität<br />
Stahleigenschaften Temp. Werkzeug<br />
Maßhaltigkeit<br />
Stand der Kühlflüssigkeit,<br />
Ursachen<br />
...<br />
Wirkungen<br />
Abb. 5.4.2: Drehen einer Welle<br />
Dieses Beispiel zeigt schon, dass zwischen den Kunden und Lieferanten ein Dialog stattfinden<br />
muss.<br />
Wie kann man den Dialog zwischen Kunden und Lieferanten führen?<br />
Bevor wir diesen Dialog aufbauen, wollen wir ein Netzwerk von Prozessen betrachten.<br />
5.5 Warum müssen Sie Ihr Unternehmen als Netzwerk von<br />
Dienstleistungs- und Fertigungsprozessen darstellen?<br />
Ein Unternehmen muss durch Fertigungs- und Dienstleistungsprozesse strukturiert werden.<br />
Ziele der Steuerung und Regelung des gesamten Unternehmens sind Erfüllung aller (Markt-)<br />
Kundenanforderungen, Erwirtschaftung der notwendigen Gelder zur erweiterten Reproduktion,<br />
das Bestehen im internationalen Wettbewerb, die Steigerung der betriebswirtschaftlichen<br />
Kennziffern und damit die Existenzsicherung. Die Strukturierung dient ebenfalls der Veränderung<br />
der Organisationsstruktur, nach der die Aufgaben und Verantwortlichkeiten eindeutig<br />
festlegt und die Mitarbeiter dadurch motiviert werden, an der Realisierung der betrieblichen<br />
Ziele mitzuwirken. Nicht zuletzt ist die Strukturierung auch die Grundlage für eine verbesserte<br />
Kostenrechnung auf der Basis des notwendigen Verbrauchs an allen Ressourcen, die z. B.<br />
gewährleistet, dass die stetig steigenden, nicht aufschlüsselbaren Gemeinkostenzuschläge der<br />
Vergangenheit angehören werden.
5.5 Warum müssen Sie Ihr Unternehmen als Netzwerk darstellen?<br />
227<br />
Wir betrachten zunächst zwei Prozesse, um daran die Vernetzung zu demonstrieren. Diese beiden<br />
Prozesse mögen einfach A und B heißen. Der eine Prozess, nehmen wir an, es sei der Prozess<br />
B, soll der Vorläufer- oder Lieferantenprozess vom Prozess A sein. Der Prozess A verarbeitet die<br />
Produkte von Prozess B, d. h. die Produkte B werden zu Inputs von A. Der Prozess A ist damit<br />
der Kundenprozess von B. Folglich muss A formulieren, was er von B verlangt. A muss also<br />
sein (Kunden-) Anforderungsprofil an B formulieren. B muss die Kundenanforderungen durch<br />
Sollwerte und Toleranzgrenzen für alle Produktvariablen des Produktes B spezifizieren. B muss<br />
dann seinen Prozess mit den Sollwerten für alle relevanten Produktvariablen als Zielwerte so<br />
steuern und regeln, dass alle Anforderungen erfüllt werden. B muss außerdem den Nachweis<br />
führen, dass die in B produzierten Produkte alle Kundenanforderungen erfüllen.<br />
Die Produkte von A werden von einem weiteren (externen oder internen) Kunden benötigt.<br />
Dieser Kunde stellt natürlich seine Anforderungen an die Produkte von A. Hieraus wird deutlich,<br />
dass jeder Prozess Kunden- und Lieferantenprozess zugleich ist.<br />
Dieses Zusammenspiel ist in der Abbildung 5.5.1 schematisch dargestellt. Dieses Zusammenspiel<br />
zwischen zwei Prozessen ist in der Literatur unter dem Begriff „internes Kunden-Lieferanten-Verhältnis“<br />
(KLV) bekannt geworden und charakterisiert in unserem Verständnis die<br />
Schnittstelle zwischen zwei Prozessen. In der Literatur wird das KLV nur beschrieben, es kommt<br />
aber darauf an, das KLV zu modellieren und zu realisieren.<br />
Anforderungen<br />
Inputs Prozess B Produkt B<br />
Input für A<br />
Prozess A<br />
Produkt A<br />
Inputvariable Prozessvariable Produktvariable Prozessvariable Produktvariable<br />
Nachweis der<br />
Erfüllung aller<br />
Anforderungen<br />
Vorläuferprozess<br />
Nachfolgerprozess<br />
= Lieferant = Kunde<br />
Abb. 5.5.1: Kunden-Lieferanten-Verhältnis<br />
Beispiel 5.5.1: Papierfeeder. Prozessnetzwerk<br />
Wir betrachten in der Abbildung 5.5.2 die Herstellung eines Papierfeeders als ein Netzwerk<br />
von Prozessen, in denen mechanische Teile, elektronische Komponenten und Kunststoffteile<br />
hergestellt werden.<br />
Das Netzwerk sieht recht einfach aus. Aber wir haben das Netzwerk ohne Kommunikation<br />
dargestellt. So kann das Netzwerk nicht funktionieren.
228 5 Qualität in der Fertigung<br />
Input<br />
Kunststoffherst.<br />
Plastikteile<br />
Inputvariable Prozessvariable Produktvariable<br />
Input<br />
Metallherstellung.<br />
Metallteile<br />
Montage Feeder Funktionen<br />
Inputvariable Prozessvariable Produktvariable<br />
Prozessvariable<br />
Produktvariable Funktionen Par.<br />
Input<br />
Elektroteileherst .<br />
Elektroteile<br />
Inputvariable Prozessvariable Produktvariable<br />
Abb. 5.5.2: Netzwerk von Herstellungsprozessen<br />
5.6 Kommunikation zwischen Prozessen<br />
Im Vorangegangenen haben wir alles Tun in einem Unternehmen durch Prozesse modelliert.<br />
Wie haben des weiteren gesehen, dass die Prozesse nicht unabhängig voneinander sind, schon<br />
allein deswegen, weil jeder Prozess Kunden- und Lieferantenprozess zugleich ist. Eine Kommunikation<br />
zwischen den Prozessen ist somit notwendig. Ohne diese beobachten wir das<br />
tägliche Chaos.<br />
Jede Kommunikation braucht eine Sprache. Die für die Kommunikation zwischen Prozessen<br />
benötigte Sprache haben wir schon bereit gestellt. Diese Sprache hat die Worte bzw. Phrasen<br />
(Teilsätze) oder Elemente<br />
•<br />
•<br />
•<br />
•<br />
•<br />
Zusammenstellung des externes und/oder internen Kundenanforderungsprofils (KAP),<br />
Parametrisierung der gewünschten Eigenschaften,<br />
Datengewinnung für die Produktvariablen,<br />
Spezifizierung des KAP durch Sollwerte und Toleranzgrenzen, mit der CAD oder statistischer<br />
Tolerierung,<br />
Nachweis der simultanen Erfüllung aller (ex- oder internen) Kundenanforderungen mit<br />
uni- und multivariaten Prozessfähigkeitsindizes,<br />
Treffen einer Entscheidung auf der Grundlage der uni- und multivariaten Prozessfähigkeitsindizes<br />
für die statistische Prozessanalyse, falls die Fähigkeiten kleines als 1 sind,<br />
– mit anschließender Prozessverbesserung durch die Steuerung der Prozesse mit der Prozessgleichung<br />
und den Sollwerten und Toleranzgrenzen als Zielwerte bzw. Zielgebiet,
5.6 Kommunikation zwischen Prozessen<br />
229<br />
– Justierung der Prozesse, falls die einfachen uni- und multivariaten Prozessfähigkeitsindizes<br />
größer und die korrigierten Indizes kleines als 1 sind,<br />
• laufende Kontrolle der Prozesse mit den uni- und vor allem multivariaten Kontrollkarten,<br />
falls die einfachen und korrigierten Fähigkeiten größer als eins sind,<br />
• neue Tolerierung, falls die Abhängigkeiten zwischen den Produktvariablen bei der Tolerierung<br />
vernachlässigt wurden,<br />
• Investitionen, falls das vorherige Ausreizen aller Möglichkeiten nicht ausreichte, Produkte<br />
zu produzieren, die alle Kundenanforderungen erfüllen und trotz der vorgegebenen Marktpreise<br />
durch den Verkauf einen Gewinn erzielen.<br />
Wie man sehen kann, ist diese technische Sprache recht einfach. Die Schwierigkeit liegt in der<br />
Bereitstellung der Elemente, die für Sprache benötigt werden, wie der Definition des Problems,<br />
der Berechnung der Sollwerte und Toleranzgrenzen für alle, nicht unabhängigen Produktvariablen<br />
mit Hilfe CAD oder multivariaten statistischen Tolerierung, der Berechnung der uniund<br />
multivariaten Prozessfähigkeitsindizes, des Treffens einer Entscheidung, der Kontrolle der<br />
Prozesse mit uni- und multivariaten Kontrollkarten und der Datenerfassung.<br />
Diese Schwierigkeiten traten in der Vergangenheit auf, weil viele der genannten Elemente bisher,<br />
aus mir nicht bekannten Gründen, nicht zur Verfügung standen. Im Abschnitt 5.3. habe ich<br />
Ihnen die von mir entwickelten neuen Methoden für die Durchführung eines modernen Audits<br />
zur Definition eines Problems und Entscheidungsfindung zur Verfügung gestellt.<br />
Beispiel 5.6.1: Papierfeeder. Prozessnetzwerk mit Kommunikation<br />
Wir betrachten jetzt, nachdem wir die Elemente der technischen Sprache genannt und im<br />
Abschnitt 5.3 zur Verfügung gestellt haben, dasselbe Netzwerk mit Kommunikation in der<br />
Abbildung 5.6.1.<br />
KAP<br />
KAP<br />
KAP<br />
Input Kunststoffherst. Plastikteile<br />
Inputvariable<br />
Prozessvariable Produktvariable<br />
MC PK<br />
KAP<br />
KAP<br />
KAP<br />
KAP<br />
KAP<br />
Input<br />
Metallherstellg.<br />
Metallteile<br />
MC PK<br />
Montage Feeder Funktionen<br />
Input<br />
MC PK<br />
Prozessvariable Produktvariable<br />
Prozessvariable Produktvariable<br />
Funktionenvariable<br />
KAP<br />
KAP<br />
KAP<br />
Input Elektroteileherst. Elektroteile<br />
MC PK<br />
Inputvariable Prozessvariable Produktvariable<br />
MC PK<br />
Abb. 5.6.1: Netzwerk für die Feederherstellung mit Kommunikation
230 5 Qualität in der Fertigung<br />
Die Abbildung zeigt, dass dieses Netzwerk mit Kommunikation auf den ersten Blick kompliziert<br />
aussieht. Aber die Kommunikation ist notwendig, um das tägliches Chaos zu ordnen,<br />
die Prozesse zu verbessern, Produkte mit geforderten Eigenschaften zu produzieren, die<br />
Qualität der Produkte nachzuweisen und zu quantifizieren.<br />
Es gilt die alte Weisheit: „… je flacher die Fertigungstiefe wird, desto intensiver muss die Kommunikation<br />
geführt werden …“.<br />
Die Antwort auf die Frage:<br />
„Wie wird in Ihrem Unternehmen die Kommunikation zwischen Prozessen geführt?“<br />
wird entweder nicht verstanden oder aber lapidar damit beantwortet, dass man sagt, „… wir<br />
regeln die Angelegenheit mit unseren Lieferanten durch Lasten- oder Pflichtenhefte …“<br />
Ich habe mir in vielen Unternehmen Lasten und/oder Pflichtenhefte angeschaut und daher<br />
die neuen Methoden entwickelt.<br />
5.7 Was heißt Prozessverbesserung und was müssen Sie<br />
tun?<br />
Nach dem Entscheidungsgraphen in Abbildung 5.16 beim Produktaudit im Abschnitt 5.3 muss<br />
im Fall MC pk < 1 entschieden werden, dass der Prozess zu verbessern ist, denn der Prozess ist<br />
nicht fähig, Produkte (materielle oder immaterielle) mit geforderten Eigenschaften zu produzieren.<br />
Ausschuss ist die Folge und der kostet Geld. Außerdem führt er zur Nichteinhaltung<br />
der versprochenen Liefertermine.<br />
Die Ursachen hierfür können sein:<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
die Prozesse werden heuristisch ohne Zielwerte gesteuert, das Methodenniveau ist zu<br />
niedrig,<br />
daher können die Streuungen der Produktvariablen zu groß sein oder<br />
die Mittelwerte von den Sollwerten abweichen,<br />
die Tolerierung wurde unter Missachtung der Abhängigkeiten zwischen den Produktvariablen<br />
vorgenommen und ist daher nicht korrekt,<br />
die Anlagen und Maschinen sind zu alt und nicht mehr fähig,<br />
die Mitarbeiter sind nicht genügend qualifiziert und vieles mehr.<br />
Gilt ebenfalls MC p < 1, dann bedeutet das, die Streuung mindestens einer Produktvariablen<br />
ist zu groß. Die Reduktion der Variabilität – man nennt diesen Sachverhalt schlicht Prozessverbesserung<br />
– mindestens einer Produktvariablen ist notwendig.<br />
Gilt MC p > 1 und MC pk < 1, dann ist das Streuverhalten der Produktvariablen in Ordnung, aber<br />
der Vektor der Mittelwerte weicht vom Vektor der Sollwerte an. Der Prozess ist zu justieren.<br />
Die verschiedenen Zielstellungen, die man aufgrund der Größen für die uni- und multivariaten<br />
Prozessfähigkeitsindizes zu verfolgen hat, sind unterschiedlich aufwendig und kosten<br />
daher unterschiedlich viel. Daher ist ja die Entscheidung für den einen oder anderen Weg so<br />
vorteilhaft für die Qualitätsverbesserungsprojekte.
5.7 Was heißt Prozessverbesserung und was müssen Sie tun?<br />
231<br />
Beispiel 5.7.1: Chemischer Prozess. Prozessverbesserung<br />
Das Produkt eines chemischen Prozesses wird durch m = 6 Produktvariable erklärt, von<br />
denen die Variable Y 1 den Anteil einer unerwünschten Substanz beschreibt, die für viel Geld<br />
aus dem Produkt herausgefiltert werden muss. Die Frage lautet, kann der Prozess so gesteuert<br />
werden, dass der Anteil der unerwünschte Substanz so klein wird, dass die unerwünschte<br />
Substanz dem Verbraucher keinen Schaden mehr zufügen kann?<br />
Die Ausgangssituation bzgl. der Produktvariablen Y 1 , d. h. der ungesteuerte Prozess und<br />
der verbesserte Prozess sind in Abbildung 5.7.1 und Abbildung 5.7.2 dargestellt.<br />
Y<br />
ungesteuerter<br />
Prozess<br />
Y<br />
gesteuerter<br />
Prozess<br />
40<br />
40<br />
30<br />
30<br />
20<br />
20<br />
10<br />
10<br />
0<br />
0 20 40 60 80 100<br />
t<br />
0<br />
0 20 40 60 80 100<br />
t<br />
Abb. 5.7.1: Vergleich der Ergebnisse des ungesteuerten und gesteuerten Prozesses<br />
Beim heuristisch oder ungesteuerten Prozess sieht man, dass die unerwünschte Substanz<br />
mal häufiger und mal seltener vorkommt und ein Trend beobachtet wird. Daraus kann<br />
man aber bereits ableiten, dass zumindest ein Teil der Ursachen für das Vorkommen der<br />
unerwünschten Substanz im Prozess oder den Inputs liegt.<br />
Der gesteuerte Prozess zeigt, dass die unerwünschte Substanz durch die Steuerung des<br />
Prozesses mit einer Prozessgleichung nahezu vollständig vermieden werden kann. Genau<br />
das ist das zu erreichende Ziel, mit Hilfe der geistigen Investition, oder anders formuliert,<br />
der Anwendung multivariater statistischer Methoden, Prozesse wesentlich zu verbessern.<br />
Das spricht nicht gegen das hohe Expertenwissen der Mitarbeiter, die aufgrund ihrer Erfahrung<br />
das heutige hohe Niveau der „heuristischen“ Steuerung erreicht haben. Ich habe<br />
großen Respekt vor diesen Leistungen. Allerdings müssen wir uns heute dem Diktat der<br />
Globalisierung und des internationalen Marktes beugen und jeden möglichen Euro für<br />
die Sicherung der Existenz deutscher Unternehmen herausfiltern. Und das ist nur mit den<br />
modernen Methoden der multivariaten Statistik möglich.<br />
Die Verteilung der Produktvariablen Y 1 (unerwünschtes Nebenprodukt) des ungesteuerten<br />
Prozesses lässt sich in der Abbildung 5.7.2, links, darstellen.<br />
Diese Abbildung repräsentiert die univariate Betrachtung. Es wird ausschließlich die<br />
Produktvariable Y 1 betrachtet, ohne die anderen vorhandenen Informationen zu berücksichtigen.<br />
Können wir uns das noch leisten?<br />
Schon die linke Darstellung in Abbildung 5.7.2 zeigt, dass außer den Werten für die Produktvariable<br />
Y 1 weitere Informationen in Form wenigstens einer Input- und/oder Prozessvariablen,<br />
hier mit t bezeichnet, vorliegt. Betrachten Sie nach dem Ursache-Wirkungs-Prinzip<br />
Y 1 als Funktion von den Input- und Prozessvariablen, dann erhalten Sie als Ergebnis die
232 5 Qualität in der Fertigung<br />
Y<br />
40<br />
30<br />
20<br />
10<br />
Ausgangssituation<br />
Was haben wir?<br />
Ohne die Anwendung der multivariaten statistischen<br />
Methoden eine breite Verteilung von Y 1<br />
Y<br />
40<br />
30<br />
20<br />
10<br />
Prozessverbesserung<br />
Was müssen wir tun?<br />
Die Prozessgleichung berechnen und die<br />
Verteilung von Y 1<br />
um die Gleichung<br />
betrachten<br />
Y<br />
40<br />
30<br />
20<br />
10<br />
0<br />
0 20 40 60 80 100<br />
t<br />
0<br />
0 20 40 60 80 100<br />
t<br />
0<br />
0 20 40 60 80 100<br />
t<br />
Abb. 5.7.2: Schritte der Prozessverbesserung<br />
Prozessgleichung, die hier in der rechten Abbildung durch die Gerade markiert ist. Uns<br />
interessiert nun die Streuung der Werte von Y 1 um die Prozessgleichung. Diese Verteilung ist<br />
auch im rechten Bild der Abbildung 5.7.2 zu sehen. Die Breite der Verteilung ist wesentlich<br />
kleiner als die Breite der Verteilung von Y 1 . Das ist nach der Shannon Theorie auf den Informationsgewinn<br />
durch die Betrachtung der zusätzlichen Variablen zurück zuführen. Die<br />
Verkleinerung der Breite der ursprünglichen Verteilung durch die Betrachtung zusätzlicher<br />
Variabler messen wir mit dem Maß der Beherrschbarkeit des Prozesses. Der Informationsgewinn<br />
ist aber bereits eine Prozessverbesserung ohne materielle Investitionen. Wir<br />
können die Prozessverbesserung steigern, indem wir den Prozess mit der Prozessgleichung<br />
steuern. Das Ergebnis ist das Bild 3 in der Abbildung 5.7.2. Die unerwünschte Substanz<br />
kommt kaum noch vor, die Verteilung der Messwerte für Y 1 des gesteuerten Prozesses ist<br />
sehr schmal, d. h. deren Streuung ist sehr klein.<br />
5.8 Wie können wir das Ergebnis erreichen?<br />
Der Prozess wurde eingeführt, da sich damit zeigen lässt, dass die Produktvariablen nach dem<br />
Ursache-Wirkungs-Prinzips nur verändert werden können, wenn sowohl die Input- als auch<br />
die Prozessvariablen verändert werden. Die Folge daraus ist, dass die Variation der Produktvariablen<br />
nur dann reduziert werden kann, wenn sowohl die Input- als auch die Prozessvariablen<br />
verändert werden. Nichts anderes tun die Prozessexperten aufgrund „ihrer“ Erfahrung.<br />
Wir müssen die Erfahrung durch Wissen ersetzen. Das können wir nur dann tun, wenn wir<br />
dem Prozess sein Wissen abluchsen. Dazu müssen wir mit den Prozessen kommunizieren und<br />
das ist nach dem Grundsatz des Galilei: „messe alles, und das nicht Messbare mache messbar“<br />
nur über die Daten für alle Produkt-, Input-, Prozess- und Störvariablen möglich. Mit diesen<br />
Daten kann<br />
• die Abhängigkeitsstruktur zwischen den Input-, Prozess- und Produktvariablen quantifiziert<br />
und analysiert und<br />
• eine Prozessgleichung berechnet werden, die über die Input- und Prozessvariablen die<br />
Steuerung der Produktvariablen so ermöglicht, dass simultan alle Kundenanforderungen<br />
durch die produzierten Produkte erfüllt werden.
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
233<br />
An dieser Stelle sei noch einmal daran erinnert, dass wir mit dieser Methodik sowohl Herstellungs-<br />
als auch Dienstleistungsprozesse behandeln müssen, um betriebswirtschaftliche<br />
Verbesserungen zu erzielen.<br />
Die Verfahren der univariaten Statistik können dieses Anliegen nicht erfüllen. Daher ist die<br />
multivariate Statistik die geeignete Methodik. Multivariat heißt nichts anderes als mehrdimensional.<br />
Und mehrdimensional müssen die statistischen Methoden schon sein, denn es gibt ja<br />
im trivialsten Fall wenigstens eine Prozess- und eine Produktvariable.<br />
Für die Prozessverbesserung benötigt man multivariate statistische Methoden zur<br />
•<br />
•<br />
•<br />
•<br />
•<br />
Analyse der Abhängigkeitsstruktur,<br />
Klassifikation einer heterogenen Stichprobe in homogene Teilstichproben,<br />
Auswahl der wesentlichen Input- und Prozessvariablen und Berechnung der Prozessgleichung,<br />
Optimierung und Steuerung des Prozesses,<br />
Kontrolle des verbesserten Prozesses mit uni- und multivariaten Kontrollkarten.<br />
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses ?<br />
Ein Prozess wird durch die Input-, Prozess-, noise- und Produktvariablen beschrieben. Diese<br />
Variablen werden in dem Vektor der Zufallsgrößen<br />
(Z 1 , …, Z l , X 1 , …, X n , U 1 , …, U p , Y 1 , …, Y m ) T = (Z T , X T , U T , Y T ) T<br />
zusammengefasst.<br />
Die Zufallsgrößen sind nicht unabhängig voneinander, sondern durch eine Abhängigkeitsstruktur<br />
miteinander verbunden. Das soll die Abbildung 5.9.1 verdeutlichen.<br />
Inputs Prozess Produkt<br />
X 1<br />
X 2<br />
Y 1<br />
Y 2<br />
X 3<br />
Abb. 5.9.1: Abhängigkeitsstruktur zwischen Input-, Prozess- und Produktvariablen
234 5 Qualität in der Fertigung<br />
Der Einfachheit halber wurden die Input- und Prozessvariablen mit dem Buchstaben X<br />
bezeichnet. Diese Abbildung zeigt, dass selbst bei einer geringen Anzahl von Variablen die<br />
Abhängigkeitsstruktur schon recht kompliziert werden kann. Stellt man sich noch vor, dass<br />
die Abhängigkeiten sowohl positiv als auch negativ sein können, dann kann man sich vorstellen,<br />
dass selbst für die logische Analyse der kleiner Abhängigkeitsstrukturen der menschliche<br />
Verstand nicht mehr ausreicht und an dessen Stelle statistische Modelle eingesetzt werden<br />
müssen.<br />
Diese Abhängigkeitsstruktur muss quantifiziert werden. Dazu dienen die Korrelations-, die<br />
Hauptkomponenten- und Faktoranalysen.<br />
5.9.1 Wie führt man eine Korrelationsanalyse (KA) durch und was<br />
besagen die Ergebnisse?<br />
Unter der Korrelationsanalyse verstehen wir die Berechnung der Abhängigkeiten<br />
• zwischen jeweils zwei Zufallsgrößen – in unserem Sprachgebrauch zwischen jeweils zwei<br />
(Input-, Prozess- und/oder Produkt-) Variablen mit dem einfachen Korrelationskoeffizienten.<br />
Die Berechnung der paarweisen Abhängigkeiten zwischen allen ⎜<br />
⎛n + p + m⎞<br />
⎝ 2 ⎟<br />
⎠<br />
Variablen liefert ebenso viele Korrelationskoeffizienten, die in der Korrelationsmatrix R<br />
zusammengefasst werden.<br />
• Häufig müssen Korrelationskoeffizienten zwischen jeweils zwei Zufallsgrößen unter der<br />
Bedingung, dass andere Zufallsgrößen konstant gehalten werden, berechnet werden. Diese<br />
Korrelationskoeffizienten heißen partielle Korrelationskoeffizienten. So wird häufig die<br />
Frage gestellt, wie ist die lineare Abhängigkeit zwischen zwei Prozessvariablen, wenn die<br />
Inputvariablen konstant gehalten werden müssen, oder anders formuliert, wenn die Werte<br />
für die Inputvariablen gegeben sind? Das bedeutet, es sind die Korrelationskoeffizienten für<br />
die Zufallsgrößen einer bedingten Verteilung, im vorliegenden Fall der bedingten Verteilung<br />
der Prozessvariablen unter der Bedingung der gegebenen Inputvariablen zu berechnen.<br />
• Zur Korrelationsanalyse zählen wir auch die Berechnung der Abhängigkeit einer Zufallsgröße,<br />
z. B. einer Produktvariablen Y j , j = 1, …, m von einer Linearkombination aller<br />
Input- und Prozessvariablen. Diese Korrelationskoeffizienten nennt man multiple Korrelationskoeffizienten<br />
und bezeichnet sie mit R 2 Y j / allen Input- und Prozessvariablen .<br />
• Außer diesen Abhängigkeiten ist häufig die Abhängigkeit zwischen einer Zufallsgröße, z. B.<br />
der Produktvariablen Y und einer Linearkombination der wesentlichen Prozessvariablen<br />
X unter der Bedingung der wesentlichen Inputvariablen Z zu quantifizieren. Ein solches<br />
Maß der Abhängigkeit nennt man partiell multipler Korrelationskoeffizient.<br />
• Da ein Produkt durch mehrere, z. B. m, m ≥ 1 Produktvariable beschrieben wird und die<br />
Kenntnis der Abhängigkeit der Gesamtheit der Produktvariablen von allen Input- und<br />
Prozessvariablen als verallgemeinertes Maß der Beherrschbarkeit eines Prozesses notwendig<br />
ist, wird auch der multivariate, multiple Korrelationskoeffizient berechnet.<br />
• Für weiterführende Analysen werden noch die multivariat partiell-multiplen und die<br />
multivariat semipartiell-multiplen Korrelationskoeffizienten eingeführt.<br />
Es versteht sich von selbst, dass die Analyse einer Abhängigkeitsstruktur mit der Berechnung<br />
der einfachen Korrelationskoeffizienten beginnt.
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
235<br />
Was sind einfache Korrelationskoeffizienten?<br />
Die einfachen Korrelationskoeffizienten messen die lineare Abhängigkeit zwischen zwei zufälligen<br />
Variablen.<br />
Beispiel 5.9.1: Bremsweg eines PKW. Korrelationskoeffizienten<br />
Fährt man mit einem PKW durch eine Stadt und muss vor einem auftretenden Hindernis<br />
plötzlich bremsen, dann können der Bremsweg und die gefahrene Geschwindigkeit<br />
gemes sen werden. Für die Rekapitulation von Unfallgeschehen möchte die Polizei wissen,<br />
wie streng die Länge des Bremsweges von der gefahrenen Geschwindigkeit des PKW abhängt.<br />
Lässt man z. B. N PKW’s fahren, dann erhält man N Wertepaare. Die Wertepaare können<br />
als Punkte in einer Ebene gedeutet und aufgezeichnet werden. Für das Experiment erhält<br />
man die Abbildung 5.9.2.<br />
51<br />
46<br />
Bremsweg<br />
41<br />
36<br />
31<br />
26<br />
21<br />
53 58 63 68<br />
Geschwindigkeit<br />
Abb. 5.9.2: Länge des Bremsweges in Abhängigkeit von der Geschwindigkeit<br />
Die Punktwolke der Wertepaare ergeben eine elliptisch umrissene Punktwolke. Intuitiv<br />
würde man sagen, der Zusammenhang zwischen der Geschwindigkeit und dem Bremsweg<br />
ist eng. Aber diese Aussage muss quantifiziert werden, denn eine qualitative Einschätzung<br />
sagt sehr wenig aus und man kann nicht für alle möglichen Abhängigkeiten erst eine<br />
Abbildung zeichnen und dann eine subjektive Einschätzung vornehmen. Der berechnete<br />
Korrelationskoeffizient r Bremweg, Geschwindigkeit = 0.88.<br />
Was besagt dieser Koeffizient und wie kann man den Korrelationskoeffizienten berechnen?<br />
Der Korrelationskoeffizient ist eine dimensionslose Zahl, die zwischen –1 und +1 liegt. Ist der<br />
Korrelationskoeffizient groß gegen 1, dann nähert sich das Aussehen der Punktwolke immer<br />
stärker dem Aussehen einer Zigarre an, d. h. die eine Hauptachse der Ellipse wird immer<br />
länger, die andere immer kürzer. Ist der Korrelationskoeffizient gleich 1, dann wird aus der<br />
Ellipse eine Gerade. Der Anstieg der Gerade kann positiv oder negativ sein. Entsprechend<br />
dem Anstieg ist der Korrelationskoeffizient positiv oder negativ. Gibt es zwischen den beiden
236 5 Qualität in der Fertigung<br />
Variablen keine Abhängigkeit, d. h. sind die beiden Variablen unabhängig voneinander, dann<br />
ist der Korrelationskoeffizient null.<br />
Für den einfachen Korrelationskoeffizienten<br />
ρ<br />
12<br />
σ12<br />
= =<br />
σ ⋅ σ<br />
1 2<br />
Kovarianz<br />
Produkt der Streuungen<br />
erhält man nach der Maximum Likelihood Methode die Schätzung<br />
wobei<br />
r<br />
12<br />
S12<br />
= .<br />
S ⋅ S<br />
1 2<br />
N<br />
∑<br />
S = ( Y − Y )( Y − Y )<br />
12 i,1 1 i,2 2<br />
i=<br />
1<br />
die Stichprobenkovarianz zwischen Y 1 und Y 2 ist. Zur Begründung des eben gesagten betrachten<br />
wir zunächst nur zwei Produktvariable Y 1 und Y 2 und nehmen an, dass der Vektor dieser beiden<br />
Variablen Y T = (Y 1 , Y 2 ) normalverteilt ist mit dem Vektor der Erwartungswerte (Mittelwerte<br />
der Grundgesamtheit)<br />
µ T = (µ 1 , µ 2 )<br />
und der Kovarianzmatrix<br />
Σ<br />
YY<br />
⎛<br />
2<br />
σ ⎞<br />
1 σ12<br />
= ⎜<br />
2<br />
⎟<br />
⎝ σ ⎠<br />
2<br />
in der σ 2 1 die Varianz von Y 1 (Quadrat der Standardabweichung von Y 1 in der Grundge samtheit),<br />
σ 2 2 die Varianz von Y 2 und σ 12 die Kovarianz zwischen Y 1 und Y 2 ist. Die Kovarianz von Y 1 und<br />
Y 2 ist als Produkt der Abweichungen der Y 1 Werte vom Erwartungswert µ 1 und der Y 2 Werte<br />
von µ 2 durch<br />
E [(Y 1 – µ 1 ) (Y 2 – µ 2 )] = σ 12<br />
definiert. Die Kovarianz ist ein Abhängigkeitsmaß zwischen Y 1 und Y 2 , d. h. diese gibt an, wie<br />
sich z. B. Y 1 in Abhängigkeit von Veränderungen von Y 2 verändert. Die Kovarianz ist aber von<br />
den Dimensionen der beiden Zufallsgrößen Y 1 und Y 2 abhängig. Das ist unschön und soll<br />
durch Standardisierung der beiden Zufallsgrößen Y 1 und Y 2 aufgehoben werden.<br />
Unter Standardisierung versteht man dabei den Übergang von Y j zu Z j über die Beziehung<br />
Z<br />
j<br />
Yj<br />
− μ j<br />
= , j = 1,2.<br />
σ<br />
j<br />
Für die standardisierten Zufallsgrößen Z 1 und Z 2 ist die Kovarianz E [Z 1 Z 2 ] durch<br />
E[( Y1 − μ1) ⋅( Y2 − μ2)]<br />
E[ Z1 ⋅ Z2]<br />
=<br />
σ ⋅ σ<br />
1 2<br />
gegeben. Die Kovarianz zwischen den standardisierten Zufallsgrößen Y 1 und Y 2 nennt man<br />
Korrelationskoeffizient ρ 12
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
237<br />
Y 2<br />
Y 1<br />
ρ 12 = 1<br />
Y 2 + ΔY 2<br />
Y 2<br />
Y 1 Y 1 + ΔY 1<br />
Abb. 5.9.3: Lineare Abhängigkeit zwischen Y 1 und Y 2<br />
Für diesen gilt:<br />
• 1 ≤ ρ 12 ≤ 1,<br />
wobei ρ 12 = 1 genau dann gilt, wenn Y 1 und Y 2 mit der Wahrscheinlichkeit eins linear abhängig<br />
sind, wie das in der Abbildung 5.9.3 dargestellt ist. Linear abhängig heißt in diesem<br />
Zusammenhang, wenn mit der Wahrscheinlichkeit 1 eine Veränderung von z. B. Y 1 zu einer<br />
determinierten Veränderung von Y 2 führt und umgekehrt, d. h. wenn P (Y 2 = β 0 + β Y.1 Y 1 )<br />
= 1, wobei β 0 und β Y.1 die unbekannten Koeffizienten der Geradengleichung sind.<br />
Man kann diesen Sachverhalt auch in der folgenden Art beschreiben: die Punkte (Y 1 , Y 2 )<br />
liegen auf der Geraden, die den funktionalen Zusammenhang zwischen Y 1 und Y 2 beschreibt,<br />
d. h. Y 1 und Y 2 haben keine Streuungen. Das wiederum heißt aber, dass der Zusammenhang<br />
zwischen Y 1 und Y 2 determiniert ist. Diesen Sachverhalt verdeutlicht die Abbildung 5.9.3.<br />
• ρ 12 = 0 gilt nur dann, wenn Y 1 und Y 2 linear unabhängig sind. In diesem Falle liegen die<br />
Realisierungen von Y 1 und Y 2 , d. h. die Wertepaare von Y 1 und Y 2 in einem kreisförmigen<br />
Gebiet.<br />
• Für alle anderen Werte des Korrelationskoeffizienten liegen die Wertepaare in elliptisch<br />
umrissenen Gebieten. Diese Ellipsen können steigend oder fallend sein, je nachdem wie<br />
das Vorzeichen des Korrelationskoeffizienten ist.<br />
• Von ρ 12 = 0 bzw. r 12 = 0 kann man nicht auf die Unabhängigkeit von Y 1 und Y 2 schließen.<br />
• Der Korrelationskoeffizient der Grundgesamtheit ρ 12 wird mit der Formel<br />
r<br />
12<br />
=<br />
N<br />
∑<br />
i=<br />
1<br />
( Y − Y ) ⋅( Y − Y )<br />
1, i 1 2, i 2<br />
N<br />
N<br />
2 2<br />
∑ ( Y1, i − Y1 ) ⋅∑<br />
( Y2, i − Y2<br />
)<br />
i= 1 i=<br />
1<br />
und den Wertepaaren (Y 11 , Y 21 ), …, (Y 1,N , Y 2,N ), d. h. der Stichprobe geschätzt.<br />
Die Korrelationskoeffizienten für alle möglichen ⎛ m ⎞<br />
⎜<br />
⎝2<br />
⎟ Paare von Produktvariablen werden<br />
⎠<br />
in der Korrelationsmatrix
238 5 Qualität in der Fertigung<br />
R<br />
YY<br />
⎛1 r12 ... r1<br />
m ⎞<br />
⎜ 1 ... r ⎟<br />
2m<br />
= ⎜<br />
⎟<br />
⎜ ... ⎟<br />
⎜<br />
⎝<br />
1 ⎟<br />
⎠<br />
zusammengestellt.<br />
Die Korrelationsmatrix ist symmetrisch, denn es gilt r jk = r kj für alle<br />
j, k = 1, … (j – 1) j (j + 1), …, (k – 1), k, (k + 1), …, m, j ≠ k. Für j = k ist ρ jj = ρ kk = 1.<br />
Die Korrelationsmatrix ist für reguläre m-dimensionale Verteilungen positiv definit, wenn<br />
das Produkt widerspruchsfrei durch die Produktvariablen beschrieben wird.<br />
Wie kann geprüft werden, ob ein berechneter Korrelationskoeffizient eine Abhängigkeit<br />
ausdrückt, die statistisch gesichert von null verschieden ist?<br />
Zu diesem Sachverhalt sagt man kurz, die Abhängigkeit zwischen zwei Zufallsgrößen ist „signifikant<br />
von null verschieden“.<br />
Da der Korrelationskoeffizient mit den Werten einer Stichprobe geschätzt wurde, hängt er<br />
einmal vom Stichprobenumfang und von der „Zufälligkeit“ der beteiligten Variablen, d. h.<br />
der Größe der Streuungen ab. Aus diesem Grund muss beim Korrelationskoeffizienten stets<br />
gefragt werden, wie groß kann r 12 von null abweichen, ohne dass die Unabhängigkeit von Y 1<br />
und Y 2 verletzt ist?<br />
Zur Beantwortung dieser Frage müssen Hypothesen über ρ 12 formuliert werden, die mit r 12<br />
zu beantworten sind, d. h. man benötigt einen Test. Die Hypothesen lauten:<br />
H 0 : ρ 12 = 0 (d. h. die Zufallsgrößen Y 1 und Y 2 sind nicht miteinander korreliert) und<br />
H 1 : ρ 12 ≠ 0 (d. h. die Zufallsgrößen sind linear nicht unabhängig voneinander)<br />
Die Prüfung der H 0 gegen die Alternativhypothese H 1 wird mit dem t-Test<br />
ˆ<br />
r12<br />
t = ⋅ N − 2<br />
2<br />
1 − r<br />
12<br />
geprüft. Ist tˆ<br />
< t α , N −2, dann kann die H 0 nicht verworfen werden. Aufgrund der Stichprobe<br />
d. h. der Größe von r 12 kann dann gesagt werden, dass Y 1 und Y 2 nicht linear abhängig voneinander<br />
sind.<br />
Beispiel 5.9.2: Bremsweg eines PKW. Abhängigkeit des Bremsweges<br />
Das erweiterte Bremswegbeispiel enthält die Produktvariable<br />
Y Länge des Bremsweges in [m]<br />
und die Input- und Prozessvariablen<br />
X 1 Geschwindigkeit des PKW in einer Ortschaft [km/h]<br />
X 2 mittlere Profiltiefe der Reifen aller 4 Räder [mm]<br />
X 3 Reaktionszeit des Fahrers in [sec].<br />
Die statistischen Maßzahlen sind in der folgenden Tabelle 5.9.1 zusammengestellt.
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
239<br />
Tabelle 5.9.1: Statistische Maßzahlen für das Bremswegbeispiel<br />
Bremsweg Geschwindigkeit Profiltiefe Reaktionszeit<br />
Mittelwert 29,96 49,74 3,47 1,24<br />
Varianz 33,5398 95,4792 0,59036 0,14773<br />
S 5,791 9,771 0,768 0,384<br />
Min 13,65 19,3 1,44 0,064<br />
Max 46,41 76,5 5,26 2,076<br />
R 32,7 57,2 3,8 2,01<br />
V 19 19 22 31<br />
Für dieses Beispiel ist die Korrelationsmatrix in der Tabelle 5.9.2 enthalten.<br />
Tabelle 5.9.2: Korrelationsmatrix Beispiel Bremsweg<br />
Bremsweg Geschwindigkeit Profiltiefe Reaktionszeit<br />
Bremsweg 1 0,837 –0,373 0,457<br />
Geschw 1 –0,207 0,168<br />
Profil 1 0,098<br />
Reaktion 1<br />
Der Abhängigkeitsgraph für diese vier Variablen ist in der Abbildung 5.9.4 dargestellt.<br />
X 1<br />
r Y1 = 0.84<br />
r 12 = - 0.20<br />
X 2<br />
Y<br />
r Y2 = - 0.37<br />
r 13 = 0.1<br />
X 3<br />
r Y3 =0.45<br />
r 23 = 0.17<br />
Abb. 5.9.4: Abhängigkeitsgraph für das Bremswegbeispiel<br />
Zur Demonstration der Anwendung des t-Tests überprüfen wir die Nullhypothese H 0 des<br />
Korrelationskoeffizienten r 23 , die lautet H 0 : ρ 23 = 0 gegen H 1 : ρ 23 ≠ 0<br />
Der t-Test liefert<br />
0.1<br />
tˆ = ⋅ 28 = 0.532<br />
2<br />
1−<br />
0.1
240 5 Qualität in der Fertigung<br />
Der zugehörige Tafelwert für die einseitige Fragestellung ist t 0.05; 28 = 2.048. Der berechnete<br />
t-Wert ist kleiner als der Tafelwert. Folglich kann die Nullhypothese nicht verworfen werden,<br />
d. h. der aus der Stichprobe vom Umfang N = 30 berechnete Korrelationskoeffizient r 23 = 0.1<br />
unterscheidet sich nicht statistisch gesichert von null. Der Stichprobenkorrelationskoeffizient<br />
r 23 weicht nur zufällig von null ab, d. h. X 2 und X 3 sind nicht miteinander korreliert.<br />
Es ist an dieser Stelle notwendig darauf hinzuweisen, dass man im Fall der Ablehnung der H 0<br />
nicht einfach sagen kann, X j und X k sind linear abhängig, denn der Korrelationskoeffizient<br />
ist ein Maß für den Grad der linearen Abhängigkeit zwischen den beiden Zufallsgrößen.<br />
Man kann in diesem Fall nur sagen, X j und X k sind korreliert.<br />
Die Hypothesen H 0 bzgl. aller anderen Korrelationskoeffizienten müssen analog geprüft<br />
werden. Am stärksten ist die Abhängigkeit zwischen der Reaktionszeit X 3 und der Alkoholkonzentration<br />
X 5 gefolgt von der Korrelation zwischen dem Bremsweg und der<br />
Geschwindigkeit.<br />
Die Korrelationsmatrix ist der Ausdruck für die Abhängigkeitsstruktur der Produkt- und<br />
Prozessvariablen (oder nur der Produkt-, oder nur der Prozessvariable), die in der nebenstehenden<br />
Abbildung für die Produktvariable und die ersten drei Input- und Prozessvariablen<br />
symbolisiert ist. Aus dieser Abbildung wird deutlich, dass die Abhängigkeit zwischen zwei<br />
Parametern natürlich durch die anderen Parameter beeinflusst wird.<br />
Der Zusammenhang zwischen der Kovarianz- und Korrelationsmatrix wird matriziell durch<br />
die Beziehung<br />
⎛ ⎞ ⎛ ⎞<br />
R = D⎜ 1 ⎟ ⋅Σ<br />
⋅ D⎜ 1 ⎟ ⎝σj<br />
⎠ ⎝σj<br />
⎠<br />
j = … n , bzw.<br />
Σ = D( σ ) ⋅ R ⋅ D( σ )<br />
j<br />
j<br />
ausgedrückt.<br />
Außerdem gilt für die Determinanten der Korrelations-R XX und Kovarianzmatrix Σ XX der oft<br />
nützliche Zusammenhang<br />
wobei<br />
n<br />
Σ = ∏ σ 2 R<br />
XX j XX<br />
j=<br />
1<br />
R<br />
XX<br />
⎧⎪ 1, falls ρjk<br />
= 0, ∀ jk , = 1, …, nj , ≠ k<br />
= ⎨<br />
⎪⎩<br />
0, falls wenigstens ein ρjk<br />
= 1, für j ≠ k.<br />
Das Modell der Korrelationskoeffizienten ist – wie jedes Modell – von den Voraussetzungen<br />
abhängig. Hier bei diesem Modell handelt es sich um die Voraussetzungen der Normalverteiltheit,<br />
Linearität der Abhängigkeiten und der Unabhängigkeit der Elemente der Stichprobe.<br />
Gibt es ein globales Maß für die Straffheit der Abhängigkeitsstruktur?<br />
⎛n + m⎞<br />
In einer Korrelationsmatrix gibt es aufgrund der Symmetrie der Matrix ⎜<br />
⎝ 2 ⎟ verschiedene<br />
Korrelationskoeffizienten. Diese können groß oder klein, positiv oder negativ sein.<br />
⎠<br />
Diese
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
241<br />
Verhältnisse erschweren die Interpretation der Abhängigkeitsstruktur. Daher suchen wir ein<br />
globales Maß für die Abhängigkeitsstruktur. Dieses Maß ist die Determinante det(R) der<br />
Korrelationsmatrix.<br />
Der maximale Wert der Determinante ist det(R) = 1. Dieser Wert wird erreicht, wenn alle<br />
Korrelationskoeffizienten gleich null sind. (Zur Erinnerung sei wiederholt, dass im Falle der<br />
Unabhängigkeit alle Korrelationskoeffizienten gleich null sind.) Die Determinante ist null,<br />
wenn wenigstens ein Korrelationskoeffizient außerhalb der Hauptdiagonalen gleich 1 ist.<br />
Beispiel 5.9.3: Bremsweg eines PKW. Determinante der Korrelationsmatrix<br />
Die Determinante der Korrelationsmatrix für die Input-, Prozess- und Produktvariablen<br />
ist det(R) = 0.12163. Interessanter ist die Determinante der Input- und Prozessvariablen,<br />
denn diese bestimmt den Grad der Multikollinearität. Hierfür berechnen wir den Wert<br />
det(R XX ) = 0.9124. Der Grad der Multikollinearität ist sehr gering und beeinflusst später<br />
folgende Resultate, wie z. B. die Berechnung der Prozessgleichung nicht.<br />
Was passiert, wenn eine oder beide Voraussetzungen verletzt sind?<br />
In diesem Fall können die verteilungsfreien Korrelationskoeffizienten bere chnet werden.<br />
5.9.2 Verteilungsfreie Korrelationskoeffizienten<br />
Verteilungsfreie Korrelationskoeffizienten benötigen keine Annahme über die zugrunde liegende<br />
Verteilung der Zufallsgrößen. Diese Koeffizienten sind daher robuster als die anderen.<br />
5.9.2.1 Was ist ein Vierfelder Korrelationskoeffizient?<br />
Es seien X, Y zwei Zufallsgrößen mit diskreter Verteilung, die nur qualitativ gemessen werden<br />
können, d. h. die Messwerte sind die Häufigkeiten einer Alternative, wie z. B. Raucher und<br />
Nichtraucher, Produkt in Ordnung und Produkt defekt usw. Eine Stichprobe eines zweidimensionalen<br />
Vektors alternativ verteilter Zufallsgrößen, wie z. B. die Zufallsgröße X besteht<br />
im Vorhandensein oder Nichtvorhandensein einer Eigenschaft A und Y bezieht sich analog<br />
auf eine Eigenschaft B, liefert vier verschiedene Häufigkeiten, die in einer Vierfeldertafel, siehe<br />
Tabelle 5.9.3 aufgeschrieben und mit dem Vierfelder Korrelationskoeffizienten ausgewertet<br />
werden müssen.<br />
Tabelle 5.9.3: Vierfeldertafel<br />
Eigenschaft A<br />
Zeilensumme<br />
vorhanden<br />
nicht vorhanden<br />
Eigenschaft B<br />
vorhanden<br />
nicht vorhanden<br />
a<br />
c<br />
b<br />
d<br />
a + b<br />
c + d<br />
Spaltensumme a + c b + d = a + b + c + d
242 5 Qualität in der Fertigung<br />
In dieser Tafel bezeichnen<br />
a die Häufigkeit des Vorkommens von A und B<br />
a + c die Häufigkeit des Vorkommens von A<br />
a + b die Häufigkeit des Vorkommens von B<br />
d die Häufigkeit der Alternative von A und B,<br />
d. h. des Nichtvorkommens von A und B<br />
b + d die Häufigkeit des Nichtvorkommens von A<br />
c + d die Häufigkeit des Nichtvorkommens von B.<br />
Die zu prüfende Nullhypothese lautet<br />
H 0 : „die beiden Alternativen verteilen sich unabhängig voneinander“<br />
Zur Prüfung dieser Hypothese verwendet man den χ 2 -Test<br />
V<br />
2<br />
χ<br />
a ⋅d − b ⋅c<br />
= =<br />
N [( a + b) ⋅ ( a + c) ⋅ ( b + d) ⋅ ( c + d)]<br />
Für diesen Koeffizienten gilt –1 ≤ V ≤ 1.<br />
Beispiel 5.9.4: Stillstandszeiten<br />
Es soll überprüft werden, ob es zwischen den Stillständen einer Anlage und den Ausschussteilen,<br />
einen Zusammenhang gibt. Die Anlage arbeitet in 3 Schichten. Pro Stunde werden 2<br />
Produkte auf der Anlage hergestellt. Die Produkte werden beurteilt ob sie i. O. oder defekt<br />
sind. Über eine längere Zeitspanne wurden die kurzfristigen Ausfälle der Anlage notiert.<br />
Man erhielt das Ergebnis in der Tabelle 5.9.4.<br />
Tabelle 5.9.4: Stillstandszeiten und defekte Produkte<br />
Produkt<br />
Zeilensumme<br />
i. O. defekt<br />
Anlage<br />
kein Stillstand<br />
Stillstand<br />
91<br />
8<br />
39<br />
18<br />
130<br />
26<br />
Spaltensumme 99 57 156<br />
Damit können wir den Vierfelderkorrelationskoeffizienten<br />
2 156 ⋅(91 ⋅18 − 39 ⋅8)<br />
χ = = 14.38<br />
130 ⋅26 ⋅99 ⋅57<br />
und<br />
V<br />
14.38<br />
= =<br />
156<br />
0.3<br />
ausrechnen. Dieser Wert besagt aufgrund des zugehörigen χ 2 -Wertes, dass ein Zusammenhang<br />
zwischen den Stillständen und den defekten Produkten vorhanden ist, oder anders<br />
formuliert, dass die Stillstandszeiten der Anlage die Qualität beeinflussen.
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
243<br />
5.9.2.2 Was für ein Abhängigkeitsmaß können wir berechnen,<br />
wenn die Variablen über eine Rangskala quantifiziert wurden?<br />
Beispiel 5.9.5: Lieferterminüberschreitung. Rangkorrelationskoeffizienten<br />
Bei 14 Kunden wurden die Lieferfristenüberschreitungen Y in Tagen gemessen. Gleichzeitig<br />
wurden für die Partien, aus denen die Kundenlieferungen stammten, die univariaten<br />
Prozessfähigkeiten für eine sehr wichtige Produktvariable ermittelt. Da weder die<br />
Lieferfristenüberschreitungen noch die korrigierten univariaten Prozessfähigkeitsindizes<br />
normal verteilt sind, wurde entschieden, anstelle des einfachen Korrelationskoeffizienten<br />
den Rangkorrelationskoeffizienten nach Spearman zu berechnen.<br />
Die Rangkorrelationskoeffizienten s ind aus dem Konzept entstanden, eine Rangskala als eine<br />
Intervallskala aufzufassen und die Rangwerte als Messwerte zu behandeln. Das Ergebnis dieses<br />
Konzeptes sind die Rangkorrelationen von Spearman and Kendall (siehe Kandall [1952]).<br />
Der Spearman’scher Rangkorrelationskoeffizient<br />
F ür die beiden Variablen X und Y kann man aus den Beobachtungsreihen X i , Y i , i = 1, …, N die<br />
beiden Rangreihen x [i] und y [i] , i = 1, …, N bilden und als neue als Messwerte auffassen.<br />
Haben Sie z. B. die Messwerte 5, 2, 7, 4 vorliegen, dann können Sie diese der Größe nach in<br />
2, 4, 5, 7 ordnen. Der Wert x 1 = 5 wird in den Rangreihe zu x [3] . Mit der Gauß’schen Summe<br />
erhält man<br />
und<br />
N<br />
∑<br />
x<br />
N ⋅ ( N + 1)<br />
= =<br />
∑<br />
i<br />
i= 1<br />
2<br />
i=<br />
1<br />
N<br />
⋅ + ⋅ +<br />
∑<br />
2 N<br />
N ( N 1) 2N<br />
1<br />
x = = ∑<br />
2<br />
i<br />
yi<br />
i= 1<br />
6<br />
i=<br />
1<br />
Außerdem gilt<br />
N<br />
N<br />
2 2<br />
∑( xi<br />
x)<br />
∑xi<br />
i= 1 i=<br />
1<br />
N<br />
y<br />
i<br />
2<br />
⎛<br />
N<br />
⎞ 2<br />
⎡ ⋅ + ⎤<br />
⎜∑<br />
x<br />
N ( N 1)<br />
i<br />
⎝<br />
⎟ ⎢ ⎥<br />
i=<br />
1 ⎠ N ⋅ ( N + 1) ⋅ (2N<br />
+ 1) ⎣ 2 ⎦<br />
− = − = −<br />
N<br />
6<br />
N<br />
2<br />
N ⋅( N −1)<br />
=<br />
12<br />
Für die Summe der quadratischen Abweichungen der y i Werte von ihrem Mittelwert erhält<br />
man denselben Ausdruck. Es sind nun noch die Differenzen der Rangpaare<br />
zu bilden.<br />
d i = X [i] – y [i] , i = 1, …, N,
244 5 Qualität in der Fertigung<br />
Setzt man all diese Umformungen in die Formel<br />
r<br />
xy<br />
=<br />
N<br />
∑<br />
i=<br />
1<br />
( x − x) ⋅( y − y)<br />
i<br />
N<br />
N<br />
2 2<br />
∑( xi<br />
− x) ⋅∑( yi<br />
− y)<br />
i= 1 i=<br />
1<br />
i<br />
.<br />
r<br />
s<br />
N<br />
∑d<br />
2<br />
i<br />
i=<br />
1<br />
2<br />
6 ⋅<br />
= 1 −<br />
.<br />
N ⋅( N −1)<br />
Signifikanzprüfung für den Spearman’schen Rangkorrelationskoeffizient<br />
Die H 0 : X und Y sind unabhängig.<br />
Gegen die Alternativhypothese wird mit dem t-Test<br />
tˆ =<br />
rs<br />
⋅ N − 2<br />
1 − r<br />
2<br />
s<br />
geprüft. Falls ˆt > t α; N – 2 dann muss die H 0 verworfen werden, d. h. in diesem Falle sagen wir<br />
die beiden Parameter X und Y sind korreliert.<br />
Beispiel 5.9.6: Lieferfristenüberschreitung. Spearmanscher<br />
Rangkorrelationskoeffizient<br />
Die Daten für dieses Beispiel sind in der Matrix der Tabelle 5.9.5 zusammengestellt.<br />
Tabelle 5.9.5: Daten für Lieferfristenüberschreitung und Prozessfähigkeiten, Rangreihen und deren<br />
Differenzen<br />
der einfachen Korrelationskoeffizienten ein, dann erhält man für den Spearman’schen Korrelationskoeffizienten<br />
Lieferfristenüberschreitung<br />
Prozessfähigkeiten<br />
Rangreihe<br />
X [i]<br />
Rangreihe<br />
Y [i]<br />
13 1,30 1 14 –13<br />
14 1,05 2 5 –3<br />
15 1,65 3 13 –10<br />
16 1,19 4 11 –7<br />
17 1,11 5 7 –2<br />
19 1,13 6 8 –2<br />
20 1,17 7 10 –3<br />
21 1,15 8 9 –1<br />
24 0,95 9 4 5<br />
25 1,20 10 12 –2<br />
30 1,10 11 6 5<br />
31 0,92 12 2 10<br />
36 0,94 13 3 10<br />
40 0,81 14 1 13<br />
d i
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
245<br />
Für den Spearman’schen Rangkorrelationskoeffizienten erhält man den Wert<br />
r s<br />
6⋅<br />
768<br />
= 1 − = −0.69.<br />
2<br />
14 ⋅(14 −1)<br />
Der zugehörige t-Wert ist<br />
0.69<br />
tˆ = ⋅ 12 = 3.3.<br />
2<br />
1−<br />
0.69<br />
Der t-Wert aus der Tafel ist t 0.05; 12 = 1.78. Da der berechnete t-Wert größer als der Tafelwert<br />
ist, muss die H 0 verworfen werden, d. h. die beiden Parameter sind nicht unabhängig<br />
voneinander. Die Lieferfristenüberschreitung ist von den Prozessfähigkeiten abhängig.<br />
Je kleiner die Prozessfähigkeiten für eine wesentliche Produktvariable sind, desto größer<br />
sind die Lieferfristenüberschreitungen. Die berechnete Irrtumswahrscheinlichkeit für die<br />
Ablehnung der H 0 ist α = 0.0059.<br />
In der Abbildung 5.9.5 ist das Korrelationsdiagramm für diese beiden Variablen enthalten.<br />
Man erkennt deutlich die fallende Tendenz, d. h. je größer die Prozessfähigkeiten sind, desto<br />
kleiner sind die Lieferfristenüberschreitungen.<br />
40<br />
35<br />
LTU<br />
30<br />
25<br />
20<br />
15<br />
10<br />
0.8 1.0 1.2 1.4 1.6<br />
Cpk<br />
Abb. 5.9.5: Lieferterminüberschreitung und Prozessfähigkeit<br />
Was ist der Kendall’scher Rangkorrelationskoeffizient?<br />
Es seien wieder zwei Rangfolgen für N Objekte gegeben, d. h. für die nicht normal verteilten<br />
oder skalierten Messwerte zweier Parameter liegen zwei Rangfolgen [i] und [j], i, j = 1, …, N<br />
vor. Als Beispiel stellen wir uns das Lieferfristenbeispiel vor. Für jedes Paar ([i],[j]) von Objekten<br />
(Messwerten) schreiben wir einen Beitrag +1 auf, wenn die Ränge [i] und [j] in der gleichen<br />
aufsteigenden Reihenfolge vorkommen, sonst –1. Konkret bedeutet das, wir definieren für die<br />
erste Rangfolge eine Zufallsgröße V ik , die den Wert +1 annimmt, wenn X i < X k , den Wert 0, wenn<br />
X i = X k und den Wert –1, wenn X i > X k . Analog verfahren wir für den zweiten Parameter Y.
246 5 Qualität in der Fertigung<br />
Die Summe der Beiträge aller Paare ist dann<br />
N<br />
∑ ij<br />
ij , = 1<br />
S = x ⋅ y .<br />
Der Maximalwert dieser Summe ist<br />
Setzt man<br />
⎛N<br />
⎞ 1<br />
⎜ ⎟ = ⋅ N ⋅ ( N − 1).<br />
⎝ 2 ⎠ 2<br />
T =<br />
ij<br />
S<br />
1<br />
⋅ N ⋅( N −1)<br />
2<br />
so nimmt T nur Werte zwischen –1 und +1 an. T = +1 gilt nur dann, wenn die beiden Rangfolgen<br />
übereinstimmen. T = –1 erhält man nur dann, wenn die beiden Rangfolgen entgegengesetzt<br />
sind. Für die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ordnet man<br />
die erste Rangfolge der Größe nach von 1 bis N. Darunter schreibt man die zugeordneten Ränge<br />
der zweiten Rangfolge, also<br />
für X: 1 2 3 … N<br />
für Y: Y 1 = Y [1] Y 2 = Y [N] Y 3 = Y [3] … Y N = Y [2] .<br />
Damit kann man S wie folgt berechnen: man zählt, wie viele der Y’s größer als Y 1 rechts von<br />
Y 1 stehen, dann zählt man wie viele der Y’s größer als Y 2 rechts von Y 2 stehen usw. Die Summe<br />
aller dieser Anzahlen sei P. Damit kann S umgeschrieben werden. Es gilt S ist die Summe von<br />
P Beiträgen +1 und ⎛ N ⎞<br />
⎜ ⎟ − P Beiträgen –1, d. h.<br />
⎝ 2 ⎠<br />
bzw.<br />
1<br />
S = 2 ⋅ P − ⋅ N ⋅( N −1),<br />
2<br />
2 ⋅ P<br />
T = −1.<br />
1<br />
⋅ N ⋅( N −1)<br />
2<br />
Beispiel 5.9.7: Lieferfristenüberschreitung. Kendallscher Rangkorrelationskoeffizient<br />
Die Berechnung des Kendall’schen Rangkorrelationskoeffizienten ergibt für das Beispiel<br />
der Lieferterminüberschreitung den Wert T = –0.538. T ist asymptotisch normal verteilt<br />
mit dem Erwartungswert 0 und der Varianz<br />
2 ⋅ ⋅ +<br />
=<br />
2 (2 N<br />
σ<br />
5) ,<br />
T<br />
9 ⋅ N ⋅( N −1)<br />
siehe z. B. van der Waerden [1957]. Damit kann man die Hypothese der Unabhängigkeit<br />
von X und Y verwerfen, wenn T größer ist als T α = σT<br />
⋅Φ(1 − α ) , wobei Φ die Verteilungsfunktion<br />
der standardisierten Normalverteilung ist.
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
247<br />
Die H 0 der Unabhängigkeit der beiden Zufallsgrößen muss aufgrund des Ergebnisses<br />
T = –0.538 verworfen werden. Die berechnete Irrtumswahrscheinlichkeit ist α′ = 0.0073.<br />
Zum Vergleich wurde der einfache Korrelationskoeffizient berechnet. Man erhält hierfür<br />
den Wert r XY = –0.795. Die berechnete Irrtumswahrscheinlichkeit für die Ablehnung der<br />
H 0 ist α′ = 0.0007.<br />
Neben den einfachen und Rangkorrelationskoeffizienten gibt es weitere Abhängigkeitsmaße.<br />
Diese sind vor allem die<br />
•<br />
•<br />
•<br />
partiellen oder bedingten Korrelationskoeffizienten,<br />
die multiplen Korrelationskoeffizienten und<br />
die multivariaten multiplen Korrelationskoeffizienten.<br />
5.9.3 Was sind partielle Korrelationskoeffizienten<br />
Wozu werden die bedingten (partielle) Korrelationskoeffizienten gebraucht?<br />
Wie werden die bedingten Korrelationskoeffizienten berechnet?<br />
Bisher haben wir die Abhängigkeitsstruktur für die Input-, Prozess- und Produktvariablen<br />
durch die einfachen (paarweisen) Korrelationskoeffizienten beschrieben. Wir haben aber auch<br />
gesehen, dass mitunter Antworten auf praktisch relevante Fragen, wie z. B. die Frage nach den<br />
Abhängigkeiten zwischen den Produkt- und Prozessvariablen ohne den Einfluss der Inputvariablen<br />
erforderlich sind. Diese Frage kann man auch so formulieren,<br />
Wie groß sind die bedingten Abhängigkeitsmaße zwischen den Produkt- und<br />
Prozessvariablen unter der Bedingung der Inputvariablen?<br />
Zur Vereinfachung der Lösung auf die Frage betrachten wir ein triviales Beispiel.<br />
Beispiel 5.9.8: Einfluss von zwei Prozess- auf eine Produktvariable. Abhängigkeiten<br />
In dem Graphen der Abbildung 5.9.6 ist der Einfluss zweier korrelierter Prozessvariablen<br />
auf eine Produktvariable dargestellt.<br />
r Y1 = 0.84<br />
X 1<br />
r 12 = 0.95<br />
Y<br />
r Y2 = 0.86<br />
X 2<br />
Abb. 5.9.6: Einfluss von zwei Prozess- auf eine Produktvariable
248 5 Qualität in der Fertigung<br />
Die Korrelationsmatrix für dieses Beispiel ist<br />
⎛1 0.84 0.86⎞<br />
R = ⎜<br />
⎜<br />
1 0.95⎟<br />
⎟<br />
⎝<br />
1 ⎠<br />
Die beiden Prozessvariablen haben den Korrelationskoeffizient r 12 = 0,95. Für die Steuerung<br />
des Prozessen müssen wir aber wissen, wie z. B. X 1 auf Y wirkt, ohne dass dieser Einfluss<br />
durch das Wirken der zweiten Prozessvariablen „verfälscht“ wird. Der Einfluss von X 2 auf<br />
X 1 soll eliminiert oder konstant gehalten werden. Das ist nur in einem Modell möglich,<br />
denn in der Natur lässt sich dieser Einfluss nicht eliminieren oder konstant halten.<br />
Ein Korrelationskoeffizient dieser Art wird als partieller Korrelationskoeffizient bezeichnet.<br />
Dieser misst den partiellen Einfluss von X 1 auf Y, oder anders ausgedrückt den Einfluss von<br />
X 1 auf Y unter der Bedingung, dass X 2 konstant gehalten wird. Wir können auch sagen, der zu<br />
findende Korrelationskoeffizient ist ein Korrelationskoeffizient der bedingten Verteilung von<br />
Y und X 1 unter der Bedingung von X 2 .<br />
Für diesen Fall wollen wir im Folgenden die Formel zur Berechnung der partiellen Korrelationskoeffizienten<br />
betrachten . Es gilt<br />
rY1 − rY2 ⋅r12<br />
rY<br />
1/2 =<br />
2 2<br />
(1 − r ) ⋅(1 − r )<br />
Y 2 12<br />
wobei r Y1/2 die symbolische Darstellung für die Abhängigkeit zwischen Y und X 1 unter der<br />
Bedingung ist.<br />
Beispiel 5.9.9: Einfluss von zwei Prozess- auf eine Produktvariable.<br />
Partieller Korrelationskoeffizient<br />
Für das Demonstrationsbeispiel gilt<br />
r Y 1/2<br />
0.84 − 0.86 ⋅0.95<br />
= = 0.146.<br />
2 2<br />
(1 − 0.86 ) ⋅(1 − 0.95 )<br />
Das Ergebnis der einfachen- und partiellen Korrelationsanalyse besagt, dass die paarweise<br />
(oder auch totale) Abhängigkeit zwischen Y und X 1 sehr straff ist (r YX1 = 0.84). Es besagt<br />
aber auch, dass diese Abhängigkeit sehr stark durch X 2 beeinflusst wird, denn X 2 wirkt<br />
sehr stark auf X 1 (r 12 = 0.95) und sehr stark auf Y (r Y2 = 0.86). Hält man diesen Einfluss<br />
konstant, oder eliminiert man diesen Einfluss, dann ist die verbleibende Abhängigkeit nur<br />
noch gering (r Y1/2 = 0.146).<br />
Was können Sie aus den Unterschieden zwischen den einfachen und partiellen<br />
Korrelationskoeffizienten ablesen?<br />
Beispiel 5.9.10: Einfluss von zwei Prozess- auf eine Produktvariable.<br />
Maß der Beherrschbarkeit<br />
Y kann einzeln sowohl durch X 1 oder X 2 und gemeinsam durch X 1 und X 2 zusammen<br />
dargestellt werden. Die Genauigkeit der unterschiedlichen Darstellungen wird durch das<br />
Maß der Beherrschbarkeit und durch die Streuungen um die Regressionsgleichung (Reststreuung)<br />
ausgedrückt.
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
249<br />
Die Darstellungen von Y durch X 1 oder X 2 liefern die beiden Gleichungen<br />
Y = b Y1 X 1 = 0.84 X 1<br />
mit dem Maß der Beherrschbarkeit R 2 Y1 = 0.7056 und der Reststreuung<br />
S Y/1 = 0.5425 bzw.<br />
Y = b Y2 X 2 = 0.86 X 2<br />
mit dem Maß der Beherrschbarkeit R 2 Y/2 = 0.7396 und der Reststreuung<br />
S Y/2 = 0.5203.<br />
Wird Y durch beide X gemeinsam dargestellt, dann erhält man die Gleichung<br />
Y = b Y.1/2 X 1 + b Y.2/1 X 2 = 0.2359 X 1 + 0.6359 X 2<br />
mit dem Maß der Beherrschbarkeit R 2 Y/1, 2 = 0.7450 und der Reststreuung<br />
S Y/1, 2 = 0.5049.<br />
Hieraus können Sie ablesen, dass<br />
•<br />
•<br />
•<br />
die Varianz von Y durch X 1 oder X 2 zu ca. 70 % erklärt wird,<br />
durch den gemeinsamen Ansatz mit beiden Einflussvariablen X 1 und X 2 wird das Maß<br />
der Beherrschbarkeit nicht wesentlich kleiner. Die Ursache hierfür ist der große Korrelationskoeffizient<br />
für X 1 und X 2 .<br />
Man nennt diesen Effekt Einfluss der Multikollinearität zwischen den Einflussgrößen<br />
auf die Regressionsgleichung und nennt eine der beiden Variablen redundant.<br />
Berechnung der partiellen Korrelationskoeffizienten über die bedingte Verteilung<br />
Für die allgemeine Ableitung setzen wir voraus, dass der zufällige Vektor (Y T , X T ) normal verteilt<br />
ist. Gesucht sind die partiellen Korrelationskoeffizienten zwischen den Produktvariablen, d. h.<br />
die bedingten Korrelationskoeffizienten der Produktvariablen Y unter der Bedingung, dass die<br />
Input- und Prozessvariablen X konstant gehalten werden, d. h. gegeben sind.<br />
Die bedingte Verteilung von Y unter der Bedingung X ist eine m-dimensionale Normalverteilung<br />
ist mit den bedingten Momenten E[Y/X] und v ar(Y/X). Für diesen verallgemeinerten<br />
Fall erhält man den Vektor bedingter Erwartungswerte<br />
−1<br />
T<br />
Y YX XX X Y / X X<br />
E[ Y/ X] = μ + Σ ⋅ Σ ⋅( X− μ ) = μ + β ⋅( X−<br />
μ )<br />
und die be dingte Kovarianzmatrix<br />
−1<br />
YY YX XX XY YY / X<br />
var [ Y/ X] = Σ − Σ ⋅ Σ ⋅ Σ = Σ .<br />
Die Elemente σ kl/1, … n , k, l = 1, …, m der bedingten Kovarianzmatrix Σ YY/X „messen“ in der<br />
Hauptdiagonalen die Variabilität der Produktvariablen und in den Nebendiagonalen die Abhängigkeiten<br />
zwischen den Produktvariablen unter der Bedingung X, d. h. unter der Bedingung,<br />
dass die Input- und Prozessvariable gegeben sind.<br />
Die partiellen Korrelationskoeffizienten zwischen den Produktvariablen unter der Bedingung,<br />
dass die Input- und Prozessvariable realisiert sind, werden analog den gewöhnlichen Korrelationskoeffizienten,<br />
nur mit den Elementen der bedingten Kovarianmatrix Σ YY/X berechnet.<br />
Wir erhalten die Formel
250 5 Qualität in der Fertigung<br />
ρ<br />
kl /1,…,<br />
n<br />
σkl /1,…, n σkl / X<br />
= =<br />
σ ⋅σ σ ⋅σ<br />
kk /1,…, n kk /1,…, n kk / X ll / X<br />
.<br />
Für σ kk/X kann man natürlich auch σ 2 k/X schreiben. Die Matrizenformel zur Berechnung der<br />
Korrelationskoeffizienten aus der Kovarianzmatrix kann natürlich auch für die bedingte Kovarianzmatrix<br />
aufgeschrieben werden. Wir erhalten<br />
D<br />
und damit<br />
2<br />
σ1/<br />
X<br />
⎜<br />
⎟<br />
= Diag ( ΣYY<br />
/ X ) = Diag<br />
⎜ … ⎟<br />
⎜<br />
2<br />
⎝ σ ⎟<br />
m / X⎠<br />
−<br />
1 −<br />
1<br />
2 ⋅Σ<br />
⋅ 2<br />
YY / X = YY / X ,<br />
D D P<br />
⎛<br />
wobei P YY/X die Matrix der partiellen Korrelationskoeffizienten bezeichnet.<br />
⎞<br />
Beispiel 5.9.11: Bremsweg eines PKW. Partielle Korrelationskoeffizienten<br />
Die partiellen Korrelationskoeffizienten für das Bremswegbeispiel sind in der Tabelle zusammen<br />
gestellt.<br />
Tabelle 5.4.5: Matrix der partiellen Korrelationskoeffizienten<br />
R<br />
partiell<br />
⎛1 0.885 −0.566 0.695⎞<br />
⎜ 1 0.413 −0.55⎟<br />
= ⎜<br />
⎟<br />
⎜ 1 0.475 ⎟<br />
⎜<br />
⎝<br />
1 ⎟<br />
⎠<br />
Vergleicht man die Matrix der bedingten mit der Matrix der einfachen Korrelationskoeffizienten<br />
für dieses Beispiel, dann sieht man, dass<br />
• sich die bedingten wesentlich von den einfachen Korrelationskoeffizienten unterscheiden<br />
können und<br />
• die bedingten auch wesentlich größer als die einfachen Korrelationskoeffizienten werden<br />
können.<br />
Die Vergrößerung oder Verkleinerung hängt im wesentlichen von den Vorzeichen der<br />
einfachen Korrelationskoeffizienten ab.<br />
5.9.4 Was sind multiple Korrelationskoeffizienten und wozu benötigt<br />
man diese?<br />
Der multiple Korrelationskoeffizient ist ein immens wichtiges Abhängigkeitsmaß zwischen<br />
der Produktvariablen Y und der Prozessgleichung, oder anders formuliert dem bedingten Erwartungswert<br />
einer Produktvariablen unter der Bedingung der Input- und Prozessvariablen,<br />
dem ja die Prozessgleichung entspricht.
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
251<br />
T −1<br />
Y Y.<br />
X XX X X<br />
EY [ / X] = μ + σ Σ ( − μ )<br />
mit der bedingten Varianz<br />
2 T −1<br />
YX Y. X XX Y.<br />
X<br />
var( Y/ X) = σ − σ Σ σ .<br />
Die Bezeichnungen liefern uns die Zerlegung der positiv definiten Kovarianzmatrix Σ entsprechend<br />
der Zerlegung des zufälligen Vektors in die Produktvariable Y und den Vektor X der<br />
Prozess- und Inputvariablen Z T = (Y, X T ) in<br />
⎛<br />
2 T<br />
σ ⎞<br />
Y σY.<br />
X<br />
Σ = ⎜ ⎟ .<br />
⎝ Σ ⎠<br />
XX<br />
Warum ist der multiple Korrelationskoeffizient für die Anwendungen so wichtig?<br />
Mit dem multiplen Korrelationskoeffizienten können Sie beurteilen,<br />
•<br />
•<br />
wie gut die Menge der Input- und Prozessvariablen die Produktvariable beeinflusst und<br />
wie gut die Varianz einer Produktvariablen durch die Input- und Prozessvariablen erklärt<br />
wird.<br />
Aus diesem Grunde nennen wir den multiplen Korrelationskoeffizienten das Maß der Beherrschbarkeit<br />
eines Prozesses. Je größer der multiple Korrelationskoeffizient ist, desto besser<br />
wird die Varianz der Produktvariablen durch die Input- und Prozessvariablen aufgeklärt, d. h.<br />
umso sicherer wird der Prozess beherrscht.<br />
Das bedeutet aber auch, dass Sie beurteilen können, wie gut Sie den Prozess nach der Steuerung<br />
mit der Prozessgleichung beherrschen. Streuen die Werte der Produktvariablen nach<br />
der Steuerung nur noch gering um die Prozessgleichung, dann werden die Werte auch nur<br />
noch sehr wenig um den Zielwert streuen. Der Zielwert für die Steuerung ist aber der Sollwert<br />
für die Produktvariable. Damit wird erreicht, dass die Kundenanforderungen überaus präzise<br />
erfüllt werden können.<br />
Für die Definition des multiplen Korrelationskoeffizienten betrachten wir wieder den zufälligen<br />
Vektor (Y, X T ) = Z T und nehmen an, dass Z ~ N n + 1 (µ, Σ) und μ und Σ entsprechend dem Z<br />
partitioniert sind.<br />
Definition des multiplen Korrelationskoeffizienten:<br />
ρ<br />
T −1<br />
2<br />
2 σY. X⋅ΣXX⋅σY.<br />
X σY<br />
/ X<br />
Y / X= = 1 −<br />
2 2<br />
σY<br />
σY<br />
Es gilt 0 ≤ ρ 2 Y/X ≤ 1.<br />
Wenn Y unabhängig von X ist, dann ist ρ 2 Y/X = 0. Wenn Y mit Wahrscheinlichkeit 1 eine Linearkombination<br />
der Komponenten von X ist, dann ist ρ 2 Y/X = 1.<br />
Wenn der zufällige Vektor X nur eine Komponente hat, dann ist ρ 2 Y/X = ρ2 Y.X , d. h. dem Quadrat<br />
des einfachen Korrelationskoeffizienten.<br />
Im standardisierten Fall wird aus der Kovarianzmatrix Σ die Korrelationsmatrix R. R wird<br />
genauso zerlegt wie Σ, d. h.<br />
⎛<br />
T<br />
1 ρ ⎞<br />
Y.<br />
X<br />
R = ⎜ ⎟ .<br />
⎝ R ⎠<br />
XX
252 5 Qualität in der Fertigung<br />
Damit erhält man als Formel zur Berechnung des multiplen Korrelationskoeffizienten<br />
2 T −1<br />
Y / X= Y. X⋅ RXX⋅<br />
Y. X.<br />
ρ ρ ρ<br />
Die Maximum Likelihood Schätzung ist<br />
2 T −1<br />
Y / X = Y. XR<br />
XX Y. X,<br />
R R R<br />
wobei die einzelnen Terme in dieser Formel aus der partitionierten Korrelationsmatrix<br />
R<br />
⎛<br />
T<br />
1 R ⎞<br />
Y.<br />
X<br />
= ⎜ ⎟<br />
⎝ R ⎠<br />
XX<br />
kommen, bzw. mit der Zerlegung der Matrix A in<br />
A<br />
⎛<br />
2 T<br />
a ⎞<br />
Y aY.<br />
X<br />
= ⎜ ⎟<br />
⎝ A ⎠<br />
XX<br />
R<br />
T −1<br />
2 aY. XA<br />
XXaY.<br />
X<br />
Y / X=<br />
2<br />
aY<br />
.<br />
Wie kann eine Hypothese über den multiplen Korrelationskoeffizienten geprüft werden?<br />
Unter den sehr allgemeinen Voraussetzungen, dass der N-dimensionale Stichprobenvektor der<br />
Produktvariablen Y sphärisch mit P (Y = 0) = 0 und die Stichprobenmatrix X unabhängig von<br />
Y ist und mit Wahrscheinlichkeit 1 den Rang n hat, ist der multiple Stichprobenkorrelationskoeffizient<br />
R 2 Y/X nach Muirhead [1982] Beta verteilt, bzw.<br />
N − n −1<br />
R ⋅<br />
Y<br />
n 1 − R<br />
2<br />
/ X<br />
2<br />
Y / X<br />
ist F n, N – n – 1 verteilt. Zur Prüfung der H 0 : ρ 2 Y/X = 0 gegen die allgemeine Alternative H 1 : ρ2 Y/X ≠ 0<br />
wird der F-Test<br />
2<br />
/<br />
2<br />
Y / X<br />
N − n −1 R ⋅<br />
Y X = Fˆ<br />
n 1 − R<br />
verwendet. ˆF ist bei Gültigkeit der H 0 F n, N – n – 1 verteilt mit n und N – n – 1 FG. Der Test zum<br />
Niveau α lehnt die H 0 ab, wenn F ˆ > Fn, N−n−1<br />
( α ) , wobei Fn, N−n−1 ( α ) den oberen 100 α % Punkt<br />
der F n, N – n – 1 Verteilung bezeichnet.<br />
Beispiel 5.9.12: Bremsweg eines PKW. Multipler Korrelationskoeffizient<br />
Zur Demonstration des Rechenweges betrachten wir die Abhängigkeit des Bremsweges<br />
Y von der Geschwindigkeit X 1 , der Profiltiefe X 2 und der Reaktionszeit X 3 . Aus der Stichproben<br />
Kovarianzmatrix S der Tabelle 5.9.6 lesen wir die Werte ab, die in die Formel zur<br />
Berechnung des multiplen Korrelationskoeffizienten einfließen.
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
253<br />
Tabelle 5.9.6: Stichprobenkovarianzmatrix für das Bremswegbeispiel<br />
Bremsweg Geschwindigkeit Profil Reaktion<br />
Bremsweg 31,5056 22,5578 –1,393 1,2417<br />
Geschwindigkeit 22,5578 23,0575 –0,6619 0,3899<br />
Profil –1,393 –0,6619 0,4417 0,0314<br />
Reaktion 1,2417 0,3899 0,0314 0,234<br />
⎛23.0575 −0.6619 0.3899⎞ ⎛22.5578⎞<br />
(22.5578 −1.393 1.2417) ⋅ ⎜ 0.4417 0.0314⎟ ⋅ ⎜ −1.393<br />
⎟<br />
⎜ ⎟ ⎜ ⎟<br />
2 ⎝ 0.234 ⎠ ⎝ 1.2417 ⎠<br />
/1,2,3 =<br />
31.5056<br />
= 0.867.<br />
R Y<br />
Das Ergebnis bedeutet, dass die Varianz des Bremsweges zu 87 % durch die Input- und<br />
Prozessvariablen wie Geschwindigkeit, Profiltiefe und Reaktionszeit erklärt wird. Betrachten<br />
wir die Abhängigkeit des Bremsweges nur von der Geschwindigkeit, dann ist der multiple<br />
Korrelationskoeffizient – das Quadrat des einfachen Korrelationskoeffizienten – gleich<br />
R 2 Y/X = r2 Y.1 = 0.83692 = 0.700,<br />
also kleiner als vorher bei der Betrachtung von 3 Prozessvariablen. Hieraus liest man ab,<br />
dass die multiplen Korrelationskoeffizienten bei Vergrößerung der Anzahl der Input- und<br />
Prozessvariablen nie kleiner werden können, sondern, wenn die Produktvariable Y und die<br />
hinzugenommenen Input- und Prozessvariable nicht unabhängig voneinander sind, stets<br />
größer werden. Das ist logisch, denn durch die Hinzunahme neuer Information kann die<br />
Varianz des Produktvariables immer besser erklärt werden.<br />
Zur Prüfung der H 0 : ρ 2 Y/X = 0 verwenden wir den F-Test<br />
0.867 30 − 3 −1<br />
F ˆ = ⋅ =<br />
1 − 0.867 3<br />
56.49<br />
Aus der Tafel für die F-Verteilung findet man den Wert F 3,140 – 3 = 2.60. Da ˆF > F 3, ∞ , , (0.05)<br />
muss die H 0 verworfen werden, d. h. Y hängt statistisch gesichert von den drei Parametern<br />
Geschwindigkeit, Profiltiefe und Reaktionszeit ab, oder anders ausgedrückt, die Varianz des<br />
Bremsweges wird zu mehr als 86 % durch die drei Prozessvariablen erklärt.<br />
−1<br />
5.9.5 Was sind partiell multiple Korrelationskoeffizienten<br />
und wozu benötigt man diese?<br />
Neben den einfachen, den partiellen und den multiplen Korrelationskoeffizienten muss ich<br />
noch den partiell multiplen Korrelationskoeffizienten ei nführen. Dieser ist für den Nachweis<br />
erforderlich, dass nach der Zerlegung des Vektors X in die Teilvektoren X(k) und X(h) die<br />
Komponenten von X(h) unwesentlich sind. Hierzu muss gezeigt werden, dass die Menge der<br />
unwesentlichen (Input- und Prozess-) Variablen, in X(h) zusammengefasst, tatsächlich unab-
254 5 Qualität in der Fertigung<br />
hängig von der Menge der wesentlichen Variablen und von Y ist und damit aus einer statistischen<br />
Prozessanalyse gestrichen werden kann, oder anders formuliert, ob die Variablen aus X(h) nach<br />
ihrer Streichung die bedingte Varianz von Y unter der Bedingung X(k) kaum vergrößern.<br />
Diesen Sachverhalt kann man auch durch die folgende Frage ausdrücken.<br />
Wie verändern sich der Grad der linearen Abhängigkeit und die Beziehung zwischen Y und X,<br />
wenn der Einfluss von X(h) auf Y und X(k) eliminiert wurde?<br />
Multipel bedeutet in diesem Sprachgebrauch die Messung des Grades der linearen Abhängigkeit<br />
zwischen einer Zufallsgröße – der Produktvariablen Y – und einer Linearkombination von<br />
Zufallsgrößen – der Prozessgleichung in X(k) und partiell bedeutet die Messung des Grades<br />
zwischen zwei „bedingten“ zufälligen Größen, nämlich zwischen den beiden bedingten Erwartungswerten<br />
Y unter X(h) und X(k) unter X(h).<br />
Ausgangspunkt für die Darstellung dieses Korrelationskoeffizienten ist die obige Zerlegung,<br />
in der Y eine Produktvariable bezeichnet, X(k) p und X(h) n – p Parameter enthält, und der<br />
Zerlegungssatz für die bedingten Erwartungswerte und Varianzen.<br />
Mit der analogen Zerlegung des Vektors der Erwartungswerte µ T = (µ Y , µ(k) T , µ(h) T ) und der<br />
Kovarianzmatrix<br />
⎛<br />
2 T T<br />
σ ⎞<br />
Y σY. k σY.<br />
h<br />
⎜<br />
⎟<br />
Σ = ⎜<br />
Σkk<br />
Σkh<br />
⎟<br />
⎜<br />
⎝<br />
Σ ⎟<br />
hh ⎠<br />
erhält man die Momente der bedingten Verteilung von (Y, X(k) T ) unter der Bedingung X(h)<br />
und<br />
⎛ ⎞<br />
E{[ Y, Xk ( ) )/ Xh ( )] } = ( μ μ ) − ⋅Σ ⋅[ Xh ( ) − μ( h)]<br />
T<br />
T T T σYh<br />
. −1<br />
Y k ⎜ ⎟ hh<br />
⎝Σkh<br />
⎠<br />
⎛ ⎞ ⎛ ⎞<br />
var[( Y X( k) )/ ( ) ] ( )<br />
2 T<br />
T<br />
T T σY σY. k σY.<br />
h −1<br />
T<br />
X h = ⎜ ⎟ − ⎜ ⎟ ⋅Σhh ⋅ σY . h Σhk<br />
⎝ Σkk<br />
⎠ ⎝Σkh<br />
⎠<br />
⎛<br />
2<br />
σ ⎛<br />
⎞<br />
Y σ<br />
= ⎜ − ⎜ ⎟<br />
⎝ Σ ⎠ ⎝Σ Σ σ Σ Σ Σ ⎠<br />
⎛<br />
2 T<br />
σ ⎞<br />
Y<br />
= / h σY . k / h<br />
⎜ ⎟ .<br />
⎝ Σ ⎠<br />
T<br />
T −1 T −1<br />
⎞ σ<br />
. Yh . ΣhhσYh . σYh . ΣhhΣ<br />
Y k<br />
hk<br />
⎟<br />
−1 −1<br />
kk kh hh Y . h kh hh hk<br />
kk / h<br />
Die Linearkombination zwischen E[X(k)/X(h)] und E[Y/X(h)] hat die Koeffizienten<br />
T<br />
T −1<br />
Yk . / h = Yk . / h kk/<br />
h<br />
β σ Σ<br />
und die maximale Korrelation<br />
ρ<br />
T −1<br />
2 σYk . / hΣkk/ hσYk . / h<br />
Yk . / h =<br />
.<br />
2<br />
σY / h<br />
Dieser Korrelationskoeffizient wird partiell multipler Korrelationskoeffizient genannt.
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
255<br />
Für die Interpretation dieses Korrelationskoeffizienten betrachten wir die folgenden Beziehungen<br />
oder<br />
T −1 2<br />
2 σYk . / hΣkk/ hσYk . / h σY/<br />
X<br />
Yk . / h<br />
2 2<br />
σY / h σY / h<br />
1 − ρ = =<br />
ρ<br />
2<br />
2 /<br />
Yk . / h<br />
2<br />
Y / h<br />
σY<br />
X<br />
= 1 − .<br />
σ<br />
Es gilt 0 ≤ ρ 2 Y.k/h ≤ 1.<br />
Damit wird deutlich, dass der partiell multiple Korrelationskoeffizient ein Maß für die Reduktion<br />
der bedingten Varianz von Y unter der Bedingung X(k) ist, wenn man den Vektor X(h)<br />
zu X(k) hinzu nimmt.<br />
Sind σ 2 Y/X und σ2 Y/h nahezu gleich groß, dann wird der Quotient nahezu gleich 1, d. h. ρ2 Y.k/h<br />
wird sehr klein sein. Andererseits, wenn σ 2 Y/X im Vergleich zu σ2 Y/h sehr klein ist, dann wird<br />
ρ 2 Y.k/h groß sein.<br />
Kleine Werte von ρ 2 Y.k/h bedeuten eine kleine Reduktion der bedingten Varianz von Y unter<br />
X(k) durch Hinzunahme von X(h).<br />
Weitere nützliche Beziehungen in Bezug auf den partiell multiplen Korrelationskoeffizienten<br />
1. Mit var[Y/X(h)] = σ 2 Y (1 – ρ2 Y/h ) und<br />
var[Y/X(k), X(h)] = σ 2 Y (1 – ρ2 Y/X ) erhält man<br />
ρ<br />
2<br />
ρY<br />
=<br />
1 − ρ<br />
2 / X<br />
Yk . / h<br />
.<br />
2<br />
Y / h<br />
2 2 2<br />
Yk . / h Y/ X Y/<br />
h<br />
ρ ρ − ρ<br />
=<br />
2 2<br />
1−<br />
ρ 1−<br />
ρ<br />
Yk . / h Y/<br />
X<br />
2. Den Zusammenhang zwischen den partiellen und multiplen Korrelationskoeffizienten<br />
erkennt man sofort, wenn X (k) und X(h) als einfache Zufallsgrößen angesehen werden.<br />
In diesem Falle wird aus der Matrix Σ kk/h die skalare Größe σ 2 kh und damit<br />
ρ<br />
T −2 2<br />
2 σYk . / h σk/ hσYk . / h σYh . / k<br />
Yk . / h = =<br />
2 2 2<br />
σY / h σY / h⋅<br />
σY / k<br />
.<br />
Wie können Hypothesen bzgl. des partiell multiplen Korrelationskoeffizienten geprüft<br />
werden?<br />
Es soll die Hypothese H 0 : ρ 2 Y.h/k = 0 gegen die Alternative H 1 : ρ 2 Y.h/k ≠ 0 geprüft werden. Hierzu<br />
ist der F-Test anwendbar. Es gilt<br />
2<br />
. /<br />
ˆ RYk h N − p − ( n − p)<br />
F = ⋅<br />
2<br />
1 − R . /<br />
n − p<br />
Yk h<br />
ist F n – p, N – n verteilt.
256 5 Qualität in der Fertigung<br />
Beispiel 5.9.13: Bremsweg eines PKW. Partiell multipler Korrelationskoeffizient<br />
Wir betrachten die Prozessgleichung<br />
Y = 17.1505 + 0.2935 Geschwindigkeit – 3.5605 Profiltiefe<br />
+ 8.516 Reaktionszeit.<br />
Das Maß der Beherrschbarkeit (Quadrat des multiplen Korrelationskoeffizienten) ist<br />
R 2 Y/1, 2, 3 = 0.867 und die Streuung um die Prozessgleichung (bedingte Standardabweichung)<br />
ist s Y/1, 2, 3 = 2.164 (S 2 Y/1, 2, 3 = 4.6828).<br />
Die Frage ist, ob zwei weitere Variable, wie z. B. Rauheit der Straße und Alkoholkonzentration<br />
den multiplen Korrelationskoeffizienten wesentlich vergrößern können. Die Kovarianzmatrix<br />
bei Einbeziehung der zusätzlichen Variablen und mit einer neuen Stichprobe ist<br />
⎛33.540 34.581 −1.878 1.300 −7.441 0.474 ⎞<br />
⎜ 95.479 −0.367 0.617 −6.665 0.863 ⎟<br />
⎜<br />
⎟<br />
⎜<br />
0.5904 0.0389 0.203 0.0127 ⎟<br />
S = ⎜ 0.1477 0.0313 0.04026 ⎟<br />
⎜<br />
⎟<br />
⎜<br />
5.0646 0.0367 ⎟<br />
⎜<br />
⎟<br />
⎝<br />
0.0217 ⎠<br />
Zur Beantwortung der Frage wird der partiell multiple Korrelationskoeffizient berechnet.<br />
Man erhält<br />
⎛S<br />
⎜<br />
⎝S<br />
und damit<br />
T<br />
Yh .<br />
hh<br />
⎛23.935114 32.237561 −0.021682 0.94003 ⎞<br />
⎞<br />
⎜<br />
⎟<br />
−1<br />
47.516117 0.210268 1.660873<br />
⎟ ⋅Shh ⋅ ( Sy.<br />
h Shk<br />
) = ⎜<br />
⎟<br />
⎠<br />
⎜<br />
0.014019 0.022227⎟<br />
⎜<br />
⎝<br />
0.074965⎟<br />
⎠<br />
⎛9.6048 2.3434 −1.8563 0.35997⎞<br />
⎛<br />
2 T<br />
S ⎞ ⎜ 47.9629 −0.5773 −1.0439<br />
⎟<br />
Y / h SY. k/<br />
h<br />
⎜<br />
⎟ = ⎜<br />
⎟<br />
⎝ S / ⎠ ⎜<br />
0.5764 0.01667<br />
kk h<br />
⎟<br />
⎜<br />
⎝<br />
0.07273⎟<br />
⎠<br />
Mit diesen Werten erhält man die Maximum Likelihood Schätzung für den partiell multiplen<br />
Korrelationskoeffizienten<br />
T −1<br />
2 SYk . / h⋅<br />
Skk/ h⋅SYk . / h<br />
Yk h<br />
SY h<br />
9.583<br />
R . / = = = 0.997.<br />
2<br />
/<br />
9.605<br />
Für die Prüfung der Hypothese H 0 : ρ 2 Y.k/h = 0 gegen die Alternative H 1 : ρ2 Y.k/h ≠ 0 wird der<br />
F-Test verwendet. Man berechnet<br />
2<br />
. /<br />
ˆ ρYk h N − p − ( n − p) 0.997 140 − 3 − 2<br />
F = ⋅ = ⋅ = 2243<br />
2<br />
1 − ρ . /<br />
n − p 1 − 0.997 2<br />
Yk h
5.9 Was bedeutet Abhängigkeitsstruktur eines Prozesses?<br />
257<br />
Hieraus folgt schon – auch ohne den Tafelwert nach zu schlagen –, dass dieser Wert statistisch<br />
gesichert von null verschieden ist, d. h. dass die beiden Parameter Rauheit der Strasse und<br />
Alkoholkonzentration im Blut das Maß der Beherrschbarkeit wesentlich vergrößern.<br />
Die vollständige Prozessgleichung ist<br />
Y = 27.362 + 0.1939 Geschwindigkeit – 3.272 Profiltiefe<br />
+ 8.4829 Reaktionszeit – 1.151 Rauheit + 2.265 Alkoholkonzentration<br />
Das Maß der Beherrschbarkeit ist R 2 Y/X = 0.999 und die Streuung um die Prozessgleichung<br />
ist S Y/X = 0.11677 (S 2 Y/X = 0.01363).<br />
Welche Aussagen sind mit dem multivariaten, multiplen Korrelationskoeffizient möglich?<br />
Häufig wird eine Maßzahl zur Bewertung der Abhängigkeit zwischen zwei zufälligen Vektoren<br />
gesucht, wie z. B. bei der multivariaten, multiplen Regressionsanalyse mit stochastischen Input-<br />
und Prozessvariablen.<br />
Der multivariate, multiple Korrelationskoeffizient wird über die Formel<br />
τ<br />
2<br />
Y/ X 1<br />
= −<br />
Σ<br />
YY / X<br />
Σ<br />
XX<br />
definiert. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit z. B. zwischen dem zufälligen<br />
Vektor Y und E(Y/X).<br />
Für m = 1 ist τ 2 Y/X identisch mit dem multiplen Korrelationskoeffizienten ρ2 Y/X .<br />
Bemerkungen<br />
1. Ein weiteres Maß für die lineare Abhängigkeit zwischen zwei zufälligen Vektoren ist die<br />
Spurkorrelation nach Anderson [1984] und Höschel [1974, 1976], die über<br />
V<br />
durch<br />
−1 −1<br />
YX = ΣYY ⋅ΣY . X ⋅ΣXX ⋅ΣX.<br />
Y<br />
−1<br />
= m − Sp ( Σyy<br />
⋅Σyy / x )<br />
Sp ( )<br />
2 VYX<br />
ηY<br />
/ X=<br />
min( mn , )<br />
definiert wird.<br />
2. Zusammenhang zwischen den multivariaten, multiplen und kanonischen Korrelationskoeffizienten<br />
κ. Es gilt<br />
2 2 2<br />
Y / X 1 min( m, n)<br />
1 − τ = (1 − κ ) ⋅…<br />
⋅[1 − κ ].<br />
Die kanonischen Korrelationskoeffizienten werden am einfachsten aus den nicht negativen<br />
−1 −1<br />
Eigenwerten von Σ ⋅Σ ⋅Σ ⋅Σ berechnet.<br />
YY Y . X XX X.<br />
Y
258 5 Qualität in der Fertigung<br />
5.9.6 Was besagen der multivariat partiell-multiple und der multivariat<br />
semipartiell-multiple Korrelationskoeffizient?<br />
Die Berechnung von Pro zessgleichungen im Rahmen des multivariaten, multiplen linearen<br />
Modells wird mit der Auswahl der wesentlichen Input- und Prozessvariablen gekoppelt.<br />
Hieraus folgt aber, dass wir Korrelationskoeffizienten für die Beurteilung der<br />
Abhängigkeiten nach der Zerlegung des zufälligen Vektors der Produkt- und Input- und<br />
Prozessvariablen in Z T = (Y T , X(k) T , X(h) T ) für die bedingten Erwartungswerte E[X(h)/X(k)]<br />
−1<br />
T<br />
= Σhk . ⋅Σkk ⋅ Xk () = : β Y/<br />
X ⋅ Xk () mit var[X(h)/X(k)] = Σ hh/k benötigen. Bezeichnen wir die<br />
Fehlermatrizen mit<br />
und<br />
E [ F ⋅ F ] = Σ<br />
Y / k h/ k Y. h/<br />
k<br />
−1<br />
Y / k h/ k = ΣY. h/ k⋅Σhh⋅<br />
h/<br />
k<br />
E [ F / F ]<br />
F<br />
T −1<br />
Y / k Fh/ k = ΣYY / k−<br />
ΣY. h/ kΣhh/ kΣY. h/<br />
k<br />
var [ F / ]<br />
dann können wir den multivariaten partiell-multiplen Korrelationskoeffizienten in der folgenden<br />
Form<br />
Σ<br />
2 = − /( , ) Σ<br />
τ<br />
= −<br />
/<br />
Yh 1 1<br />
. / k<br />
ΣYY / k Σ /<br />
YY k h YY X<br />
YY k<br />
definieren.<br />
Dieser Korrelationskoeffizient misst den Grad der linearen Abhängigkeit zwischen den bedingten<br />
Erwartungswerten E[Y/X] und E[Y/X(k)].<br />
Für jede Produktvariable Y r , r = 1, …, m kann man aufgrund der Darstellung für τ 2 Y.h/k die<br />
Beziehung<br />
τ<br />
σ 2 2 −<br />
2 Red , ( )<br />
Y X σr k σ<br />
rph<br />
r X<br />
= ρr h k= 1 − = =<br />
σ σ σ<br />
2 2 / / /<br />
Yr<br />
. h/ k . / 2 2 2<br />
Y / k r/ k r/<br />
k<br />
aufschreiben, die besagt, dass Hypothesen über die Red p (h) bzw. Red r, p (h) des Abschnittes 5.9.2<br />
mit den partiell-multiplen Korrelationskoeffizienten geprüft werden können.<br />
Aus ρ 2 r.h/k = 0 folgt mit Wahrscheinlichkeit 1, dass die Streichung der Input- und Prozessvariablen<br />
in X(h) keine Vergrößerung der bedingten Varianz σ 2 Y/X zur Folge hat. In diesem Fall<br />
muss gelten, sowohl Σ hk = 0 als auch σ r.h = 0.<br />
Aus ρ 2 r.h/k = 1 folgt mit Wahrscheinlichkeit 1, dass X(h) eine lineare Funktion von X(k) ist.<br />
Für die Zerlegung des Vektors der Input- und Prozessvariablen in X(k) und X(h) gilt für den<br />
partiell-multiplen Korrelationskoeffizienten<br />
2 2 2 2 2 2<br />
r/ X r/ k rh . / k r r/ k rh . / k<br />
σ = σ ⋅(1 − ρ ) = σ ⋅(1 − ρ ) ⋅(1 − ρ ).<br />
Dieser interessante Zusammenhang lässt sich auf den multivariaten Fall übertragen.<br />
Für die Zerlegung des Vektors der Produktvariablen Y in Y(s) und Y(t) mit<br />
s = (s 1 , …, s q ), s 1 < … < s q und<br />
t = (t 1 , …, t m – q ), t 1 < … < t m – q gilt
5.10 Was ist eine Prozessgleichung und wozu benötigt man diese?<br />
259<br />
2 2 2<br />
Y / X s/ X t. X/<br />
s<br />
1 − τ = (1 − τ ) ⋅(1 − τ )<br />
und für die Zerlegung von X in X(k) und X(h) gilt<br />
2 2 2<br />
Y / X Y. h/ k Y / k<br />
1 − τ = (1 − τ ) ⋅(1 − τ ).<br />
In analoger Weise kann der multivariate semi partielle Korrelationskoeffizient<br />
τ<br />
2<br />
Y .( h / k ) 1<br />
gebildet werden.<br />
= −<br />
Σ<br />
YY /( k, h)<br />
Σ<br />
YY<br />
5.10 Was ist eine Prozessgleichung und wozu benötigt man<br />
diese?<br />
Wie wir schon wiederholt feststellten, ist jedes Produkt (materielles Produkt oder Dienstleistung)<br />
das Ergebnis eines (Herstellungs- oder Dienstleistungs-) Prozesses. Jedes Produkt wird<br />
durch m, m ≥ 1 nicht unabhängige Produktvariable beschrieben. Der Kunde, der ein Produkt<br />
kaufen möchte, stellt seine Anforderungen an das Produkt. Diese Anforderungen werden in<br />
einem Kundenanforderungsprofil (KAP) zusammen gestellt. Das KAP wird parametrisiert und<br />
durch Sollwerte und Toleranzgrenzen für alle relevanten Produktvariable spezifiziert.<br />
Ein Prozess wird durch die Input-, Prozessvariablen X als Ursachen und die Produktvariablen<br />
Y als Wirkungen beschrieben. Eine Veränderung der Produktvariablen kann nach dem Ursache-Wirkungs-Prinzip<br />
nur durch die Veränderung der Input- und/oder Prozessvariablen<br />
erreicht werden. Die Veränderungen durch die Störvariablen (noise variables) sind zufällig<br />
und nicht steuerbar, müssen aber trotz alledem berücksichtigt werden, denn deren Einfluss<br />
kann erheblich sein.<br />
Damit die Kundenanforderungen durch die gefertigten Produkte auch wirklich erfüllt werden,<br />
muss der Prozess gesteuert werden. Dazu benötigen wir die Prozessgleichung. In die können<br />
wir Werte für die Input- und Prozessvariable einsetzen und damit die Werte für die Produktvariable<br />
(oder Produktvariablen) berechnen.<br />
Definition der Prozessgleichung<br />
Die Prozessgleichung ist eine Funktion, die den Input- Z und Prozessvariablen X die Produktvariablen<br />
Y zuordnet, sodass eine Steuerung des Prozesses möglich ist.<br />
Die Funktion ist in der Regel unbekannt. Es sind kaum Gesetze bekannt, nach denen die Prozessgleichung<br />
gefunden werden kann. Daher muss die Funktion statistisch bestimmt werden.<br />
Dazu benötigt man möglichst fehlerfreie, vollständige, zuordenbare Messwertsätze in ausreichender<br />
Anzahl für die Input-, Prozess- und Produktvariablen.<br />
Die Input- und Produktvariablen sind dabei in der Regel zufällige Vektoren, denn die Inputvariablen<br />
sind nach Abschnitt 5.5 die Produktvariablen der Produkte von Vorläuferprozessen.<br />
Produktvariable sind zufällige Vektoren, da in jedem Prozess zufällige Komponenten wirken,<br />
deren Beitrag sich auf die Werte der Produktvariablen auswirkt.
260 5 Qualität in der Fertigung<br />
Die Prozessvariablen können zufällig oder determiniert sein. Häufig wirken aber auch die determinierten<br />
Einstellvariablen zufällig auf das Produkt. Diese Voraussetzung bedingt, dass für<br />
die Berechnung der Prozessgleichung gewisse Verteilungsvoraussetzungen benötigt werden.<br />
Beispiel 5.10.1: Brennen von Porzellan. Technologie<br />
Porzellan wird aus Kaolin, Quarz und Feldspat hergestellt. Die aus der Porzellanmasse<br />
geformten Gegenstände werden zuerst in einem Glühbrand von 900 [°C] gesintert, wobei<br />
der Scherben entsteht. Nach dem Verglühen wird der Scherben glasiert und dem Gar- oder<br />
Glattbrennen von 1400 – 1500 [°C] unterworfen. Der Quarz und Feldspat geraten bei der<br />
hohen Temperatur in Fluss und füllen das Gerippe von Kaolin vollständig aus.<br />
Der Brennofen wird auf 900 [°C] oder 1400 [°C] hoch geheizt. Dass Brenngut wird in<br />
Regale einsortiert und eingeschoben. An jeder Stelle des Regals wirkt eine klein wenig<br />
unterschiedliche Temperatur, d. h. trotz der festen Einstellung des Ofens wirken auf die zu<br />
brennenden Gegenstände verschiedene Temperaturen.<br />
Wie kann man eine Prozessgleichung gewinnen?<br />
In der Antwort zu dieser Frage werden Methoden zur Prüfung der Homogenität und zur<br />
Klassifikation der inhomogenen Stichprobe in homogene Teilstichproben, zur Berechnung<br />
der Prozessgleichung und zur Auswahl der wesentlichen Input- und Prozessvariablen bereit<br />
gestellt.<br />
Um die Verbindung zur klassischen Literatur über die Regressionsanalyse herzustellen, betrachten<br />
wir zunächst den klassischen Fall, bei dem angenommen wird, dass nur Y eine Zufallsgröße<br />
oder ein zufälligen Vektor ist und erweitern diesen dann auf den praktikablen Fall, in dem<br />
sowohl die Input-, Prozess- und Produktvariable zufällige Vektoren sind.<br />
5.11 Modelle für die Prozessgleichung<br />
5.11.1 Nur die Produktvariable Y ist zufällig<br />
Wir wollen annehmen, dass Y ~ N m (µ Y , Σ YY ). Die Input- und Prozessvariablen, wir fassen diese<br />
zu dem Vektor x zusammen, sind determiniert. Die funktionale Darstellung der Produktvariable<br />
Y durch die determinierten Input- und Prozessvariablen<br />
Y = f (x) + ε<br />
bezeichnen wir als Prozessgleichung. Wir können dafür auch schreiben,<br />
Y ~ N m (f (x), Σ YY ).<br />
Da x ein Vektor fester Einstellgrößen für die Input- und Prozessvariablen ist, wird das Modell<br />
multivariates lineares Modell mit festen Input- und Prozessvariablen genannt. Ist X ein zufälliger<br />
Vektor von Input- und Prozessvariablen und sind Y und X gemeinsam nach einer n + m<br />
dimensionalen Normalverteilung verteilt, dann wird das Modell multivariates lineares multiples<br />
Modell mit stochastischen Input- und Prozessvariablen genannt. Wir beginnen mit dem Modell<br />
mit determinierten Input- und Prozessvariablen, da dieses aus der Literatur bek annt ist.
5.11 Modelle für die Prozessgleichung<br />
261<br />
Den Vektor der Input- und Prozessvariablen bezeichnen wir mit x, den Vektor der Produktvariablen<br />
mit Y. Um das Ursache-Wirkungs-Prinzip auch in diesem Falle zu betonen, schreiben<br />
wir anstelle der Y auch Y = Y(x 1 , …, x n ).<br />
Das multivariate lineare Modell mit festen Input- und Prozessvariablen wird wie folgt geschrieben<br />
Y(x 1 , …, x n ) = f (x 1 , …, x n ) + ε,<br />
wobei<br />
f (x 1 , …, x n ) ist eine lineare Funktion,<br />
E[Y(x 1 , …, x n )] = f (x 1 , …, x n ),<br />
ε ∼ N μ (0, Σ), Σ ist positiv definit und<br />
f (x 1 , …, x n ) und ε sind unabhängig voneinander. Die Kovarianzmatrix Σ, kann zwei grundsätzliche<br />
verschiedene Strukturen haben. Beim klassischen linearen Modell gilt<br />
var(ε) = σ 2 I N , d. h. var(ε i ) = σ 2 und cov(ε i , ε k ) = 0 für i ≠ k.<br />
Für das allgemeine lineare Modell gilt<br />
var(ε) = σ 2 Σ YY .<br />
Σ YY wird manchmal als bekannt vorausgesetzt, kann aber auch unbekannte Modellparameter<br />
enthalten. σ 2 ist in jedem Fall ein unbekannter Modellparameter. Die Eigenschaft gleicher<br />
Varianz σ 2 der Fehlervariablen ε i , i = 1, …, N wird als Homoskedastizität bezeichnet.<br />
Manchmal ist Σ diago nal, aber ≠ I N , so nennt man diesen Fakt Heteroskedastizität. Im Fall von<br />
Zeitreihendaten ist die Voraussetzung cov(ε i , ε k ) = 0 für i ≠ k, d. h. der Unkorreliertheit der Fehlervariablen<br />
verletzt. In Kurzschrift können wir hierfür auch schreiben Y ~ N m (f (x 1 , …, x n ), Σ)<br />
mit den Eigenschaften der positiven Definitheit von Σ und der Unabhängigkeit von Fehler<br />
und linearer Funktion.<br />
Die statistischen Aufgaben sind in diesem Fall die<br />
•<br />
•<br />
•<br />
Bestimmung der linearen Funktion f (x 1 , …, x n ),<br />
Berechnung des Maßes der Beherrschbarkeit des Prozesses durch die ausgewählten Inputund<br />
Prozessvariablen,<br />
Beantwortung der Frage, ob das berechnete Maß der Beherrschbarkeit auch mit weniger Input-<br />
und Prozessvariablen erreicht werden kann, d. h. Auswahl der optimalen Teilmenge von<br />
wesentlichen Input- und Prozessvariablen und Streichung der redundanten Variablen.<br />
Das lineare Modell mit festen Input- und Prozessvariablen kann nun durch<br />
•<br />
•<br />
Varianzanalysen oder<br />
Regressionsanalysen<br />
realisiert werden. Das Unterscheidungskriterium zwischen diesen beiden Modelltypen ist die<br />
Messbarkeit der Input- und Prozessvariablen. Sind x 1 , …, x n nur qualitativ messbar, d. h. lassen<br />
sich hierfür Abstufungen angeben, dann ist die Varianzanalyse der passende Modelltyp.<br />
Die Input- und Prozessvariablen sind feste Einstellgrößen, d. h. x 1 , x 2 , …, x n ∈ R n . Die m, m ≥ 1<br />
Produktvariablen Y 1 , Y 2 , …, Y m sind Zufallsgrößen und Funktionen der determinierten Inputund<br />
Prozessvariablen. Auch dieser Sachverhalt wird in Verbindung mit einer Verteilungsannahme
262 5 Qualität in der Fertigung<br />
Y ∼ N ( B x, Σ ),<br />
m<br />
Yx .<br />
YY<br />
dargestellt, wobei B Y.x die Matrix der unbekannten Koeffizienten der Prozessgleichungen ist,<br />
die den Vektor der Produktvariablen Y T = (Y 1 … Y m ) als Linearkombination von den Inputund<br />
Prozessvariablen x T = (x 1 … x n ) darstellt. Σ YY ist die Kovarianzmatrix des Vektors der<br />
Produktvariablen.<br />
Die Normalverteilungsannahme ist oft gerechtfertigt und wird genau so oft, zumindest von<br />
Kritikern infrage gestellt. Unter den hier formulierten Voraussetzungen ist sowohl der lineare<br />
als auch nichtlineare Modellansatz möglich.<br />
Bei all diesen höher dimensionalen Problemen sollte die statistische Prozessanalyse zunächst<br />
mit linearen Modellen begonnen werden. Sind die Maße der Beherrschbarkeit niedrig und<br />
können nicht durch zusätzliche Input- und/oder Prozessvariable vergrößert werden, dann<br />
kann man zu den nichtlinearen Modellen übergehen.<br />
Die Stichprobe<br />
T T<br />
1 = 11 … 1n<br />
Y Y ( x , , x )<br />
…<br />
T T<br />
N = N1<br />
… Nn<br />
Y Y ( x , , x )<br />
an den N Messwertstellen für die Input- und Prozessvariablen<br />
⎛ x<br />
⎜<br />
⎜<br />
⎝x<br />
…<br />
…<br />
…<br />
11 1n<br />
N1<br />
x<br />
x<br />
Nn<br />
und die Darstellung<br />
Y = f( x ,…, x ) + ε , ∀ i = 1, …,<br />
N<br />
⎞<br />
⎟<br />
⎟<br />
⎠<br />
i i1<br />
in i<br />
sind Grundlagen für die Berechnung der Prozessgleichung mit festen Input- und Prozessvariablen.<br />
Es wird noch vorausgesetzt, dass<br />
E [ εi] = 0<br />
var ( ε ) = Σ<br />
i<br />
Des weiteren wird angenommen, daß f (x 1 , …, x n ) von den unbekannten Modellparametern<br />
β Y.1 , …, β Y.n abhängen möge. Es gibt folglich eine Funktionenschar<br />
̃ nm ⋅<br />
f ( x ,…, x ; β ,…, β ), mit ( β ,…, β ) ∈ R ,<br />
1 n Y.1 Y. n Y.1 Y.<br />
n<br />
die die unbekannte Funktion enthält. Für die Ableitung von Schätzfunktionen für die unbekannten<br />
Modellparameter wollen wir voraussetzen, daß die Funktion ̃f nur linear von den<br />
unbekannten Koeffizienten abhängt, d. h.<br />
f̃ ( x , … , x ; β , … , β ) = β ⋅ g ( x , … , x ) + … + β ⋅ g ( x , … , x )<br />
1 n Y.1 Y. n Y.1 1 n Y.<br />
n 1 n<br />
wobei g(x 1 , …, x n ) bekannte linear unabhängige Funktionen sind. Diese Gleichung nennen<br />
wir Prozessgleichung, wenn x T = (x 1 , …, x n ) der Vektor der determinierten Input- und Prozessvariablen<br />
ist.
5.11 Modelle für die Prozessgleichung<br />
263<br />
5.11.1.1 Was versteht man unter einem univariaten, linearen, multiplen Modell<br />
mit festen Input- und Prozessvariablen ?<br />
Dieses Modell besitzt die Darstellung<br />
T<br />
Yx . .<br />
Y = β ⋅ x + ε<br />
In diesem Modell ist Y eine nach Y ~ N 1 (β T Y…x x, σ2 ) verteilte Zufallsgröße, x T = (x 1 , …, x n )<br />
der Vektor der festen Input- und Prozessvariablen und ε der Anpassungsfehler Y – β T Y…x x mit<br />
der Verteilung ε ~ N 1 (0, σ 2 ). Y und ε sind unabhängig voneinander verteilt. Das dazugehörige<br />
statistische univariate, lineare, multiple Modell mit festen Input- und Prozessvariablen ist<br />
wobei<br />
Y<br />
Y<br />
T<br />
Yx .<br />
= β ⋅ x + ε<br />
⎛Y1 ⎞ ⎛ x11 … x1N<br />
⎞<br />
= ⎜…<br />
⎟ und x = ⎜ … ⎟<br />
⎜ ⎟ ⎜ ⎟<br />
⎝Y ⎠ ⎝x … x ⎠<br />
N N1<br />
Nn<br />
die Stichproben vom Umfang N für die Produktvariable Y und den Vektor der determinierten<br />
Input- und Prozessvariablen sind. In der Schreibweise mit der Verteilung gilt für dieses Modell<br />
T<br />
2 2<br />
N Y.<br />
x N N N<br />
Y ∼ N ( β ⋅ x, σ ⋅ I ) und ε ~ N (0, σ ⋅ I )<br />
wobei I N die N dimensionale Einheitsmatrix ist.<br />
Was müssen wir weiter tun?<br />
Wir müssen mit der Stichprobe für Y und x die unbekannten Modellparameter für das multivariate,<br />
lineare, multiple Modell mit festen Input- und Prozessvariablen schätzen. Hierzu verwenden<br />
wir die bekannte Methode der kleinsten Quadrate, die von Gauß eingeführt wurde. Diese<br />
Methode wollen wir an dem vereinfachten Beispiel 5.11.1 demonstrieren. Vereinfacht bedeutet,<br />
dass wir nur die eine Prozessvariable Geschwindigkeit betrachten und hierfür annehmen, dass<br />
diese Variable fest ist. Die Festlegung kann realisiert werden, idem wir die Geschwindigkeiten<br />
vorgeben und nach dem plötzlichen Bremsen die Länge des Bremsweges messen.<br />
Beispiel 5.11.1: Bremsweg. Einfache Prozessgleichung<br />
Wir betrachten nur die Abhängigkeit des Bremsweges Y [m] von der vorgegebenen Geschwindigkeit<br />
x [km/h]. In diesem einfachsten Fall erhalten wir das einfache lineare Modell<br />
mit einer festen Prozessvariablen<br />
Y = β Y. x x + ε.<br />
Wir wollen annehmen, dass ε ~ N (0, σ 2 ). Die beiden Modellparameter β Y.x und σ 2 sind<br />
unbekannt. Für deren Bestimmung wird eine Stichprobe für die beiden Produkt- und Prozessvariablen<br />
vom Umfang N benötigt. Um das Nachrechnen zu ermöglichen, betrachten<br />
wir nur die kleine Stichprobe in der Tabelle 5.11.1, die auch in der Datei 052Bremsweg03<br />
auf der beiliegenden CD enthalten ist.
264 5 Qualität in der Fertigung<br />
Tabelle 5.11.1: Messwerte für das Bremswegbeispiel<br />
Nr. Y x<br />
1 35,1 58,0<br />
2 34,1 55,6<br />
3 39,5 60,4<br />
4 36,9 59,8<br />
5 34,1 58,4<br />
6 34,4 58,7<br />
7 30,7 56,3<br />
8 30,3 52,5<br />
9 33,9 54,4<br />
10 49,7 70,5<br />
Zuerst werden die statistischen Maßzahlen berechnet. Man erhält die Werte:<br />
Tabelle 5.11.2: Statistische Maßzahlen für das Bremswegbeispiel<br />
Statistische Maßzahl Y X<br />
Mittelwert 35,87 58,46<br />
Standardabweichung 5,539 4,895<br />
Minimum 30,3 52,5<br />
Maximum 49,7 70,5<br />
Spannweite 19,4 18<br />
Variationskoeffizient 15,4 8,4<br />
Die statistischen Maßzahlen verraten nichts über die Abhängigkeit des Bremsweges von der<br />
Geschwindigkeit, obwohl die natürlich gegeben ist. Das lehrt die Erfahrung und zeigt die<br />
Abbildung 5.11.1. Diese Abbildung zeigt uns auch, dass die Abhängigkeit zwischen diesen<br />
beiden Variablen linear ist.<br />
Für das Bremswegbeispiel erhalten wir die Punktwolke der Abbildung 5.11.1.<br />
Plot Bremsweg über der Geschwindigkeit<br />
50<br />
Bremsweg<br />
46<br />
42<br />
38<br />
34<br />
30<br />
52 56 60 64 68 72<br />
Geschwindigkeit<br />
Abb. 5.11.1: Punktwolke für das Bremswegbeispiel<br />
Was ist in dieser Situation zu tun? Wir denken uns eine Gerade Y = b 0 + b Y.x x durch die<br />
„Punktwolke“ gelegt und fragen, wie die unbekannten Koeffizienten der Gleichung aus den<br />
Messwertepaaren für die beiden Variablen bestimmen werden können.
5.11 Modelle für die Prozessgleichung<br />
265<br />
Das plausibelste Prinzip hierfür ist, den Abstand der einzelnen Punkte von der gedachten<br />
Gerade zu minimieren. Hierbei ist darauf zu achten, dass die Summe der Abstände oberhalb<br />
der Geraden genauso groß ist, wie die Summe der Abstände unterhalb der Geraden.<br />
Für diese Lösung betrachten wir die Quadrate der Abstände der Punkte von der Geraden.<br />
Der quadratische Abstand eines Punktes i mit den Koordinaten (x i , y i ), i = 1, …, N von<br />
der gedachten Geraden<br />
yˆ<br />
= b + b x<br />
0 yx .<br />
2<br />
i<br />
ist ( yˆ<br />
− y ) . Die Summe der quadratischen Abstände aller Punkte von der gedachten<br />
Ausgleichsgeraden ist<br />
N<br />
N<br />
2 2<br />
∑ yi − yˆ<br />
= ∑ yi − b0 + by.<br />
xx<br />
i= 1 i=<br />
1<br />
( ) [ ( )] .<br />
Diese Summe soll minimiert werden. Für diese Aufgabe sind die Methoden der Differentialrechnung<br />
zu verwenden. Es müssen zunächst die partiellen Ableitungen der Summe der<br />
quadratischen Abweichungen gebildet und dann null gesetzt werden. Das so entstehende<br />
Gleichungssystem ist zu lösen. Formelmäßig erhält man<br />
N<br />
N<br />
2 2<br />
∑ i<br />
ˆ ∑ i 0 y.<br />
x<br />
i= 1 i=<br />
1<br />
QS = ( y − y) = ( y − b − b x) ⇒ Min!<br />
N<br />
∂QS<br />
=−2 ⋅∑ ( yi<br />
−b0 −by.<br />
x x)<br />
∂b<br />
0 i=<br />
1<br />
N<br />
∂QS<br />
=−2 ⋅∑ ( yi<br />
−b0 −by.<br />
x x)<br />
⋅x<br />
∂b<br />
yx . i = 1<br />
d. h. man muss das Gleichungssystem<br />
N<br />
∑ i 0 y.<br />
x<br />
i=<br />
1<br />
( y − b − b x) = 0<br />
N<br />
∑ i 0 y.<br />
x<br />
i=<br />
1<br />
( y − b − b x) ⋅ x = 0<br />
lösen.<br />
Das Gleichungssystem kann man umformen zu<br />
N<br />
∑<br />
∑<br />
y = N ⋅ b + b ⋅ x<br />
i 0 y.<br />
x i<br />
i= 1 i=<br />
1<br />
N N N<br />
∑x ⋅ y = b ⋅ ∑x + b ⋅∑x<br />
2<br />
i i 0 i y.<br />
x i<br />
i= 1 i= 1 i=<br />
1<br />
N<br />
Dieses Gleichungssystem nennt man Normal Gleichungs System (NGS) für die unbekannten<br />
Koeffizienten b 0 und b y.x der linearen Gleichung und die bekannten Ausdrücke
266 5 Qualität in der Fertigung<br />
N<br />
N<br />
∑x<br />
∑x<br />
2<br />
i<br />
und .<br />
i<br />
i= 1 i=<br />
1<br />
Dieses einfache NGS löst man am schnellsten mit der Kramer’schen Regel (siehe Bronstein<br />
[1960]).<br />
Die Koeffizientendeterminante des NGS ist<br />
D =<br />
N<br />
N<br />
∑<br />
x<br />
N<br />
∑<br />
i<br />
i=<br />
1<br />
N<br />
∑<br />
i<br />
i= 1 i=<br />
1<br />
x<br />
x<br />
2<br />
i<br />
D 0 ist die Determinante, die sich aus D ergibt, wenn man in dieser die Spalte der Koeffizienten<br />
für das unbekannte b 0 durch die Spalte der Absolutglieder<br />
ersetzt, d. h.<br />
N<br />
∑<br />
i=<br />
1<br />
y und<br />
i<br />
N<br />
∑<br />
i<br />
i=<br />
1<br />
x ⋅ y<br />
i<br />
D<br />
0<br />
=<br />
N<br />
∑<br />
y<br />
N<br />
∑<br />
x<br />
i<br />
i<br />
i= 1 i=<br />
1<br />
N<br />
N<br />
2<br />
∑xi ⋅ yi ∑xi<br />
i= 1 i=<br />
1<br />
Analog erhält man<br />
D<br />
N<br />
∑<br />
i=<br />
1<br />
yx . =<br />
N N<br />
∑<br />
∑<br />
N<br />
y<br />
x x ⋅ y<br />
i i i<br />
i= 1 i=<br />
1<br />
i<br />
.<br />
Damit erhält man für b y.x den Ausdruck<br />
b<br />
N N N<br />
∑ ∑ ∑<br />
N ⋅ x ⋅ y − y ⋅ x<br />
i i i i<br />
Dyx<br />
. A<br />
i= 1 i= 1 i=<br />
1<br />
xy .<br />
yx . = = =<br />
2<br />
D ⎛<br />
N<br />
⎞ A ⋅<br />
2<br />
x Ay<br />
N ⋅∑xi<br />
− ⎜ ∑xi<br />
⎝ ⎟<br />
i=<br />
1 ⎠<br />
Mit den Daten aus obiger Tabelle erhält man die Matrix<br />
.<br />
A<br />
⎛2156.44 2324.68⎞<br />
= ⎜<br />
⎝ 2761.61 ⎟<br />
⎠<br />
und damit<br />
b yx .<br />
2324.68<br />
= = 1.078.<br />
2156.44
5.11 Modelle für die Prozessgleichung<br />
267<br />
b 0 kann man wie folgt berechnen:<br />
b0 = y − byx<br />
. ⋅ x = 35.87 −1.078 ⋅ 58.46 = −27.15<br />
.<br />
Damit lautet die Prozessgleichung für die Länge des Bremsweges in Abhängigkeit von der<br />
Geschwindigkeit<br />
yˆ =− 27.15 + 1.078 ⋅x.<br />
Für den Korrelationskoeffizienten erhält man den Wert<br />
r xy<br />
2324.68<br />
= = 0.952.<br />
2156.44 ⋅ 2761.61<br />
Zur Prüfung der Hypothese, ob der Bremsweg unabhängig von der gefahrenen Geschwindigkeit<br />
ist, muss der t-Test berechnet werden. Man erhält<br />
0.95<br />
tˆ = 8 = 8.6.<br />
2<br />
1−<br />
0.95<br />
Der Tafelwert t α, FG für die Irrtumswahrscheinlichkeit α = 0.05 und 8 FG ist 1.859, d. h.<br />
die aufgestellte Hypothese der Unabhängigkeit muss verworfen werden. Die Länge des<br />
Bremsweges ist abhängig von der gefahrenen Geschwindigkeit.<br />
Die Stichprobenvarianz der einzelnen Messwerte um die Prozessgleichung, d. h. die Restvarianz<br />
kann man wie folgt berechnen:<br />
2<br />
N<br />
= ⋅ ∑ − 2 N<br />
1<br />
−<br />
= 1<br />
/ ⋅ ∑ − 0 − . ⋅ 2<br />
y x i<br />
ˆi i y x<br />
N 2<br />
i= 1<br />
N − 2<br />
i=<br />
1<br />
s ( y y ) ( y b b x ) .<br />
Diese Art der Berechnung ist sehr aufwendig. Daher rechnet man die obige Formel um<br />
und erhält<br />
2 2 2<br />
Y / x y y/<br />
x<br />
s = s ⋅(1 − r ),<br />
wobei r Y/x der einfache Korrelationskoeffizient zwischen der Produktvariable Y und der<br />
Prozessvariable x ist. Nach dieser Formel erhält man die bedingte Stichprobenvarianz<br />
s 2 Y/x = 2.99 bzw. die bedingte Standardabweichung s Y/x = 1.73.<br />
5.11.1.2 Multivariates, multiples lineares Modell mit determinierten Input- und<br />
Prozessvariablen; Y ist ein zufälliger Vektor<br />
Anstelle der einen Produk tvariablen Y müssen wir dem Vektor der m, m ≥ 1 nicht unabhängigen<br />
Produktvariablen Y T = (Y 1 , …, Y m ) betrachten. Mit den Abkürzungen<br />
⎛Y<br />
⎞ ⎛ ⎞<br />
⎛ ⎞<br />
⎛ ⎞<br />
Y = ⎜… ⎟ = ⎜ … ⎟ = … ∈ = ⎜ … ⎟<br />
⎜ ⎟ ⎜ ⎟ ⎜ ⎟<br />
⎝Y<br />
⎠ ⎝ ⎠ ⎝ ⎠<br />
lautet dieses Modell<br />
T<br />
1 βY1.1 … β β<br />
Y1. n Y1.<br />
x<br />
εY1<br />
⎜ ⎟<br />
m×<br />
n<br />
, ΒYx<br />
.<br />
⎜ ⎟ Μ und ε<br />
T<br />
m βYm.1 … β ⎜ ⎟<br />
Ym.<br />
n β<br />
ε<br />
⎝<br />
Ym<br />
Ym.<br />
x ⎠<br />
Y<br />
T<br />
Yx .<br />
= Β ⋅ x + ε
268 5 Qualität in der Fertigung<br />
wobei<br />
Y ~ N m (Β T Y.x x, Σ εε )<br />
ε ~ N m (0, Σ εε ),<br />
Σ<br />
εε<br />
2<br />
⎛ var( ε1) … cov( ε1, εm)<br />
⎞ ⎛ σ1 … σ ⎞<br />
1m<br />
⎜<br />
⎟<br />
= ⎜<br />
…<br />
⎟ = ⎜<br />
… .<br />
⎜<br />
⎟<br />
⎟<br />
⎝cov( ε , ε ) … var( ε ) ⎠ ⎜<br />
⎝σ σ ⎟<br />
⎠<br />
2<br />
m 1 m m1<br />
… m<br />
Y und ε sind unabhängig voneinander. In diesem Modell sind die Modellparameter Β Y.x und<br />
Σ εε unbekannt und müssen mit den Werten einer Stichprobe geschätzt werden.<br />
Das statistische Modell ist gegeben durch<br />
wobei gilt<br />
Y = Β T Y.x x + ε,<br />
⎛Y11 … Y1 N ⎞ ⎛ x11 … x1n<br />
⎞<br />
Y = ⎜ … ⎟, x = ⎜ … ⎟ die Stichprobe und<br />
⎜ ⎟ ⎜ ⎟<br />
⎝Ym1 … YmN ⎠ ⎝xN1<br />
… xNn⎠<br />
⎛ ε11 … ε1N<br />
⎞<br />
ε = ⎜ … ⎟<br />
⎜ ⎟<br />
⎝η<br />
… ε ⎠<br />
m1<br />
In diesem Modell ist<br />
mN<br />
Y ~ N N (Β Y.x T x, Σ YY ⊗ I N ),<br />
wobei ⊗ das Kronecker Produkt der beiden Matrizen Σ YY und I N bezeichnet. Dieses Produkt<br />
ist in diesem Spezialfall<br />
Σ<br />
YY<br />
⎛ΣYY<br />
0 … 0 ⎞<br />
⎜ 0 Σ<br />
⎟<br />
YY … 0<br />
⊗ IN<br />
= ⎜<br />
⎟<br />
⎜ …<br />
⎟<br />
⎜<br />
⎝ 0 0 … Σ ⎟<br />
⎠<br />
YY<br />
eine Block-Diagonalmatrix, die N mal die Kovarianzmatrix der Produktvariable Y enthält.<br />
5.11.2 Lineare Modelle mit stochastischen Input- und Prozessvariablen<br />
Diese Modelle haben formal das selbe Aussehen wie die Modelle mit determinierten Inputund<br />
Prozessvariablen. Trotzdem unterscheiden sich die Modelle wesentlich, vorallem bzgl. der<br />
Verteilungen für die Schätz- und Teststatistiken.<br />
Warum müssen wir Modelle mit stochastischen Input- und Prozessvariablen betrachten?<br />
Sehr häufig ist die Voraussetzung, dass die Input- und Prozessvariablen feste Einstellgrößen<br />
sind, in der Praxis verletzt. Betrachtet man z. B. die Prozessvariable Temperatur bei der Her-
5.11 Modelle für die Prozessgleichung<br />
269<br />
stellung von Hochbrand Porzellan, dann wird diese zwar auf 1400 °C eingestellt, aber an den<br />
verschiedenen Stellen des Ofens und damit für verschiedene Teile des zu brennenden Gutes<br />
im Ofen sind die Temperaturen zufällig unterschiedlich. Der fest eingestellte Parameter wirkt<br />
somit auf das Produkt stochastisch. Daraus folgt, dass neben den bisher genannten Modellen<br />
die Modelle mit stochastischen Input- und Prozessvariablen betrachtet werden müssen.<br />
Es gibt einen weiteren Grund für die Verwendung dieses Modells. Die Inputvariablen sind<br />
Produktvariable eines Vorläuferprozesses und damit natürlich stochastisch.<br />
5.11.2.1 Wie sieht das multiple lineare Modell mit stochastischen Input- und<br />
Prozessvariablen aus und wodurch unterscheidet es sich von dem Modell<br />
mit festen Input- und Prozessvariablen?<br />
Die Ableitung des Modells für diesen praktisch relevanten Fall basiert auf der gemeinsamen,<br />
multivariaten Verteilung für die Input- (Z 1 , …, Z l ), Prozess- (X 1 , …, X n ) und Produktvariablen<br />
(Y 1 , …, Y m ). Im univariaten, multiplen, linearen Modell wird nur eine Produktvariable Y<br />
betrachtet. X und Z können Vektoren von Input- und Prozessvariablen sein.<br />
Wir wollen hier annehmen, dass die gemeinsame Verteilung des Vektors<br />
(Z T , X T , Y) = (X T , Y) ~ N n + 1 (µ, Σ),<br />
wobei die Input- und Prozessvariablen der Einfachheit halber zu dem Vektor X zusammengefasst<br />
werden und Σ als positiv definit vorausgesetzt wird. Mit der Zerlegung des zufälligen<br />
Vektors (Y, X T ) in den Teilvektor der Input- und Prozessvariablen X, d. h. die Ursachen und<br />
die Wirkung Y, erhält man für die Momente µ T = (µ Y , µ T X ) und<br />
⎛<br />
2 T<br />
σ ⎞<br />
Y σY.<br />
X<br />
Σ = ⎜ ⎟<br />
⎝ Σ ⎠<br />
XX<br />
den bedingten Erwartungswert<br />
T −1<br />
T<br />
Y Y. X XX X 0 Y / X<br />
EY [ / X] = μ + σ Σ ( X− μ ) = β + β X<br />
und die bedingte Varianz<br />
2 T −1<br />
Y Y. X XX Y.<br />
X<br />
var[ Y/ X] = σ − σ Σ σ .<br />
In diesen Formeln haben die ei nzelnen Symbole die folgenden Bedeutungen:<br />
σ 2 Y<br />
ist die Varianz der Produktvariablen Y,<br />
σ Y.X ist der Vektor der Kovarianzen zwischen der Produktvariablen und dem Vektor der Inputund<br />
Prozessvariablen X und<br />
Σ XX ist die Kovarianzmatrix für die Input- und Prozessvariable.<br />
Der bedingte Erwartungswert wird auch Regressionsfunktion genannt. Sie sehen erstens den<br />
Unterschied zur Regressionsanalyse mit festen Input- und Prozessvariablen und zweitens die<br />
Möglichkeit der anderen Darstellung in Form der Prozessgleichung<br />
Y = β 0 + β Y/X X + F Y/X ,<br />
wobei β Y/X = σ Y.X Σ –1<br />
YY , β 0 = µ Y – β Y/X µ X und F Y/X = Y – E [Y/X] ~ N 1 (0, σ2 Y/X ) ist der normalverteilte<br />
Anpassungsfehler. Y und F Y/X sind unabhängig voneinander.
270 5 Qualität in der Fertigung<br />
Beispiel 5.11.2: Bremsweg. Prozessgleichung mit mehreren Prozessvariablen<br />
Neben der Produktvariable Y werden die Prozessvariablen<br />
X 1 = Geschwindigkeit [km/h]<br />
X 2 = Profiltiefe [mm]<br />
X 3 = Reaktionszeit [sec]<br />
betrachtet. Die Prozessvariablen sind Zufallsgrößen.<br />
Die Kovarianzmatrix ist<br />
⎛<br />
2<br />
σ ⎞<br />
Y σY.1 σY.2 σY.3<br />
⎜<br />
2<br />
⎟<br />
⎜ σ ⎟ ⎛<br />
2 T<br />
x1 σx1. x2 σx1. x3 σ ⎞<br />
Y σY.<br />
X<br />
Σ = ⎜ ⎟<br />
=<br />
2 ⎜ ⎟<br />
⎝ ⎠<br />
⎜<br />
σx 2 σx 2. x 3<br />
Σ<br />
⎟<br />
XX<br />
⎜<br />
⎝<br />
σ ⎟<br />
⎠<br />
.<br />
2<br />
x 2<br />
Das Modell lautet<br />
Y = β 0 + β Y.1/2, 3 X 1 + β Y.2/1, 3 X 2 + β Y.3/1, 2 X 3<br />
und<br />
var[Y/X] = σ 2 Y/X = σ2 Y – σT Y.X Σ–1 XX σ Y.X ,<br />
wobei<br />
β0 = β T<br />
Y / X ( μY−<br />
μX)<br />
und<br />
T T −1<br />
Y / X=<br />
Y.<br />
X XX<br />
β σ Σ<br />
2<br />
/<br />
bedeuten. Die beiden Modellparameter σ Y X und β Y / X sind unbekannt und müssen mit<br />
einer Stichprobe geschätzt werden.<br />
Die Unterschiede zum Modell mit festen Input- und Prozessvariablen bestehen hauptsächlich<br />
darin, dass<br />
•<br />
•<br />
•<br />
die Modellparameter im Modell mit stochastischen Input- und Prozessvariablen die Parameter<br />
einer bedingten Verteilung sind,<br />
in den Verteilungen der Schätzungen für die unbekannten Modellparameter und<br />
in den Verteilungen der Teststatistiken.<br />
Was ist das Maß der Beherrschbarkeit?<br />
Das Quadrat des multiplen Korrelationskoeffizienten ρ 2 Y/X zwischen Y und der linearen Prozessgleichung<br />
wird Maß der Beherrschbarkeit des Prozesses genannt, denn dieses Maß gibt an, wie<br />
gut die Varianz der Produktvariablen Y durch die Input- und Prozessvariablen erklärt wird.<br />
Der Sprachgebrauch „Maß der Beherrschbarkeit“ wird durch die Beziehung<br />
2 2 2<br />
σ = σ ⋅(1 − ρ )<br />
Y / X Y Y / X<br />
deutlich, in der σ 2 Y die Varianz von Y und ρ2 Y/X den multiplen Korrelationskoeffizienten zwischen<br />
Y und der Prozessgleichung bezeichnen. Man kann von der bedingten Varianz ausgehen und<br />
daraus das Maß der Beherrschbarkeit über die Beziehung
5.11 Modelle für die Prozessgleichung<br />
271<br />
ρ<br />
2 T −1<br />
T<br />
2 σY / X σY. X⋅ΣXX⋅σY.<br />
X βY / X⋅ΣXX⋅βY / X<br />
Y / X= 1 − = =<br />
2 2 2<br />
σY σY σY<br />
ausrechnen.<br />
Sind Y und X unabhängig voneinander, dann ist ρ 2 Y/X = 0 und daraus folgt σ2 Y/X = σ2 Y , d. h. der<br />
Vektor der Input- und Prozessvariable trägt nicht zur Erklärung der Varianz der Produktvariablen<br />
bei.<br />
Sind Y und X mit Wahrscheinlichkeit 1 voneinander linear abhängig, dann ist ρ 2 Y/X = 1 und<br />
somit ist σ 2 Y/X = 0, d. h. alle Punkte Ŷ liegen auf der Ausgleichshyperebene. Die bedingte Varianz<br />
der Produktvariablen unter der Wirkung der Input- und Prozessvariablen ist null, d. h.<br />
die Varianz von Y wird durch die Input- und Prozessvariablen vollständig erklärt.<br />
Beispiel 5.11.3: Bremsweg. Mehrere Prozessvariable<br />
Der Prozess ist das Bremsen eines PKW’s vor einem plötzlich auftauchenden Hindernis.<br />
Die Produktvariable Y ist der Bremsweg in [m]. Die Prozessvariablen sind<br />
X 1 = Geschwindigkeit in [km/h],<br />
X 2 = Gewicht des PKW [kg] und<br />
X 3 = Profiltiefe des Reifens in [mm].<br />
Ein PKW vom selben Typ wurde von ein und denselben Fahrer auf ein und derselben Strasse<br />
unter den gleichen Wetterbedingungen mit verschiedenen Reifen auf unterschiedliche<br />
Geschwindigkeiten beschleunigt und vor dem Hindernis abgebremst. Die Daten dieses<br />
Versuches sind im Internet unter dem Namen 05.11.3 Bremsweg enthalten.<br />
Die statistischen Maßzahlen sind in der Tabelle 5.11.3 enthalten.<br />
Tabelle 5.11.3: Statistische Maßzahlen<br />
Statistische Maßzahlen Y X 1 X 2 X 3<br />
Mittelwert 25,907 49,862 1440,23 3,549<br />
Standardabweichung 0,832 3,276 168,0 0,496<br />
Minimum 23,98 42,60 1040,4 2,165<br />
Maximum 28,11 57,45 1832,8 5,18<br />
Die statistischen Maßzahlen sagen nichts aus über die Abhängigkeitsstruktur zwischen den<br />
Variablen. Man kann aus ihnen nicht ablesen, ob die Vergrößerung der Geschwindigkeit<br />
des PKW zu einem längeren Bremsweg führt.<br />
Um das ablesen zu können müssen wir zunächst die Korrelationsmatrix für diese Variablen<br />
berechnen. Die Werrte stehen in der Tabelle 5.11.4.<br />
Tabelle 5.11.4: Korrelationsmatrix<br />
Korr.Matrix Y X 1 X 2 X 3<br />
Y 1 0,828 0,748 –0,677<br />
X 1 1 0,425 –0,275<br />
X 2 1 –0,437<br />
X 3 1
272 5 Qualität in der Fertigung<br />
Die Korrelationsmatrix sagt uns, dass die Länge des Bremsweges und die Geschwindigkeit<br />
hoch miteinander korreliert sind. Die Länge des Bremsweges hängt aber außerdem von<br />
dem Gewicht und der Profiltiefe ab, wobei die Länge des Bremsweges und die Profiltiefe<br />
negativ korreliert sind, d. h. je tiefer die Profile sind, desto kürzer ist der Bremsweg, oder<br />
anders ausgedrückt, je abgefahrener die Reifen sind, desto länger wird der Bremsweg.<br />
Die Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen unter den<br />
Bedingungen, dass alle anderen Variablen konstant gehalten werden, sind in der Tabelle<br />
5.11.5 enthalten.<br />
Tabelle 5.11.5: Matrix der partiellen Korrelationskoeffizienten<br />
Part.Korr.Matrix Y X 1 X 2 X 3<br />
Y 0,976 0,926 –0,943<br />
X 1 –0,875 0,913<br />
X 2 0,827<br />
X 3<br />
Der partielle Korrelationskoeffizient<br />
r Y.1/2, 3 = 0,976<br />
zwischen der Länge des Bremsweges Y und der Geschwindigkeit X 1 unter der Bedingung,<br />
dass sowohl das Gewicht X 2 als auch die Profiltiefe X 3 konstant gehalten werden, ist größer als<br />
der ursprüngliche einfache Korrelationskoeffizient. Der partielle Korrelationskoeffizient<br />
r 1.2/X, 3 = –0,875<br />
zwischen X 1 und X 2 unter der Bedingung Y und X 3 wird sogar negativ. Das zeigt, dass die<br />
Variablen sehr stark voneinander abhängen. Die partiellen Korrelationskoeffizienten für<br />
die Produktvariable Y mit allen Prozessvariablen liefert eine Rangfolge für den Einfluss der<br />
Prozessvariablen auf die Produktvariable. Den stärksten Einfluss hat die Prozessvariable X 1 ,<br />
gefolgt von der Prozessvariablen X 3 und X 2 . Da alle diese partiellen Korrelationskoeffizienten<br />
groß sind, folgt, dass alle Prozessvariablen einen starken Einfluss auf die Produktvariable<br />
Y haben.<br />
Die Determinante der Korrelationsmatrix R als globales Maß für die Abhängigkeitsstruktur<br />
besitzt den Wert det(R) = 0,00885. Die Kleinheit dieses Wertes zeigt die Straffheit der<br />
Abhängigkeitsstruktur.<br />
Der Grad der Multikollinearität ist der Kehrwert der Determinante der Korrelationsmatrix<br />
nur für die Prozessvariablen. Die Determinante det(R XX ) = 0,655 ist erfreulich groß, d. h.<br />
die Schätzungen für die Koeffizienten der Prozessgleichung werden nicht wesentlich durch<br />
den Grad der Multikollinearität beeinflusst.<br />
Die Folge der Prozessgleichungen für die Produktvariable, in der Tabelle 5.11.6 zusammengestellt,<br />
nacheinander für die Abhängigkeit nur von X 1 , dann in Abhängigkeit von X 1<br />
und X 2 und dann von X 1 , X 2 und X 3 zeigen , dass die multiplen Korrelationskoeffizienten<br />
für die Produktvariable Y in Abhängigkeit von den Prozessvariablen mit zunehmender<br />
Information durch die größer werdende Anzahl von Prozessvariablen größer werden und<br />
die bedingten Standardabweichungen die gegensätzliche Tendenz aufweisen.
5.11 Modelle für die Prozessgleichung<br />
273<br />
Tabelle 5.11.6: Folge der Prozessgleichungen für die zunehmende Anzahl von Prozessvariablen<br />
Absolutglied<br />
X 1 X 2 X 3 R 2 Y/X S Y/X F-Wert<br />
Koeffizienten 15,41 0,2105 – – 0,6861 0,4683 292,9<br />
t-Test 25,07 17,11<br />
Koeffizienten 14,56 0,1583 0,0024 – 0,8774 0,2938 475,9<br />
t-Test 37,3 18,6 14,4<br />
Koeffizienten 18,30 0,1481 0,0017 –0,6198 0,9865 0,09788 3213<br />
t-Test 105,7 51,84 28,2 32,6<br />
Betrachten wir die Prozessgleichung für Y in Abhängigkeit von X 1 allein, dann ist das<br />
Maß der Beherrschbarkeit 0,686 und die bedingte Standardabweichung ist s Y/X = 0,468.<br />
Betrachten wir Y in Abhängigkeit von X 1 , X 2 und X 3 dann ist das Maß der Beherrschbarkeit<br />
R 2 Y/X = 0,986 und die bedingte Standardabweichung ist s Y/X = 0,09788.<br />
Für die Prozessgleichungen in der Anwendung bedeutet die Anforderung, dass das Maß<br />
der Beherrschbarkeit größer als 0,9 sein soll keine Utopie, sondern lediglich die verschärfte<br />
Suche nach Input- und Prozessvariablen, die einen Einfluss auf den oder die Produktvariablen<br />
haben.<br />
Als Prozessverbesserung definierten wir<br />
•<br />
•<br />
die Reduktion der Variabilität der Produktvariablen und<br />
die Steuerung des Prozesses mit der Prozessgleichung, so dass simultan alle relevanten<br />
Kundenanforderungen erfüllt werden.<br />
Diese beiden Anliegen werden durch die Abbildung 5.11.2 und Abbildung 5.11.3 verdeutlicht.<br />
28<br />
27<br />
26<br />
Y<br />
25<br />
24<br />
24.5 25.0 25.5 26.0 26.5 27.0 27.5<br />
Fitted : X1<br />
Abb. 5.11.2: Streuung der Messwerte für Y um die Prozessgleichung mit einer Prozessvariablen
274 5 Qualität in der Fertigung<br />
28<br />
27<br />
26<br />
Y<br />
25<br />
24<br />
24 25 26 27 28<br />
Fitted : X1 + X2 + X3<br />
Abb. 5.11.3: Messwerte für Y um die Prozessgleichung mit drei Prozessvariablen<br />
Diese beiden Abbildungen zeigen deutlich, dass sich die Suche nach der erschöpfenden<br />
Anzahl von Input- und Prozessvariablen lohnt.<br />
5.11.2.2 Das multivariate, multiple, lineare Modell mit stochastischen Input- und<br />
Prozessvariablen<br />
Jedes Produkt wird durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben. Folglich<br />
benötigen wir ein Modell, in dem Y ein Vektor von Produktvariablen ist, der durch Linearkombinationen<br />
in den Input- und Prozessvariablen erklärt werden soll. In diesem Fall betrachten<br />
wir die Zerlegung der Kovarianzmatrix<br />
⎛ΣYY<br />
ΣYX<br />
⎞<br />
Σ = ⎜<br />
⎝Σ<br />
Σ ⎟<br />
⎠<br />
XY<br />
und damit das Modell<br />
XX<br />
Y = β 0 + β T Y/X X + F Y/X ,<br />
wobei<br />
F Y/X ~ N (0, Σ YY/X ) der Vektor der Fehler, β T Y/X = Σ YX Σ–1 XX die Matrix der unbekannten Koeffizienten<br />
des Systems der Prozessgleichungen und<br />
F Y/X = Y – β T Y/X X ~ Σ YY/X<br />
ist. Die bedingte Kovarianzmatrix Σ YY/X wird nach der Beziehung<br />
berechnet.<br />
−1<br />
YY / X = YX ⋅ XX ⋅ XY<br />
Σ Σ Σ Σ
5.11 Modelle für die Prozessgleichung<br />
275<br />
Beispiel 5.11.4: Multivariates multiples Modell mit zwei Produkt- und zwei<br />
stochastischen Prozessvariablen. Bedingte Kovarianz und bedingte Erwartungswerte<br />
Für zwei Produkt- und zwei Input- und Prozessvariablen soll das multivariate multiple<br />
lineare Modell mit stochastischen Input- und Prozessvariablen ausführlich aufgeschrieben<br />
werden. Mit der Zerlegung der Kovarianzmatrix in die Elemente<br />
⎛<br />
2<br />
σ ⎞<br />
Y σ<br />
1 Y1Y σ<br />
2 Y1.1 σY<br />
1.2<br />
⎜<br />
⎟<br />
2<br />
⎛ΣYY ΣYx ⎞ ⎜ σY σ ⎟<br />
2 Y2.1 σY<br />
2.2<br />
Σ = ⎜ ⎟ = ⎜ ⎟<br />
⎝ Σ XX ⎠<br />
2<br />
⎜<br />
σ1 σ12<br />
⎟<br />
⎜<br />
2 ⎟<br />
⎝<br />
σ ⎠<br />
erhalten wir die Matrix der bedingten Erwartungswerte und die bedingte Kovarianzmatrix<br />
2<br />
und<br />
−1<br />
Y. X XX X Y / X X<br />
E [ Y/ X] = Σ Σ ( X − μ ) = : Β ( X − μ )<br />
−1<br />
. . /<br />
var( Y/ X) = ΣYY − ΣY X ΣXX ΣX Y = ΣYY X<br />
Schreiben wir diese Ausdrücke ausführlich auf, dann erhalten wir<br />
2<br />
⎛σY<br />
1.1 σY<br />
1.2 ⎞ 1 ⎛ σ2 −σ ⎞<br />
12 ⎛X1 − μ1⎞<br />
E [ Y/ X]<br />
= ⎜ 2 2 2<br />
σ 2<br />
Y2.1 σ<br />
⎟ ⎜<br />
⎟ ⋅<br />
Y2.2 σ1 σ2 (1 ρ12)<br />
⎜X<br />
12 1 2 μ ⎟<br />
⎝ ⎠ ⋅ − ⎝−σ σ ⎠ ⎝ − 2 ⎠<br />
⎛<br />
2 2<br />
σY 1.1 σ2 − σY 1.2σ12 − σY 1.2σ12 + σ1 σ ⎞<br />
Y1.2<br />
⎜ 2 2 2 2 2 2 ⎟<br />
σ1 ⋅σ2 (1 − ρ12) σ1 ⋅σ2 (1 − ρ12)<br />
=<br />
⎜ ⎟ ⎛X1 − μ1⎞<br />
⋅<br />
⎜ 2 2 2<br />
σY 2.1 σ2 − σY 2.1 σ2 σY 2.2σ1 − σY<br />
2.1 σ<br />
⎟ ⎜<br />
⎝X<br />
12<br />
2 − μ ⎟<br />
2⎠<br />
⎜ 2 2 2<br />
2 2 2<br />
⎝ σ1 ⋅σ2 (1 − ρ12)<br />
σ1 ⋅σ2 (1 − ρ12)<br />
⎟<br />
⎠<br />
⎛βY<br />
1.1/ 2 βY<br />
1.2 /1 ⎞ ⎛X1 − μ1⎞<br />
= ⎜<br />
βY<br />
.1/ 2 β<br />
⎟ ⋅ ⎜<br />
Y .2 /1 X2 μ ⎟<br />
⎝<br />
⎠ ⎝ − 2 ⎠<br />
2 2<br />
Formt man einen Regressionskoeffizienten, z. B. den ersten aus der Matrix der Regressionskoeffizienten<br />
unter Verwendung der Korrelationskoeffizienten um, dann erhält man<br />
β<br />
2<br />
ρY −<br />
1.1 σY σ<br />
1 2 ρY 1.2 σY σ<br />
1 2 ρ12 σ1 σ2 ρY 1.1/2<br />
σY<br />
1<br />
= =<br />
σ ⋅σ (1 − ρ ) σ ⋅(1 − ρ )<br />
Y1<br />
.1/2 2 2 2 2<br />
1 2 12 1 12<br />
einen Quotienten mit dem partiellen Korrelationskoeffizienten im Zähler. Hieraus erklärt<br />
sich der Sprachgebrauch partieller Regressionskoeffizient. Ähnliche Umformungen der<br />
bedingten Kovarianzmatrix liefern<br />
⎛<br />
2<br />
σ<br />
⎞<br />
Y1 / X σY 1Y2<br />
/ X<br />
var( Y/ X) = .<br />
⎜<br />
2<br />
⎝ σ /<br />
⎟<br />
Y X ⎠<br />
2
276 5 Qualität in der Fertigung<br />
Gibt es auch für das multivariate multiple Modell ein Maß der Beherrschbarkeit?<br />
Ja, für das multivariate multiple Modell zur Berechnung des Systems der Prozessgleichungen<br />
benötigen wir ein verallgemeinertes Maß der Beherrschbarkeit. Diese i st der multivariate,<br />
multiple Korrelationskoeffizient<br />
wobei<br />
2<br />
ΣYY<br />
/ X<br />
τY<br />
/ X= 1 − ,<br />
Σ<br />
Σ<br />
und<br />
Σ<br />
YY<br />
YY / X<br />
YY<br />
die Determinanten der bedingten bzw. unbedingten Kovarianzmatrix der Produktvariable<br />
sind. Dieser Koeffizient ist ein Maß für die lineare Abhängigkeit zwischen dem Vektor der<br />
Produktvariablen und dem System der Prozessgleichungen.<br />
Beispiel 5.11.5: Multivariates multiples Modell mit zwei Produkt- und zwei<br />
stochastischen Prozessvariablen. Multivariater multipler Korrelationskoeffizient<br />
Für das Beispiel 16 kann man den multivariaten, multiplen Korrelationskoeffizienten<br />
umformen. Man erhält:<br />
τ<br />
2<br />
σY σ<br />
1 Y1Y2/<br />
X<br />
2<br />
Y / X= 1− 2 2 2 2<br />
Σ<br />
σ<br />
/<br />
YY −<br />
1 2/ X σ<br />
YY X<br />
Y2/ X σY 1/ X σY 2/ X σY 1Y2/<br />
X<br />
= 1− = 1−<br />
Σ<br />
2<br />
YY σ<br />
2 2 −<br />
Y σ<br />
1 Y1Y<br />
σ<br />
2<br />
Y σ<br />
1 Y σ<br />
2 Y1Y2<br />
2<br />
σY<br />
2<br />
2 2<br />
(1 − ρY −<br />
1/ X) (1 ρY 1Y2/<br />
X)<br />
= 1 −<br />
2<br />
(1 − ρ )<br />
YY 1 2<br />
Für m = 1 ist τ 2 Y/X gleich ρ2 Y/X .<br />
τ 2 Y/X gibt also auch an, wie gut die verallgemeinerte Varianz des Vektors der Produktvariable<br />
durch die Kovarianzmatrix der Input- und Prozessvariable erklärt wird.<br />
5.11.3 Statistische Modelle mit stochastischen Input- und<br />
Prozessvariablen<br />
Die statist ischen Modelle sehen sehr ähnlich wie die theoretischen Modelle aus. Der Unterschied<br />
besteht darin, dass anstelle der Zufallsgrößen zufällige Stichprobenvektoren, anstelle der<br />
zufälligen Vektoren zufällige Stichprobenmatrizen stehen und anstelle der Modellparameter<br />
die statistischen Schätzungen stehen.<br />
Aus den verschiedenen Modellen erkennt man, dass das lineare Modell mit festen Input- und<br />
Prozessvariablen das bedingte Modell des entsprechenden Modells mit stochastischen Inputund<br />
Prozessvariablen ist. Diese Feststellung ist bedeutsam für die Ableitung der Schätzfunktionen.
5.11 Modelle für die Prozessgleichung<br />
277<br />
Welche Ziele können mit den linearen Modellen erreicht we rden?<br />
Das statistische lineare Modell mit stochastischen Input- und Prozessvariablen liefert uns<br />
• die notwendige Prozessgleichung. Damit können die Produktvariablen zielgerichtet über<br />
die Input- und Prozessvariablen so gesteuert werden, dass<br />
–<br />
–<br />
simultan alle Kundenanforderungen erfüll und<br />
die Varianzen der Produktvariablen reduziert werden können.<br />
• An die Stelle der Streuung der Produktvariablen tritt die bedingten Streuung der Produktvariablen<br />
unter der Bedingung, dass die Input- und Prozessvariablen realisiert sind, d. h.<br />
als Messwerte vorliegen.<br />
Die Bedeutung dieses zweiten Faktes zeigt uns noch einmal die Abbildung 5.11.4. Diese Bedingung<br />
ist Ausdruck der Wirkungsweise des Ursache-Wirkungs-Prinzipes und bezieht die<br />
Informationsmenge ein, die durch die Wirkung der Input- und Prozessvariablen gegeben ist.<br />
Die bedingte Varianz σ 2 Y/X ist stets kleiner oder gleich der unbedingten Varianz σ2 Y für die<br />
Produktvariable Y. Das folgt sofort aus der Formel<br />
2 2 2<br />
Y / x Y Y / x<br />
σ = σ ⋅(1 − Ρ )<br />
in der P 2 Y/x der multiple Korrelationskoeffizient zwischen einer Produktvariablen Y und der<br />
Prozessgleichung ist.<br />
Produktvariable Y<br />
obere Toleranz<br />
Sollwert<br />
untere Toleranz<br />
Prozessvariable X<br />
Abb. 5.11.4: Vergleich der Breiten der Verteilung der Produktvariablen Y und der bedingten Verteilung<br />
von Y unter X
278 5 Qualität in der Fertigung<br />
5.11.4 Wie kann man die Schätzungen für die unbekannten<br />
Modellparameter für die Modelle mit stochastischen Input- und<br />
Prozessvariablen gewinnen?<br />
Das Modell mit stochastischen Input- und Prozessvariablen wurde aus der gemeinsamen multivariaten<br />
Verteilung für die Produkt-, Prozess- und Inputvariablen abgeleitet. Zu diesem Zweck<br />
haben wir angenommen, dass der Vektor mit allen Komponenten multivariat normalverteilt<br />
ist, oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Das bedeutet aber, dass die<br />
analytische Form der Verteilungsdichte bekannt ist. Andererseits haben wir immer wieder darauf<br />
hingewiesen, dass die unbekannten Modellparameter nur mit Hilfe einer Stichprobe geschätzt<br />
werden können. Eine Stichprobe besteht aus N unabhängigen „Beobachtungsvektoren“ für den<br />
Vektor der Produkt-, Prozess- und Inputvariablen.<br />
Damit können wir die sogenannte Likelihood Funktion als Produkt der Verteilungsdichten<br />
N<br />
2 2<br />
Y / X Y / X = ∏ i i Y / X Y / X<br />
i=<br />
1<br />
L( β , σ ) f [( y , x ); β , σ ]<br />
an den Stellen der Beobachtungsvektoren aufschreiben und diesen Ausdruck mit den bekannten<br />
Werten für die Input-, Prozess- und Produktvariablen als Funktion der unbekannten Modellparameter<br />
auffassen. Die Maximierung der Likelihood Funktion liefert Schätzungen für die<br />
unbekannten Modellparameter.<br />
Auch das ist ein heuristisches Prinzip. Es liefert aber praktisch vernünftige Schätzfunktionen<br />
für die unbekannten Modellparameter.<br />
Wir haben die Stichprobe<br />
⎛ X11 … X1n<br />
Y11 … Y1<br />
m ⎞<br />
⎜ X ⎟<br />
21 … X2n<br />
Y21 … Y2m<br />
⎜<br />
⎟<br />
⎜ …<br />
…<br />
⎟<br />
( XY , ) = ⎜ ⎟<br />
⎜<br />
⎟<br />
⎜XN−1.1 … XN−1. n YN−1.1 … YN−1.<br />
m⎟<br />
⎜<br />
⎟<br />
⎝ X … X Y … Y ⎠<br />
N1 Nn N1<br />
Nm<br />
für den multivariaten, multiplen Fall. Die Maximum Likelihood Methode liefert uns die<br />
Schätzfunktionen<br />
⎛<br />
( X , Y )<br />
X Y<br />
N<br />
N<br />
T T 1 T 1 T<br />
= ⎜ ⋅∑<br />
i ⋅∑<br />
i<br />
⎝N<br />
i= 1<br />
N<br />
i=<br />
1<br />
für den Mitt elwertvektor. Für die Schätzfunktion gilt<br />
⎛X<br />
⎞ ⎡⎛μ ⎞ ⎛ ⎞⎤<br />
X 1 ΣXX ΣXY<br />
⎜ ⎟ ∼ Nn+<br />
m⎢⎜ ⎟,<br />
⋅ ⎜ ⎟⎥<br />
⎝Y<br />
⎠ ⎢⎝μ<br />
⎠ N ⎝ Σ ⎠<br />
⎣ Y<br />
YY ⎥⎦<br />
Außerdem erhalten wir die Schätzfunktion<br />
N<br />
∑<br />
A = ( V − V) ( V − V),<br />
i= 1<br />
i<br />
T<br />
i<br />
⎞<br />
⎟<br />
⎠
5.11 Modelle für die Prozessgleichung<br />
279<br />
für die Kovarianzmatrix, wobei wir der Einfachheit halber die Input-, Prozess- und Produktvariablen<br />
in V zusammengefasst haben. Die Schätzfunktion A für die Kovarianzmatrix ist Wishart<br />
verteilt, mit N – 1 FG und dem Verteilungsparameter Σ. Hierfür schreiben wir abkürzend<br />
A ~ W n + m (N – 1, Σ).<br />
Die Schätzfunktionen für den Vektor der Erwartungswerte und die Kovarianzmatrix sind<br />
unabhängig voneinander. Die Stichprobenmatrix A wird analog zu Σ in<br />
⎛<br />
2 T<br />
A ⎞<br />
Y AY.<br />
X<br />
A = ⎜ ⎟<br />
⎝ A ⎠<br />
XX<br />
zerlegt.<br />
Mit diesen Größen können wir die Schätzfunktionen für die unbekannten Koeffizienten in den<br />
Prozessgleichungen und die unbekannten bedingten Varianzen (Restvarianzen) aufschreiben.<br />
Wir erhalten<br />
B<br />
T −1<br />
Y/X = Axx<br />
⋅ AY . x<br />
B<br />
T<br />
0 = Y − BY/X<br />
x<br />
1 −1<br />
1 T<br />
1<br />
SYY / X = ( AYY − AYX ⋅AXX ⋅ AXY) = ( AYY<br />
− BY/X ⋅AXX ⋅ BY / X) = ⋅AYY / X.<br />
N N N<br />
Am Beispiel des Plastikgehäuses für den Akku-Bohrschrauber wollen wir alle Schritte ausführlich<br />
demonstrieren.<br />
Beispiel 5.11.6: Akkubohrschrauber. Statistische Prozessanalysen<br />
Das Problem<br />
Bei der M ontage des Akku-Bohrschraubers treten Probleme auf. Diese wurden erstmals<br />
bei der Durchführung einer Montagezeitstudie mit MOST (Maynards Operation Sequence<br />
Technique) deutlich. Als Ursachen hierfür wurden Qualitätsmängel an den Plastikschalen<br />
für den Bohrschrauber erkannt. Einige Schalen ließen sich gut, andere weniger gut montieren.<br />
Für das Plastikgehäuse eines Akku-Bohrschraubers in der Abbildung 5.11.1 wurde<br />
daraufhin ein Produktaudit durchgeführt. Die Daten für die Prozess- und Produktvariablen<br />
sind in der Datei 05.11.6 Akkubohrschrauber im Internet enthalten.<br />
Zu diesem Zweck werden das Plastikschalen durch die Produktvariablen<br />
Y 1 = Thermoschrumpf in [%]<br />
Y 2 = Abweichung in axialer Richtung [mm]<br />
Y 3 = Abweichung von der Parallelität [mm]<br />
Y 4 = Dicke [mm]<br />
parametrisiert. Das ist eine Auswahl und diese erhebt nicht den Anspruch auf Vollständigkeit.<br />
Die gegebenen Toleranzen der Tabelle 5.2.1 wurden mit der statistischen Tolerierung überprüft.<br />
Die statistischen Toleranzen sind in der Tabelle 5.2.4 zusammengestellt.
280 5 Qualität in der Fertigung<br />
Abb. 5.11.5: Akku-Bohrschrauber<br />
Problemdefinition<br />
Das Problem wird mit den uni- und multivariaten Prozessfähigkeitsindizes aus dem Abschnitt<br />
5.2. definiert. Es gilt MC pk = 0,73 mit den berechneten statistischen Toleranzen. Da<br />
dieser Wert kleiner als eins ist, muss der Prozess verbessert werden.<br />
Problemlösung<br />
Die Verbesserung der Produktqualität ist nur durch die Steuerung des Herstellungsprozesses<br />
mit einer Prozessgleichung möglich. Daher müssen wir eine umfassende statistische<br />
Prozessanalyse durchführen, die wesentlichen Input- und Prozessvariablen auswählen und<br />
die Prozessgleichungen für die Produktvariablen berechnen.<br />
Statistische Prozessanalyse<br />
Der Herstellungsprozess für die Plastikgehäuse wird durch die Input- und Prozessvariablen<br />
X 1 = Friktion im Extruder (Reibungszahl µ, dimensionslos)<br />
X 2 = Heiztemperatur [°C]<br />
X 3 = Masse – Volumen – Index (mvi)<br />
X 4 = Dichte<br />
X 5 = Massetemperatur [°C]<br />
beschrieben. Auch das ist nur eine Auswahl.<br />
Modellierung<br />
Das multivariate multiple lineare Modell hat das Aussehen<br />
Y 1 = β 0.1 + β Y1.1/2, 3, 4, 5 X 1 + β Y1.2/1, 3, 4, 5 X 2 + β Y1.3/1, 2, 4, 5 X 3 + β Y1.4/1, 2, 3, 5 X 4 + β Y1.5/1, 2, 3, 4 X 5<br />
Y 2 = β 0.2 + β Y2.1/2, 3, 4, 5 X 1 + β Y2.2/1, 3, 4, 5 X 2 + β Y2.3/1, 2, 4, 5 X 3 + β Y2.4/1, 2, 3, 5 X 4 + β Y2.5/1, 2, 3, 4 X 5<br />
Y 3 = β 0.3 + β Y3.1/2, 3, 4, 5 X 1 + β Y3.2/1, 3, 4, 5 X 2 + β Y3.3/1, 2, 4, 5 X 3 + β Y3.4/1, 2, 3, 5 X 4 + β Y3.5/1, 2, 3, 4 X 5<br />
Y 4 = β 0.4 + β Y4.1/2, 3, 4, 5 X 1 + β Y4.2/1, 3, 4, 5 X 2 + β Y4.3/1, 2, 4, 5 X 3 + β Y4.4/1, 2, 3, 5 X 4 + β Y4.5/1, 2, 3, 4 X 5 .
5.11 Modelle für die Prozessgleichung<br />
281<br />
Die Matrix der Prozessgleichungskoeffizienten wurde nach der Beziehung<br />
−1<br />
Y / X=<br />
Y.<br />
X XX<br />
Β Σ Σ<br />
erhalten, wobei diese Matrizen aus der Zerlegung<br />
⎛σ σ σ σ σ σ σ σ σ<br />
⎜ σ σ σ σ σ σ σ σ<br />
⎜<br />
⎜<br />
σ σ σ σ σ σ σ<br />
⎜<br />
σ σ σ σ σ σ<br />
⎛ΣYY<br />
ΣYX<br />
⎞ ⎜<br />
Σ = ⎜ ⎟ = ⎜<br />
σ σ σ σ σ<br />
⎝ Σ XX ⎠ ⎜<br />
⎜<br />
σX2X2<br />
σX<br />
σ σ<br />
⎜<br />
σ σ σ<br />
⎜<br />
⎜<br />
σ σ<br />
⎜<br />
⎝<br />
σ<br />
Y1Y1 Y1Y2 Y1Y3 Y1Y4 Y1X1 Y1X2 Y1X3 Y1X4 Y1X5<br />
Y2Y2 Y2Y3 Y2Y4 Y2X1 Y2X2 Y2X3 Y2X4 Y2X5<br />
Y3Y3 Y3Y4 Y3X1 Y3X2 Y3X3 Y3X4 Y3X5<br />
stammen. Die bedingte Kovarianzmatrix wird nach der Gleichung<br />
−1<br />
YY / X = YY − YY . X XX X.<br />
YY<br />
Σ Σ Σ Σ Σ<br />
Y4Y4 Y4X1 Y4X2 Y4X3 Y4X4 Y4X5<br />
X1X1 X1X2 X1X3 X1X4 X1X5<br />
2X3 X2X4 X2X5<br />
X3X3 X3X4 X3X5<br />
X4X4 X4X5<br />
X5X5<br />
berechnet. In den linearen Modellen sind die Modellparameter B Y/X und Σ YY/X unbekannt.<br />
Diese müssen aufgrund einer Stichprobe geschätzt werden.<br />
Die Korrelationsmatrix hierfür ist<br />
⎞<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎠<br />
Tabelle 5.11.7: Korrelationsmatrix für den Akku-Bohrschrauber<br />
Y 1 Y 2 Y 3 Y 4 X 1 X 2 X 3 X 4 X 5<br />
Y 1 1 0,036 –0,457 –0,102 –0,136 0,414 0,275 –0,41 0,224<br />
Y 2 1 0,417 –0,042 –0,113 0,081 –0,332 0,108 –0,132<br />
Y 3 1 0,355 –0,133 –0,151 –0,236 0,2 –0,285<br />
Y 4 1 0,387 0,272 0,045 0,257 0,032<br />
X 1 1 0,561 0,346 –0,108 0,319<br />
X 2 1 0,447 –0,371 0,547<br />
X 3 1 –0,878 0,838<br />
X 4 1 –0,782<br />
X 5 1<br />
Diese Korrelationsmatrix entspricht der Zerlegung der Gesamtkorrelationsmatrix R in<br />
die Blöcke<br />
⎛RYY<br />
RYX<br />
⎞<br />
R = ⎜<br />
⎝R<br />
R ⎟<br />
⎠<br />
XY<br />
XX
282 5 Qualität in der Fertigung<br />
R YY = Korrelationsmatrix der Produktvariablen,<br />
R YX = Korrelationsmatrix zwischen den Produkt- und Prozessvariablen,<br />
R XX = Korrelationsmatrix der Prozessvariablen.<br />
Aus der Korrelationsmatrix R YY lesen wir ab, dass die Korrelationskoeffizienten der Produktvariablen<br />
Y 1 mit Y 3 und der Produktvariablen Y 2 mit Y 3 statistisch gesichert von null<br />
verschieden sind.<br />
Aus der Matrix R YX lesen wir ab, dass X 2 mit Y 1 und X 4 mit Y 1 korreliert ist.<br />
Aus R XX lesen wir ab, dass X 3 mit X 4 , X 3 mit X 5 und X 4 mit X 5 hoch korreliert sind und X 1<br />
mit X 2 , X 2 mit X 3 , und X 2 mit X 5 korreliert sind. Die Größen der Korrelationskoeffizienten<br />
entsprechen den Erwartungen der Experten.<br />
Das globale Maß für die Abhängigkeitsstruktur des Plastikgehäuses ist<br />
det(R) = 0.0007809236.<br />
Dieser Wert ist sehr klein, d. h. die Abhängigkeitsstruktur ist eng.<br />
Für später ist es notwendig zu wissen, ob die Produktvariablen, die Prozessvariablen oder<br />
die Produkt- mit den Prozessvariablen stark miteinander korreliert sind. Zu diesem Zweck<br />
berechnen wir die entsprechenden Determinanten der Korrelationsmatrizen. Es gilt<br />
det(R YY ) = 0.4894116,<br />
d. h. das globale Maß für die Straffheit der Abhängigkeitsstruktur der Produktvariablen ist<br />
groß, d. h. die Produktvariablen hängen nur gering voneinander ab.<br />
det(R XX ) = 0.02383498, d. h. die Prozessvariablen hängen stark voneinander ab.<br />
Grafische Abbildungen für das Gehäusebeispiel:<br />
Star Plots für die Produktvariablen in Abbildung 5.11.6<br />
Ein Star Plot ist eine ideale Darstellung für einen multivariaten Datensatz, z. B. für ein Produkt,<br />
aber auch für ein Produkt in Abhängigkeit von seinen Input- und Prozessvariablen.<br />
Jeder Stern visualisiert z. B. ein Produkt.<br />
Jeder Stern besteht aus einer Anzahl von Strahlen, die vom Mittelpunkt aus gezeichnet<br />
werden. Jeder Strahl repräsentiert eine Variable. Auf jeden Strahl wir ein spezieller „Relativwert“<br />
für den entsprechenden Wert der Variablen aufgetragen. Werden z. B. die Gehäuse<br />
durch star plots visualisiert, dann entspricht der Strahl in der 3 00 Position der 1. Produktvariablen<br />
Y 1 = Thermoschrumpf. Der 2. Strahl entgegen dem Uhrzeigersinn entspricht<br />
der 2. Produktvariablen usw. Der kürzeste Strahl entspricht dem kleinsten Wert einer<br />
Produktvariable, der größte dem größten.<br />
Die Achsen der Star Plots sind in den Schlüssel der Abbildung 5.11.7 bezeichnet.<br />
Die N = 113 Star Plots sind sehr verschieden. Betrachtet man z. B. die Stars für die Produkte<br />
2 und 19, dann kann man sich kaum vorstellen, dass diese Produkte gleich sein sollen. Auf<br />
diese Art findet man viele sehr Paare von verschiedenen Stars. Pauschal kann man sagen,<br />
dass die Produkte, beschrieben durch die vier Produktvariablen hinsichtlich eines jeden<br />
Parameters stark streuen.<br />
Eine andere ganz wichtige Abbildung ist das Korrelationsdiagramm. Die Zusammenfassung<br />
mehrerer Korrelationsdiagramme nennt man Draftsman Plots. Diese Darstellungen sind<br />
sehr wichtig, da die paarweisen Abhängigkeit visualisiert werden.
5.11 Modelle für die Prozessgleichung<br />
283<br />
111 112 113<br />
100 101 102 103 104 105 106 107 108 109 110<br />
89 90 91 92 93 94 95 96 97 98 99<br />
78 79 80 81 82 83 84 85 86 87 88<br />
67 68 69 70 71 72 73 74 75 76 77<br />
56 57 58 59 60 61 62 63 64 65 66<br />
45 46 47 48 49 50 51 52 53 54 55<br />
34 35 36 37 38 39 40 41 42 43 44<br />
23 24 25 26 27 28 29 30 31 32 33<br />
12 13 14 15 16 17 18 19 20 21 22<br />
1 2 3 4 5 6 7 8 9 10 11<br />
Abb. 5.11.6 : Star Plots für die Produktvariablen<br />
AXIALITY<br />
PARALLEL<br />
THERMOSHR<br />
THICKNESS<br />
Abb. 5.11.7: Schlüssel für die Star Plots<br />
Draftsman Plots<br />
Die draftsman Plots (Abbildung 5.11.8) zeigen, dass die vier Produktvariablen nicht unabhängig<br />
voneinander sind. Die stärkste Abhängigkeit finden wir zwischen den Produktvariablen<br />
Parallelität und Thermoschrumpf. Diese Abhängigkeit ist negativ.<br />
Jedes Korrelationsdiagramm wird durch einen Korrelationskoeffizienten quantifiziert.
284 5 Qualität in der Fertigung<br />
AXIALITY<br />
PARALLEL<br />
THICKNESS<br />
THERMOSHR<br />
AXIALITY<br />
PARALLEL<br />
Abb. 5.11.8: Draftman Plots für die Produktvariable des Gehäuses<br />
Häufigkeitsverteilungen<br />
Eine Häufigkeitsverteilung ist die grafische Darstellung der Verteilung der Werte einer<br />
Stichprobe für eine Variable. Diese Darstellung wird gern verwendet, um Hypothesen<br />
bzgl. der Verteilung einer Variablen aufzustellen, sofern diese nicht durch irgendwelche<br />
theoretischen Annahmen gefunden werden können. Die Häufigkeitsverteilungen liefern<br />
des weiteren eine erste Information darüber, ob der Stichprobenumfang ausreichend ist<br />
und ob die Anzahl der Klassen in Anhängigkeit davon klein genug gewählt wurde, über den<br />
mittleren Wert, die Streuung und über mögliche Ausreißer. Die Häufigkeitsverteilungen<br />
für das Gehäusebeispiel sind in der Abbildung 5.11.9 dargestellt.<br />
40<br />
Histogram for THERMOSHR<br />
40<br />
Histogram for AXIALITY<br />
frequency<br />
30<br />
20<br />
10<br />
frequency<br />
30<br />
20<br />
10<br />
0<br />
0 0,5 1 1,5 2 2,5 3<br />
THERMOSHR<br />
0<br />
-0,7 -0,3 0,1 0,5 0,9<br />
AXIALITY<br />
frequency<br />
40<br />
30<br />
20<br />
10<br />
Histogram for PARALLEL<br />
frequency<br />
40<br />
30<br />
20<br />
10<br />
Histogram for THICKNESS<br />
0<br />
-1,5 -0,5 0,5 1,5 2,5<br />
PARALLEL<br />
0<br />
2,8 2,9 3 3,1 3,2 3,3 3,4<br />
THICKNESS<br />
Abb. 5.11.9: Häufigkeitsverteilungen für die Produktvariablen
5.11 Modelle für die Prozessgleichung<br />
285<br />
Diese vier Häufigkeitsverteilungen zeigen, dass bzgl. aller vier Produktvariablen die Verteilungshypothese<br />
H 0 : „die Produktvariable sind normalverteilt“ formuliert werden kann.<br />
Die H 0 kann mit verschiedenen Tests geprüft werden.<br />
Hier wurden der χ 2 -Test, der Test von Shapiro-Wilks (W) und der Kolmogorov-Smirnov-<br />
Test (DN) angewandt.<br />
Die berechneten Teststatistiken und Irrtumswahrscheinlichkeiten p dieser Anpassungstests<br />
sind in der Tabelle 5.4.4 zusammen gefasst:<br />
Tabelle 5.11.8: Ergebnisse der Anpassungstests<br />
χ 2 p W p DN p<br />
Thermoschrumpf 22.62 0.42 0.98 0.5 0.052 0.92<br />
Axialität 27.92 0.18 0.98 0.716 0.042 0.985<br />
Parallelität 13.76 0.909 0.983 0.668 0.0488 0.95<br />
Dicke 13.32 0.923 0.981 0.565 0.038 0.996<br />
Die Entscheidung über die Ablehnung oder Annahme der H 0 wird aufgrund der p-Werte<br />
getroffen. Da der kleinste p-Wert > 0.1 ist, können die H 0 mit Wahrscheinlichkeiten, die<br />
größer als 0.9 sind, nicht verworfen werden, d. h. die einzelnen Produktvariable sind, jeder<br />
für sich betrachtet, normal verteilt.<br />
3D Häufigkeitsverteilung<br />
Die 3D (3 dimensionale) Häufigkeitsverteilung fasst die Informationen der Häufigkeitsverteilungen<br />
für zwei Variable und des zugehörigen Korrelationsdiagramms zusammen.<br />
Eine 3D-Häufigkeitsverteilung ist demzufolge eine Häufigkeitsverteilung über einem<br />
Korrelationsdiagramm. In der Abbildung 5.11.10 ist die 3D Häufigkeitsverteilung für den<br />
Thermoschrumpf und die Dicke enthalten.<br />
Frequency<br />
10<br />
6<br />
2<br />
0<br />
0<br />
1<br />
2<br />
3<br />
2.8<br />
3<br />
3.2<br />
3.4<br />
Dicke<br />
Thermoschrumpf<br />
Abb. 5.11.10: 3D Häufigkeitsverteilung für den Akku-Bohrschrauber
286 5 Qualität in der Fertigung<br />
Man erkennt aus dieser Darstellung, dass die Werte in der Ebene mit den Achsen Thermoschrumpf<br />
und Dicke in einem elliptisch umrissenen Gebiet liegen und das „Gebirge“<br />
durch eine 2-dimensionale Normalverteilung angepasst werden kann. Man sieht aber auch,<br />
dass man für eine 3D Häufigkeitsverteilung mehr als die vorliegenden N = 113 Wertesätze<br />
benötigt, um ein klares Bild zu erhalten.<br />
Stichprobenkovarianzmatrix<br />
Die gesamte Stichprobenkovarianzmatrix für alle Variablen wurde in der Tabelle 5.11.9<br />
zusammengestellt.<br />
Tabelle 5.11.9: Stichprobenkovarianzmatrix für den Akku-Bohrschrauber<br />
Thermo Axialit Parallel Dicke Friktion Heiztemp. MVI Dichte Massetemp.<br />
Thermo 0,2249 0,00353 –0,10751 –0,00455 –0,0365 0,97655 0,4792 –0,005321 0,1211<br />
Axialit 0,04206 0,04239 –0,000809 –0,01316 0,08313 –0,2507 0,000605 –0,0309<br />
Parallel 0,24587 0,01653 –0,037465 –0,3723 –0,4309 0,002714 –0,16129<br />
Dicke 0,00882 0,020592 0,12701 0,01546 0,000659 0,003443<br />
Friktion 0,3215 1,584 0,72217 –0,001669 0,206865<br />
Heiztemp. 24,7719 8,19388 –0,05056 3,10952<br />
MVI 13,5408 –0,088371 3,523025<br />
Dichte 0,0007485 –0,024429<br />
Massetemp. 1,304455<br />
Die Berechnung der Schätzungen für B Y/X und Σ YY/X nach den obigen Formeln ergeben<br />
die Resultate:<br />
B<br />
⎛−0.38891 0.068 0.008913 −8.6534 −0.19371<br />
⎞<br />
⎜ 0.02941 0.009073 −0.07755 −6.3397 0.04074 ⎟<br />
= ⋅ = ⎜<br />
⎟<br />
⎜ − 0.04865 0.004145 − 0.001863 − 0.93452 − 0.13828 ⎟<br />
⎜<br />
⎝ 0.003045 0.0050539 0.02557 4.29743 0.001544⎟<br />
⎠<br />
T −1<br />
Y/X Axx<br />
AY . x<br />
T<br />
B0 = (29.022 1.602 22.272 − 3.927)<br />
und<br />
S<br />
YY / X<br />
⎛0.117493 −0.005757 −0.100668 0.001048 ⎞<br />
⎜<br />
0.027342 0.037235 0.00267 ⎟<br />
= ⎜<br />
⎟<br />
⎜ 0.22503 0.018135 ⎟<br />
⎜<br />
⎝<br />
0.00488349⎟<br />
⎠<br />
Aus diesen Ergebnissen kann man die Prozessgleichungen für die verschiedenen Produktvariablen<br />
zusammenstellen, so z. B. für Y 1 :<br />
Y 1 = 29.022 – 0.38891 X 1 + 0.068 X 2 + 0.008913 X 3 – 8.6534 X 4 – 0.19371 X 5
5.11 Modelle für die Prozessgleichung<br />
287<br />
Die Reststreuung ist die Quadratwurzel aus dem 1. Diagonalelement von S YY/X , d. h.<br />
0.117493 = 0.3428.<br />
Diese Resultate erhält man auch, wenn man die Prozessgleichung für jede Produktvariable<br />
einzeln berechnet.<br />
Das multivariate Maß der Beherrschbarkeit hatten wir bei der Betrachtung der Korrelationsanalyse<br />
berechnet. Es galt<br />
τ<br />
2<br />
Y / X<br />
ΣYY<br />
/ X 6.737213333 10^-7<br />
= 1 − = 1 − = 0.9329<br />
Σ<br />
1.004384604 10^-5<br />
XX<br />
d. h. die Variabilität der Produktvariablen wird zu ca. 93 % durch die Prozessvariablen<br />
erklärt.<br />
Prozessgleichungen für die einzelnen Produktvariablen im multivariaten, multiplen<br />
Modell<br />
Im multivariaten, multiplen Modell mit stochastischen Input- und Prozessvariablen erhält<br />
man einen Vektor von Prozessgleichungen, für jede Produktvariable eine. Das Problem<br />
besteht nun aber darin, dass der Prozess nur mit einer optimalen Teilmenge von Inputund<br />
Prozessvariablen gefahren werden kann. Das bedeutet, dass die globale Teilmenge an<br />
wesentlichen Input- und Prozessvariablen für die Vorhersagen gesucht werden muss.<br />
Tabelle 5.11.10: Prozessgleichungen für die einzelnen Produktvariablen<br />
Prozessgleichung f. Y1<br />
-----------------------------------------------------------------------------<br />
Dependent variable: Thermo<br />
-----------------------------------------------------------------------------<br />
Standard<br />
T<br />
Parameter Estimate Error Statistic P-Value<br />
-----------------------------------------------------------------------------<br />
CONSTANT 27,9028 10,1695 2,74377 0,0071<br />
Friktion -0,388912 0,0808537 -4,81007 0,0000<br />
Heiztemp 0,0679991 0,00925225 7,34947 0,0000<br />
MVI 0,00891195 0,0244504 0,36449 0,7162<br />
Dichte -8,65339 2,90976 -2,97392 0,0036<br />
Massetemp -0,193712 0,0581907 -3,32893 0,0012<br />
-----------------------------------------------------------------------------<br />
Analysis of Variance<br />
-----------------------------------------------------------------------------<br />
Source Sum of Squares Df Mean Square F-Ratio P-Value<br />
-----------------------------------------------------------------------------<br />
Model 12,0353 5 2,40707 19,57 0,0000<br />
Residual 13,159 107 0,122981<br />
-----------------------------------------------------------------------------<br />
Total (Corr.) 25,1944 112<br />
R-squared = 47,77 percent<br />
R-squared (adjusted for d.f.) = 45,3294 percent<br />
Standard Error of Est. = 0,350687<br />
Mean absolute error = 0,265689<br />
Durbin-Watson statistic = 2,22739
288 5 Qualität in der Fertigung<br />
Prozessgleichung f. Y2<br />
-----------------------------------------------------------------------------<br />
Dependent variable: Axialit<br />
-----------------------------------------------------------------------------<br />
Standard<br />
T<br />
Parameter Estimate Error Statistic P-Value<br />
-----------------------------------------------------------------------------<br />
CONSTANT 0,763646 4,90555 0,15567 0,8766<br />
Friktion 0,0294221 0,0390021 0,754373 0,4523<br />
Heiztemp 0,00907345 0,00446308 2,033 0,0445<br />
MVI -0,0775608 0,0117944 -6,57609 0,0000<br />
Dichte -6,34085 1,4036 -4,51755 0,0000<br />
Massetemp 0,0407386 0,0280699 1,45133 0,1496<br />
-----------------------------------------------------------------------------<br />
Analysis of Variance<br />
-----------------------------------------------------------------------------<br />
Source Sum of Squares Df Mean Square F-Ratio P-Value<br />
-----------------------------------------------------------------------------<br />
Model 1,64909 5 0,329818 11,53 0,0000<br />
Residual 3,06195 107 0,0286164<br />
-----------------------------------------------------------------------------<br />
Total (Corr.) 4,71104 112<br />
R-squared = 35,0048 percent<br />
R-squared (adjusted for d.f.) = 31,9676 percent<br />
Standard Error of Est. = 0,169164<br />
Mean absolute error = 0,128768<br />
Durbin-Watson statistic = 1,83917<br />
Prozessgleichung f. Y3<br />
-----------------------------------------------------------------------------<br />
Dependent variable: Parallel<br />
-----------------------------------------------------------------------------<br />
Standard<br />
T<br />
Parameter Estimate Error Statistic P-Value<br />
-----------------------------------------------------------------------------<br />
CONSTANT 21,7397 14,074 1,54467 0,1254<br />
Friktion -0,0486358 0,111897 -0,434649 0,6647<br />
Heiztemp 0,00414507 0,0128046 0,323719 0,7468<br />
MVI -0,00187052 0,033838 -0,0552787 0,9560<br />
Dichte -0,935801 4,02693 -0,232386 0,8167<br />
Massetemp -0,138288 0,0805324 -1,71717 0,0888<br />
-----------------------------------------------------------------------------<br />
Analysis of Variance<br />
-----------------------------------------------------------------------------<br />
Source Sum of Squares Df Mean Square F-Ratio P-Value<br />
-----------------------------------------------------------------------------<br />
Model 2,33505 5 0,46701 1,98 0,0870<br />
Residual 25,2033 107 0,235545<br />
-----------------------------------------------------------------------------<br />
Total (Corr.) 27,5384 112<br />
R-squared = 8,47926 percent<br />
R-squared (adjusted for d.f.) = 4,20259 percent<br />
Standard Error of Est. = 0,48533<br />
Mean absolute error = 0,380747<br />
Durbin-Watson statistic = 2,37876
5.11 Modelle für die Prozessgleichung<br />
289<br />
Prozessgleichung f. Y4<br />
-----------------------------------------------------------------------------<br />
Dependent variable: Dicke<br />
-----------------------------------------------------------------------------<br />
Standard<br />
T<br />
Parameter Estimate Error Statistic P-Value<br />
-----------------------------------------------------------------------------<br />
CONSTANT -3,48103 2,07271 -1,67946 0,0960<br />
Friktion 0,00302197 0,0164793 0,18338 0,8548<br />
Heiztemp 0,00505451 0,00188576 2,68036 0,0085<br />
MVI 0,0255782 0,0049834 5,13268 0,0000<br />
Dichte 4,29957 0,593056 7,24985 0,0000<br />
Massetemp 0,00155342 0,0118602 0,130978 0,8960<br />
-----------------------------------------------------------------------------<br />
Analysis of Variance<br />
-----------------------------------------------------------------------------<br />
Source Sum of Squares Df Mean Square F-Ratio P-Value<br />
-----------------------------------------------------------------------------<br />
Model 0,441305 5 0,088261 17,28 0,0000<br />
Residual 0,54664 107 0,00510878<br />
-----------------------------------------------------------------------------<br />
Total (Corr.) 0,987945 112<br />
R-squared = 44,669 percent<br />
R-squared (adjusted for d.f.) = 42,0834 percent<br />
Standard Error of Est. = 0,0714757<br />
Mean absolute error = 0,0554062<br />
Durbin-Watson statistic = 2,10562<br />
Gewisse Unterschiede in den Ergebnissen resultieren z. T. aus Rundungsfehlern und insbesondere<br />
bei den Reststreuungen aus der Tatsache, dass ich S YY/X aus 1/N A YY/X berechnet<br />
habe. Diese Schätzung ist nicht erwartungstreu. Die erwartungstreue Schätzung verwendet<br />
anstelle des Faktors 1/N den Faktor 1/(N – m).<br />
Die Güte des Ausgleichs kann aus<br />
•<br />
•<br />
der bedingten Standardabweichung (Reststreuung) und<br />
dem Maß der Beherrschbarkeit (multipler Korrelationskoeffizient R 2 Yj/X<br />
abgelesen werden.<br />
Für die Produktvariable Y 1 (Thermoschrumpf) liest man ab:<br />
s Y1/X = 0,3506 und R 2 Y1/X = 0.4532. Es gibt hier einen 2. Wert, der „R squared adjusted”<br />
genannt wird. Dieser Wert verwendet die erwartungstreue Schätzung für S 2 Y/X .<br />
Die Programme zur Berechnung der Prozessgleichungen gestatten noch das Zeichnen verschiedener<br />
Sachverhalte. Hier wollen wir nur schauen, wie gut die Residuen ε ˆ<br />
1 = ( 1 − ˆ<br />
i Yi Yi1)<br />
,<br />
i = 1, … N (Abweichungen der Messwerte von den berechneten Werten) durch eine Normalverteilung<br />
angepasst werden können.<br />
Die Abbildung 5.11.11 zeigt, dass die Residuen sehr gut durch eine Normalverteilung<br />
approximiert werden können.
290 5 Qualität in der Fertigung<br />
49<br />
8<br />
Residuals<br />
-0.5 0.0 0.5<br />
60<br />
-2 -1 0 1 2<br />
Quantiles of Standard Normal<br />
Abb. 5.11.11: Residuen ε i1 für die Anpassung von Y 1 durch die Prozessgleichung über den<br />
Quantilen der Normalverteilung<br />
Es bleibt noch die Frage zu klären, wie die Auswahl der wesentlichen Input- und Prozessvariablen<br />
im multivariaten, multiplen Fall zu realisieren ist, denn Fakt ist ja, dass der Prozess nur<br />
mit einer optimalen Teilmenge von Input- und Prozessvariablen für alle Produktvariablen<br />
gesteuert werden kann. Die Antwort auf diese Frage wird bei der Lösung des Problems nach<br />
der Auswahl der wesentlichen Input- und Prozessvariablen gegeben.<br />
5.12 Welche Eigenschaften haben die Schätzungen für die<br />
unbekannten Modellparameter?<br />
Die Eigenschaften für diese Schätzfunktionen werden ste llvertretend für das multivariate,<br />
multiple Modell mit stochastischen Input- und Prozessvariablen aufgeschrieben.<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
Sie sind:<br />
E[B Y/X /X] = E[B Y/X ] = β Y/X ,<br />
d. h. die Schätzfunktion für die Matrix (Vektor) der unbekannten Koeffizienten der Prozessgleichung<br />
ist erwartungstreu.<br />
E[A YY/X /X] = E[A YY/X ] = Σ YY/X (N – n –1)<br />
cov(B Y/X /X) = A –1<br />
XX ⊗ Σ YY/X<br />
und cov(B Y/X ) = (N – n –1) –1 Σ –1<br />
XX ⊗ Σ YY/X<br />
{B (N)<br />
Y/X } N→∞ ist konsistent<br />
B Y/X und S YY/X sind unabhängig<br />
V(B Y/X /X) = N(B Y/X , A –1<br />
XX ⊗ Σ YY/X )<br />
und die unbedingte Verteilung ist eine multivariate t-Verteilung.
5.12 Welche Eigenschaften haben die Schätzungen?<br />
291<br />
Die Beweise für diese Behauptungen findet man in Jahn [1991a].<br />
Vorhersagen für die Werte der Produktvariablen<br />
Die Prozes sgleichung wird für die Steuerung des Prozesses gebraucht. Für die Input- und Prozessvariablen<br />
werden Werte eingesetzt und der oder die Werte für den oder die Produktvariablen<br />
werden ausgerechnet. Diesen Vorgang bezeichnen wir im linearen Modell als „Vorhersage“.<br />
Die vorhergesagten Werte für den oder die Produktvariablen streuen natürlich auch. Daher<br />
müssen wir den Vorhersagefehler berechnen.<br />
Wie kann man den Vorhersagefehler berechnen und wie groß ist der Fehler für diese<br />
Vorhersagen?<br />
Vorhersagen sind hier im Sinne der Extra- oder Interpolation des oder der Produktvariablen<br />
Y aufgrund der Kenntnis der Input- und Prozessvariablen gemeint. Wir betrachten die<br />
Vorhersage gleich für den Vektor von Produktvariablen Y. Für eine Produktvariable gelten<br />
dieselben Formeln.<br />
Den Vektor der Input- und Prozessvariablen, für den wir die „Vorhersage“ berechnen wollen,<br />
bezeichnen wir mit X E . Es muss selbstverständlich gelten, dass<br />
X E ~ N n (µ, Σ XX ) und X E ist unabhängig von X, d. h. von X 1 , …, X N .<br />
Mit diesem Vektor wird ̃ = ̃<br />
T<br />
Y( XE)<br />
YE = B0 + BY / X ⋅ X E .<br />
Die Beurteilung der „Vorhersage“ erfolgt mit den bedingten und unbedingten Vorhersagefehlern.<br />
Der bedingte Vorhersagefehler ist<br />
und<br />
M E[( ̃ ) ( ̃ ) / , X ] MSEP ( ̃ /, )<br />
U<br />
T<br />
Nn , = YE − YE ⋅ YE − YE X E = YE XE<br />
T −1<br />
= ΣYY / X ⋅ (1 + XE ⋅ AXX ⋅ XE)<br />
⎛<br />
⎞<br />
= − ̃ ⋅ − ̃ T<br />
= ̃<br />
n<br />
E[( Y Y ) ( Y Y ) ] MSEP ( Y ) = Σ ⋅ ⎜1 +<br />
⎝<br />
⎟.<br />
N − n −1⎠<br />
N, n E E E E E YY / X<br />
Den Beweis kann man in Jahn [1991b] nachlesen.<br />
Der unbedingte Vorhersagefehler des linearen Modells mit stochastischen Input- und<br />
Prozessvariablen stimmt mit dem Vorhersagefehler des Modells mit festen Input- und<br />
Prozessvariablen überein.<br />
Beispiel 5.12.1: Bremsweg. Vorhersagen<br />
1. Beispiel zum Nachrechnen (05.11.3 Bremsweg)<br />
Die berechnete Prozessgleichung war<br />
Yˆ =− 27.151 + 1.078 ⋅x<br />
Fasst man auch die gefahrene Geschwindigkeit als Zufallsgröße auf, dann erhält man für<br />
dieses Demonstrationsbeispiel den unbedingten „Vorhersagefehler“<br />
U 10,1 = 2.991 (1 + 1/8) = 3.3648
292 5 Qualität in der Fertigung<br />
und damit die „Vorhersagestandardabweichung“<br />
U 10,1 = 3.3648 = 1.83<br />
Wählt man für x E die Werte 45, 50 und 55, dann erhält man hierfür die „vorhergesagten“<br />
Bremswege:<br />
Tabelle 5.12.1: „Vorhersagewerte“ für den Bremsweg bei einer Prozessvariablen und dem<br />
Stichprobenumfang N = 10.<br />
x E<br />
Vorhersage<br />
Konfidenzintervall<br />
ỸE<br />
unten<br />
oben<br />
45 21,3 17,7 24,9<br />
50 26,7 23,1 30,3<br />
55 32,1 28,5 35,7<br />
2. Beispiel aus dem Kapitel 1 (Datei 01.3.6 Bremsweg)<br />
Mit dem Programm Statgraphics Plus 7.0 oder SPLUSWIN erhält man die Prozessgleichung<br />
Y ˆ = − 10.0798 + 0.84465 ⋅ X − 2.18613 ⋅ X + 4.1934 ⋅ X<br />
1 2 3<br />
wobei<br />
X 1 = Geschwindigkeit [km/h]<br />
X 2 = Profiltiefe [mm]<br />
X 3 = Reaktionszeit [sec], anstelle des PKW-Gewichtes<br />
und die bedingte Varianz bzw. die bedingte Standardabweichung<br />
S 2 Y/X = 4.68432 und S Y/X = 2.1643.<br />
Der unbedingte Vorhersagefehler ist<br />
U 33,3 = 4.68432 [1 + 3 / (30 – 3 – 1)] = 5.2248<br />
und die unbedingte Vorhersage-Standardabweichung ist<br />
U 33,3 = 2.2858 .<br />
Das Maß der Beherrschbarkeit des Prozesses „Bremsen vor einem Hindernis“ ist R 2 Y/X<br />
= 0.8667, bzw. nach der Korrektur mit den Freiheitsgraden R′ 2 Y/x = 0.851318, wobei die<br />
Korrektur mit der Formel<br />
R′<br />
N − 1<br />
= 1 − (1 − RY x),<br />
N − n −1<br />
2 2<br />
Y / x<br />
/<br />
vorgenommen wird. Das Maß der Beherrschbarkeit besagt, ca. 86 % der Varianz des Bremsweges<br />
werden durch die drei Prozessvariablen X 1 (Geschwindigkeit), X 2 (Profiltiefe) und<br />
X 3 (Reaktionszeit) erklärt. Verwendet man das Maß der Beherrschbarkeit zur Berechnung<br />
der bedingten Varianz, dann erhält man<br />
S 2 Y/X = 31.50563 (1 – 0.851318) = 4.68432 und damit s Y/x = 2.1643.<br />
also denselben Wert für die bedingte Standardabweichung wie oben.
5.12 Welche Eigenschaften haben die Schätzungen?<br />
293<br />
Wie können Sie Hypothesen über die unbekannten Modellparameter prüfen?<br />
Die unbekannten Modellparameter sind im univariaten multiplen Modell mit stochastischen<br />
Input- und Prozessvariablen<br />
•<br />
•<br />
der Vektor der Koeffizienten der Prozessgleichung β Y/X und<br />
die bedingte Varianz σ 2 Y/X .<br />
Wir wollen Antworten auf die Fragen<br />
1. Welche Input- und Prozessvariable hat einen statistisch gesicherten Einfluss auf die Produktvariable?<br />
2. ist die bedingte Varianz statistisch gesichert kleiner als die Varianz der Produktvariablen<br />
Y?<br />
3. ist das Maß der Beherrschbarkeit statistisch gesichert größer als Null?<br />
Prüfung von Hypothesen über den Vektor der Koeffizienten der Prozessgleichung<br />
Di e Prüfung der Hypothese über den Vektor der Regressionskoeffizienten<br />
H 0 : β Y/X = 0 gegen die alternative Hypothese H 1 : β Y/X ≠ 0 mit dem F-Test<br />
T<br />
ˆ BY / X SXX BY / X N − n −1<br />
F =<br />
2<br />
S / ( n + 1)<br />
Y<br />
X<br />
und P ( Fˆ<br />
≤ F α /H 0) = 1− α , wobei Fˆ ∼ Fn+ 1, N−m−1( α ) wird durch das bekannte „finite<br />
intersection“ Prinzip auf die Prüfung der Einzelhypothesen H 0,j : β Y.j/n – j = β * Y.j/n – j gegen H 1 :<br />
β Y.j/n – j ≠ β * Y.j/n – j zurückgeführt, wobei β* Y.j/n – j gegeben sein möge. Die Teststatistik für eine<br />
bestimmte Input- oder Prozessvariable X j ist<br />
( β − B )<br />
t = ⋅S ⋅ N − n − 1, j = 1, …, n.<br />
Y. j/ n−j Y. j/ n−j<br />
2<br />
j j / n−<br />
j<br />
sY<br />
/ X<br />
Oft wird einfach angenommen, dass β * Y.j/n – j = 0.<br />
Die t-Prüfstatistik kann auch mit der F-Statistik geschrieben werden. Es gilt<br />
2 2 2<br />
Y. j/ n−j Y / X Y / n−j<br />
2 jj<br />
SY / X S<br />
2<br />
1 − RY / X<br />
B ( N − n) ( R − R )( N − n)<br />
Fˆ = =<br />
,<br />
j<br />
wobei S jj die Diagonalelemente von S –1<br />
XX sind. Für diese gilt aber<br />
S<br />
−1<br />
XX<br />
⎧<br />
2 2 −1<br />
j − j/<br />
n−<br />
j<br />
=<br />
[ S (1 R )] , für alle j 1, …,<br />
n<br />
⎪<br />
= ⎨ −Rjk / n- { j,<br />
k}<br />
⎪<br />
, für jk , = 1, …, nj , ≠ k<br />
2 2<br />
⎪⎩<br />
Sj Sk (1 − Rj/ n−j) (1 − Rk/<br />
n−k)<br />
und<br />
2 2 2<br />
j − j/ n−j = j/ n−1<br />
[ S (1 R )] S .
294 5 Qualität in der Fertigung<br />
Varianzanalyse für die berechnete Prozessgleichung<br />
Für die P rüfung der linearen Prozessgleichung, d. h. für die Prüfung der Hypothese, ob wenigstens<br />
eine Input- und/oder Prozessvariable einen statistisch gesicherten Einfluss auf die<br />
Produktvariable hat, wird die Varianzanalyse der<br />
Tabelle 5.12.2 durchgeführt. Diese Analyse basiert auf der Identität<br />
Y − Y = Y − Yˆ<br />
+ Yˆ<br />
− Y<br />
i i i i<br />
nach der die Abweichung einer Beobachtung der Produktvariablen Y i vom Mittelwert Y zerlegt<br />
wird in die Abweichung der Beobachtung Y i von dem mit der Prozessgleichung berechneten<br />
Wert Y<br />
ˆi und die Abweichung Yˆi<br />
− Y der berechneten Werte vom Mittelwert. Werden die<br />
Abweichungen quadriert und über alle Beobachtungen summiert, so erhält man die Zerlegung<br />
der Summe der Abweichungsquadrate der Einzelwerte vom Mittelwert<br />
SAQ = ( Y − Y)<br />
gesamt<br />
N<br />
∑<br />
i=<br />
1<br />
in die beiden Summanden<br />
i<br />
2<br />
1. Summe der Abweichungsquadrate der berechneten Werte vom Mittelwert, SAQ Modell =<br />
N<br />
ˆ 2<br />
( Y − Y ) und<br />
∑<br />
i=<br />
1<br />
i<br />
2. die Summe der Abweichungsquadrate der einzelnen Beobachtungswerte von den berechneten<br />
Werten SAQ = ( Y − Y ˆ )<br />
N<br />
2<br />
.<br />
Fehler<br />
∑<br />
i=<br />
1<br />
i<br />
i<br />
Die Summen der Abweichungsquadrate werden in Varianztabelle Tabelle 5.11.1 zusammen<br />
gestellt.<br />
Tabelle 5.12.2: Varianztabelle für die „Güte“ der Prozessgleichung<br />
Variationsursache<br />
Summe<br />
der quadratischen<br />
Abweichungen<br />
FG<br />
Mittlere Summe<br />
der quadratischen<br />
Abweichungen<br />
F-Quotient<br />
Gesamt<br />
Modell<br />
N<br />
∑<br />
i=<br />
1<br />
N<br />
∑<br />
i=<br />
1<br />
2<br />
( Y − Y)<br />
N – 1<br />
i<br />
2<br />
( Yˆ<br />
− Y)<br />
m<br />
i<br />
N<br />
1<br />
∑ 2<br />
( Yi<br />
− Y)<br />
N − 1<br />
i=<br />
1<br />
Fehler<br />
N<br />
N<br />
2 2<br />
∑ ( Y − − ˆ<br />
i Y) ∑ ( Yi<br />
− Y)<br />
i= 1 i=<br />
1<br />
N<br />
2<br />
= ∑ ( Y − ˆ<br />
i Yi)<br />
i=<br />
1<br />
N – m – 1<br />
N<br />
∑<br />
i=<br />
1<br />
N<br />
∑<br />
i=<br />
1<br />
( Yˆ<br />
− Y)<br />
i<br />
2<br />
( Y − Yˆ<br />
)<br />
i<br />
2<br />
i<br />
= F<br />
Mit der Varianzanalyse kann man auch noch einmal die Bedeutung des Maßes der Beherrschbarkeit<br />
sehr klar erkennen.
5.12 Welche Eigenschaften haben die Schätzungen?<br />
295<br />
Beispiel 5.12.2: Bremsweg. Varianzanalyse<br />
Für das Beispiel erhalten wir mit den Daten aus der Datei 03.5.1 Bremsweg (im Internet)<br />
die Tabelle 5.12.3.<br />
Tabelle 5.12.3: Varianzanalyse für die Prozessgleichung<br />
Variationsursache<br />
Summe<br />
der quadratischen<br />
Abweichungen<br />
FG<br />
Mittlere Summe<br />
der quadratischen<br />
Abweichungen<br />
F-Quotient<br />
Gesamt 913,663 29<br />
Modell 791,871 3 263,957<br />
Fehler 121,7934 26 4,6843 56,35<br />
Der berechnete Wert des F-Testes ist sehr viel größer als der entsprechende Tafelwert<br />
F 0.05; 29,3 = 2.93, d. h. die Hypothese, dass die Varianz der Produktvariablen Y durch die<br />
Input- und Prozessvariablen nicht reduziert wird, muss mit sehr kleiner Irrtumswahrscheinlichkeit<br />
verworfen werden.<br />
Die Modellvarianz kann weiter zerlegt werden. Man erhält die weiterführende Tabelle<br />
5.12.4.<br />
Tabelle 5.12.4: Weiterführende Varianzanalyse<br />
Variationsursache Summe der quadratischen F-Quotient Wahrscheinlichkeit<br />
Abweichungen<br />
Modell 791,871 136,63 0,0000<br />
Geschwindigkeit 639,997 8,14 0,0084<br />
Profiltiefe 38,1208 24,28 0,0000<br />
Reaktionszeit 113,752<br />
Residuum 121,7927<br />
Aus dieser Varianztabelle kann man die Bedeutungen der einzelnen Input- und Prozessvariablen<br />
ablesen. Die Geschwindigkeit ist die wichtigste Prozessvariable. Dieser Parameter<br />
hat den größten F-Wert und die kleinste Irrtumswahrscheinlichkeit.<br />
Die „Vorhersagen“ mit diesem statistischen Modell sind in der Tabelle 5.2.15 enthalten<br />
Tabelle 5.12.5: Vorhersagewerte und Vorhersageintervalle für den Bremsweg<br />
Werte X E für Input- und Prozessvariable Vorhersage V.-Intervall<br />
die Input-<br />
X E,1 X E,2 X E,3 ỸE<br />
45 2 1 27,7 [23,0; 32,5]<br />
50 2 2 32,0 [27,3: 36,6]<br />
55 2 1 36,2 [31,5; 40,8]<br />
Die Vorhersagen mit dem ausführlicheren Modell unterscheiden sich von denen, die mit<br />
dem einfachen Modell gewonnen wurden. Das ist aber klar, denn in dem ausführlicheren<br />
Modell steckt sehr viel mehr Information.
296 5 Qualität in der Fertigung<br />
5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />
In vielen Arbeiten, so z. B. in Johnston [1963], Mason [1975], Harvey [1981], Gunst [1983],<br />
Sen and Srivastava [1990] usw. wird der Einfluss der Multikollinearität auf die Schätzfunktionen<br />
im linearen Modell studiert. Dabei begnügen sich die Autoren häufig mit einer intuitiven<br />
Darstellung des Einflusses der Multikollinearität. Wir wollen hier speziell den Einfluss auf die<br />
Prozessgleichung studieren und ein quantitatives Maß für die Multikollinearität verwenden,<br />
um zu erkennen, wie groß der Einfluss der Multikollinearität ist.<br />
Was ist die Multikollinearität?<br />
Wie können wir die Multikollinearität messen?<br />
Nach Anderson [1984] wird die Variabilität eines zufälligen Vektors X durch die verallgemeinerte<br />
Varianz Σ XX beurteilt. Gleichzeitig gilt aber Σ XX = 0 , wenn mit der Wahrscheinlichkeit 1<br />
lineare Abhängigkeiten zwischen den Input- und/oder Prozessvariablen vorkommen. Hieraus<br />
folgt schon, dass der Begriff verallgemeinerte Varianz viel zu eng gefasst ist, wenn es um den<br />
Grad der Multikollinearität geht, denn durch die Determinante werden sowohl die Varianzen<br />
als auch die Abhängigkeitsstruktur erfasst.<br />
Definition der Multikollinearität: Die Straffheit der Abhängigkeitsstruktur zwischen den<br />
Input- und Prozessvariablen wird Multikollinearität genannt und durch die Determinante der<br />
Korrelationsmatrix beurteilt. Für die Determinante der Korrelationsmatrix R XX gilt<br />
und<br />
Σ<br />
= R ⋅∏σ<br />
2<br />
XX XX j<br />
j=<br />
1<br />
n<br />
R<br />
XX<br />
⎧⎪ 1, falls ρjk<br />
= 0, für alle jk , = 1, …, nj , ≠ k<br />
= ⎨<br />
⎪⎩<br />
0, falls wenigstens ein ρjk<br />
= 1, für j ≠ k, j, k = 1, …,<br />
n<br />
Als Maß für die Multikollinearität verwenden wir daher<br />
δ =<br />
1<br />
R<br />
XX<br />
.<br />
Welchen Einfluss hat die Multikollinearität auf die Prozessgleichung und auf das Maß der<br />
Beherrschbarkeit?<br />
Im Netzwerk von betrieblichen Prozessen wurde deutlich ersichtlich, dass die Inputvariablen<br />
eines Prozesses die Produktvariablen eines Vorläuferprozesses sind. Ein Produkt wurde aber<br />
durch mehrere, nicht unabhängige Produktvariable charakterisiert. Der Vektor der Produktvariablen<br />
ist ein zufälliger Vektor. Der Vektor der Prozessvariablen ist in sehr vielen Fällen<br />
ebenfalls ein zufälliger Vektor. Hieraus folgte ja, dass zur Berechnung der Prozessgleichung das<br />
lineare Modell mit stochastischen Input- und Prozessvariablen zu verwenden ist. D. h. aber<br />
auch, dass die Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen, ausgedrückt<br />
durch deren Korrelations- oder Kovarianzmatrix, die Schätzfunktionen für die unbekannten<br />
Koeffizienten in den Gleichungen beeinflusst. Die Abhängigkeitsstruktur zwischen den Input-<br />
und Prozessvariablen kann sehr unterschiedlich sein. Einerseits kann diese durch einen
5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />
297<br />
großen Korrelationskoeffizienten zwischen zwei Parametern oder andererseits durch mäßig<br />
große Korrelationskoeffizienten zwischen allen möglichen Paaren von Variablen und deren<br />
unterschiedliche Vorzeichen geprägt sein.<br />
Diese Feststellungen führen auf drei Probleme, die im Rahmen der Multikollinearitätsproblematik<br />
beantwortet werden müssen.<br />
•<br />
•<br />
•<br />
Wie beeinflusst die Abhängigkeitsstruktur und damit die Multikollinearität die Schätzfunktionen<br />
für die unbekannten Koeffizienten und die bedingte Varianz?<br />
Wie kann die Abhängigkeitsstruktur beurteilt werden?<br />
Wie kann ein großer Grad der Multikollinearität korrigiert werden?<br />
In den meisten Schätzfunktionen für die unbekannten Modellparameter kommt die Inverse<br />
der Kovarianzmatrix vor. Folglich schreiben wir die Inverse elementeweise auf und erhalten<br />
die Darstellung<br />
A<br />
−1<br />
XX<br />
⎧<br />
−2 2 −1<br />
Aj (1 − Rj/<br />
n−<br />
j) , für alle j = 1, …,<br />
n<br />
⎪<br />
−R<br />
j k n j k<br />
= ⎨ jk / m−<br />
j,<br />
k<br />
, für , 1, , ,<br />
1<br />
= …<br />
⎪ ≠<br />
⎡<br />
2 2 2 2<br />
A (1 2<br />
j Ak − Rj/ n−j) ⋅(1 − Rk/<br />
n−k)<br />
⎤<br />
⎪ ⎩⎣<br />
⎦<br />
wobei R jk / n−( j, k)<br />
die Korrelationskoeffizienten der bedingten Verteilung von (X j , X k ) unter<br />
der Bedingung der restlichen Variablen (X 1 , …, X j – 1 , X j + 1 , …, X k – 1 , X k + 1 , …, X n ) d. h. die<br />
partiellen Korrelationskoeffizienten bezeichnen. [n – (j, k)] bezeichnet die Indexmenge der<br />
restlichen Variablen.<br />
Diese zeigt, dass mit zunehmender Strenge der Abhängigkeit innerhalb des Vektors der Inputund<br />
Prozessvariablen der multiple Korrelationskoeffizient zwischen einem beliebigen X j und<br />
einer Linearkombination in den restlichen Input- und Prozessvariablen R 2 j/n – j stets größer wird.<br />
Dadurch wird 1 – R 2 j/n – j immer kleiner und somit das Diagonalelement − −<br />
Aj 2 ⋅(1 − R<br />
2 j/<br />
n−<br />
j)<br />
1<br />
von A –1<br />
XX immer größer.<br />
Für die globale Beurteilung der Abhängigkeitsstruktur zwischen den Input- und Prozessvariablen<br />
benötigt man ein Maß. Zur Ableitung eines solchen betrachtet man den bekannten<br />
Zusammenhang (Muirehead [1982])<br />
T<br />
−1 2<br />
XX X n<br />
P[ X ⋅Σ ⋅ ≤ χ ( α)] = 1 − α,<br />
d. h. mit der Wahrscheinlichkeit 1 – α fällt X in das Innere des Konzentrationsellipsoides<br />
T −1 X ⋅Σ ⋅ X = χ 2 ( α ) mit dem Volumen<br />
XX<br />
n<br />
V<br />
=<br />
1 n<br />
⋅<br />
⋅<br />
⋅ ⋅ ⋅ (<br />
⋅<br />
∏<br />
1<br />
2 2 2<br />
π<br />
n<br />
R<br />
2 n<br />
XX σj χn<br />
α<br />
j=<br />
1<br />
(2 ) [ )]<br />
⎛ 1 ⎞<br />
Γ ⎜ ⎟ ⋅ n<br />
⎝2<br />
⋅ n ⎠<br />
,<br />
falls X ∼ N n (0, Σ XX ). Das Volumen ist nur von R XX abhängig, denn die anderen Variablen<br />
bleiben für diese Betrachtung konstant. Somit sollte sich ein Maß für die Multikollinearität<br />
auf die Determinante beziehen.
298 5 Qualität in der Fertigung<br />
Beispiel 5.13.1: Multikollinearität<br />
Der Einfluss der Multikollinearität auf die Parameter des linearen Modells wird durch ein<br />
Beispiel transparent. Es sei Z ~ N 3 (0, R ZZ ), R ZZ sei positiv definit und<br />
R<br />
ZZ<br />
⎛1<br />
ρY1 ρY2⎞<br />
⎜<br />
⎟ ⎛1<br />
ρY.<br />
X⎞<br />
= 1 ρ12<br />
=<br />
⎜ ⎟ ⎜<br />
⎝ ⎟ .<br />
R XX ⎠<br />
⎝ 1 ⎠<br />
Für diesen einfachen Fall sagt man X T = (X 1 , X 2 ) habe den Grad der Multikollinearität<br />
R<br />
1<br />
− 1<br />
XX = δ =<br />
2<br />
1 − ρ 12<br />
,<br />
wenn<br />
ρ<br />
2<br />
12<br />
=<br />
δ − 1 .<br />
δ<br />
In diesem Fall gilt<br />
⎧<br />
2 2<br />
2 2 ⎪1 − ( ρY1 + ρY2) δ + 2 ⋅ρY1 ⋅ρY2 ⋅ ( δ −1) ⋅δ, falls ρ12<br />
≥ 0<br />
σY / X= σY / X () δ = ⎨<br />
⎪ ⎩ −<br />
2 +<br />
2<br />
1 ( ρY1 ρY2) δ − 2 ⋅ ρY1 ⋅ ρY2 ⋅ ( δ − 1) ⋅ δ, falls ρ12<br />
< 0<br />
Da R ZZ positiv definit vorausgesetzt wurde, gilt<br />
mit<br />
2 2<br />
Y1 Y2 12<br />
ρ < 1, ρ < 1 und ρ ∈( ab , )<br />
2 2 2 2<br />
Y1 Y2 Y1 Y2 Y1 Y2<br />
ab , = ρ ⋅ ρ ± 1 − ρ − ρ + ρ ⋅ρ<br />
.<br />
Nur für ρ Y1 = ρ Y2 erhält man b = 1. Setzt man<br />
⎧ 1<br />
⎪ , füra<br />
≥ 0<br />
A =<br />
2<br />
⎨1<br />
− a<br />
⎪<br />
⎩ 0, für a < 0<br />
und<br />
⎧ 1<br />
⎪ , fürρ<br />
≠<br />
=<br />
2<br />
Y ρ<br />
B ⎨1<br />
− b<br />
⎪∞ ⎩ , fürρY<br />
= ρ<br />
dann ist δ ∈ [A, B] und<br />
bzw.<br />
σ<br />
1 Y2<br />
1 Y2<br />
⎧⎪ 0 füra<br />
≥ 0<br />
( A + 0) = ⎨ ⎪ ⎩1 − ( ρY1 + ρY2) füra<br />
< 0<br />
2<br />
Y / X<br />
2 2
5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />
299<br />
σ<br />
⎧⎪ 0 fürρY<br />
≠ ρY<br />
( B − 0) = ⎨ ⎪ ⎩1 − ρY fürρY = ρY<br />
2 1 2<br />
Y / X<br />
2<br />
2 1 2<br />
Aus Symmetriegründen ist nur der Fall a < 0 < b und ρ 12 < 0 zu untersuchen.<br />
2<br />
Es gilt σ / () δ ist monoton wachsend in (A, δ 0 ] und monoton fallend in [δ 0 , B), wobei<br />
Y<br />
X<br />
⎧<br />
2 2<br />
max( ρY1, ρY2)<br />
⎪<br />
für ρ ≠<br />
2 2<br />
Y ρ<br />
δ0 = ⎨ ρY1 − ρY2<br />
⎪<br />
⎩ ∞ für ρY<br />
= ρ<br />
2<br />
/ ()<br />
1 Y2<br />
1 Y2<br />
2 2<br />
Die Funktion σY<br />
Xδ erreicht ihr Maximum 1−<br />
max( ρY1, ρ Y2)<br />
an der Stelle δ 0 .<br />
Zum Beweis für ρ Y1 ≠ ρ Y2 wird − ( ρY1 + ρY2) δ + 2 ρY1ρY2 ( δ −1) ⋅ δ = : g1( δ ) untersucht.<br />
Zur Abkürzung wird ρ Y12 + ρ Y22 =: c und ρ Y1 ρ Y2 =: d gesetzt. Mit diesen Abkür zungen<br />
gilt<br />
d ⋅(2 δ −1)<br />
g1′<br />
() δ =− c +<br />
.<br />
( δ −1)<br />
⋅δ<br />
2 2 2 2<br />
2 2 2 2 2<br />
Aus g′<br />
() δ = c ⋅( δ − δ) − d (4⋅δ − 4⋅ δ + 1) = 0und c = 4 ⋅ d + ( ρY1 − ρ Y2)<br />
erhält<br />
man<br />
δ<br />
2<br />
d<br />
− δ − = 0<br />
2 2 2<br />
( ρ − ρ )<br />
2<br />
Y1 Y2<br />
und somit<br />
δ<br />
2 2 2 2<br />
ρY1 − ρY2 ± ( ρY1 + ρY2) =<br />
.<br />
ρ − ρ<br />
1/2 2 2<br />
Y1 Y2<br />
Für ρ Y1 = ρ Y2 wird<br />
g = ⋅ ⋅ ⎡ − ⋅ − ⎤<br />
2() δ 2 ρY<br />
1 ⎣<br />
( δ 1) δ δ<br />
⎦<br />
untersucht. Da<br />
2<br />
⎡ 2⋅δ<br />
−1<br />
⎤<br />
g2′ () δ = 2⋅ρY<br />
1 ⎢ −1⎥<br />
⎣ ( δ −1)<br />
⋅δ<br />
⎦<br />
folgt aus g ′2 () δ = 0 , dass keine reelle Lösung existiert.<br />
Zur Demonstration dieser Resultate betrachten wir die Korrelationsmatrix<br />
⎛1 0. 9 0.<br />
6⎞<br />
R = ⎜<br />
⎜<br />
1 ρ ⎟<br />
12 ⎟<br />
⎝ 1 ⎠<br />
für den Vektor (Y, X 1 , X 2 ).
300 5 Qualität in der Fertigung<br />
Die Grenzen des Variationsintervalls für den Korrelationskoeffizienten ρ 12 sind<br />
2 2 2 2<br />
Y1 Y2 Y1 Y2 Y1 Y2<br />
ab , = ρ ⋅ ρ ± 1− ρ − ρ + ρ ⋅ρ<br />
2 2<br />
= 0.9 ⋅ 0.6 ± 1 − 0.9 − 0.6 + 0.81 ⋅ 0.36 = 0.54 ± 0.348<br />
⎧<br />
−4<br />
a R = ⋅ δ a =<br />
⎪0.192, für , mit ′ 4.96 10 und ( ) 1.038<br />
= ⎨<br />
−4<br />
⎪⎩ 0.888, für b, mit R′′<br />
= 4.96 ⋅ 10 und δ( b) = 4.729<br />
Der Grad der Multikollinearität bis zu dem σ 2 Y/X<br />
monoton wächst ist<br />
δ<br />
2 2<br />
ρY1 ρY2<br />
0 2 2<br />
ρY1 − ρY2<br />
max ( , ) 0.81<br />
= = = 1.8.<br />
0.45<br />
Die bedingte Varianz im standardisierten Modell wird nach der Beziehung<br />
−1<br />
2<br />
1 ρ12 ρY<br />
1<br />
Y / X = 1 − ( Y 1 Y 2 ) ⋅ ⋅<br />
1 ρY<br />
2<br />
⎛ ⎞ ⎛ ⎞<br />
σ ρ ρ ⎜<br />
⎝<br />
⎟<br />
⎠<br />
⎜<br />
⎝<br />
⎟<br />
⎠<br />
1 ⎛1<br />
−ρ<br />
⎞ ⎛ρ<br />
⎞<br />
= 1 − ( ρ ) ⋅ ⋅ ⎜ ⋅<br />
⎝<br />
⎟<br />
⎠<br />
⎜<br />
⎝<br />
⎟<br />
⎠<br />
ρ ρ ρ ρ ρ<br />
= 1 −<br />
12 Y1<br />
Y1 ρY2 2<br />
1 − ρ12<br />
1 ρY<br />
2<br />
2 2<br />
Y1 + Y2 − 2 ⋅ Y1 ⋅ Y2 ⋅ 12<br />
2<br />
1 − ρ12<br />
berechnet.<br />
Für a, b, δ 0 und einige weitere Zwischenstellen für den Grad der Multikollinearität erhält<br />
man die folgenden Werte für die bedingte Varianz bzw. bedingte Standardabweichung:<br />
2<br />
Y / X( a) = 0.000515, σ Y/X ( a) = 0.0227,<br />
2<br />
Y / X( 1 = 1.19) = 0.1214, Y/X ( 1 ) = 0.3484,<br />
2<br />
Y / X( 2 = 1.312) = 0.1561, Y/X ( 2 ) = 0.395,<br />
2<br />
Y / X( 3 = 1.33) = 0.16, Y/X ( 3 ) = 0.4,<br />
2 2 2<br />
Y / X 0 = Y/X 0 = Y/X = − Y1<br />
2<br />
Y / X( 4 = 2.5) = 0.1776, Y/X ( 4 ) = 0.4083,<br />
2<br />
Y / X( 5 = 3.249) = 0.118, Y/X ( 5 ) = 0.3435,<br />
2<br />
Y / X( 6 = 4) = 0.0611, Y/X ( 6 ) = 0.2472,<br />
) 0.19,<br />
Y/X<br />
σ<br />
σ δ σ δ<br />
σ δ σ δ<br />
σ δ σ δ<br />
2<br />
σ ( δ ) 0.18999, σ ( δ ) 0.4359, max σ ( δ) 1 max ( ρ , ρY<br />
2 =<br />
2<br />
σY / X( b ) = 0.002346, σ ( ) = 0.0484.<br />
σ δ σ δ<br />
σ δ σ δ<br />
σ δ σ δ<br />
Die Abbildung 5.13.1 zeigt die Werte für die bedingte Standardabweichung über den verschiedenen<br />
Graden der Multikollinearität. Wie berechnet, steigen die Werte der bedingten<br />
Standardabweichung vom kleinst möglichen Grad a bis zum Grad δ 0 der Multikollinearität an<br />
und fallen dann wieder bis zum maximal möglichen Grad b der Multikollinearität.
5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />
301<br />
0.4<br />
0.3<br />
bedStreuung<br />
0.2<br />
0.1<br />
0.0<br />
0 1 2 3 4 5<br />
Det<br />
Abb. 5.13.1: Bedingte Standardabweichung über dem Grad der Multikollinearität<br />
Für höher dimensionale Vektoren (n ≥ 3) von Input- und Prozessvariablen kann man die Abhängigkeit<br />
der bedingten Varianz (Standardabweichung) vom Grad der Multikollinearität δ<br />
nicht mehr analytisch darstellen. Es bleibt hier nur die Möglichkeit, mit Beispielen die Vermutung,<br />
dass bei den höher dimensionalen Fällen die gleiche Tendenz gilt, zu untermauern.<br />
Gibt es einen Zusammenhang zwischen dem Grad der Multikollinearität und der<br />
Konditionszahl?<br />
Um die Auswirkung eines großen δ auf d ie Schätzfunktionen für die unbekannten Parameter<br />
in der Prozessgleichung zu untersuchen, bietet sich die Berechnung der Fehler E an, die bei<br />
der Lösung des Normalgleichungssystems<br />
T<br />
Y / X XX Y.<br />
X<br />
B R = R<br />
entstehen. Um diesen Fehler berechnen zu können, führen wir die Konditionszahl<br />
k<br />
E<br />
=<br />
⎛<br />
⎜<br />
⎝<br />
R<br />
R<br />
XX<br />
XX<br />
n<br />
⎞<br />
⎟<br />
⎠<br />
n<br />
mit<br />
⎛<br />
RXX<br />
= ⎜n + 2∑r<br />
⎝<br />
2<br />
jk<br />
j<<br />
k<br />
⎞<br />
⎟<br />
⎠<br />
1<br />
2<br />
ein. Damit gilt nach Focke [1962]<br />
E<br />
≤<br />
3 ⋅ n a<br />
,<br />
k R<br />
E<br />
XX
302 5 Qualität in der Fertigung<br />
wobei a der Vektor der Abweichungen ist, die man erhält, wenn man die Lösung B Y/X in das<br />
Normalgleichungssystem BY T<br />
/ X RXX = RY.<br />
X einsetzt, d. h. a = BY T<br />
/ X RXX − RY.<br />
X .<br />
Je größer der Grad der Multikollinearität ist, desto größer werden die Fehler. Unter den genannten<br />
Voraussetzungen, dass der zufällige Vektor Z = (Y T , X T ) aus den m Produkt- und n<br />
Input- und Prozessvariablen m + n dimensional normal- oder elliptisch umrissen verteilt und<br />
die gemeinsame Kovarianzmatrix positiv definit ist, gilt für eine Stichprobe<br />
(Y i , X i ), i = 1, …, N<br />
von unabhängigen und identisch nach Z verteilten zufälligen Vektoren mit der Schätzfunktion<br />
N<br />
∑<br />
A = ( Z − Z) ⋅( Z − Z)<br />
ZZ i i<br />
i= 1<br />
für die Kovarianzmatrix und deren Zerlegung<br />
A<br />
ZZ<br />
⎛AYY<br />
AYX<br />
⎞<br />
= ⎜<br />
⎝ A ⎟<br />
⎠ ,<br />
XX<br />
T<br />
die Maximum Likelihood Schätzfunktion MLSF) für die Matrix der Regressionskoeffizienten<br />
wird nach der Beziehung<br />
T T −1<br />
Y / X= YX⋅<br />
XX<br />
B A A<br />
berechnet.<br />
Der Vektor der Absolutglieder besitzt die Darstellung<br />
T<br />
0 = − Y / X ⋅ .<br />
B Y B X<br />
Die MLSF für die bedingte Kovarianzmatrix<br />
−1<br />
YY / X = YY − YX ⋅ XX ⋅ XY<br />
Σ Σ Σ Σ Σ ist<br />
−1<br />
YY / X = YY − XX ⋅ XY<br />
A A A A<br />
bzw. mit der MLSF<br />
S<br />
ZZ<br />
1<br />
= ⋅ A<br />
N − 1<br />
ZZ<br />
−1<br />
YY / X = YY − YX ⋅ XX ⋅ XY.<br />
S S S S S<br />
Für die MLSF haben wir schon gezeigt, dass<br />
E[ BY/ X / X] = E[ BY/ X] = ΒY/<br />
X,<br />
E[ AYY / X / X] = ( N − n −1) ΣYY / X ,<br />
−1 −1<br />
cov [ B / X] = A ⊗ Σ und cov [ B ] = ( N − n −1) ⋅Σ ⋅Σ<br />
.<br />
Y/ X XX YY/ X Y/ X XX YY/<br />
X<br />
Aus diesen Eigenschaften können Sie schon ablesen, dass die Varianzen der MLSF für die<br />
Regressionskoeffizienten immer größer werden, je größer der Grad der Multikollinearität ist,<br />
denn überall dort wo die Inverse Kovarianzmatrix ins Spiel kommt, wirkt der Grad der Multikollinearität.<br />
Das gilt auch für die folgenden Eigenschaften.
5.13 Einfluss der Multikollinearität auf die Schätzfunktionen<br />
303<br />
•<br />
•<br />
•<br />
die bedingte Verteilung von B Y/X ist N ( ΒY / X, A XX ⊗ ΣYY / X)<br />
,<br />
die unbedingte Verteilung von B Y/X ist eine multivariate t-Verteilung,<br />
( N −1) ⋅ S YY / X ist Wishart verteilt, d. h. Wm ( N − m −1, ΣYY / X).<br />
Außerdem gelten für die bedingten und unbedingten Vorhersagefehler die folgenden Beziehungen.<br />
Der bedingte Vorhersagefehler wird nach der Beziehung<br />
M<br />
−1<br />
Nm = ΣYY X ⋅ + XE ⋅ AXX ⋅ XE<br />
, / (1 )<br />
und der unbedingte nach<br />
U<br />
⎛ n ⎞<br />
= Σ ⋅ ⎜ +<br />
⎝<br />
⎟<br />
N − n −1⎠<br />
Nm , YY/ X 1<br />
berechnet. Aus den Modellparametern bzw. den MLSF und deren Eigenschaften liest man die<br />
Abhängigkeit von A –1<br />
XX und damit vom Grad der Multikollinearität ab.<br />
−1<br />
Beispiel 5.13.2: Einfluss der Multikollinearität. Einfluss auf die Modellparameter<br />
Für n = 4 wird ein Beispiel nach faktoranalytisch folgender Vorschrift konstruiert:<br />
X 1 = ½ (X 2 + X 3 + X 4 )<br />
X 2 = 2 A + U 2<br />
X 3 = –A + 2 U 3<br />
X 4 = A + U 4<br />
wobei A einen gemeinsamen Faktor und U j , j = 2, 3, 4 spezielle Faktoren bezeichnen. Durch<br />
das Einsetzen der falktoranalytischen Annahmen erhält man<br />
X 1 = ½ (U 2 + 2 U 3 + U 4 ) + A.<br />
Die Voraussetzungen an die gemeinsamen und speziellen Faktoren der Faktoranalyse,<br />
E(A) = E(U j ) = 0, und var(A) = var(U j ) = 1, j = 1, 2, 3, 4 ermöglichen die Berechnung der<br />
Varianzen und Kovarianzen zwischen den vier Prozessvariablen X 1 bis X 4 . Man erhält<br />
var(X 1 ) = E [1/4 (U 2 + 2 U 3 + U 4 ) 2 + A 2 + (U 2 + 2 U 3 + U 4 ) A]<br />
= ¼ (1 + 4 + 1) + σ 2 A = 6/4 + 1 = 5/2,<br />
var(X 2 ) = E (2 A + U 2 ) 2 = 5,<br />
var(X 3 ) = E (–A + 2 U 3 ) 2 = 5,<br />
var(X 4 ) = E (A – U 4 ) 2 = 2<br />
cov(X 1 X 2 ) = E (X 1 X 2 ) = E [(1/2 (U 2 + 2 U 3 + U 4 ) + A) (2 A + U 2 )] = 5/2,<br />
cov(X 1 X 3 ) = E (X 1 X 3 ) = E [(1/2 (U 2 + 2 U 3 + U 4 ) + A) (–A + 2 U 3 )] = 1<br />
cov(X 1 X 4 ) = E (X 1 X 4 ) = E [(1/2 (U 2 + 2 U 3 + U 4 ) + A) (A + U 4 )] = 3/2,<br />
cov(X 2 X 3 ) = E (X 2 X 3 ) = E [(2 A + U 2 ) (–A + 2 U 3 )] = – 2,<br />
cov(X 2 X 4 ) = E (X 2 X 4 ) = E [(2 A + U 2 ) (A + U 4 )] = 2,<br />
cov(X 3 X 4 ) = E (X 3 X 4 ) = E [(–A + 2 U 3 ) (A + U 4 )] = – 1.
304 5 Qualität in der Fertigung<br />
Mit den Varianzen und Kovarianzen können die Korrelationskoeffizienten<br />
cov( Xj, Xk)<br />
ρ jk = , j, k= 1, …,4,<br />
j≠<br />
k<br />
1/2<br />
[var( X ) ⋅ var( X )]<br />
j<br />
berechnet werden. Man erhält die Korrelationsmatrix<br />
k<br />
R<br />
XX<br />
⎛ 1 2 2/3 ⎞<br />
⎜1<br />
2 5 5<br />
⎟<br />
⎜ ⎟ ⎛1 0.707 0.282 0.670 ⎞<br />
⎜ −2 2 ⎟<br />
1<br />
⎜ 1 −0.400 0.632 ⎟<br />
= ⎜ ⎟<br />
5 5 = ⎜ ⎟,<br />
⎜ ⎟ ⎜<br />
1 −0.316⎟<br />
⎜<br />
−1<br />
⎟<br />
1<br />
⎜ 1 ⎟<br />
⎜<br />
⎟ ⎝<br />
⎠<br />
⎜<br />
10<br />
⎟<br />
⎝<br />
1 ⎠<br />
wobei die Dezimalbrüche durch die Berechnungen von 3 Stellen nach dem Komma zustande<br />
kommen. Das Wesen dieser Korrelationsmatrix besteht darin, dass der Rang der Korrelationsmatrix<br />
durch das aufgeprägte weiße Rauschen 4 beträgt; ansonsten nur 3! und der<br />
Einfluss des weißen Rauschens mit zunehmender Anzahl von Stellen für die Dezimalbrüche<br />
immer kleiner wird. Aus der zweiten Eigenschaft folgt, dass der Grad der Multikollinearität<br />
durch die Anzahl der Dezimalstellen verändert werden kann. Die Determinante für die<br />
Korrelationsmatrix mit drei Dezimalstellen ist det(R XX ) = 9.66 10 –4 .<br />
Für 4 Stellen nach dem Komma erhält man det(R XX ) = 3.53 10 –5 . Für 6 Dezimalstellen erhält<br />
man den Wert det (R XX ) = 1.306 10 –6 usw. Erweitert man die Korrelationsmatrix R XX mit<br />
3 Dezimalstellen um den Vektor der Korrelationskoeffizienten<br />
ρ T Y.X = (1 0.3 0.3 –0.3 0.65),<br />
dann erhält man eine Korrelationsmatrix für den gemeinsamen Vektor (Y, X T ) von einem<br />
Produkt- und vier Prozessvariablen.<br />
Die inverse Korrelationsmatrix hat die Elemente<br />
⎡ 518.00409761864935308 −366.52374300262834013 −365.67403717048603733 −230.972735572707543<br />
⎤<br />
⎢<br />
−366.52374300262834013 261.13943712283653603 259.13986870735832069 162.4189820616535264<br />
⎥<br />
⎢<br />
⎥<br />
⎢−365.67403717048603733 259.13986870735832069 259.33982968888505582 163.1765940628628639⎥<br />
⎢<br />
⎥<br />
⎣−230.9727355727075434 162.41898206165352646 163.17659406286286398 104.6667398946136903⎦<br />
Mit den Elementen der inversen Korrelationsmatrix kann man die Koeffizienten der Regressionsfunktion<br />
(bedingten Erwartungswertes) berechnen. Man erhält die Funktion<br />
E[Y/X] = 5.014039 X 1 – 3.784914 X 2 – 3.697413 X 3 – 1.485723 X 4<br />
und die bedingte Varianz<br />
σ 2 Y/X = 1 – 0.512241 = 0.487759.<br />
Berechnet man 4 Dezimalstellen der Korrelationsmatrix und rundet auf 3 Stellen, dann<br />
erhält man die inverse Korrelationsmatrix
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
305<br />
⎡ 3903.7774652061360842 −2759.4607872664600142 −2759.9198281797504894 −1744.8306665184492782<br />
⎤<br />
⎢<br />
−1<br />
−2759.4607872664600142 1952.3805292153284385 1951.3032020137744162 1232.3531250988444835<br />
⎥<br />
R XX = ⎢<br />
⎥ ,<br />
⎢ − 2759.9198281797504894 1951.3032020137744162 1952.4272516129524397 1233.6982893435863439 ⎥<br />
⎢<br />
⎥<br />
⎣−1744.8306665184492782 1232.3531250988444835 1233.6982893435863439 781.55050847888419224⎦<br />
die Determinante der Korrelationsmatrix der Prozessvariable det(R XX ) = 1.279 10 –4 , den<br />
bedingten Erwartungswert<br />
E[Y/X] = 37.131019 X 1 – 26.485507X 2 – 26.409275 X 3 – 15.844919 X 4<br />
und die bedingte Varianz<br />
σ 2 Y/X = 1 – 0.817239 = 0.182761.<br />
Die geringfügige Veränderung der einzelnen Elemente der Korrelationsmatrix führt zu<br />
starken Veränderungen der Ergebnisse (Elemente der inversen Korrelationsmatrix und<br />
damit der multiplen Korrelationskoeffizienten, Koeffizienten des bedingten Erwartungswertes,<br />
bedingte Varianz).<br />
Aus dieser Darstellung erkennt man, dass die Fehler mit kleiner werdender Determinante<br />
der Korrelationsmatrix für die Input- und Prozessvariable und damit mit kleiner werdenden<br />
Konditionszahlen größer werden.<br />
5.14 Wie können wir die wesentlichen Input- und<br />
Prozessvariablen auswählen?<br />
In den Regressionsansätzen mit festen oder stochastischen Input- und Prozessvariablen wird<br />
der Zusammenhang zwischen einem (oder mehreren) Produktvariablen Y und den n Inputund<br />
Prozessvariablen X T = (X′, Z) gesucht. Da zu Beginn der Analyse nicht bekannt ist, welche<br />
Input- und Prozessvariablen den (oder die) Produktvariable wesentlich beeinflussen, misst<br />
man nach dem Grundsatz des<br />
Galilei: „Messe alles, und das nicht Messbare mache messbar“,<br />
so viel wie möglich Input- und Prozessvariablen und hofft, dass unter den gemessenen diejenigen<br />
sind, die Y gut erklären. Hinter dieser Formulierung steht die Frage nach der Adäquatheit<br />
des Modells. Hierfür verwenden wir das Maß der Beherrschbarkeit, den F-Test, die t-Tests und<br />
Residualanalysen. Diese Analysen reichen aber nicht aus, den optimalen Ansatz zu finden.<br />
5.14.1 Warum müssen aber nun wieder Input- und/oder Prozessvariablen<br />
aus dem Ansatz gestrichen werden?<br />
Es ist doch offensichtlich, dass mit zunehmender Anzahl von Input- und Prozessvariablen die<br />
Information über Y nicht geringer werden kann. Das ist der Inhalt der Wiener Shannon’sche<br />
Theorie, wonach die Entropie als Maß der Unbestimmtheit einer oder mehrerer Produktvariablen<br />
mit zunehmender Anzahl von Input- und Prozessvariablen desselben Prozesses stets<br />
kleiner wird.
306 5 Qualität in der Fertigung<br />
Trotzdem gibt es verschiedene Gründe für die Notwendigkeit der Auswahl der wesentlichen<br />
Input- und Prozessvariablen . Zwei dieser Gründe sind:<br />
Der Grad der Multikollinearität nimmt mit wachsender Anzahl n von Input- und Prozessvariablen<br />
zu. Daraus folgt aber sofort, dass die Anzahl der redundanten oder unwesentlichen<br />
Input- und Prozessvariablen ebenfalls zunimmt und aufgrund des zunehmenden Grades<br />
der Multikollinearität die numerischen Fehler bei der Lösung des Normalgleichungssystems<br />
größer werden.<br />
Die beiden Terme des unbedingten Vorhersagefehlers (das ist auch der Vorhersagefehler im<br />
2 ⎛ n ⎞<br />
linearen Modell mit festen Input- und Prozessvariablen) UNn , = σY / X ⎜1<br />
+ ⎟ zeigen<br />
⎝ N − n −1⎠<br />
2<br />
unterschiedliches Verhalten. Die Folge { σY / X ( n ) }, n → ∞ ist antiton (monoton nicht wachsend,<br />
wenn die Anzahl der Input- und Prozessvariablen größer wird) und<br />
⎛ n ⎞<br />
⎜1 + , n → ∞<br />
⎝<br />
⎟<br />
N − n −1⎠<br />
ist streng isoton (monoton wachsend). Die Abbildung 5.14.1 zeigt, dass ein p* = p*(N) mit<br />
p* ∈ {0, 1, …, n} gefunden werden kann, für dass p < p* und p > p* U N.p > U N,p* ist. Das p*<br />
wollen wir optimale Anzahl nennen.<br />
Mit den Auswahlverfahren sollen sowohl das p* wie auch die wesentlichen Input- und Prozessvariablen<br />
gefunden werden.<br />
Dabei beinhaltet die Teilmenge der unwesentlichen Input- und Prozessvariablen diejenigen<br />
Variablen, die<br />
•<br />
•<br />
entweder mit den Produktvariablen nicht oder nur sehr gering korreliert<br />
oder aber redundant sind.<br />
Neben der „Vorhersage“ der Produktvariablen aufgrund von Werten für die Input- und<br />
Prozessvariablen ist somit die Auswahl der wesentlichen Input- und Prozessvariablen ein<br />
vorrangiges Ziel der Anwendung der Regressionsanalyse sowohl mit bekannten, festen (nicht<br />
stochastischen) als auch stochastischen Input- und Prozessvariablen.<br />
σ Y/X<br />
<br />
→ ∞<br />
<br />
+ n<br />
1 ,<br />
N − n −1<br />
n<br />
σ Y/X<br />
optimale Anzahl<br />
n<br />
Abb. 5.14.1: Optimale Anzahl p*
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
307<br />
Es ist notwendig an dieser Stelle noch einmal darauf hinzuweisen, dass es zwischen den beiden<br />
Modellen grundsätzliche Unterschiede gibt. Diese sind:<br />
Wird in dem Modell mit festen Input- und Prozessvariablen z. B. X n gestrichen, dann<br />
• verändert sich das Modell<br />
n<br />
T<br />
Yx . , mit<br />
Yj . j<br />
j = 1<br />
Y = β ⋅ x + ε ε = Y −∑ β x<br />
in das Modell<br />
Y<br />
n−1<br />
∑<br />
= β x + ε *,<br />
Y.<br />
j<br />
j = 1<br />
j<br />
in dem E(ε*) verschieden von null ist.<br />
• Im Modell mit stochastischen Input- und Prozessvariablen<br />
Y = β 0 + β Y/X X + F Y/X ,<br />
mit<br />
β T Y/X = σ Y.X Σ–1 YY , β 0 = µ Y – β Y/X μ X und F Y/X = Y – E[Y/X] ~ N 1 (0, σ2 Y/X )<br />
und<br />
Y und F Y/X sind unabhängig voneinander,<br />
gilt auch nach der Streichung des Input- oder Prozessvariables X n , dass<br />
F Y/X = Y – E[Y/X] ~ N 1 (0, σ 2 Y/X ) ist.<br />
Es ist aber klar, in diesem Modell wird σ 2 Y/X größer.<br />
Alle Verfahren zur Auswahl der wesentlichen Input- und Prozessvariablen werden unter der<br />
Bezeichnung Teilmengenregression subl imiert. Die meisten Verfahren entstanden unter der<br />
Annahme, dass die Input- und Prozessvariablen feste Einstellgrößen sind. Diese Annahme<br />
ist – zumindest für die Anwendung der Verfahren zur statistischen Analyse von Prozessen<br />
– nicht gerechtfertigt, denn zumindest die Inputvariablen sind Zufallsgrößen, da sie als<br />
Produktvariablen von Vorläuferprozessen aufgefasst werden müssen. Diese Verfahren, siehe<br />
z. B. Hocking [1972, 1976], Hocking and Leslie [1967], Thompson [1978], Kinal and Lahiri<br />
[1983], Mallows [1966, 1977]Miller [1990] und viele andere, werden nicht im Detail beschrieben,<br />
sondern nur für die Einschätzung des universellen Red-Verfahrens von Jahn [1984,<br />
1991] verwendet.<br />
5.14.2 Welche Verfahren können für die Auswahl optimaler Teilmengen<br />
von „fixen“ Input- und Prozessvariablen verwendet werden?<br />
Für das Modell mit festen Input- und Prozessvariablen (feste Einstellgrößen) wurden in den<br />
letzten Jahren zahlreiche Auswahlverfahren entwickelt. Diese Verfahren lassen sich in drei<br />
Gruppen einteilen.
308 5 Qualität in der Fertigung<br />
1. Berechnungsalgorithmen zum Auffinden der besten Anpassungsteilmengen.<br />
Die se Verfahren basieren entweder auf dem „Kleinst Quadrat Anpassungskriterium“, der<br />
Minimax Anpassung oder der L 1 bzw. L ∞ Anpassung. Bei all diesen Verfahren müssen die<br />
Restsummen der Abweichungsquadrate für alle 2 n – 1 Teilmengen berechnet werden. Das ist<br />
ein Riesenaufwand, vgl. z. B. Edwards and Havra’nek [1987].<br />
2. Vorhersagefehler Minimierungsverfahren.<br />
Der Vorhersagefehler für das Modell mit festen Input- und Prozessvariablen wird genauso<br />
berechnet wie der unbedingte Vorhersagefehler im Modell mit stochastischen Input- und<br />
Prozessvariablen. Auswahlverfahren, die darauf basieren, sind das C p -Verfahren von Mallows<br />
[1973], das PSS von Allen [1971] und das BIC von Schwarz [1978]. Informationstheoretische<br />
Betrachtungen im Zusammenhang mit dem Vorhersagefehler führen auf das AIC von Akaike<br />
[1973, 1976].<br />
An dieser Stelle soll nur das C p Kriterium von Mallows für das lineare Modell mit festen Input-<br />
und Prozessvariablen etwas ausführlicher skizziert werden. Nach obigen Grundanliegen<br />
soll der Vektor x der festen Input- und Prozessvariablen in zwei Teilvektoren zerlegt werden.<br />
Dabei beinhaltet der Teilvektor x(k) die wesentlichen und x(h) die unwesentlichen Input- und<br />
Prozessvariablen, wobei k = (k 1 , …, k p ), mit<br />
mit<br />
k 1 < … < k p die Teilmenge der Indices für die wesentlichen und h = (h 1 , …, h n – p ),<br />
h 1 < … < h n – p die Teilmenge der Indices der unwesentlichen Variablen bezeichnen.<br />
Das Teilmengenregressionsmodell lautet dann<br />
Y = β T Y.k x (k) + ε(k).<br />
Der Vorhersagefehler für dieses Modell ist<br />
N = E[ Y − Yˆ( k)] = + var[ Yˆ( k)] + { E[ Yˆ( k) − Y]}<br />
.<br />
N.<br />
p<br />
2 2 2<br />
σR<br />
Eine Mittelung über die Zeilen der Design Matrix x liefert<br />
N N N N<br />
2 2 2<br />
U ˆ ˆ ˆ<br />
Npi , , = E[ Yi − Yi( k)] = N σR + var[ Yi( k)] + { E[ Yi( k) − Yi]}<br />
i= 1 i= 1 i= 1 i=<br />
1<br />
∑ ∑ ∑ ∑ .<br />
Mallows betrachtet nun das folgende Kriterium<br />
1 ⎛<br />
N<br />
N<br />
ˆ ˆ<br />
2<br />
⎞<br />
Γ p = var [ Y<br />
2<br />
i( k)] { E[ Yi( k) Yi]}<br />
σ<br />
⎜∑<br />
+ ∑ −<br />
R ⎝<br />
⎟<br />
i= 1 i=<br />
1<br />
⎠<br />
1<br />
[ ˆ T T<br />
( ) ˆ T<br />
= E Y k − β<br />
2<br />
Yxk . ( ) x( k)] E[ Y( k) − βYxk<br />
. ( ) x( k)]<br />
+ p .<br />
σR<br />
Den Bias<br />
ˆ T T<br />
[ ( ) ( )] [ ˆ T<br />
E Y k − β x k E Y( k) − β x( k) = SSB]<br />
Yxk . ( ) Yxk . ( )
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
309<br />
kann man ausdrücken durch<br />
xkT ( )<br />
T<br />
xkT ( )<br />
Yxk . ( ) Yxk . ( )<br />
SSE = ⎡Y B ⎤ ⎡Y B ⎤<br />
⎣<br />
−<br />
⎦ ⎣<br />
−<br />
⎦<br />
= RSE (Bezeichnung in manchen Programmen).<br />
Der Erwartungswert von SSE ist E (SSE) = ( N − p) σ R + SSB .<br />
Für die Schätzung von Γ p verwendet Mallows die Statistik<br />
2<br />
( N − p)<br />
σˆ<br />
R<br />
Cp = + 2 p − N ≈ p.<br />
ˆ<br />
2<br />
σ<br />
R<br />
3. Testverfahren<br />
Zu diesen V erfahren gehören die stufenweisen oder schrittweisen Verfahren (Vorwärts- und<br />
Rückwärtsauswahl) von Draper, Smith [1981], Miller [1990] als die bekanntesten. Außerdem<br />
gehören der overall F-Test und der finite intersection Test von Krishnaiah [1982] zu dieser<br />
Gruppe.<br />
Die stufenweisen Verfahren verwenden die F-Statistik<br />
Fˆ<br />
T T −1<br />
T<br />
Y ⋅ Xj ⋅ Xj ⋅ Xj ⋅ Xj<br />
⋅Y ⋅ N −<br />
j =<br />
T T −1<br />
T<br />
Y ⋅[ I − Xj ⋅( Xj ⋅ Xj ) ⋅ Xj]<br />
⋅Y<br />
( ) ( 1)<br />
zur Prüfung der Einzelhypothese H 0,j : β Y/j = 0, für j = 1, …, n, wobei β Y/j aus dem Modell<br />
E[Y] = β Y/j X j kommt. Unter der Normalverteilungsannahme ist F ˆj ∼ F1, N−<br />
1 verteilt.<br />
Wird die H 0, j nicht verworfen, dann wird x j als unwesentlich angesehen. Werden die H 0, j<br />
j = 1, …, n verworfen, dann wird die Input- oder Prozessvariable als wesentlich deklariert, der<br />
max ( Fˆ<br />
ˆ<br />
1, …, Fn<br />
) > F α entspricht. Diese Variable ist dann x [1] . Gilt z. B. max ( F ˆ ˆ<br />
1, …, Fn<br />
) = F1,<br />
dann wird x 1 zur wichtigsten Prozessvariablen erklärt. Ist max ( F ˆ ˆ 1, …, Fn<br />
) ≤ F α , dann wird<br />
keine der Input- und Prozessvariablen als wichtig erkannt und die Analyse ist beendet.<br />
Nach dem Auffinden von x 1 wird die zweitwichtigste Input- oder Prozessvariable gesucht.<br />
Hierzu werden die F-Statistiken<br />
mit<br />
T<br />
Y ⋅ M0. ( 2)<br />
ˆ jk ⋅Y ⋅ N −<br />
Fjk<br />
= , j = 1, …,<br />
n<br />
T<br />
Y ⋅ M Y<br />
jk<br />
T T −1 T T T T −1 T −1<br />
0, jk = [ − k ⋅( k ⋅ k ) ⋅ k] ⋅ j [ j ⋅ j − j ⋅ k ⋅( k ⋅ k ) ⋅ k ⋅ j ] ⋅ j<br />
−1<br />
⎡ X<br />
T T<br />
⎛ k⎞ ⎤ X<br />
T T<br />
⎛ k⎞<br />
= I − ( Xj , Xk ) ⋅ ⎢⎜ ( xk Xj<br />
)<br />
X ⎟ ⋅ ⎥ ⎜<br />
j<br />
X ⎟<br />
j<br />
M I X X X X X X X X X X X X X X<br />
⎢⎣⎝ ⎠ ⎥⎦<br />
⎝ ⎠<br />
berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen, d. h. ist<br />
max ( Fˆ<br />
ˆ<br />
12, …, F1 n)<br />
≤ F1<br />
α , dann ist keine der Prozessvariablen X 2 , …, X n wesentlich und wir sind<br />
fertig. F 1α ist der obere 100α % Punkt der zentralen F-Verteilung. Wenn max ( F ˆ ˆ<br />
12, …, F1 n)<br />
> F1<br />
α ,<br />
dann ist die zu dem Maximum gehörende Variable die zweit wich tigste Input- oder Prozessvariable.<br />
In dieser Weise wird das Verfahren fortgesetzt.<br />
Die F-Statistik ist nichts anderes als der Test zur Prüfung der Hypothese<br />
2
310 5 Qualität in der Fertigung<br />
H 0 : β Y.j = 0 für das klassische Modell E[Y] = β Y.j X j , für j = 1, …, n. Für dieses Modell ist F j<br />
zentral F-verteilt mit (1, N – 1) FG. Wenn H 0 „wahr“ ist, dann ist x j unwichtig. Wenn H 0 nicht<br />
„wahr“ ist, dann bedeutet das jedoch nicht, dass x j im 1. Schritt in die Prozessgleichung einbezogen<br />
wird. In der 1. Stufe, wenn alle Prozessvariablen nicht unwesentlich sind, picken wir<br />
nur die wesentlichste heraus und formulieren keine Aussage über die Auswahl der anderen<br />
Prozessvariablen, die als nicht unwichtig deklariert werden. Das Vorgehen führt somit in einen<br />
Bereich, in dem keine Entscheidung getroffen wird.<br />
Bei diesem Verfahren werden die n Einzelhypothesen individuell und nicht simultan geprüft,<br />
denn der Fehler 1. Art wird in jeder Stufe separat gewählt unter der Bedingung, dass<br />
P[F j ≤ F α/H0,j ] = 1 – α. Nehmen wir nun an, dass für ein beliebiges j das Modell E[Y] = β Y.j X j<br />
nicht korrekt ist, dann ist F nicht zentral F-verteilt mit<br />
(1, N – 1) FG.<br />
Betrachten wir nur einmal in der r-te Stufe das Modell<br />
E[Y] = β Y.1 X 1 + … + β Y.r X r + β Y.j X j für j = r + 1, …, n. Dann gilt auch hier, dass die F-Statistik<br />
diejenige Statistik ist, die zur Prüfung der H 0 unter diesem Modell ist. Damit wird deutlich,<br />
dass auf der (j + 1)-ten Stufe der kritische F j, α Wert gewählt wird, ohne Beachtung der Entscheidungen<br />
in den vorangegangenen Stufen. Nimmt man z. B. die 2. Stufe, dann sollte man die<br />
bedingten Wahrscheinlichkeiten P[F 1j ≤ F 1α /H 0 ; max(F 1 , …, F n ) ≥ F α ] für j = 2, …, n berechnen,<br />
um den Fehler 1. Art für die Prüfung der H 0 für ein gegebenes j anstelle der P[F 1j ≤ F α /H 0 ] zu<br />
bestimmen, denn wir wollen ja zur 2. Stufe übergehen, nur wenn max ( Fˆ<br />
ˆ<br />
12, …, F1<br />
n)<br />
> F α .<br />
Beispiel 5.14.1: Chemischer Prozess. Teilmengenregressionen<br />
Auswahl der wesentlichen Input- und Prozessvariablen nach dem C p -Kriterium von Mallows.<br />
Die Auswahl wird mit dem Datensatz 05.7.1 chem. Prozess demonstriert.<br />
Die Produktvariable ist Y 1 , als Prozessvariablen habe ich aus der Gesamtmenge der Inputund<br />
Prozessvariablen die folgende Teilmenge der Prozessvariablen ausgewählt und mit<br />
den Buchstaben A bis L bezeichnet, da das Programm von Mallows Buchstaben anstelle<br />
von Symbolen erwartet.<br />
X 3 = A<br />
X 4 = B<br />
X 5 = C<br />
X 6 = D<br />
X 7 = E<br />
X 9 = F<br />
X 16 = G<br />
X 17 = H<br />
X 18 = I<br />
X 19 = J<br />
X 20 = K<br />
X 21 = L<br />
Der Stichprobenumfang umfasst N = 107 Beobachtungsvektoren.<br />
Die Anzahl der möglichen Modellansätze ist 2 12 = 4096.<br />
Es ist vollkommen klar, dass ich nicht alle 4096 Detailergebnisse hier darstellen kann. Daher<br />
wähle ich nur eine Teilmenge von Resultaten aus.
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
311<br />
Die Teilmengen mit einer Prozessvariablen sind<br />
Model Results<br />
--------------------------------------------------------------------<br />
Adjusted<br />
Included<br />
MSE R-Squared R-Squared Cp Variables<br />
--------------------------------------------------------------------<br />
47,5433 0,0 0,0 207,759<br />
44,5049 7,27389 6,39078 187,01 A<br />
46,4821 3,15448 2,23214 199,893 B<br />
47,5433 0,943396 0,0 209,731 C<br />
38,1133 20,5909 19,8346 145,359 D<br />
47,5433 0,943396 0,0 207,453 E<br />
30,7136 36,008 35,3986 97,1408 F<br />
45,6049 4,98194 4,07701 194,178 G<br />
26,0692 45,6846 45,1673 66,8763 H<br />
25,4059 47,0667 46,5626 62,5538 I<br />
44,7453 6,77295 5,88507 188,576 J<br />
45,6593 4,86876 3,96275 194,532 K<br />
44,1012 8,11493 7,23983 184,379 L<br />
Teilmengen mit zwei Prozessvariablen<br />
44,9072 7,32686 5,54468 188,844 AB<br />
44,8954 7,35104 5,56933 188,768 AC<br />
36,7184 24,2257 22,7685 135,991 AD<br />
44,9241 7,29186 5,50901 188,953 AE<br />
24,8555 48,7066 47,7202 59,4249 AF<br />
42,5661 12,1581 10,4688 173,734 AG<br />
26,258 45,8124 44,7704 68,4767 AH<br />
25,5116 47,3528 46,3403 63,659 AI<br />
Teilmengen mit drei Prozessvariablen<br />
45,3041 7,40662 4,70972 190,594 ABC<br />
36,8847 24,6144 22,4187 136,776 ABD<br />
45,289 7,43763 4,74164 190,497 ABE<br />
25,0909 48,7188 47,2252 61,3867 ABF<br />
42,9776 12,1617 9,60326 175,723 ABG<br />
26,5118 45,8148 44,2366 70,4692 ABH<br />
25,7582 47,355 45,8216 65,6522 ABI<br />
43,0642 11,9846 9,42104 176,276 ABJ<br />
43,9621 10,1495 7,53251 182,016 ABK<br />
45,3041 7,40662 4,70972 190,594 ABC<br />
36,8847 24,6144 22,4187 136,776 ABD<br />
45,289 7,43763 4,74164 190,497 ABE<br />
25,0909 48,7188 47,2252 61,3867 ABF<br />
42,9776 12,1617 9,60326 175,723 ABG<br />
26,5118 45,8148 44,2366 70,4692 ABH<br />
25,7582 47,355 45,8216 65,6522 ABI<br />
43,0642 11,9846 9,42104 176,276 ABJ<br />
43,9621 10,1495 7,53251 182,016 ABK
312 5 Qualität in der Fertigung<br />
44,1848 9,69442 7,06416 183,439 EKL<br />
22,5179 53,9776 52,6371 44,9394 FGH<br />
21,9735 55,0902 53,7821 41,4596 FGI<br />
28,8272 41,0824 39,3664 85,2701 FGJ<br />
29,5788 39,5463 37,7855 90,0747 FGK<br />
28,2781 42,2048 40,5215 81,7598 FGL<br />
20,0571 59,007 57,813 29,2095 FHI<br />
Teilmengen mit vier Prozessvariablen<br />
31,5516 36,1403 33,636 102,727 ABCD<br />
45,7117 7,48072 3,85251 192,363 ABCE<br />
25,3001 48,7932 46,7851 63,154 ABCF<br />
43,3714 12,2174 8,77489 177,548 ABCG<br />
26,1166 47,1406 45,0677 68,3227 ABCH<br />
25,3429 48,7066 46,6951 63,4247 ABCI<br />
43,4204 12,1182 8,67186 177,858 ABCJ<br />
44,3193 10,2989 6,78124 183,548 ABCK<br />
44,3107 10,3163 6,79932 183,494 ABCL<br />
34,7803 29,6056 26,8451 123,165 ABDE<br />
25,0574 49,2845 47,2957 61,6174 ABDF<br />
35,457 28,2359 25,4216 127,449 ABDG<br />
26,7585 45,8414 43,7175 72,386 ABDH<br />
26,0094 47,3576 45,2932 67,6439 ABDI<br />
36,4121 26,3029 23,4128 133,494 ABDJ<br />
37,1576 24,794 21,8447 138,214 ABDK<br />
Teilmengen mit 5 Prozessvariablen<br />
36,7797 26,2887 22,6396 135,539 ACEGJ<br />
42,5645 14,6951 10,4721 171,799 ACEGK<br />
42,2385 15,3485 11,1578 169,755 ACEGL<br />
22,3575 55,1926 52,9744 45,1393 ACEHI<br />
25,2319 49,432 46,9286 63,1561 ACEHJ<br />
26,149 47,594 44,9996 68,9047 ACEHK<br />
25,6355 48,6232 46,0798 65,6858 ACEHL<br />
24,4621 50,9747 48,5477 58,3311 ACEIJ<br />
25,4623 48,9702 46,444 64,6003 ACEIK<br />
24,7337 50,4303 47,9764 60,0338 ACEIL<br />
42,6308 14,5622 10,3326 172,215 ACEJK<br />
Teilmengen mit 6 Prozessvariablen<br />
26,1567 48,0976 44,9835 69,3295 DEFGKL<br />
17,8856 64,5098 62,3804 17,9989 DEFHIJ<br />
18,375 63,5388 61,3511 21,0359 DEFHIK<br />
16,7221 66,8186 64,8277 10,7779 DEFHIL<br />
21,9859 56,3736 53,756 43,4456 DEFHJK<br />
21,5517 57,2352 54,6693 40,7509 DEFHJL<br />
23,7889 52,7959 49,9637 54,6351 DEFHKL
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
313<br />
Teilmengen mit 7 Prozessvariablen<br />
27,39 46,1938 42,3893 77,284 BCEFGKL<br />
18,0465 64,5487 62,042 19,8774 BCEFHIJ<br />
18,5408 63,5777 61,0023 22,9143 BCEFHIK<br />
16,742 67,1113 64,7858 11,8625 BCEFHIL<br />
22,0387 56,7062 53,645 44,4055 BCEFHJK<br />
21,3412 58,0764 55,1121 40,12 BCEFHJL<br />
23,1807 54,4627 51,2429 51,422 BCEFHKL<br />
Teilmengen mit 8 Prozessvariablen<br />
23,9941 53,341 49,5321 56,9304 ACEFGJKL<br />
17,5608 65,8513 63,0636 17,8034 ACEFHIJK<br />
15,7099 69,4505 66,9566 6,54646 ACEFHIJL<br />
16,7391 67,4492 64,7919 12,8058 ACEFHIKL<br />
20,589 59,9625 56,6942 36,2209 ACEFHJKL<br />
19,9684 61,1693 57,9995 32,4466 ACEFIJKL<br />
Teilmengen mit 9 Prozessvariablen<br />
20,8595 59,8505 56,1253 38,5712 BCEFGIJKL<br />
15,6886 69,8033 67,0015 7,44312 BCEFHIJKL<br />
21,1712 59,2505 55,4696 40,448 BCEGHIJKL<br />
17,1917 66,9102 63,84 16,4915 BCFGHIJKL<br />
17,5588 66,2036 63,0678 18,7015 BDEFGHIJK<br />
15,8758 69,4428 66,6076 8,5704 BDEFGHIJL<br />
16,4236 68,3885 65,4555 11,8678 BDEFGHIKL<br />
21,9824 57,6892 53,7634 45,3311 BDEFGHJKL<br />
21,139 59,3125 55,5374 40,2539 BDEFGIJKL<br />
15,6909 69,7989 66,9967 7,45684 BDEFHIJKL<br />
Teilmengen mit 10 Prozessvariablen<br />
16,5797 68,4171 65,1272 13,7785 BCDEFGHIKL<br />
21,5669 58,9168 54,6373 43,4915 BCDEFGHJKL<br />
20,8591 60,2652 56,1262 39,2742 BCDEFGIJKL<br />
15,8501 69,8069 66,6617 9,43186 BCDEFHIJKL<br />
20,9867 60,022 55,8577 40,0348 BCDEGHIJKL<br />
17,1039 67,4185 64,0246 16,9016 BCDFGHIJKL<br />
15,8428 69,8207 66,6771 9,38847 BCEFGHIJKL<br />
15,8457 69,8152 66,671 9,40572 BDEFGHIJKL<br />
Teilmengen mit 11 Prozessvariablen<br />
15,9586 69,9168 66,4334 11,0881 ABCDEFHIJKL<br />
20,524 61,3108 56,831 38,004 ABCDEGHIJKL<br />
17,2566 67,47 63,7034 18,7405 ABCDFGHIJKL<br />
15,9447 69,9431 66,4628 11,0057 ABCEFGHIJKL<br />
15,9527 69,9279 66,4459 11,0533 ABDEFGHIJKL<br />
15,9463 69,94 66,4594 11,0153 ACDEFGHIJKL<br />
16,0081 69,8236 66,3294 11,3796 BCDEFGHIJKL<br />
Teilmenge mit allen 12 Prozessvariablen<br />
16,1133 69,9449 66,1081 13,0 ABCDEFGHIJKL
314 5 Qualität in der Fertigung<br />
Tabelle 5.14.1: Kleinste C p innerhalb der Teilmengen gleicher Mächtigkeit<br />
Models with Smallest Cp<br />
Model Results<br />
----------------------------------------------------------------<br />
Adjusted<br />
Included<br />
MSE R-Squared R-Squared Cp Variables<br />
----------------------------------------------------------------<br />
15,4953 69,2528 67,408 3,16473 EFHIJL<br />
15,4133 69,7215 67,5806 3,69893 EFHIJKL<br />
15,5857 69,3828 67,218 4,75808 AEFHIJL<br />
15,6116 69,3319 67,1634 4,91743 DEFHIJL<br />
15,6167 69,3218 67,1526 4,94894 BEFHIJL<br />
15,6168 69,3217 67,1526 4,94916 EFGHIJL<br />
15,4847 69,8885 67,4304 5,17655 AEFHIJKL<br />
15,548 69,7653 67,2972 5,5618 BEFHIJKL<br />
15,5531 69,7555 67,2865 5,59256 EFGHIJKL<br />
15,556 69,7497 67,2803 5,61057 DEFHIJKL<br />
15,5592 69,7435 67,2736 5,62989 CEFHIJKL<br />
15,6304 69,9152 67,1238 7,09298 ACEFHIJKL<br />
15,6324 69,9114 67,1197 7,10487 AEFGHIJKL<br />
15,6387 69,8992 67,1063 7,14302 ADEFHIJKL<br />
15,6422 69,8925 67,0991 7,16386 ABEFHIJKL<br />
15,6886 69,8033 67,0015 7,44312 BCEFHIJKL<br />
16,3819 67,4935 65,5431 8,667 EFGHIL<br />
15,7809 69,9388 66,8074 9,01932 ACEFGHIJKL<br />
16,5957 66,7401 65,0935 9,02353 EFHIL<br />
15,7896 69,922 66,7889 9,07166 ABEFGHIJKL<br />
15,7901 69,9212 66,788 9,07414 ADEFGHIJKL<br />
15,7928 69,9159 66,7822 9,09072 ACDEFHIJKL<br />
15,7929 69,9159 66,7822 9,09076 ABCEFHIJKL<br />
16,5026 67,2541 65,2894 9,41573 EFHIKL<br />
16,6609 66,94 64,9564 10,3981 BEFHIL<br />
16,7079 66,8466 64,8574 10,6902 CEFHIL<br />
15,9447 69,9431 66,4628 11,0057 ABCEFGHIJKL<br />
15,9463 69,94 66,4594 11,0153 ACDEFGHIJKL<br />
15,9527 69,9279 66,4459 11,0533 ABDEFGHIJKL<br />
15,9586 69,9168 66,4334 11,0881 ABCDEFHIJKL<br />
16,0081 69,8236 66,3294 11,3796 BCDEFGHIJKL<br />
16,1133 69,9449 66,1081 13,0 ABCDEFGHIJKL<br />
17,6875 64,552 62,7971 15,867 BFHIL<br />
17,8372 64,2519 62,4822 16,8056 EFHIJ<br />
17,848 64,2303 62,4595 16,8731 DFHIL<br />
18,2284 63,4679 61,6594 19,2575 EFHIK<br />
18,6575 62,2376 60,7567 21,1054 FHIL<br />
18,8727 61,8022 60,3042 22,4673 EFHI<br />
19,3647 60,8064 59,2694 25,5817 DFHI<br />
19,3769 60,7817 59,2438 25,6587 FGHI<br />
19,6796 60,1689 58,6069 27,5753 FHIK<br />
20,0571 59,007 57,813 29,2095 FHI<br />
21,5712 55,9124 54,6283 38,8881 FIJ<br />
21,7327 55,5824 54,2887 39,9202 HIL<br />
21,9735 55,0902 53,7821 41,4596 FGI<br />
22,1304 54,7696 53,4522 42,4623 FHJ<br />
22,7717 53,0069 52,1032 45,9754 FI<br />
23,3479 51,818 50,8914 49,6938 FH<br />
23,6865 51,1191 50,1791 51,8795 HI<br />
24,6811 49,0666 48,0871 58,299 GI<br />
24,7316 48,9625 47,981 58,6246 IJ<br />
25,4059 47,0667 46,5626 62,5538 I<br />
26,0692 45,6846 45,1673 66,8763 H<br />
30,7136 36,008 35,3986 97,1408 F<br />
38,1133 20,5909 19,8346 145,359 D<br />
44,1012 8,11493 7,23983 184,379 L<br />
47,5433 0,0 0,0 207,759<br />
----------------------------------------------------------------
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
315<br />
Cp<br />
240<br />
200<br />
160<br />
120<br />
80<br />
40<br />
0<br />
Mallows' Cp Plot for y1<br />
0 3 6 9 12 15<br />
Number of Coefficients<br />
Abb. 5.14.2: C p -Kriterium von Mallows<br />
Die Darstellung des besten (kleinsten) C p innerhalb jeder Teilmenge von Prozessvariablen<br />
gleichen Umfangs ist in der Abbildung 5.14.2 enthalten.<br />
Diese Abbildung zeigt, dass die Mächtigkeit der Teilmenge mit dem kleinsten C p zwischen<br />
n = 6 und n = 8 zu liegen scheint.<br />
Für eine genauere Bestimmung sucht der Computer innerhalb jeder Mächtigkeit der Teilmengen<br />
das kleinste C p . Die Werte sind in der Tabelle 5.14.1 angegeben.<br />
Das Gesamtmodell (das Modell mit allen 12 Prozessvariablen) ist in der Tabelle 5.14.2<br />
enthalten.<br />
Tabelle 5.14.2: Prozessgleichung mit allen Prozessvariablen<br />
Prozessgleichung<br />
-----------------------------------------------------------------------------<br />
Produktvariable: y1<br />
-----------------------------------------------------------------------------<br />
Standard<br />
T<br />
Parameter Estimate Error Statistic P-Value<br />
-----------------------------------------------------------------------------<br />
CONSTANT -408,705 214,545 -1,90499 0,0598<br />
x3 -0,63914 0,852096 -0,750079 0,4551<br />
x4 0,201308 0,523085 0,384847 0,7012<br />
x5 1,92428 18,9108 0,101756 0,9192<br />
x6 1,27445 17,1746 0,0742055 0,9410<br />
x7 -11,723 3,98068 -2,94496 0,0041<br />
x9 0,322213 0,0597561 5,39213 0,0000<br />
x16 -0,0941571 0,845685 -0,111338 0,9116<br />
x17 89,7031 18,5206 4,84342 0,0000<br />
x18 -91,06 17,9793 -5,06472 0,0000<br />
x19 1,07786 0,47749 2,25734 0,0263<br />
x20 3,53736 2,78535 1,26999 0,2072<br />
x21 0,802039 0,23722 3,381 0,0010<br />
-----------------------------------------------------------------------------<br />
Analysis of Variance<br />
-----------------------------------------------------------------------------<br />
Source Sum of Squares Df Mean Square F-Ratio P-Value<br />
-----------------------------------------------------------------------------<br />
Model 3537,88 12 294,824 18,48 0,0000<br />
Residual 1515,41 95 15,9517<br />
-----------------------------------------------------------------------------<br />
Total (Corr.) 5053,3 107<br />
R-squared = 70,0114 percent<br />
R-squared (adjusted for d.f.) = 66,2233 percent<br />
Standard Error of Est. = 3,99396<br />
Mean absolute error = 2,89319<br />
Durbin-Watson statistic = 1,02239
316 5 Qualität in der Fertigung<br />
Das Maß der Beherrschbarkeit für diesen Ansatz ist R 2 Y.X = 0.700 und die Reststandardabweichung<br />
ist s = 3.9939.<br />
Diese Gleichung kann auch in der üblichen Form<br />
y1 = -408,705 - 0,63914*x3 + 0,201308*x4 + 1,92428*x5 + 1,27445*x6 -<br />
11,723*x7 + 0,322213*x9 - 0,0941571*x16 + 89,7031*x17 - 91,06*x18 +<br />
1,07786*x19 + 3,53736*x20 + 0,802039*x21<br />
geschrieben werden.<br />
Verwendet man die optimale Teilmenge {X 7 , X 9 , X 17 , X 18 , X 19 , X 21 } die man nach dem C p<br />
Kriterium von Mallows über alle möglichen Teilmengen von Prozessvariablen aufgefunden<br />
hat, dann erhält man die Prozessgleichung in folgender Tabelle.<br />
Tabelle 5.14.3: Prozessgleichung für die C p optimale Teilmenge von Prozessvariablen<br />
Optimale Prozessgleichung<br />
-----------------------------------------------------------------------------<br />
Produktvariable: Produktvariablee: y1<br />
-----------------------------------------------------------------------------<br />
Standard<br />
T<br />
Parameter Estimate Error Statistic P-Value<br />
-----------------------------------------------------------------------------<br />
CONSTANT -229,092 48,0022 -4,77254 0,0000<br />
x7 -10,9841 2,41239 -4,5532 0,0000<br />
x9 0,278296 0,043022 6,4687 0,0000<br />
x17 90,2917 15,5109 5,82117 0,0000<br />
x18 -92,135 14,6712 -6,28001 0,0000<br />
x19 0,973529 0,332094 2,93148 0,0042<br />
x21 0,824957 0,203737 4,04912 0,0001<br />
-----------------------------------------------------------------------------<br />
Analysis of Variance<br />
-----------------------------------------------------------------------------<br />
Source Sum of Squares Df Mean Square F-Ratio P-Value<br />
-----------------------------------------------------------------------------<br />
Model 3501,64 6 583,607 37,99 0,0000<br />
Residual 1551,65 101 15,3629<br />
-----------------------------------------------------------------------------<br />
Total (Corr.) 5053,3 107<br />
R-squared = 69,2942 percent<br />
R-squared (adjusted for d.f.) = 67,4701 percent<br />
Standard Error of Est. = 3,91956<br />
Mean absolute error = 2,85277<br />
Durbin-Watson statistic = 1,0026<br />
Bemerkung zur Tabelle 5.14.3<br />
Die 1. Spalte der beiden Tabellen beinhaltet die Parameterbezeichnung, die 2. Spalte die<br />
Koeffizienten der Prozessgleichung. Die Prozessgleichung kann auch in der Form<br />
y1 = -229,092 - 10,9841*x7 + 0,278296*x9 + 90,2917*x17 - 92,135*x18 +<br />
0,973529*x19 + 0,824957*x21<br />
geschrieben werden. In der 3. Spalte stehen die Standardabweichungen für die Koeffizienten<br />
der Prozessgleichung. Die 4. Spalte ist für die Werte der t-Statistik
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
317<br />
t<br />
j<br />
BY.<br />
j N − n<br />
= ⋅<br />
jj<br />
S A<br />
R<br />
mit A jj als einem Diagonalelement von A –1<br />
xx reserviert. Die letzte Spalte beinhaltet die berechneten<br />
Irrtumswahrscheinlichkeiten für den t-Test. Sind diese Werte < 0.05, dann ist<br />
der zugehörige Regressionskoeffizient statistisch gesichert von null verschieden, d. h. dann<br />
hat x j einen wesentlichen Einfluss auf Y.<br />
Das Maß der Beherrschbarkeit des vollständigen Ansatzes sinkt durch den Übergang zum<br />
C p -optimalen Ansatz. Die Reststandardabweichung wird geringfügig kleiner. Das liegt aber<br />
offensichtlich an der Anzahl der FG.<br />
Schrittweise Auswahl der unwesentlichen Prozessvariablen nach dem Verfahren von Draper,<br />
Smith<br />
Das schrittweise Verfahren von Draper Smi th wurde von Miller [1984] beschrieben und vorn<br />
in diesem Abschnitt diskutiert.<br />
Beispiel 5.14.2: Chemischer Prozess. Schrittweise Auswahl der unwesentlichen<br />
Prozessvariablen<br />
Das Verfahren liefert die Prozessgleichung<br />
Tabelle 5.14.4: Ergebnis für die Prozessgleichung nach der schrittweisen Auswahl<br />
Prozessgleichung<br />
-----------------------------------------------------------------------------<br />
Produktvariable: y1<br />
-----------------------------------------------------------------------------<br />
Standard<br />
T<br />
Parameter Estimate Error Statistic P-Value<br />
-----------------------------------------------------------------------------<br />
CONSTANT -224,444 49,8182 -4,50527 0,0000<br />
x7 -10,9184 2,42925 -4,49457 0,0000<br />
x9 0,273991 0,0447462 6,12322 0,0000<br />
x17 90,3134 15,5777 5,7976 0,0000<br />
x18 -92,2535 14,7377 -6,25969 0,0000<br />
x19 0,959545 0,335657 2,85871 0,0052<br />
x21 0,838724 0,207968 4,03294 0,0001<br />
-----------------------------------------------------------------------------<br />
Analysis of Variance<br />
-----------------------------------------------------------------------------<br />
Source Sum of Squares Df Mean Square F-Ratio P-Value<br />
-----------------------------------------------------------------------------<br />
Model 3490,06 6 581,676 37,54 0,0000<br />
Residual 1549,53 100 15,4953<br />
-----------------------------------------------------------------------------<br />
Total (Corr.) 5039,59 106<br />
R-squared = 69,2528 percent<br />
R-squared (adjusted for d.f.) = 67,408 percent<br />
Standard Error of Est. = 3,93641<br />
Mean absolute error = 2,86302<br />
Durbin-Watson statistic = 1,00251
318 5 Qualität in der Fertigung<br />
oder wird in der üblichen Weise geschrieben:<br />
y1 = -224,444 - 10,9184*x7 + 0,273991*x9 + 90,3134*x17 - 92,2535*x18 +<br />
0,959545*x19 + 0,838724*x21<br />
Diese Gleichung stimmt mit der C p -optimalen Gleichung überein. Die geringfügigen Abweichungen<br />
sind numerischer Art.<br />
5.14.3 Red-Auswahlverfahren von Jahn<br />
Für das Modell mit stochastischen Input- un d Prozessvariablen wurde von Jahn [1991] das Red<br />
Auswahlverfahren entwickelt. Dieses Verfahren basiert auf der Reduktion der bedingten Varianz<br />
2<br />
σ Y / X durch Hinzunahme weiterer Input- und Prozessvariablen bzw. auf der Reduzierung dieser<br />
Varianz durch Streichen von Input- und Prozessvariablen und realisiert die Anforderungen an<br />
das optimale p* und die dazu gehörende Teilmenge von wesentlichen Input- und Prozessvariablen.<br />
Außerdem liefert dieses Verfahren die „wahre“ Rangfolge der Input- und Prozessvariable<br />
bzgl. ihres Einflusses auf den (die) Produktvariablen.<br />
Zur Untersuchung der durch die Streichung eines Teilvektors bedingten Veränderungen auf die<br />
Modellparameter Regressionskoeffizienten, bedingte Varianz (Restvarianz),„Vorhersagefehler“,<br />
Maß der Beherrschbarkeit des Prozesses und die Teststatistiken, wird von einer beliebigen,<br />
disjunk ten Zerlegung des Vektors X der Input- und Prozessvariable in X T = [X(k) T , X(h) T ],<br />
mit<br />
k = (k 1 , …, k p ), k 1 < k 2 < … < k p und h = (h 1 , …, h n – p ), h 1 < h 2 < … < h n – p<br />
ausgegangen. Damit erhält man die Zerlegung (siehe Glossar) der positiv definiten Kovarianzmatrix<br />
⎛ΣYY ΣYk ΣYh<br />
⎞<br />
Σ = ⎜ Σkk<br />
Σ ⎟<br />
kh ,<br />
⎜ ⎟<br />
⎝<br />
Σ ⎠<br />
hh<br />
wobei die Teilmatrizen die Ordnungen Σ YY : m × m, Σ kk : p × p, Σ hh : (n – p) × (n – p), Σ Yk : m × p,<br />
Σ Yh : m × (n – p) und Σ kh : p × (n – p) haben.<br />
Entsprechend der Kovarianzmatrix kann man die Momente der bedingten Verteilung, den<br />
bedingten Erwartungswert (Regressionsfunktion) und die bedingte Kovarianzmatrix zerlegen.<br />
Man erhält das folgende Ergebnis.<br />
Zerlegungssatz für die Momente einer bedingten Verteilung:<br />
Es sei Z ~ N m + n (0, Σ), Σ > 0 (positiv defi nit).<br />
und<br />
T<br />
T<br />
Yk . / h βYh . / k<br />
E[ Y/ X( k), X( h)] = β ⋅ X( k) + ⋅ X( h)<br />
T<br />
YY / k Y . h / k hh / k Y . h / k YY / X<br />
var [ Y/ X( k), X(<br />
h)] = Σ − β ⋅ Σ ⋅ β : = Σ ,
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
319<br />
wobei<br />
T<br />
Yk . / h = Yk . / h⋅<br />
−1<br />
kk/<br />
h,<br />
T<br />
−1<br />
Yh . / k = Yh . / k⋅<br />
hh/<br />
k,<br />
−1<br />
Yk . / h Yk Yh<br />
−1<br />
hh hk<br />
Yh . / k<br />
hh / k =<br />
Yh<br />
hh −<br />
Yk<br />
hk ⋅<br />
kk<br />
−1<br />
kk ⋅<br />
kh<br />
kh<br />
kk/<br />
h = kk − kh ⋅<br />
−1<br />
hh ⋅ hk<br />
β Σ Σ<br />
β Σ Σ<br />
Σ<br />
Σ<br />
= Σ<br />
= Σ<br />
− Σ<br />
− Σ<br />
⋅ Σ<br />
⋅ Σ<br />
⋅ Σ<br />
⋅ Σ<br />
= cov{[ Y, X( k)]/ X( h)},<br />
= cov{[ Y, X( h)]/ X( k)},<br />
Σ<br />
Σ<br />
Σ<br />
Σ<br />
Σ<br />
Σ<br />
Σ<br />
Σ<br />
Σ<br />
Σ<br />
,<br />
.<br />
Beweis: Jahn [1991].<br />
Dieser Satz besagt, dass eine Regressionsfunktion als Summe zweier bedingter Regressionsfunktionen<br />
darstellbar ist; einmal zwischen Y und X(k) unter der Bedingung X(h) und zum<br />
anderen zwischen Y und X(h) unter der Bedingung X(k). Analog zerfällt die bedingte Kovarianzmatrix<br />
ebenfalls in zwei Bestandteile; einmal die bedingte Kovarianzmatrix des Vektors<br />
der Produktvariable Y unter der Bedingung X(k) und zum anderen in die quadratische Form<br />
T<br />
βYh . / k⋅Σhh/ k⋅β Yh . / k.<br />
Diese Form ist der Anteil, um den die bedingten Varianzen und Kovarianzen von Y unter<br />
der Bedingung X(k) verringert werden, wenn der Teilvektor der Input- und Prozessvariable<br />
X(h) zu dem Teilvektor X(k) hinzu genommen wird. Daher wird die quadratische Form<br />
T<br />
Yh . / k hh/ k Yh . / k<br />
β ⋅Σ ⋅β RED p (h) genannt. Die Umkehr dieser Interpretation ist, Red p (h) ist die<br />
proportionale Vergrößerung der bedingten Varianz z. B. der Produktvariablen Y r , r = 1, …, m<br />
unter der Bedingung X, wenn die Input- und Prozessvariablen X(h) gemeinsam gestrichen<br />
werden.<br />
Was bedeutet die Teilmengenregression?<br />
Die Zerlegung des bedingten Erwartungswertes und der bedingten Varianz dienen dem Auffinden<br />
eines Auswahlverfahrens für eine optimale Teilmenge von Input- und Prozessvariablen<br />
im Sinne der Minimierung des unbedingten Vorhersagefehlers und der Auseinandersetzung<br />
mit der Hocking’schen Teilmengenregression, die z. B. in Hocking and Lesie [1967], Hocking<br />
[1972, 1976], beschrieben wurde.<br />
T<br />
Y / k () Y / k<br />
Y = β ⋅ X k + F<br />
T<br />
1<br />
mit F Y/k ∼ N p (0, Σ YY/k ) und ist unabhängig von X(k), wobei βY / k = ΣY.<br />
k Σkk<br />
− . Der Vergleich der<br />
Teilmengenregression mit dem Zerlegungssatz zeigt eine Übereinstimmung des vollständigen<br />
Ansatzes mit der Teilmengenregression nur für den Fall Σ Yh = 0 und Σ kh = 0. Ist nur Σ kh = 0,<br />
dann gilt<br />
mit<br />
T<br />
T<br />
Y / k () βY / h () Y / X<br />
Y = β ⋅ X k + ⋅ X h + F<br />
Y / X = YY T<br />
/ k − Y / h ⋅ YY / h ⋅ Y / h<br />
var ( F ) Σ β Σ β .<br />
Da diese Fälle bei praktischen Anwendungen erkannt würden, besitzen sie nur theoretisches<br />
Interesse. Über die Auswirkung der Streichung von X(h) aus dem Ansatz gibt der folgende<br />
Satz Auskunf t.
320 5 Qualität in der Fertigung<br />
Satz: Unter den bisherigen Voraussetzungen gilt<br />
und damit<br />
T T T<br />
−1<br />
Y / k = Y. k/ h + Y. h/<br />
k ⋅ hk ⋅ kk,<br />
T<br />
−1<br />
Y / k = Y / X + βY. h/<br />
k ⋅ − Σhk ⋅ Σkk<br />
β β β Σ Σ<br />
F F [ X( h) ]<br />
T<br />
YY/ k = YY/ X + Yh . / k⋅ hh/ k⋅<br />
Yh . / k.<br />
Σ Σ β Σ β<br />
Die Elemente der bedingten Kovarianzmatrix Σ YY/k sind größer als die von Σ YY/X und zwar um<br />
genau die Elemente von Red p (h).<br />
Die Vorhersagefehler der Teilmengenregression sind<br />
und<br />
T<br />
T −1<br />
N. k= ΣYY / k+ βY. h/ k⋅ Σhh/ k⋅βY. h/<br />
k ⋅ + E ⋅ kk⋅<br />
E<br />
M ( ) [1 X () k A X ()] k<br />
U<br />
⎛ p ⎞<br />
= ( + ⋅ ⋅ ) ⋅ ⎜1+<br />
⎝ N − p −1⎟<br />
⎠ .<br />
T<br />
N. k ΣYY / k βY. h/ k Σhh/ k βY. h/<br />
k<br />
Der Vergleich der beiden unbedingten Vorhersagefehler U N.n und U N.k liefert ein erstes Indiz<br />
für die Konstruktion des Auswahlverfahrens, denn die Diagonalelemente der Vorhersagefehlermatrizen<br />
sind die Vorhersagefehler für jede Produktvariable Y j , j = 1, …, m und für diese<br />
genügt es, wenn gilt<br />
mit<br />
n − p<br />
N − n −1<br />
T<br />
Yh . / k⋅ hh/ k⋅ Yh . / k ≤ YY/ X ⋅ .<br />
β Σ β Σ<br />
T<br />
Y ⋅ M0. ( 2)<br />
ˆ jk ⋅Y ⋅ N −<br />
Fjk<br />
= , j = 1, …,<br />
n<br />
T<br />
Y ⋅ M Y<br />
jk<br />
T T −1 T T T T −1 T −1<br />
0, jk = ( − k ⋅( k ⋅ k ) ⋅ k) ⋅ j [ j ⋅ j − j ⋅ k ⋅( k ⋅ k ) ⋅ k ⋅ j ] ⋅ j<br />
−1<br />
⎡ X<br />
T T<br />
⎛ k⎞ ⎤ X<br />
T T<br />
⎛ k⎞<br />
= I − ( Xj , Xk ) ⋅ ⎢⎜ ( Xk Xj<br />
)<br />
X ⎟ ⋅ ⎥ ⎜<br />
j<br />
X ⎟<br />
j<br />
M I X X X X X X X X X X X X X X<br />
⎢⎣⎝ ⎠ ⎥⎦<br />
⎝ ⎠<br />
berechnet. Die Entscheidungen werden entsprechend dem 1. Schritt vorgenommen.<br />
Die Vorhersagefehler sind unbekannt und müssen ebenfalls bestimmt werden. Die ML-Schätzfunktion<br />
für den Vorhersagefehler ist<br />
ˆ 2 ⎛<br />
. / 1 n ⎞<br />
UNn = SY X ⎜ +<br />
⎝<br />
⎟<br />
N − n −1⎠<br />
.<br />
Der Vorhersagefehler kann nun mit der Stichprobenkovarianzmatrix und dem geschätzten<br />
Red nach der Formel<br />
ˆ ˆ<br />
2 ⎛ p ⎞<br />
UNn ′ . = [Red p( h) + ( N − n − 1) SY/<br />
X] ⎜1<br />
+<br />
⎝ N − p −1⎟<br />
⎠<br />
bestimmt werden.
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
321<br />
Bei einem sehr hohen Grad der Multikollinearität δ können Sie anstelle der Stichprobenkovarianzmatrix<br />
besser die Stichprobenkorrelationsmatrix R<br />
ˆ ˆ<br />
2 ⎛ p ⎞<br />
UNn ′′ . = [Red′ p( h) + ( N − n − 1) SY′ / X] ⎜1<br />
+<br />
⎝ N − p −1⎟<br />
⎠<br />
verwenden, wobei ˆRed ′ p( h ) mit den Diagonalelementen der inversen Korrelationsmatrix −1<br />
R XX<br />
2<br />
gebildet wird. Analoges gilt für S′ Y / X .<br />
Die ML-Schätzfunktionen für den unbedingten Vorhersagefehler können umgeschrieben<br />
werden. Man erhält<br />
ˆ ˆ<br />
2 ⎛ p ⎞<br />
UNn ′ . = [Red p( h) + ( N − n − 1) SY/<br />
X] ⎜1<br />
+<br />
⎝ N − p −1⎟<br />
⎠<br />
ˆ<br />
2 N − 1<br />
= [Red p( h) + ( N − n −1) SY / X]<br />
N − p −1<br />
ˆ ˆ<br />
2 ⎛ p ⎞<br />
UNn ′′ . = [Red′ p( h) + ( N − n − 1) SY′ / X) ⎜1<br />
+<br />
⎝ N − p −1⎟<br />
⎠<br />
ˆ<br />
2 N − 1<br />
= [Red′ p( h) + ( N − n − 1) SY′<br />
/ X)<br />
.<br />
N − p −1<br />
N ist konstant, daher kann man die Vorhersage im Sinne des Kriterium von Mallows umschreiben,<br />
d. h. N – 1 weglassen. Damit erhält man<br />
S<br />
n<br />
2 ˆRed ( ) ( 1)<br />
ˆ p h + N − n − SY / X<br />
= UC, N. n =<br />
.<br />
2<br />
( N − p −1)<br />
p* wird dann geschätzt, indem man für alle möglichen Teilmengen das kleinste U ˆ CNn , . sucht.<br />
Das dazu gehörende p bezeichnet man mit ˆp und betrachtet es als Schätzung für p*. Da ˆp eine<br />
Schätzung für p* ist, die aus den Realisierungen der Produktvariablen Y und des Vektors der<br />
Input- und Prozessvariablen X ermittelt wurde, kann anstelle der Optimalität des Verfahrens<br />
nur die asymptotische Optimalität nachgewiesen werden, d. h. es gilt die Wahrscheinlichkeit,<br />
dass<br />
Uˆ<br />
N. pˆ<br />
( N)<br />
⎯⎯⎯⎯⎯→ 1.<br />
U<br />
N−n( N)<br />
→∞<br />
N.<br />
pˆ<br />
( N)<br />
ˆRed ( ) ( ) ( )<br />
2 2 2 2 T<br />
ph = AY / k− AY / X= N − p ⋅ SY / k− N − n ⋅ SY / X= BY. h/ k⋅ Ahh/ k⋅<br />
BY. h/<br />
k<br />
ist die Schätzfunktion für Red p (h). Die Minimierung des unbedingten Vorhersagefehlers beinhaltet<br />
zwei Teilaufgaben, nämlich<br />
•<br />
•<br />
die Bestimmung der optimalen Anzahl der Elemente der Teilmenge und<br />
die Auswahl der wesentlichen Input- und Prozessvariablen.
322 5 Qualität in der Fertigung<br />
Das Red Auswahlverfahren<br />
Da der Term N – 1 in der Formel U ˆ N . p konstant ist, genügt es, den Ausdruck<br />
S<br />
p<br />
2 ˆ<br />
Y / X p<br />
( N − n −1) ⋅ S + Red ( h)<br />
=<br />
( N − p −1) ⋅( N − p −1)<br />
zu minimieren.<br />
Das Red Auswahlverfahren läuft in mehreren Schritten ab.<br />
Im ersten Schritt wird für jede Input- und Prozessvariable<br />
ˆRed ( )<br />
2 2<br />
p j = BY. j/ n−j ⋅ Sj/<br />
n−j<br />
berechnet, wobei die Indexmenge h nur das Element j und demzufolge die Indexmenge k die<br />
restlichen n – j Elementen beinhaltet. S 2 j/<br />
n− jist die Maximum Likelihood Schätzfunktion<br />
für die bedingte Varianz der j ten Input- oder Prozessvariablen unter der Bedingung, dass die<br />
−1<br />
restlichen Input- und Prozessvariablen konstant gehalten werden. Aus der Matrix S XX kann<br />
2<br />
S − j/<br />
n− j abgelesen werden. Analog kann man natürlich auch mit der Korrelationsmatrix R XX<br />
2<br />
rechnen. Durch die Kehrwertbildung erhält man sofort den Wert A j/<br />
n−<br />
j .<br />
B Y.j/n – j ist folglich der j-te Regressionskoeffizient der j-ten Input- oder Prozessvariablen. Dieser<br />
Koeffizient kann nach dem Zerlegungssatz gemäß der Zerlegung<br />
T<br />
T<br />
Y / X = Y. j/ n−j Y. n−j/<br />
j<br />
B ( B , B )<br />
sofort aus dem vollständigen Ansatz abgelesen werden.<br />
Die Minimierung des unbedingten Vorhersagefehlers U ˆ N . p mit Red p (h) erfolgt über die Lösung<br />
der oben genannten zwei Probleme<br />
•<br />
•<br />
Bestimmung des optimalen p ˆ * und<br />
die Auswahl der Input- und Prozessvariablen, die in X(k) zusammengefasst werden und<br />
die U ˆ N . p minimieren.<br />
Weiter oben wurde bereits darauf verwiesen, dass es aufgrund der Konstanz von N ausreichend<br />
ist, S p (h n – p ) zu minimieren. Für den vollen Ansatz gilt<br />
2<br />
Y / X<br />
n −1<br />
S<br />
Sn<br />
=<br />
N −<br />
anstelle von U ˆ Nn . .<br />
Mit den berechneten ˆRed n−<br />
1 ( j ) , j = 1, …, n werden alle Input- und Prozessvariablen in eine<br />
Rangfolge X [1] , …, X [n – p – 1] , X [n – p] , X [n – p + 1] , …, X [n] geordnet, in der X [1] die unwichtigste<br />
Input- oder Prozessvariable ist, da diese beim Streichen den unbedingten Vorhersagefehler<br />
am geringsten vergrößert.<br />
Der Ansatz ohne die unwichtigste Input- oder Prozessvariable<br />
S<br />
( h ) =<br />
n−1 [1]<br />
wird mit S n verglichen.<br />
ˆRed ([1]) ( 1)<br />
( N − n) ⋅( N − n −1)<br />
2<br />
n−1 + N − n − ⋅ SY / X
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
323<br />
Gilt<br />
S<br />
n−1 ≤ Sn,<br />
dann wird X [1] d. h. h [1] = h 1 = ([1]) aus der Analyse entfernt. Im anderen Fall, d. h. falls<br />
Sn− 1 > Sn<br />
, kann der vollständige Ansatz nicht reduziert werden.<br />
Im ˆRed nächsten Schritt ist zu prüfen, ob mit X [1] auch X [2] gestrichen werden kann. Hierfür ist<br />
n− 2 ( h2<br />
) zu berechnen, wobei h 2 = ([1], [2]) die zweielementige Teilmenge der beiden<br />
unwichtigsten Input- und Prozessvariablen ist.<br />
Gilt nun<br />
Red ˆ ( h ) ≤ Red ˆ ([3])<br />
und<br />
S<br />
n−2 2 n−1<br />
n−2 ≤ Sn−1 ,<br />
dann kann die Teilmenge X(h 2 ) T = (X [1] , X [2] ) aus dem Ansatz gestrichen werden.<br />
Gilt dagegen<br />
aber<br />
Red ˆ ( h ) > Red ˆ ([3]),<br />
S<br />
n−2 2 n−1<br />
n−2 ≤ Sn−1 ,<br />
muss man prüfen, ob alle möglichen Zweier-Teilmengen, die alle die 3. Input- oder Prozessvariable<br />
beinhalten, ein kleineres ˆRed n− 2 als ˆRed n− 1([3])<br />
liefern und damit ein kleineres<br />
S ˆ<br />
p [Red n− 2( h2)]<br />
ergeben. In diesem Fall wird das Verfahren fortgesetzt. Andernfalls ist das<br />
Verfahren beendet.<br />
Es gilt<br />
ˆRed 1<br />
.[1]/ [1]<br />
2 ( 2 ) ( .[1]/ [1] , .[2]/ 2] ) −<br />
Y n−<br />
n− h = bY n− bY n− ⋅ S[1].[2]/ n−[1].[2]<br />
⋅ ⎜<br />
⎝b<br />
⎟ ,<br />
Y.[2]/ n−2]<br />
⎠<br />
wobei wiederum die beiden Regressionskoeffizienten b Y.[1]/ n−[1]<br />
und b Y.[2]/ n−2]<br />
aus dem vollständigen<br />
Ansatz abgelesen werden und S [1].[2]/n – [1].[2] entweder aus der inversen Matrix SXX<br />
− 1<br />
abgelesen oder entsprechend durch Invertierung der zerlegten Matrizen gebildet wird.<br />
In dieser Weise wird das Verfahren so lange fortgesetzt, wie<br />
Red ˆ ( h ) ≤ Red ˆ ([ n − p + 1])<br />
und<br />
p n−p n−1<br />
S ( h ) ≤ S ( h )<br />
p n− p p+ 1 n−p−1<br />
gilt, wobei im (n – p)-ten Schritt h n – p = ([1], [2], …, [n – p]). Die Teilmenge h n – p kann in<br />
diesem Fall gestrichen und das Verfahren mit der Erweiterung der Teilmenge h n – p um die<br />
[n – p + 1]-te Input- oder Prozessvariable fortgesetzt werden.<br />
Sind beide Bedingungen nicht erfüllt, dann ist man am Ende des Auswahlprozesses angelangt.<br />
Gilt jedoch<br />
Red ˆ ( h ) > Red ˆ ([ n − p + 1])<br />
p n−p n−1<br />
⎛b<br />
⎞
324 5 Qualität in der Fertigung<br />
und<br />
S ( h ) ≤ S ( h ),<br />
p n− p p+ 1 n−p−1<br />
dann ist das Verfahren in der 2. Stufe fortzusetzen.<br />
Wie vorher wird die Teilmenge<br />
([1], …, [n – p], [n – p + 1])<br />
betrachtet. Aus dieser werden alle Teilmengen mit (n – p) Input- und/oder Prozessvariablen,<br />
die alle die [n – p + 1]-te Input- oder Prozessvariable beinhalten, gebildet. Es sind dies die<br />
Teilmengen<br />
(1)<br />
n−<br />
p<br />
(2)<br />
n−<br />
p<br />
( n−<br />
p)<br />
n−<br />
p<br />
h = ([2],[3],…,[ n − p],[ n − p + 1]),<br />
h = ([1],[3],…,[ n − p],[ n − p + 1]),<br />
h = ([1],[2],…,[ n − p −1],[ n − p + 1])<br />
Hierfür werden die ˆRed p( hn − p)<br />
berechnet.<br />
Ist das Kleinste aller bisher berechneten<br />
⎡ ⎛n − p⎞⎤<br />
⎛n − p + 1⎞<br />
⎢1 + ⎜ ⎥ =<br />
, d.h.<br />
⎝ 1 ⎟<br />
⎠<br />
⎜<br />
⎝ 1 ⎟<br />
⎣ ⎦<br />
⎠<br />
⎧<br />
⎛n<br />
− p⎞<br />
⎫<br />
⎪<br />
⎜ 1 ⎟<br />
⎪<br />
⎝ ⎠<br />
⎪ Min Red ˆ ( ), Min [Red ˆ l ⎪<br />
⎨<br />
( )] Red ˆ<br />
p hn−p p hn−p ⎬ ≤ n−p([ n − p + 2]),<br />
⎪<br />
l = 1<br />
⎪<br />
⎪<br />
⎪<br />
⎪⎩<br />
⎪⎭<br />
dann ist die Auswahl beendet und die zugehörige Teilmenge wird gestrichen.<br />
Gilt dagegen<br />
⎧<br />
⎛n<br />
− p⎞<br />
⎫<br />
⎪<br />
⎜ 1 ⎟<br />
⎪<br />
⎝ ⎠<br />
⎪ Min Red ˆ ( ), Min [Red ˆ l ⎪<br />
⎨<br />
( )] Red ˆ<br />
p hn−p p hn−p ⎬ > n−p([ n − p + 2]),<br />
⎪<br />
l = 1<br />
⎪<br />
⎪<br />
⎪<br />
⎪⎩<br />
⎪⎭<br />
dann wird das Verfahren fortgesetzt. Hierzu wird die Teilmenge<br />
hn− p+ 2 = ([1], …,[ n − p + 2])<br />
gebildet. Aus dieser werden alle Teilmengen mit (n – p) Input- und Prozessvariablen, die alle<br />
die [n – p + 2]-te Input- oder Prozessvariable beinhalten, gebildet. Für all diese Teilmengen<br />
werden die Red’s berechnet. Ist das Kleinste aller bisher berechneten
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
325<br />
⎡ ⎛n − p⎞ ⎛n − p + 1⎞⎤<br />
⎛n − p + 2⎞<br />
⎢1<br />
+ ⎜ + ⎥ =<br />
⎝ 1 ⎟<br />
⎠<br />
⎜<br />
⎝ 2 ⎟<br />
⎠<br />
⎜<br />
⎝ 2 ⎟<br />
⎣<br />
⎦<br />
⎠<br />
ˆRed p( hn − p)<br />
kleiner oder gleich ˆRed n−1([ n − p + 3]) , dann hat man die optimale Teilmenge<br />
gefunden und das Verfahren ist beendet.<br />
Andernfalls ist das Verfahren wie bisher beschrieben fortzusetzen. In der q-ten Stufe müssten<br />
⎡ ⎛n − p⎞ ⎛n − p + q −1⎞⎤<br />
⎛n − p + q⎞<br />
⎢1<br />
+ ⎜ + + =<br />
1 ⎟ …<br />
⎥<br />
⎝ ⎠<br />
⎜<br />
⎝ q ⎟<br />
⎠<br />
⎜<br />
⎝ q ⎟<br />
⎣<br />
⎦<br />
⎠<br />
l ˆRed p( hn − p)<br />
berechnet und mit ˆRed n−1([ n − p + q])<br />
verglichen werden. Da q = 1, …, n – p<br />
⎛n⎞<br />
müssten im ungünstigsten Fall ⎜<br />
⎝p⎟<br />
solche Teilmengenuntersuchungen durchgeführt werden.<br />
⎠<br />
Satz: Dieser Algorithmus liefert das Minimum des unbedingten Vorhersagefehlers.<br />
Beweis: siehe Jahn [1991b].<br />
Empfehlungen<br />
Insbesondere im Falle hoch multikollinearer Kovarianzmatrizen sind alle Berechnungen<br />
im standardisierten Modell durchzuführen, d. h. auf der Basis der Korrelationsmatrix. Die<br />
Rechenzei ten werden kürzer und die Ergebnisse wesentlich genauer.<br />
Abbruch des Verfahrens:<br />
Gilt sowohl<br />
Red ˆ ( h ) > Red ˆ ([ n − p + 1])<br />
als auch<br />
p n−p n−1<br />
S ( h ) > S ( h ),<br />
p n− p p+ 1 n−p−1<br />
dann ist das Verfahren beendet und h n – p ist die zu streichende Teilmenge, die U N.n minimiert.<br />
Gilt<br />
Red ˆ ( h ) > Red ˆ ([ n − p + 1])<br />
aber<br />
p n−p n−1<br />
S ( h ) ≤ S ( h ),<br />
p n− p p+ 1 n−p−1<br />
dann ist das Verfahren in der 2. Stufe fortzusetzen. In dieser Stufe werden alle Teilmengen mit<br />
n – p Input- und Prozessvariablen, die alle die [n – p + 1]-te Variable beinhalten, gebildet. Das<br />
Verfahren kann nach der 2. Stufe abgebrochen werden, da der Rechenaufwand sehr hoch wird<br />
und die Verbesserung minimal ist.<br />
Bei sehr hoch multikollinearen Matrizen sollte das Verfahren eventuell nach der 1. Auswahl noch<br />
einmal mit den verbleibenden wesentlichen Input- und Prozessvariablen neu gestartet werden.
326 5 Qualität in der Fertigung<br />
Beispiel 5.14.3: Chemischer Prozess. Red-Auswahlverfahren<br />
Das obige Beispiel ist ein Modell mit stochastischen Input- und Prozessvariablen. Der<br />
vollständige Ansatz mit n = 12 Prozessvariablen liefert das Ergebnis der Tabelle 5.14.5.<br />
Tabelle 5.14.5: Prozessgleichung mit allen Prozessvariablen<br />
Prozessvar. Koeff.Proz.Gleich. t-Wert Irrtumswahrsch. Red(j)<br />
b 0 –408,705 –1,905 0,0598 0<br />
X 3 –0,63914 –0,75 0,455 0,0838<br />
X 4 0,2013 0,385 0,701 0,02208<br />
X 5 1,92428 0,1017 0,919 0,00154<br />
X 6 1,2744 0,0742 0,941 0,00082<br />
X 7 –11,7229 –2,9449 0,00406 1,2929<br />
X 9 0,32221 5,3921 0 4,3345<br />
X 16 –0,094157 –0,1113 0,9116 0,001848<br />
X 17 89,703117 4,8434 0 3,49726<br />
X 18 –91,06 –5,0647 0 3,82416<br />
X 19 1,07785 2,2573 0,0263 0,75965<br />
X 20 3,53736 1,26999 0,20719 0,24045<br />
X 21 0,80203 3,38099 0,001 1,7041<br />
Das Modell mit den wesentlichen Prozessvariablen ist in der Tabelle 5.14.6 enthalten.<br />
Tabelle 5.14.6: Prozessgleichung mit den wesentlichen Prozessvariablen<br />
Prozessvar. Koeff.Proz.Gleich. t-Wert Irrtumswahrsch. Red(j)<br />
b 0 –367,637 –3,029 0,00312 0,0000<br />
X 20 3,14768 1,242 0,217 0,2404<br />
X 19 0,96515 2,913 0,0044 0,75965<br />
X 7 –11,1443 –4,6253 0,00001 1,2929<br />
X 21 0,75278 3,562 0,00057 1,7042<br />
X 17 95,681 5,9554 0,0000 3,4973<br />
X 18 –97,11326 –6,401 0,0000 3,8241<br />
X 9 0,29609 6,54563 0,0000 4,33456<br />
Die F-Statistik hat den Wert 32.956 mit der Irrtumswahrscheinlichkeit p = 2.662e–023. Das<br />
vollständige wird mit dem reduzierten Modell anhand des Maßes der Beherrschbarkeit, des<br />
Vorhersagefehlers und der bedingten Standardabweichung verglichen.<br />
Tabelle 5.14.7: Vergleich des vollständigen und reduzierten Modells<br />
Statistik Vollständiges Reduziertes<br />
Maß d. Beherrschbarkeit 0,7001 0,6976<br />
Vorhersagefehler 3,9939 3,909<br />
Bedingte Standardabw. 3,7633 3,779<br />
FG d. Residuen 95 100
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
327<br />
Der Vergleich mit den „klassischen“ Auswahlverfahren liefert uns die folgenden Resultate:<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
•<br />
Nach dem Red-Auswahlverfahren verbleiben 7 Prozessvariablen im Ansatz.<br />
Die wesentlichen Prozessvariablen nach dem Red-Verfahren sind X 7 , X 9 , X 17 , X 18 , X 19 ,<br />
X 20 und X 21 . Die Prozessvariablen X 3 , X 4 , X 5 , X 6 , X 16 werden als unwesentlich erkannt<br />
und gestrichen.<br />
Die Rangfolge der wichtigen Prozessvariablen nach dem Red-Verfahren ist X [1] = X 9 ,<br />
X [2] = X 18 , X [3] = X 17 , X [4] = X 21 , X [5] = X 7 , X [6] = X 19 , X [7] = X 20 .<br />
Nach den „klassischen“ Verfahren verbleiben 5 Prozessvariablen im Ansatz.<br />
Die wesentlichen Prozessvariablen nach den „klassischen“ Verfahren sind X 7 , X 9 , X 17 , X 18 ,<br />
X 19 und X 21 . Die Prozessvariablen X 3 , X 4 , X 5 , X 6 , X 16 und X 20 werden als unwesentlich<br />
erkannt und gestrichen.<br />
Die Rangfolge ist: X [1] = X 9 , X [2] = X 18 , X [3] = X 17 , X [4] = X 7 , X [5] = X 21 , X [6] = X 19 .<br />
Die Rangfolgen unterscheiden sich.<br />
2<br />
Die Maße der Beherrschbarkeit sind nach der klassischen Auswahl R Y / p = 0.6929 und<br />
nach der Red-Auswahl R 2 Y/p = 0.6976 unterscheiden sich.<br />
Die Reststandardabweichungen nach der klassisch Auswahl S Y/X = 3.919 und nach der<br />
Red-Auswahl s Y/X = 3.779 unterscheiden sich.<br />
Warum unterscheiden sich die „klassischen“ von dem Red-Auswahlverfahren?<br />
Die Ursachen für die Ungleichheit der verschiedenen Verfahren sind:<br />
• Bei den klassischen Verfahren werden alle n Einzelhypothesen des 1. Schrittes individuell,<br />
nacheinander und nicht simultan geprüft, d. h. der Fehler 1. Art wird separat für jede<br />
Einzelhypothese nach<br />
P ( Fˆ<br />
≤ F / H ) = 1−<br />
α<br />
j<br />
α<br />
0. j<br />
gewählt. Das ist nicht korrekt!<br />
• Die univariaten einfachen Modelle E[Y] = β Y/j X j müssen nicht unbedingt „wahr“ sein. In<br />
diesen Fällen ist F ˆj nichtzentral F verteilt mit 1 und (N – 1) FG. Die univariaten Modelle<br />
müssen auch nicht unter Gültigkeit der H 0.j richtig sein. Die Nichtzentralitätsparameter<br />
sind unbekannt.<br />
• Bei der k-ten Entscheidung werden bei den klassischen Verfahren die vorangegangenen<br />
Entscheidungen nicht beachtet.<br />
• Das Red-Auswahlverfahren basiert in natürlicher Weise auf der Verringerung der bedingten<br />
Varianz (Restvarianz) durch Hinzufügen einer neuen Prozessvariablen, oder alternativ, auf<br />
der Vergrößerung der bedingten Varianz durch Streichen einer Prozessvariablen.<br />
• Die bedingte Varianz und die Tests werden unterschiedlich vom Grad der Multikollinearität<br />
beeinflusst.<br />
Nimmt der Unterschied zwischen den beiden Verfahren mit zunehmender Anzahl von<br />
Variablen zu?<br />
Zur Beantwortung dieser Frage betrachten wir das Beispiel des chemischen Prozesses mit einer<br />
größeren Anzahl von Input- und Prozessvariablen.
328 5 Qualität in der Fertigung<br />
Beispiel 5.14.4: Chemischer Prozess. Vergleich von Reduktionsverfahren<br />
Y 1 sei wieder der Anteil der unerwünschten Substanz. Gegeben sind des weiteren p = 11<br />
Input und n = 21 Prozessvariablen. Das Modell nach der schrittweisen Auswahl ist in der<br />
Tabelle 5.14.8 enthalten.<br />
Tabelle 5.14.8: Modell nach der schrittweisen Auswahl<br />
Prozessgleichung<br />
-----------------------------------------------------------------------------<br />
Produktvariable: y1<br />
-----------------------------------------------------------------------------<br />
Standard<br />
T<br />
Parameter Estimate Error Statistic P-Value<br />
-----------------------------------------------------------------------------<br />
CONSTANT 32,7401 13,4005 2,4432 0,0164<br />
x7 -6,31507 1,49519 -4,22359 0,0001<br />
x11 -0,011167 0,00382231 -2,92152 0,0043<br />
x17 5,07868 1,34843 3,76636 0,0003<br />
x21 0,689957 0,12185 5,66233 0,0000<br />
z1 0,752165 0,143026 5,25895 0,0000<br />
z2 2,01531 0,631772 3,18994 0,0019<br />
z3 0,0160964 0,00763823 2,10735 0,0377<br />
z5 0,121066 0,0086293 14,0297 0,0000<br />
z9 -0,0037483 0,00126582 -2,96116 0,0039<br />
z11 0,000460799 0,000129713 3,55245 0,0006<br />
-----------------------------------------------------------------------------<br />
Analysis of Variance<br />
-----------------------------------------------------------------------------<br />
Source Sum of Squares Df Mean Square F-Ratio P-Value<br />
-----------------------------------------------------------------------------<br />
Model 4625,68 10 462,568 104,93 0,0000<br />
Residual 427,621 97 4,40846<br />
-----------------------------------------------------------------------------<br />
Total (Corr.) 5053,3 107<br />
R-squared = 91,5378 percent<br />
R-squared (adjusted for d.f.) = 90,6654 percent<br />
Standard Error of Est. = 2,09963<br />
Mean absolute error = 1,48313<br />
Durbin-Watson statistic = 1,41397<br />
Die Red-Auswahl liefert das Modell in der Tabelle 5.14.9.<br />
Der Vergleich des schrittweisen und des Red-Auswahlverfahrens liefert folgende Ergebnisse:<br />
Nach dem schrittweisen Verfahren werden die Variablen<br />
x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 8 , x 9 , x 10 , x 12 , x 13 , x 14 , x 15 , x 16 , x 18 , x 19 , x 20 , z 4 , z 6 , z 7 , z 10<br />
gestrichen, nach dem Red-Auswahlverfahren werden die Variablen<br />
x 4 , x 5 , x 8 , x 12 , x 13 , x 14 , x 15 , x 16<br />
gestrichen. Die Mengen der unwesentlichen, gestrichenen Variablen sind verschieden.
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
329<br />
Tabelle 5.14.9: Red-Auswahl<br />
Value Std.Error t-value Pr(>|t|) Redn1<br />
b 0 2.027252e+002 2.243049e+002 0.90379 0.36872 0.00000000<br />
z 10 –6.204065e–004 5.822072e–004 –1.06561 0.28969 0.01659399<br />
z 4 1.954888e–001 1.817600e–001 1.07553 0.28525 0.03508154<br />
x 11 –2.643214e–002 1.165562e–002 –2.26776 0.02594 0.03583230<br />
x 6 –7.249619e+000 6.719864e+000 –1.07883 0.28379 0.03744574<br />
v 18 –2.017283e+001 1.669251e+001 –1.20850 0.23029 0.04066924<br />
v 19 3.563528e–001 2.197435e–001 1.62168 0.10867 0.04790650<br />
x 17 2.299280e+001 1.575657e+001 1.45925 0.14827 0.05208574<br />
x 1 1.117445e+000 6.533908e–001 1.71022 0.09096 0.05374786<br />
z 6 –1.495682e–002 1.464805e–002 –1.02108 0.31018 0.05745906<br />
x 7 –7.100759e+000 2.046982e+000 –3.46889 0.00083 0.05826068<br />
z 8 –3.658574e–001 2.529059e–001 –1.44661 0.15177 0.06943185<br />
x 3 –6.214773e–001 5.310112e–001 –1.17037 0.24520 0.07239814<br />
z 7 –5.642632e+001 3.649344e+001 –1.54620 0.12586 0.09617223<br />
x 9 2.859829e–001 1.464424e–001 1.95287 0.05421 0.09727591<br />
x 20 4.399184e+000 2.540006e+000 1.73196 0.08700 0.14827725<br />
z 2 1.457339e+000 6.175290e–001 2.35995 0.02062 0.16755061<br />
z 3 1.739045e–002 7.359728e–003 2.36292 0.02047 0.17278911<br />
z 11 9.192015e–004 3.210841e–004 2.86281 0.00531 0.19585702<br />
x 10 3.788326e–002 1.252605e–002 3.02436 0.00332 0.20522901<br />
z 9 –4.191362e–003 1.502543e–003 –2.78951 0.00655 0.23452021<br />
x 2 –5.915323e+000 2.305041e+000 –2.56625 0.01208 0.26927001<br />
x 21 6.039320e–001 1.607141e–001 3.75780 0.00032 0.28263726<br />
z 1 1.586419 0.38234719 4.14916 8e–005 0.5332058<br />
z 5 0.103754 0.01126534 9.21002 0e+000 1.2338190<br />
F-Statistic: 51.6531840865295 with a p-value of: 3.16569470906557e–040<br />
Statistic Complete_Model Red_Reduction<br />
Rsquared 0.939247 0.9372484<br />
UNn/UNp 4.093372 3.8205083<br />
Sqrt_UNn/UNp 2.023208 1.9546121<br />
RSS 307.002919 317.1021928<br />
syx/syp 1.693867 1.7215028<br />
Residual_df 75 83
330 5 Qualität in der Fertigung<br />
Die Rangfolge für das schrittweise Verfahren ist<br />
Z 5 , X 21 , Z 1 , X 7 , X 17 , Z 11 , Z 2 , Z 9 , X 11 , Z 3<br />
und für das Red-Auswahlverfahren<br />
Z 5 , Z 1 , X 21 , X 2 , Z 9 , X 10 , Z 11 , Z 3 , Z 2 , X 20 , X 9 , Z 7 , Z 6 , X 1 , X 17 , X 19 , X 18 , X 6 , X 11 , Z 4 und Z 10 .<br />
Die Rangfolgen sind verschieden.<br />
Die Maße der Beherrschbarkeit (klassisch R 2 = 0.915, Red R 2 Y/X = 0.937) sind verschieden.<br />
Die Reststreuungen (klassisch s = 2.099, Red s Y/X = 1.72) sind ebenfalls verschieden.<br />
Wir wollen noch ein zweites Beispiel mit einer großen Anzahl von Input- und Prozessvariablen<br />
betrachten, bevor ich meine Schlussfolgerungen ziehe.<br />
Beispiel 5.14.5: Mikroelektronik. Red-Verfahren<br />
Die Herstellung mikroelektronischer Schaltkreise ist kompliziert. Die Anzahl der verschiedenen<br />
Prozesse des Netzwerkes „Herstellung“ ist groß. Die Anzahl der Input- und<br />
Prozessvariablen ist sehr groß.<br />
Wir wollen hier die Ausbeute an mikroelektronischen Schaltkreisen für zwei Netzwerke<br />
betrachten. Im 1. Netzwerk ist die Anzahl der Input- und Prozessvariablen n = 52. Der<br />
Grad der Multikollinearität ist δ = 0.8 10 58 . Im 2. Netzwerk ist n = 45 und δ = 0.2 10 27 . Die<br />
Ergebnisse der schrittweisen Verfahren, des C p von Mollows und des Red Auswahlverfahrens<br />
sind in der folgenden Tabelle zusammengestellt.<br />
Tabelle 5.14.10: Ergebnisse der Auswahl nach dem schrittweisen und Red-Verfahren<br />
n S 2 Y/p R 2 Y/p U N, p p<br />
1. Netzwerk<br />
vollständig 52 0,0017 0,708 0,00404<br />
schrittweise 0,0051 0,12 0,0052 2<br />
Red 0,0022 0,62 0,00306 25<br />
2. Netzwerk<br />
vollständig 45 69,55 0,52 140,7<br />
schrittweise 112,6 0,22 116,5 3<br />
Red 78,9 0,45 94,9 15<br />
Diese Beispiele zeigen:<br />
• Die schrittweisen Auswahlverfahren tendieren zu mächtigeren Auswahlmengen unwesentlicher<br />
Input- und Prozessvariablen, d. h. die Anzahl der wesentlichen Input- und<br />
Prozessvariablen wird zu klein.<br />
• Mit zunehmender Anzahl von Input- und Prozessvariablen werden die klassischen Verfahren<br />
schlechter, da bei diesen die Maße der Beherrschbarkeit zu klein und demzufolge<br />
die Reststandardabweichungen zu groß werden.<br />
• Mit zunehmenden Grad der Multikollinearität werden die klassischen Verfahren<br />
schlechter, da die Reduktion der Dimension des Parameterraumes größer, ja sogar zu<br />
groß wird.
5.14 Wie können wir die wesentlichen Input- und Prozessvariablen auswählen?<br />
331<br />
Gibt es Tests zur Prüfung von Hypothesen über Red p (h)?<br />
Ja. Zur Prüfung von Hypothesen über Red p (h) kann man den overall-F-Test, Varianzanalysen<br />
oder Tests zur Prüfung der partiell multiplen Korrelationskoeffizienten verwenden.<br />
Wir wollen die Tests im Einzelnen betrachten.<br />
Test zur Prüfung der Hypothese über Red n – 1 (j)<br />
2 2 2<br />
Aus der Darstellung [Re dn−1 ( j)]<br />
= BY. j/ n−j ⋅S j/<br />
n−j<br />
folgt, dass wir zur Prüfung der<br />
H 0 : Red n – 1 (j) = 0 gegen die Alternative H 1 : Red n – 1 (j) ≠ 0 den F-Test in der Form<br />
ˆ Red n−1( j) ( N − n)<br />
F =<br />
S<br />
2<br />
Y / X<br />
verwenden können. Ist F ˆ ≥ FnN<br />
, −n<br />
() a , dann muss die H 0 zugunsten der H 1 verworfen werden.<br />
Dieser Test ist identisch mit dem F-Test zur Prüfung einer Einzelhypothese über einen<br />
Koeffizienten B Y.j/n – j der Prozessgleichung.<br />
Tests zur Prüfung der Hypothese über Red p (h)<br />
Zur Prüfung dieser Hypothese kann ebenfalls der F-Test verwendet werden.<br />
Die Teststatistik ist<br />
Red ( ) ( )<br />
2 2<br />
T<br />
p h ⋅ N − n ( R / / ) ( ) . / / . / ( )<br />
ˆ( )<br />
Y X − RY k ⋅ N − n BYh kShh kBYh k N − n<br />
Fh = = =<br />
2 2 2<br />
.<br />
( n − p) S (1 − R ) ⋅( n − p) S ( n − p)<br />
Y / X Y / X Y / X<br />
Ist Fh ˆ( ) ≥ F ( )<br />
n−p,<br />
N−n<br />
α , dann muss die H 0 zugunsten der H 1 verworfen werden.<br />
Varianzanalytische Prüfung<br />
Ausgangspunkt für diese Prüfung ist die Teilmengenregression<br />
T<br />
Y = β ⋅ X() k + F .<br />
Y / k Y / k<br />
(1)<br />
Die zu prüfende Hypothese lautet H0 : β Y / k = 0 .<br />
Verlängert man den Vektor der Input- und Prozessvariablen X(k) durch Hinzufügen von<br />
Komponenten aus X(h), die im Vektor X(u) zusammengefasst werden, wobei u = (u 1 , …, u s ),<br />
u 1 < … < u s , s ≤ n – p, dann kann man prüfen, ob die Verkleinerung der Summe der Abweichungsquadrate<br />
um die Prozessgleichung durch Verlängerung des Vektors X(k) null ist. Dieser<br />
Umstand wird durch die Hypothese<br />
(2)<br />
0 β T<br />
Yu . / k ⋅ Σ uu/ k ⋅ β Yu . / k = = p h<br />
H : 0 Red ( )<br />
abgebildet. Zur Prüfung dieser Hypothese wird die folgende Varianztabelle aufgebaut.<br />
In dieser Tabelle bedeuten<br />
T −1<br />
Akk<br />
−1<br />
ATT<br />
H = X() k ⋅ ⋅ X(),<br />
k<br />
p<br />
T<br />
Hs<br />
= T ⋅ ⋅T,<br />
T = X( u) ⋅( I − H ),<br />
A<br />
TT<br />
= T ⋅T<br />
T<br />
p
332 5 Qualität in der Fertigung<br />
Tabelle 5.14.11: Varianztabelle für die Prüfung der H 0 über Red p (h)<br />
Variationsursache Summe der<br />
Abweichungsquadrate<br />
FG<br />
F-Test<br />
Prozessgleichung<br />
in X(k)<br />
Prozessgleichung<br />
in X(k) und X(u)<br />
T<br />
Y ⋅ H ⋅Y<br />
p<br />
p<br />
Y ⋅ H ( )<br />
T<br />
Y ⋅ Hs<br />
⋅Y<br />
s ˆ<br />
p ⋅Y ⋅ N − p<br />
F1<br />
=<br />
T<br />
Y ⋅( I − H ) ⋅Y ⋅ p<br />
T<br />
p<br />
T<br />
Rest Y ⋅( I − Hp<br />
− Hs)<br />
⋅Y<br />
N – p – s<br />
(2) ˆF<br />
Gesamt<br />
T<br />
Y ⋅ Y<br />
und somit<br />
T<br />
⋅ T<br />
T<br />
= A<br />
uu / k ,<br />
so dass<br />
T<br />
Y ⋅ Hs<br />
⋅ Y = ˆRed p( j).<br />
F ˆ ∼ F′<br />
( δ )<br />
mit<br />
1 pN , − p 1<br />
T<br />
βY / k⋅<br />
Akk⋅βY / k<br />
δ1 =<br />
.<br />
2<br />
σ /<br />
Y k<br />
2<br />
Y / k 0<br />
Bei Gültigkeit der H 0 gilt σ Y.k = 0 und damit ρ = , δ 1 = 0 und folglich<br />
ˆ .<br />
F1 ∼ FpN<br />
, − p<br />
Bemerkungen<br />
1. Die Teststatistik F 1 kann man mit multiplen Korrelationskoeffizienten darstellen. Es gilt<br />
2<br />
2<br />
R (<br />
/<br />
1) ( )<br />
Y k ⋅( N − p)<br />
χp<br />
δ ⋅ N − p<br />
1 = = ∼ F<br />
2 2<br />
pN ′, − p δ1<br />
(1 − RY / k)<br />
⋅ p χN−<br />
p ⋅ p<br />
Fˆ ( ).<br />
Für die Prüfung der zweiten Hypothese<br />
ˆ (2) X ⋅ Hs<br />
⋅Y ⋅( N − p − s)<br />
F =<br />
T<br />
Y ⋅( I − H − H ) ⋅Y ⋅ s<br />
verwendet, wobei<br />
T<br />
(2)<br />
F ˆ ∼ FsN , −p−s<br />
( δ2<br />
)<br />
p<br />
s<br />
(2)<br />
H 0 wird die Statistik
5.15 Unter welchen Umständen ist die Annahme der Linearität gerechtfertigt?<br />
333<br />
ist und<br />
T<br />
βYu . / k⋅<br />
Auu/ k⋅βYu . / k<br />
δ2 =<br />
.<br />
2<br />
σ / ,<br />
Y k u<br />
(2)<br />
Für die Gültigkeit der H 0 ist auch diese F-Statistik zentral F verteilt mit den angegebenen<br />
Freiheitsgraden.<br />
2. Wegen der Darstellung<br />
2 2<br />
p h = ρY. h/ k ⋅σY / k<br />
Red ( )<br />
können zur Prüfung von Hypothesen über Red p (h) auch die Tests zur Prüfung von partiell<br />
multiplen Korrelationskoeffizienten verwendet werden.<br />
5.15 Unter welchen Umständen ist die Annahme der<br />
Linearität gerechtfertigt?<br />
Über die Voraussetzung der Linearität in den Modellen für die Proze ssgleichung wird oft und<br />
heftig gestritten. Wir wollen zur Schlichtung des Streits hier von dem Modell mit stochastischen<br />
Input- und Prozessvariablen ausgehen. Für dieses Modell hatten wir vorausgesetzt, dass der<br />
Vektor Z T = (X T , Y T ) der Input-, Prozess- und Produktvariablen entweder multivariat normalverteilt<br />
ist oder zur Klasse der elliptisch umrissenen Verteilungen gehört. Beide Annahmen<br />
sind praktisch relevant.<br />
Im Glossar wurde die bedingte multivariate Normalverteilung mit dem bedingten Erwartungswert<br />
und der bedingten Varianz beschrieben.<br />
Für den Vektor Z gilt unter den beiden Voraussetzungen<br />
−1<br />
Y YX XX X X<br />
E[ Y/ X] = μ + Σ Σ ( − μ ).<br />
Das ist eine lineare Funktion in X. Diese Funktion wird Regressionsfunktion genannt. Für die<br />
bedingte Varianz gilt<br />
−1<br />
YY YX XX XY YY / X<br />
var [ Y/ X] = Σ − Σ Σ Σ = : Σ .<br />
Dieser Ausdruck hängt nicht von X ab.<br />
Damit kann man den für die Anwendungen wichtigen Charakterisierungsatz aufschreiben,<br />
der einen Zusammenhang zwischen der Verteilungsvoraussetzung und der Linearität der<br />
Regressionsfunktion präzisiert.<br />
Wenn der bedingte Erwartungswert eine lineare Funktion in den Variablen unter Bedingung und<br />
die bedingte Varianz unabhängig von X ist, dann ist die zugrunde liegende gemeinsame Verteilung<br />
eine Normalverteilung. Wenn die Verteilung von Z eine multivariate Normalverteilung ist,<br />
dann ist der bedingte Erwartungswert eine lineare Funktion der Variablen unter der Bedingung<br />
und die bedingte Kovarianz ist unabhängig von den Variablen unter der Bedingung.<br />
Aus diesem Satz wird deutlich, dass der Streit entweder auf der Basis des Modells mit festen<br />
Input- und Prozessvariablen oder akademisch geführt wird.
334 5 Qualität in der Fertigung<br />
5.16 Warum muss ein Prozess gesteuert werden und wie<br />
können wir einen Prozess steuern?<br />
Jeder, der sich in sein Auto setzt und die Absicht hat, loszufahren, überlegt sich vorher, wohin<br />
er fahren und welche Strecke er benutzen will. Niemand startet sein Auto, macht die Augen<br />
zu und fährt los! Das Ziel der Autofahrt entspricht dem Sollwert und die zu fahrende Strecke<br />
– entweder über das Gebirge oder durch das flache Land – kann mit der Steuerung eines Prozesses<br />
verglichen werd en. Was jeder mit seinem privaten Fahrzeug macht, kann er auch mit<br />
den betrieblichen Prozessen tun.<br />
In einem heuristisch, d. h. durch Erfahrung gesteuerten oder ungesteuerten Prozess sind<br />
•<br />
•<br />
•<br />
•<br />
die Streuungen der Input-, Prozess- und Produktvariablen in der Regel sehr groß,<br />
die Zielwerte für die Steuerung in Form von Sollwerten und Toleranzgrenzen in der Regel<br />
nicht bekannt,<br />
der Ausschuss sehr hoch, die Kundenanforderungen werden nur mangelhaft erfüllt und<br />
die uni- und multivariaten Prozessfähigkeitsindizes sind in der Regel kleiner als 1.<br />
Die Folge hiervon ist, der Prozess muss verbessert werden, um die Verluste durch mangelhafte<br />
Qualität zu reduzieren. Das ist nur durch die statistische Prozessanalyse mit anschließender<br />
Steuerung des Prozesses möglich.<br />
Die statistische Prozessanalyse liefert uns hierfür die Prozessgleichung mit den wesentlichen<br />
Input- und Prozessvariablen. Die Zielwerte und den Zielbereich für die Steuerung liefert uns<br />
die statistische Tolerierung. In diesem Zusammenhang müssen wir darüber sprechen, dass die<br />
Qualität des Prozesses notwendige Voraussetzung für die Qualität des Produktes ist.<br />
Was ist die Qualität des Prozesses?<br />
Die Qualität des Prozesses ist die Fähigke it des Prozesses, Produkte mit vorgegebenen Eigenschaften<br />
zu produzieren, wobei die vorgegebenen Eigenschaften eines Produktes durch die<br />
Sollwerte und Toleranzgrenzen für die Menge der nicht unabhängigen Produktvariablen spezifiziert<br />
werden. Die Produktion solcher Produkte (materielle Produkte oder Dienstleistungen)<br />
erfordert, dass der dazu gehörende Prozess mit der Prozessgleichung in Richtung der Zielwerte<br />
gesteuert wird, so dass die Werte für die Produktvariablen der produzierten Produkte in dem<br />
durch die Toleranzgrenzen vorgegebenen Zielgebiet liegen.<br />
Die Steuerung besteht nun im wesentlichen darin, solche Werte für die Input- und Prozessvariablen<br />
in die Prozessgleichung einzusetzen, die<br />
• garantieren, dass die Werte für die Produktvariablen in dem gegebenen Zielgebiet liegen<br />
und deren Mittelwerte mit den Sollwerten übereinstimmen,<br />
• zu einer Verringerung der Variation der Produktvariablen von bislang ungesteuerten<br />
Prozessen führen<br />
• und somit simultan alle Kundenanforderungen erfüllt werden.<br />
Die Frage ist nun nur noch,<br />
Wie können wir diese Werte für die wesentlichen Input- und Prozessvariablen finden?<br />
Für die Lösung stehen uns mindestens zwei Wege zur Verfügung.
5.16 Warum und wie muss ein Prozess gesteuert werden?<br />
335<br />
Der 1. Weg führt auf die Berechnung der statistischen Sollwerte und Toleranzgrenzen für die<br />
Input- und Prozessvariablen und der 2. Weg auf die Optimierung des gesamten Prozesses mit<br />
den Methoden der linearen und nichtlinearen Optimierung (vgl. Kapitel 12).<br />
Hauptsächlich befassen wir uns in diesem Kapitel mit dem 1. Weg, da uns dieser die Sollwerte<br />
und Toleranzgren zen für die Inputprodukte liefert. Und diese sind ja notwendige Voraussetzung<br />
für die Realisierung der Kommunikation zwischen den Kunden und Lieferanten.<br />
5.16.1 Statistische Tolerierung der Inputvariablen<br />
Zuerst berechne n wir nach dem bekannten Verfahren der statistischen Tolerierung aus dem<br />
Abschnitt 5.2 die statistischen Sollwerte und Toleranzgrenzen für die wesentlichen Inputvariablen<br />
unter der Bedingung, dass die Werte für die Produktvariablen vorgegeben sind. Danach<br />
berechnen wir die Sollwerte und statistischen Toleranzgrenzen für die Prozessvariablen unter<br />
der Bedingung, dass die Produkt- und Inputvariablen gegeben sind.<br />
Mit einer vorliegenden Stichprobe berechnen wir die Inputgleichungen. Das sind Gleichungen,<br />
in denen die Inputvariablen die abhängigen Zielvariablen sind und die Produktvariablen<br />
als unabhängige Variablen fungieren. In diese Gleichungen setzen wir die Sollwerte und die<br />
Toleranzgrenzen für die Produktvariablen ein, um die Sollwerte und Toleranzgrenzen für die<br />
Inputvariablen zu berechnen.<br />
Für all die Fälle, in denen keine Sollwerte und Toleranzgrenzen für die Produktvariablen<br />
vorhanden sind, verwenden wir die Formeln der statistischen Tolerierung für die Produktund<br />
Inputvariablen und berechnen die statistischen Sollwerte und Toleranzgrenzen für die<br />
Inputvariablen.<br />
Die Berechnungen der statistischen Sollwerte und Toleranzgrenzen für die Input- und Prozessvariablen<br />
unter den entsprechenden Bedingungen werde ich an dem folgenden Beispiel<br />
demonstrieren.<br />
Beispiel 5.16.1: Chemischer Prozess. Statistische Tolerierung der Input- und<br />
Prozessvariablen<br />
Die statistischen Toleranzgrenzen wurden mit dem Prozessspezialisten abgesprochen,<br />
geringfügig korrigiert und in der Tabelle 5.16.1 zusammengefasst.<br />
Tabelle 5.16.1: Statistische Toleranzgrenzen für die Produktvariablen<br />
Produktvariable Untere Toleranz Obere Toleranz<br />
Y 1 0 8<br />
Y 2 1680 1820<br />
Y 3 1902 1920<br />
Y 4 1546 1565<br />
Y 5 8000 10000<br />
Y 6 320 400<br />
Mit den abgestimmten statistischen Toleranzgrenzen wurden die uni- und multivariaten<br />
Prozessfähigkeitsindizes berechnet und in der Tabelle 5.16.2 zusammengestellt.<br />
Die Prozessfähigkeiten sind kleiner als 1; der Prozess muss verbessert werden.
336 5 Qualität in der Fertigung<br />
Tabelle 5.16.2: Uni- und multivariate Prozessfähigkeitsindizes<br />
Produktvariable C p k C pk<br />
Y 1 0,194 3,82 –0,55<br />
Y 2 1,38 0,005 1,375<br />
Y 3 0,315 0,342 0,207<br />
Y 4 0,432 0,038 0,415<br />
Y 5 0,227 0,194 0,183<br />
Y 6 0,217 0,268 0,159<br />
Multivariate Prozessfähigkeiten<br />
MC p 0,65<br />
MC pk 0,038<br />
Die folgenden beiden Abbildungen enthalten die Star Plots für alle Input-, Prozess- und<br />
Produktvariablen und nur für die Inputvariablen, da der Verdacht besteht, dass für die<br />
Inputvariablen weder Sollwerte und Toleranzgrenzen berechnet, noch Eingangsprüfungen<br />
vorgenommen wurden.<br />
100 108<br />
90<br />
80<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
Abb. 5.16.1: Star Plots für die Input-, Prozess- und Produktvariablen<br />
10
5.16 Warum und wie muss ein Prozess gesteuert werden?<br />
337<br />
X11<br />
X17<br />
X18<br />
X19<br />
X20<br />
X21<br />
Z1<br />
Z2<br />
Z3<br />
Z4<br />
Abb. 5.16.2: Schlüssel für die Star Plots<br />
X10<br />
Z5<br />
X9<br />
Z6<br />
X7<br />
Z7<br />
X6<br />
Z8<br />
X3<br />
X2<br />
X1<br />
Y1<br />
Z11<br />
Z10<br />
Z9<br />
Die Star plots zeigen:<br />
•<br />
•<br />
•<br />
•<br />
die Streuungen für die einzelnen Variablen sind sehr groß; man vergleiche z. B. die Stars<br />
55 und 104 miteinander,<br />
der Prozess zeigt ein gewisses „Atmen“, d. h. eine gewisse systematische Veränderung<br />
bis zum Star 50 und dann eine ziemlich rigide Veränderung.<br />
Innerhalb der Gruppen gibt es aber auch noch sehr starke Veränderungen,<br />
die Produktvariable Y 1 (unerwünschtes Nebenprodukt) kommt mal sehr selten, siehe<br />
z. B. die Star Plots 86, 87, 49, 40 und ein anderes Mal sehr häufig vor, siehe z. B. die Star<br />
Plots 90, 91, 10, …<br />
100<br />
90<br />
80<br />
70<br />
60<br />
50<br />
40<br />
30<br />
Abb. 5.16.3: Star Plots für die Input- und Produktvariable Y 1<br />
20<br />
10
338 5 Qualität in der Fertigung<br />
Da die Stars aufgrund der vielen Achsen (Variablen) schwer zu interpretieren sind, weil sowohl<br />
Input-, Prozess- und Produktvariablen dargestellt wurden, wollen wir noch die Inputund<br />
die Produktvariablen allein betrachten, um zu sehen, ob die Inputvariablen ebenfalls<br />
stark streuen und diese Streuungen einen Einfluss auf die Produktvariable Y 1 haben.<br />
Z5<br />
Z4<br />
Z3<br />
Z6<br />
Z2<br />
Z7<br />
Z1<br />
Z8<br />
Y1<br />
Z9<br />
. Z10<br />
Z11<br />
Abb. 5.16.4: Schlüssel für die Star Plots für die Input- und Produktvariablen Y 1<br />
Interpretation der Star Plots für die Input- und die Produktvariablen<br />
Die Inputvariablen schwanken sehr stark. Das Produkt kann daher gar nicht homogen sein,<br />
oder anders gesprochen, das unerwünschte Nebenprodukt kommt mal vor und mal nicht.<br />
Schauen Sie sich nur einmal die Plots mit den Nummern 49 und 91 an, dann sehen Sie die<br />
gewaltigen Unterschiede. Beim Plot Nummer 91 kommt das unerwünschte Nebenprodukt<br />
in hoher Konzentration vor. Beim Plot Nummer 40 kommt das Nebenprodukt praktisch<br />
T2<br />
0 50 100 150<br />
5 10 15 20<br />
Abb. 5.16.5: Multivariate Kontrollkarte für das „Lieferantenprodukt“
5.16 Warum und wie muss ein Prozess gesteuert werden?<br />
339<br />
überhaupt nicht vor. Schon hieraus muss man schließen, dass das unerwünschte Nebenprodukt<br />
im Herstellungsprozess entsteht und dass der Prozess so gesteuert werden kann,<br />
dass das Nebenprodukt nicht mehr vorkommt. Die moderne Industrie muss nach meinem<br />
Dafürhalten anders, präziser arbeiten.<br />
Die multivariate Kontrollkarte für die Inputvariablen mit der berechneten Toleranzgrenze<br />
für das Inputprodukt in der Abbildung 5.16.5 bestätigt unsere Vermutung hinsichtlich der<br />
Inputvariablen, dass für diese nämlich keine Sollwerte und Toleranzgrenzen zu existieren<br />
scheinen.<br />
Das „Lieferantenprodukt“ sind die zusammengefassten Inputvariablen des chemischen<br />
Prozesses. Die Abbildung zeigt ganz deutlich: Die meisten Werte der Teilstichproben liegen<br />
oberhalb der Toleranzgrenze für das „Lieferprodukt“, d. h. die meisten Lieferantenprodukte<br />
sind Ausschuss. Die Input variablen erfüllen offenbar keinerlei Vorgaben. Es muss etwas<br />
getan werden.<br />
Uni- und multivariater Prozessfähigkeitsnachweis für die Inputprodukte<br />
Der Nachweis der simultanen Erfüllung der Kundenanforderungen bzgl. der Lieferantenprodukte<br />
(Menge der Inputvariablen) erfolgt über die Fähigkeiten der Tabelle 5.16.3.<br />
Tabelle 5.16.3: Univariate Prozessfähigkeitsindizes<br />
Inputvariable<br />
untere<br />
Toleranz<br />
obere<br />
Toleranz<br />
Mittel Stabw. C p k C pk<br />
Z 1 19,4 28,6 24,857 1,88 0,815 0,186 0,663<br />
Z 2 0,8 1,2 1,223 0,363 0,183 1,115 –0,021<br />
Z 3 100 160 134,85 40,136 0,249 0,161 0,209<br />
Z 4 0,3 0,4 0,3565 1,1326 0,0147 0,129 0,0128<br />
Z 5 100 180 144,56 51,654 0,258 0,114 0,229<br />
Z 6 90 130 107,93 26,86 0,248 0,103 0,222<br />
Z 7 1,12 1,18 1,13 0,0118 0,846 0,667 0,282<br />
Z 8 9,22 10,78 9,749 0,962 0,27 0,32 0,183<br />
Z 9 1600 1780 1677,25 221,79 0,135 0,142 0,116<br />
Z 10 900 1000 905,68 1147,18 0,0145 0,886 0,0017<br />
Z 11 2500 3300 2991,58 2033,33 0,066 0,229 0,051<br />
Die multivariaten Prozessfähigkeitsindizes sind<br />
MC p = 0.3104<br />
MC pk = 0.0372<br />
Die uni- und multivariaten Prozessfähigkeitsindizes bestätigen die vorangegangene Vermutung.<br />
Sie sind viel kleiner als 1. Die Inputvariablen erfüllen nicht die Anforderungen.<br />
Wie kann man die Werte für die wesentlichen Input- und Prozessvariablen finden, die auf<br />
jeden Fall die genannten Ziele der Reduktion der Variation und der Übereinstimmung<br />
von Mittel- und Sollwerten erfüllen?
340 5 Qualität in der Fertigung<br />
5.16.2 Berechnung der statistischen Sollwerte und Toleranzgrenzen für<br />
die Inputvariablen unter der Bedingung der gegebenen Werte für<br />
die Produktvariablen<br />
Diese Berechnungen werden mit dem linearen Modell mit stochastischen Variablen realisiert,<br />
wobei die Inputvariablen als Zielgrößen fungieren und für die Produktvariablen die<br />
Sollwerte und Toleranzgrenzen eingesetzt werden.<br />
Die so zu berechnenden Gleichungen nennen wir Inputgleichungen.<br />
Nach Diskussion und Abstimmung mit den Prozessexperten erhalten wir die Resultate in<br />
Tabelle 5.16.4.<br />
Tabelle 5.16.4: Statistische Sollwerte und Toleranzgrenzen für die Inputvariablen<br />
Inputvariable Sollwert untere Toleranz obere Toleranz<br />
Z 1 23,57 22,2 24,9<br />
Z 2 0,89 0,11 1,66<br />
Z 3 115,5 46,5 184,6<br />
Z 4 0,014 0 2,59<br />
Z 5 65,6 30,4 100,9<br />
Z 6 101,1 60,4 141,7<br />
Z 7 1,12 1,1 1,14<br />
Z 8 11,3 9,2 13,4<br />
Z 9 1867 1511 2223<br />
Z 10 733 633 933<br />
Z 11 2351 1160 3538<br />
Berechnung der statistischen Toleranzen für die wesentlichen Prozessvariablen<br />
Analog wie vorher werden Einstellgleichungen für die wesentlichen Prozessvariablen<br />
berechnet. In diese werden die Sollwerte und Toleranzgrenzen für die Produktvariablen<br />
und die abgestimmten statistischen Sollwerte und statistischen Toleranzgrenzen für die<br />
Inputvariablen eingesetzt. Damit erhält man die Einstellwerte und zugehörigen statistischen<br />
Toleranzgrenzen für die wesentlichen Prozessvariablen in Tabelle 5.16.5.<br />
Die Kunden haben für die unerwünschte Produktvariable die obere Grenze (oG) für Y 1<br />
vorgegeben. Diese ist oG (Y 1 ) = 8.00 [‰]. Die optimale Einstellung der Input- und wesentlichen<br />
Prozessvariablen für die Erreichung des Zieles: „die Werte von Y 1 dürfen nicht größer<br />
als 8 [‰] sein, sollten aber mehr in der Nähe der Null liegen“ ist durch die statistischen<br />
Sollwerte und Toleranzgrenzen für die Prozessvariablen und die unter den Bedingungen<br />
gegebener Produkt- und Prozessvariablen berechneten Sollwerte und Toleranzgrenzen für<br />
die Inputprodukte gegeben.<br />
Prozessgleichung für den gesteuerten Prozess<br />
Nach der Steuerung mit der Prozessgleichung wurde eine neue Stichprobe gezogen. Die<br />
erneute Berechnung der Prozessgleichung findet sich in Tabelle 5.16.6.<br />
Nach der erneuten Red-Auswahl erhält man die noch einmal reduzierte Prozessgleichung<br />
der Tabelle 5.16.7.
5.16 Warum und wie muss ein Prozess gesteuert werden?<br />
341<br />
Tabelle 5.16.5: Statistische Toleranzgrenzen für die wesentlichen Prozessvariablen<br />
Prozessvariable Sollwert untere Toleranz obere Toleranz<br />
X 1 67,8 66 69,6<br />
X 2 99,7 99,2 100,3<br />
X 3 65,2 63 67,4<br />
X 6 9,7 9,5 9,9<br />
X 7 10 9,4 10,6<br />
X 9 1130 1123 1137<br />
X 10 1060 960 1160<br />
X 11 1500 1400 1600<br />
X 17 2,6 2,5 2,7<br />
X 18 2,7 2,6 2,8<br />
X 19 36 30 42<br />
X 20 38,6 38,1 39,1<br />
X 21 25 17,8 32,2<br />
Tabelle 5.16.6: Prozessgleichung nach der Steuerung<br />
Variable Koeff.Proz.Gleich. Red(j)<br />
b o –273,416 0<br />
X 1 0,32589 0,00137<br />
X 2 –1,08663 0,01091<br />
X 3 –0,20621 0,002856<br />
X 6 –0,595993 0,000465<br />
X 7 –1,36983 0,0152204<br />
X 9 0,261945 0,0047759<br />
X 10 0,114271 0,010079<br />
X 11 –0,0716 0,0073467<br />
X 17 85,48145 0,0024669<br />
X 18 –49,4267 0,0015969<br />
X 19 0,114293 0,00582<br />
X 20 0,635618 0,007018<br />
X 21 0,167596 0,027981<br />
Z 1 0,455685 0,026173<br />
Z 2 1,633097 0,0080945<br />
Z 3 0,0121218 0,005202<br />
Z 4 4,065848 0,002721<br />
Z 5 0,068044 0,07361<br />
Z 6 –0,01391 0,00199<br />
Z 7 –18,1231 0,00493298<br />
Z 8 –0,385073 0,005596<br />
Z 9 –0,006996 0,011288<br />
Z 10 –0,00021174 9,91 E–7<br />
Z 11 0,0015124 3,177 E–3
342 5 Qualität in der Fertigung<br />
Tabelle 5.16.7: Prozessgleichung nach der erneuten Red-Auswahl<br />
Variable Koeff.Proz.Gleich. Red(j)<br />
b 0 –280,853 0<br />
X 1 0,333204 0,001372<br />
X 18 –50,0706 0,001596<br />
Z 6 –0,013221 0,001992<br />
X 17 87,2177 0,002466<br />
Z 4 4,431869 0,002721<br />
X 3 –0,225889 0,0028566<br />
Z 11 0,0013754 0,0031779<br />
X 9 0,259213 0,0047758<br />
Z 7 –18,15834 0,004932<br />
Z 3 0,012232 0,005202<br />
Z 8 –0,381648 0,005596<br />
X 19 0,11539 0,00582<br />
X 20 0,656262 0,007019<br />
X 11 –0,07158 0,007346<br />
Z 2 1,601321 0,0080945<br />
X 10 0,114915 0,010079<br />
X 2 –1,064585 0,010916<br />
Z 9 –0,0072043 0,011288<br />
X 7 –1,470685 0,01522<br />
Z 1 0,462309 0,026173<br />
X 21 0,173212 0,027981<br />
Z 5 0,067565 0,07361<br />
Die erneute Red-Auswahl führte dazu, dass die beiden Variablen X 6 und Z 10 gestrichen<br />
werden konnten. Das Maß der Beherrschbarkeit für die Prozessgleichung des gesteuerten<br />
2<br />
Prozesses ist mit R Y / X = 0,9072 sehr hoch. Die bedingte Standardabweichung (Streuung<br />
um die Prozessgleichung) ist s Y/X = 0,369.<br />
Die graphische Darstellung der Werte für Y 1 vor und nach der Steuerung zeigt die Abbildung<br />
5.16.6<br />
Anteil in ppm<br />
50<br />
45<br />
y1(gesteuert)<br />
40<br />
35<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
1 51 101 151 201<br />
Messwertsatz<br />
y1(ungesteuert)<br />
Abb. 5.16.6: Werte für die Produktvariable Y 1 vor und nach der Steuerung mit der Prozessgleichung
5.16 Warum und wie muss ein Prozess gesteuert werden?<br />
343<br />
Die Prozessverbesserung ist enorm. Hinsichtlich der Mittelwerte beträgt die Verbesserung<br />
ca. 450 %! Oder anders ausgedrückt, der Anteil des unerwünschten Nebenproduktes wird<br />
auf ca. 1/5 reduziert.<br />
Der Nachweis der simultanen Erfüllung aller relevanten Kundenanforderungen erfolgt<br />
durch uni- und multivariate Prozessfähigkeitsindizes.<br />
Tabelle 5.16.8: Univariate Prozessfähigkeiten für den gesteuerten Prozess<br />
Produktvariable C p k C pk<br />
Y 1 1,099 0,0048 1,094<br />
Y 2 1,005 0,0015 1,003<br />
Y 3 1,0086 0,027 1,004<br />
Y 5 1,0676 0,009 1,0579<br />
Y 6 1,072 0,0113 1,06<br />
Die multivariaten Prozessfähigkeitsindizes sind<br />
MC p = 1,182<br />
MC pk = 1,173.<br />
Das Maß der Beherrschbarkeit und die Prozessfähigkeitsindizes zeigen, dass der Prozess beherrscht<br />
wird und fähig ist, Produkte mit den geforderten Eigenschaften zu produzieren.<br />
Die Inputvariablen erfüllen ebenfalls simultan die Anforderungen, wie die uni- und multivariaten<br />
Prozessfähigkeitsindizes der folgenden Tabelle zeigen.<br />
Tabelle 5.16.9: Univariate Prozessfähigkeitsindizes für die Inputvariablen nach der Steuerung<br />
Inputvariable C p k C pk<br />
Z 1 1,041 0,0075 1,034<br />
Z 2 0,957 0,025 0,933<br />
Z 3 0,993 0,0047 0,998<br />
Z 4 1,103 0,0056 1,097<br />
Z 5 1,0778 0,0052 1,072<br />
Z 6 1,0294 0,0055 1,072<br />
Z 7 0,991 0,0001 0,99<br />
Z 8 0,937 0,01 0,927<br />
Z 9 0,959 0,0073 0,953<br />
Z 10 1,035 0,0099 1,024<br />
Z 11 0,976 0,0008 0,975<br />
Die multivariaten Prozessfähigkeitsindizes für die Lieferantenprodukte sind<br />
MC p = 1,027<br />
MC pk = 1,017.<br />
Auch die Lieferantenprodukte haben sich verbessert. Die Qualität der Lieferantenprodukte,<br />
ausgedrückt durch die multivariaten Prozessfähigkeitsindizes ist geringfügig größer als 1,<br />
kann also noch etwas verbessert werden.<br />
Die uni- und multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die<br />
Prozessvariablen sind in folgender Tabelle dargestellt.
344 5 Qualität in der Fertigung<br />
Tabelle 5.16.10: Univariate Prozessfähigkeitsindizes<br />
Prozessvariable C p k C pk<br />
X 1 0.38 0.025 0.37<br />
X 2 0.84 0.083 0.77<br />
X 3 0.619 0.026 0.60<br />
X 6 1.11 0.11 0.98<br />
X 9 0.20 0.4 0.12<br />
X 10 0.12 0.003 0.12<br />
X 11 0.12 0.11 0.105<br />
X 17 0.05 0.12 0.045<br />
X 18 0.049 0.18 0.04<br />
X 19 1.31 0.097 1.18<br />
X 20 0.937 0.048 0.89<br />
X 21 0.98 0.12 0.85<br />
Die multivariaten Prozessfähigkeitsindizes des ungesteuerten Prozesses für die Prozessvariablen<br />
sind<br />
MC p = 0.9399<br />
MC pk = 0.0798.<br />
Die Einstellung der Prozessvariablen ist nicht in Ordnung. Mit den berechneten Einstellwerten<br />
für die Prozessvariablen erhält man die Fähigkeitsindizes der Tabelle 5.16.11.<br />
Tabelle 5.16.11: Univariate Prozessfähigkeitsindizes für die Prozessvariablen<br />
Prozessvariable C p k C pk<br />
X 1 0.48 0.008 0.48<br />
X 2 0.98 0.14 0.84<br />
X 3 0.68 0.00 0.68<br />
X 6 1.21 0.05 1.15<br />
X 9 0.26 0.004 0.26<br />
X 10 0.15 0.005 0.15<br />
X 11 0.12 0.01 0.12<br />
X 17 0.033 0.004 0.03<br />
X 18 0.03 0.03 0.03<br />
X 19 0.89 0.01 0.88<br />
X 20 0.86 0.05 0.81<br />
X 21 1.22 0.005 1.22<br />
Die multivariaten Prozessfähigkeitsindizes für die Prozessvariablen sind<br />
MC p = 0.992<br />
MC pk = 0.8226.<br />
Die Qualität des Prozesses muss weiter verbessert werden. Die Zentrierung ist in Ordnung,<br />
die Reduktion der Variabilität der Prozessvariablen ist nicht ausreichend. Die Entscheidung<br />
muss aber das Management fällen, da die weitere Verbesserung Kosten verursacht.
5.16 Warum und wie muss ein Prozess gesteuert werden?<br />
345<br />
Die Verbesserung des Prozesses durch die Steuerung mit der Prozessgleichung kann durch<br />
die multivariate Regelkarte für die „Produkte“ in Abbildung 5.16.7 sichtbar gemacht<br />
werden. Auch die Verbesserung der Lieferantenprodukte durch die Steuerung des Lieferantenprozesses<br />
mit den berechneten Sollwerten und Toleranzgrenzen als Zielgebiet kann<br />
visualisiert werden.<br />
T2<br />
0 1 2 3 4 5<br />
0 10 20 30 40<br />
Abb. 5.16.7: Multivariate Kontrollkarte für die Produkte des gesteuerten Prozesses<br />
Alle Produkte liegen unterhalb der Toleranzgrenze für das Produkt. Der Prozess ist in Ordnung,<br />
d. h. die Produkte erfüllen simultan alle relevanten Kundenanforderungen.<br />
Die multivariate Kontrollkarte für die Lieferantenprodukte ist in der Abbildung gegeben.<br />
T2<br />
0 1 2 3 4 5 6<br />
0 10 20 30 40<br />
Abb. 5.16.8: Kontrollkarte für die gesteuerten Lieferantenprodukte<br />
Bei dieser Karte liegen zwei Stichproben oberhalb der Kontrollgrenze. Der Lieferantenprozess<br />
muss noch weiter verbessert werden.
346 5 Qualität in der Fertigung<br />
5.17 Zusammenfassung der Produktvariablen<br />
Welches Problem soll mit der Zusammenfassung gelöst werden?<br />
Wiederholt habe ich darauf hingewiesen, dass<br />
• ein Produkt durch m, m ≥ 1 nicht unabhängige Produktvariablen beschrieben wird,<br />
• sich die Produktvariablen mitunter bzgl. ihrer Zielstellung gegensätzlich verhalten, d. h. die<br />
eine Produktvariable muss eventuell maximiert, die andere minimiert werden,<br />
• der Prozess zur Herstellung eines Produktes aber nur nach dem Zielwert einer Produktvariablen<br />
gesteuert werden kann,<br />
• die Steuerung nur mit einer optimalen Teilmenge von Input- und Prozessvariablen möglich<br />
ist und<br />
• nur mit einer optimalen Einstellung für die Input- und Prozessvariablen vorgenommen<br />
werden kann.<br />
Aus diesen Feststellungen folgt, dass für die Ermittlung der einen optimalen Teilmenge von<br />
Input- und Prozessvariablen und die Berechnung der optimalen Einstellung, die Produktvariablen<br />
zusammengefasst werden müssen.<br />
Diese Zusammenfassung kann natürlich nicht auf der Addition basieren, denn die Produktvariablen<br />
haben verschiedene Dimensionen und sind nicht unabhängig voneinander.<br />
Wie können die verschiedenen Produktvariablen zusammengefasst werden?<br />
Um diese Frage beantworten zu können, müssen wir einige Sachverhalte aus der Schätztheorie<br />
wiederholen.<br />
Es liege wieder eine Stichprobe X 1 , …, X N für den zufälligen Vektor X T = (X 1 , …, X n ) vor. Der<br />
T<br />
Vektor der Mittelwerte X = ( X 1 ,…, X n ) ist n-dimensional normalverteilt mit dem Erwartungswert<br />
μ T = (µ 1 , …, µ n ) und der Kovarianzmatrix N –1 Σ. Wir symbolisieren diese Tatsache<br />
−1<br />
durch X ∼ Nn<br />
( μ, N Σ)<br />
.<br />
Die Schätzfunktion N S ist Wishart verteilt mit den Verteilungsparametern Σ und N – 1, wobei<br />
S die Stichprobenkovarianzmatrix bezeichnet. Die Wishart Verteilung ist eine multivariate<br />
Verallgemeinerung der χ 2 Verteilung. Diesen Sachverhalt kürzen wir durch die Symbolik<br />
N S ~ W n (Σ, N – 1) ab.<br />
Analog wie im univariaten Fall gilt auch im multivariaten Fall, dass X und N S unabhängig<br />
voneinander sind. Mit diesen Bezeichnungen gilt,<br />
T<br />
−1 2<br />
( N −1)( X − μ) S ( X − μ) = T .<br />
T 2 bezeichnet die Hotelling Statistik und leistet genau das von uns Gewünschte. Wir verwenden<br />
also die T 2 -Statistik für die Zusammenfassung der m, m ≥ 1 Produktvariablen zu einer neuen<br />
univariaten Statistik in der Form<br />
2 T −1<br />
T i i i<br />
= ( X − X) S ( X − X).<br />
Die T 2 -Statistik von Hotelling ist die multivariate Verallgemeinerung des Quadrates der univariaten<br />
t 2 -Statistik.
5.17 Zusammenfassung der Produktvariablen<br />
347<br />
Beispiel 5.17.1: Karosseriebau. Zusammenfassung der Produktvariablen<br />
Die m = 14 nicht unabhängigen Produktvariablen Y 1 , …, Y 14 werden zu „Produkten“ über<br />
die T 2 -Statistik von Hotelling zusammengefasst. Die Werte für diese Statistik werden in<br />
der Abbildung 5.17.1 dargestellt.<br />
80<br />
Produkte<br />
60<br />
40<br />
20<br />
0<br />
0 40 80 120 160 200 240<br />
Messwertsätze<br />
Abb. 5.17.1: Produkte für die Karosserievariablen<br />
Es ist, so glaube ich, sofort einzusehen, dass sich die univariaten T 2 i-Werte leichter einschätzen<br />
lassen als die Matrix der m = 14 mal N Einzelwerte.<br />
Große Werte können vorkommen, weil<br />
•<br />
•<br />
entweder ein Einzelwert für eine Produktvariable sehr groß wird oder<br />
die Werte für mehrere oder alle Produktvariablen an den Grenzen der statistischen<br />
Konfidenzintervalle liegen.<br />
Für die T 2 -Statistik gilt des weiteren<br />
T<br />
2<br />
( N − 1) n<br />
≥ F<br />
N − n<br />
nN , −n ( α ).<br />
Mit dieser Eigenschaft kann die T 2 -Statistik von Hotelling verwendet werden, um verschiedene<br />
Hypothesen über den Vektor X bzw. X zu prüfen.<br />
Außerdem gilt<br />
T 1 1<br />
i −<br />
−<br />
i i i<br />
E[( X − X) S ( X − X)] = Sp{ E[ X − X) ( X − X) S ]] = n.<br />
Diese Eigenschaft ist bei vielen praktischen Anwendungen nachteilig. So kann man aufgrund<br />
dieser Eigenschaft die T 2 -Statistik nicht verwenden, um die Prozessverbesserung nachzuweisen,<br />
indem man die Produktvariablen Y 1 , …, Y m vor und nach der Prozessverbesserung zu den<br />
Produkten zusammenfasst.<br />
Übung Kneterprozess<br />
Probleme<br />
In einem Unternehmen der Kunststoffindustrie gibt es Probleme mit den Knetern.<br />
Die ex- und internen Kundenanforderungen sind nur in einem Lastenheft verbal hinterlegt.<br />
Die Kunden der Kneterprodukte sind unzufrieden, können aber ihre Unzufriedenheit nicht<br />
quantitativ belegen. Die Streuungen der einzelnen Produktvariablen sind nachweisbar zu groß.<br />
Der Messwertaufwand ist für die vorliegenden Resultate zu hoch.
348 5 Qualität in der Fertigung<br />
Prozessbeschreibung<br />
Die Inputprodukte werden durch k = 14 Inputvariablen, der Prozess wird durch n = 21 Prozessvariablen<br />
und die Produkte werden durch m = 16 Produktvariablen beschrieben.<br />
Die Visualisierung einer Stichprobe von N = 155 Wertesätzen für die Produktvariablen liefert<br />
die Star Plots der Abbildung 5.17.2. Diese bestätigen die großen Streuungen der einzelnen<br />
Variablen. Die Stars variieren in ihrer Form sehr stark, zeigen aber auch gewisse periodische<br />
Schwankungen, deren Ursache wir nicht kennen.<br />
Die Zusammenfassung der Produktvariablen liefert die Abbildung 5.17.4.<br />
Die Zusammenfassung der Inputvariablen liefert die Abbildung 5.17.5.<br />
Der Vergleich der beiden Abbildungen zeigt einen deutlichen Zusammenhang zwischen den<br />
Input- und Produktvariablen. Daraus folgt, dass die Ursache für das Problem in der Kommunikation<br />
zwischen dem Kunden- und Lieferantenprozess zu liegen scheint.<br />
144 150<br />
131<br />
118<br />
105<br />
92<br />
79<br />
66<br />
53<br />
Abb. 5.17.2: Star Plots für die Kneterprodukte
5.17 Zusammenfassung der Produktvariablen<br />
349<br />
MISCH05.Y5<br />
MISCH05.Y4<br />
MISCH05.Y7<br />
MISCH05.Y8<br />
MISCH05.Y2<br />
MISCH05.Y1<br />
MISCH05.Y10<br />
MISCH05.Y12<br />
MISCH05.Y14<br />
Abb. 5.17.3: Schlüssel für die Star Plots<br />
T-Squared<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
Multivariate Control Chart<br />
0 30 60 90 120 150<br />
Observation<br />
Abb. 5.17.4: Zusammenfassung der Produktvariablen<br />
UCL = 25,37<br />
T-Squared<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
zusammengefasste Inputparameter<br />
0 30 60 90 120 150<br />
Observation<br />
UCL = 20,38<br />
Abb. 5.17.5: Zusammenfassung der Inputvariablen<br />
Für die statistische Prozessanalyse habe ich für Sie eine Auswahl für die Input-, Prozess- und<br />
Produktvariablen getroffen, damit Sie mit den beiliegenden Programmen arbeiten können.<br />
Diese sind:<br />
•<br />
•<br />
zwei Rohstoffe, die durch Z 13 und Z 14 beschrieben werden,<br />
die drei Prozessvariablen<br />
X 4 Masse [kg]<br />
X 10 Drehzahl [U/min]<br />
X 12 Mischzeit [min]<br />
und die beiden
350 5 Qualität in der Fertigung<br />
• Produktvariablen mit den Sollwerten und Toleranzgrenzen<br />
Y 9 Rheo Wert (Soll = 0,6, T u = 0,59, T o = 0,61)<br />
Y 12 Dichte (Soll = 1,05, T u = 1,024, T o = 1,076).<br />
Führen Sie bitte eine umfassende statistische Prozessanalyse mit den Zwischenergebnissen<br />
•<br />
•<br />
•<br />
•<br />
Definition des Problems,<br />
Quantifizierung der Abhängigkeitsstruktur,<br />
Berechnung der Prozessgleichungen,<br />
Steuerung des Prozesses mit der Prozessgleichung<br />
durch.<br />
5.18 Kalibrierung<br />
Die pra ktische Erfahrungen – nicht immer positiv – eines Labors zur Untersuchung von Bodenproben<br />
mit der DIN ISO 8466-2 „Kalibrierstrategie für nichtlineare Kalibrierfunktionen<br />
zweiten Grades“, Auftraggebern und Gutachtern für die Verfahrensetablierung, veranlassten<br />
uns, diesen Beitrag aufzunehmen.<br />
Das Problem aus dem Zusammenspiel der Kombattanten besteht häufig in der Vorgabe einer linearen<br />
Kalibrierung durch die Verfahrensetablierung, obwohl der Sachverhalt nichtlinear ist.<br />
Zur Lösung dieses Problems muss dafür Sorge getragen werden, dass obige Norm unbedingt<br />
angewandt wird. Dazu sind einige Verbesserungen erforderlich, die wir im Folgenden diskutieren<br />
wollen.<br />
Messwerte und Entscheidungen<br />
Eine umweltbelastende Konsequenz der industriellen Ansiedlungen sind kontaminierte Böden.<br />
Diese müssen gereinigt und in den Kreislauf zurückgeführt werden. Dazu sucht der Besitzer<br />
des Bodens durch Ausschreibung einen Sanierer. Zur Konkretisierung der Ausschreibung und<br />
für den Nachweis der simultanen Erfüllung aller relevanten Kunden – Besitzer und Gesetzgeber<br />
– Anforderungen schaltet der Sanierer ein Labor und falls erforderlich einen Gutachter ein. Das<br />
Labor ermittelt für die kontaminierten Böden nach einer entsprechenden Parametrisierung<br />
die Istwerte für die festgelegten Variablen.<br />
In diesem Zusammenhang ist die Kalibrierung von grundlegender Bedeutung, da die Konzentrationen<br />
bestimmter Substanzen nicht direkt gemessen werden können. Es lässt sich nur eine<br />
Funktion Y (Kalibrierfunktion) der Konzentration X, Y = f(X) messen. Der Funktionstyp und<br />
die Koeffizienten der Funktion sind unbekannt und müssen so genau wie möglich bestimmt<br />
werden. Hierfür werden Daten für Standardproben gewonnen. Die Konzentration X i wird<br />
vorgegeben und die Funktion der Konzentration Y i , i = 1, …, N wird gemessen. Die Werte Y i<br />
nennt man der Einfachheit halber Messwerte der Variablen. Bei den praktischen Problemen<br />
gewinnt man die Messwerte Y i und will durch einen Umkehrschluss X = g(Y) die Konzentration<br />
der Verbindung bestimmen. Die Funktion g(X) nennt man Analysefunktion.<br />
Vom Kunden (Gesetzgeber, Besitzer, Weiterverwerter, …) werden die Anforderungen an den<br />
weiter zu verwertenden Boden gestellt. Das Labor hat nach der Reinigung der Böden die
5.18 Kalibrierung<br />
351<br />
Kundenanforderungen<br />
Kundenanforderungen<br />
Gesetzgeber<br />
N<br />
kontaminierter<br />
Boden<br />
Sanierung<br />
gereinigter<br />
Boden<br />
E<br />
J<br />
Verbringung<br />
In den Kreislauf<br />
zurückgeführt<br />
Bodenvariablen Prozessvariablen Bodenvariablen Prozessvariablen Bodenvariablen<br />
Labor<br />
Labor<br />
Messwertermittlung<br />
Nachweis der Erfüllung<br />
Messwertermittlung<br />
Nachweis der Erfüllung<br />
Abb. 5.18.1: Netzwerk der Prozesse für die Bodensanierung<br />
Werte für die Variablen erneut zu bestimmen und den Nachweis zu führen, dass simultan alle<br />
relevanten Anforderungen durch den gereinigten Boden erfüllt werden. Das Zusammenspiel<br />
der Prozesse und Verantwortlichen wird durch das abgebildete Netzwerk der Prozesse mit<br />
Kommunikation dargestellt.<br />
Nach dieser Abbildung sind die folgenden Fehlentscheidungen möglich:<br />
Tabelle 5.18.1: Entscheidungen und Fehlentscheidungen<br />
Boden<br />
Entscheidungen<br />
A Anforderungen nicht erfüllt B Anforderungen erfüllt<br />
kontaminiert Ja Fehlentscheidung 1<br />
saniert Fehlentscheidung 2 ja<br />
Die Fehlentscheidung 1 besagt, dass ein kontaminierter Boden in den Kreislauf zurückkommt<br />
und die Umwelt weiter schwer belastet. Durch das Zurückholen und erneute Reinigen des Bodens<br />
entsteht ein enormer Verlust für den Kunden. Die Fehlentscheidung 2 verlangt, dass ein<br />
ausreichend sanierter Boden erneut saniert wird und daher ein Verlust für die Bodensanierer<br />
entsteht.<br />
Die Wahrscheinlichkeiten für Fehlentscheidungen müssen minimiert werden, um Verluste zu<br />
vermeiden oder zumindest ebenfalls zu minimieren.<br />
Hierfür stehen uns aber nur zwei Möglichkeiten zur Verfügung. Der erste Weg bedeutet Investitionen<br />
in neue Geräte. Der zweite Weg verlangt geistige Investition, um die Gesetzmäßigkeiten<br />
der Sanierung und den simultanen Nachweis der Erfüllung aller relevanten Anforderungen im<br />
Sinne der DIN ISO Norm zu erkennen und auszunutzen. Damit wird deutlich, dass der erste<br />
Weg nur dann beschritten werden darf, wenn der zweite nicht mehr weiter führt, zumal in der<br />
Regel die materiellen Investitionen ausgeschöpft sind.
352 5 Qualität in der Fertigung<br />
Beispiel 5.18.1: Kalibrierung. Linear<br />
Für die Kalibrierung liegen die Messwerte M 1 und die Konzentrationen vor. Die Darstellung<br />
dieser Wertepaare enthält die Abbildung 5.18.2.<br />
Werden die Punkte durch eine lineare Kalibrierfunktion angepasst, dann erhält man die<br />
Abbildung 5.18.3.<br />
Die Kalibriergerade hat die Koeffizienten<br />
Y = M 1 = b 0 + b Y/X X = –44611 + 1,36577 Konzentration.<br />
Zur Beurteilung der Kalibrierfunktion werden das Quadrat des Korrelationskoeffizienten<br />
2<br />
r Y / X = 0.9935 und die Reststandardabweichung S Y/X = 37540 angegeben.<br />
Der quadrierte Korrelationskoeffizient ist ein Maß für die lineare Abhängigkeit zwischen<br />
den Messwerten Y und der Konzentration X und gibt an, zu wieviel Prozent die Varianz der<br />
Messwerte Y durch die Konzentration erklärt wird. Dieser Koeffizient ist erfreulicherweise<br />
überaus groß, d. h. ca. 99.3 % der Varianz der Messwerte werden durch die Konzentration<br />
(X 100000)<br />
15<br />
12<br />
9<br />
M1<br />
6<br />
3<br />
0<br />
0 0,2 0,4 0,6 0,8 1<br />
Konzentration<br />
Abb. 5.18.2: Statistischer Zusammenhang zwischen den Messwerten M 1 und den Konzentrationen<br />
(X 100000)<br />
15<br />
12<br />
9<br />
M1<br />
6<br />
3<br />
0<br />
0 0,2 0,4 0,6 0,8 1<br />
Abb. 5.18.3: Anpassung der Messwerte durch eine lineare Kalibrierfunktion<br />
Konzentration
5.18 Kalibrierung<br />
353<br />
erklärt. Die Reststandardabweichung ist die Standardabweichung der Messwerte um die<br />
Kalibriergerade. Diese kann nach der einfachen Beziehung<br />
2 2 2<br />
Y / X = Y − Y / X<br />
S S (1 R )<br />
berechnet werden.<br />
Die quadratische Kalibrierfunktion ist<br />
2 2<br />
Y = M1 + b0 ′ + bY′ / X X + bY′<br />
/ XX X = 6398,8 + 991257 Konz + 383015 Konz<br />
Das Quadrat des (in diesem Falle multiplen) Korrelationskoeffizienten ist<br />
2<br />
Y<br />
R / X = 0.9987.<br />
Würde man aufgrund des Korrelationskoeffizienten entscheiden, ob die lineare Kalibrierung<br />
ausreichend ist, so würde man – wie so häufig – entscheiden, dass die lineare Kalibrierung<br />
ausreicht. Aber berechnet man die Reststandardabweichung, dann erhält man den Wert<br />
S Y/X = 16325.<br />
Das ist eine Verbesserung von mehr als 220 %!<br />
Die Darstellung der quadratischen Kalibrierfunktion ist in der Abbildung 5.18.4 zu sehen.<br />
(X 100000)<br />
15<br />
12<br />
9<br />
M1<br />
6<br />
3<br />
0<br />
0 0,2 0,4 0,6 0,8 1<br />
Abb. 5.18.4: Quadratische Kalibrierfunktion mit dem 95 % Konfidenzintervall<br />
Konzentration<br />
Auswirkungen des linearen und quadratischen Ansatzes auf die Kalibrierfunktion<br />
Für die Bestimmung der unbekannten Konzentration einer Substanz wird die Analysefunktion<br />
X =g(Y) verwendet. Diese Funktion wird in den verschiedenen Standards als Umkehrfunktion<br />
der Kalibrierfunktion bestimmt. Das ist nicht zulässig, da der Zusammenhang zwischen den<br />
Messwerten M 1 und der Konzentration stochastisch und damit nicht eineindeutig ist. Es ist<br />
besser allgemein anzunehmen, dass<br />
(Y, X) ~ N 2 (µ, Σ),<br />
wobei µ T = (µ Y , µ X ) und<br />
⎛<br />
2<br />
σY<br />
σ ⎞<br />
Σ = ⎜ ⎟.<br />
⎝ σ ⎠<br />
YX<br />
2<br />
X
354 5 Qualität in der Fertigung<br />
Da zu Beginn der Analysen alles unbekannt ist, verwendet man Standardproben und bestimmt<br />
hierfür für vorgegebene Konzentrationen die Messwerte.<br />
Unter dieser Annahmen kann man mit derselben Methode und denselben Werten die Analysefunktion<br />
X = g(Y) bestimmen.<br />
Mit dieser Funktion kann der Nachweis über das Vorhandensein einer Verbindung geführt<br />
werden. Darüber hinaus kann aber auch die Konzentration (Gehalt) einer Verbindung bestimmt<br />
werden.<br />
Die Chemiker sind an weiteren Charakteristika interessiert. Zu diesen gehören der kritische<br />
Wert einer Messgröße, die Nachweisgrenze, die Erfassungsgrenze und die Bestimmungsgrenze.<br />
Diese Charakteristika hängen natürlich ganz stark vom Kurventyp der Kalibrier- bzw.<br />
Analysefunktion ab und können daher auch als Entscheidung für den einen oder anderen<br />
Funktionstyp dienen.<br />
Der kritische Wert der Messgröße Y we ist darauf hin, dass mit vorgebbarer Wahrscheinlichkeit<br />
die Substanz vorhanden ist.<br />
Der kritische Wert muss berechnet werden. Als Modell wird die Breite des „Prognoseintervalls“<br />
an der Stelle X = 0 (Konzentration ist gleich null) verwendet.<br />
Für den Vergleich der verschiedenen Typen der Kalibrierfunktion werden die Prognosevarianz<br />
und damit die Prognoseintervallbreite für den linearen und quadratischen Fall berechnet.<br />
Für die lineare Kalibrierfunktion erhält man aus den Berechnungen die Schätzung für die<br />
Prognosevarianz<br />
⎛<br />
ˆvar [ Yˆ<br />
( X )]<br />
⎜<br />
1<br />
2<br />
2 1 ( XE<br />
− X)<br />
E = SY /<br />
⎜<br />
X + +<br />
N<br />
⎜ N<br />
2<br />
⎜ ∑ ( Xi<br />
− X)<br />
⎝<br />
i=<br />
1<br />
und damit die halbe Breite des Prognoseintervalls<br />
⎞<br />
⎟<br />
⎟<br />
⎟<br />
⎟<br />
⎠<br />
ˆ 1 ( XE<br />
− X)<br />
YE + tFG, α ⋅ SY / X ⋅ 1 + +<br />
.<br />
N<br />
N<br />
2<br />
( X − X)<br />
∑<br />
i=<br />
1<br />
i<br />
In diesen Darstellungen ist X E die Konzentration für die man die Prognose berechnen möchte<br />
und Y ˆ ˆ( E = Y XE)<br />
.<br />
Für die quadratische Kalibrierfunktion gilt<br />
2<br />
ˆ 2 ⎡ 1<br />
T −1<br />
⎤<br />
ˆvar( YE) = SY / X ⎢<br />
1 + + ( XE − X) AXX ( XE<br />
− X)<br />
⎣ N<br />
⎥<br />
⎦<br />
und damit<br />
1<br />
Y t S X X A X X<br />
N<br />
ˆ T −1<br />
E + FG, α ⋅ Y / X ⋅ 1 + + ( E − ) XX ( E − ).
5.18 Kalibrierung<br />
355<br />
Beispiel 5.18.2: Kalibrierung. Vorhersageintervall<br />
Für die lineare Kalibrierfunktion erhält man das Prognoseintervall für die Stelle X E = 0<br />
ˆ 1 ( XE<br />
− X)<br />
YE + tFG, α ⋅ SY / X ⋅ 1 + + = − 44611 ± 97845,<br />
N<br />
N<br />
2<br />
( X − X)<br />
∑<br />
i=<br />
1<br />
d. h. die halbe Breite des Prognoseintervalls ist 97845.<br />
Der kritische Messwert für die lineare Kalibrierfunktion ist<br />
i<br />
2<br />
1 X<br />
Yk = b0 + tFG, α ⋅ SY / X ⋅ 1 + + = − 44611 + 97845 = 53234.<br />
N<br />
N<br />
2<br />
( X − X)<br />
∑<br />
i=<br />
1<br />
Für die quadratische Kalibrierfunktion erhalten wir<br />
i<br />
2<br />
1<br />
Y t S X X A X X<br />
N<br />
ˆ T −1<br />
E + FG, α ⋅ Y / X ⋅ 1 + + ( E − ) XX ( E − ) = 6398.8 ± 44542<br />
d. h. die halbe Breite des Prognoseintervalls 44542 ist sehr viel kleiner als bei der linearen<br />
Kalibrierfunktion.<br />
Der Wert Y ˆ( X E = 0) entspricht dem Wert b 0 in den Kalibrierfunktionen.<br />
Der kritische Messwert für die quadratische Kalibrierfunktion ist<br />
1<br />
T −1<br />
Yk = b0 + tFG, α ⋅ SY / X ⋅ 1 + + ( XE − X) AXX ( XE<br />
− X) = 6398 + 44542<br />
N<br />
= 50940.<br />
Beispiel 5.18.3: Nachweisgrenze<br />
Die Nachweisgr enze ist die Konzentration, die dem kritischen Wert des Messwertes entspricht.<br />
Im linearen Fall erhält man für die Funktion X = g(Y) die halbe Breite des Prognoseintervalls<br />
ˆ 1 ( YE<br />
− Y)<br />
XE + tFG, α ⋅ SX / Y ⋅ 1 + +<br />
N<br />
N<br />
( Y − Y)<br />
und damit die Nachweisgrenze<br />
∑<br />
i=<br />
1<br />
1 ( Yk<br />
− Y)<br />
XNG = tFG, α ⋅ SX / Y⋅ 1 + + = 0.069987.<br />
N<br />
N<br />
2<br />
( Y − Y)<br />
∑<br />
i=<br />
1<br />
i<br />
i<br />
2<br />
2<br />
2
356 5 Qualität in der Fertigung<br />
Im quadratischen Fall erhält man<br />
1<br />
X b t S Y Y A Y Y<br />
N<br />
ˆ T −1<br />
E = 0′ + FG, α ⋅ X / Y ⋅ 1 + + ( E − ) YY ( E − )<br />
und die Nachweisgrenze<br />
1<br />
T −1<br />
XNG = tFG, α ⋅ SX / Y⋅ 1 + + ( YE− Y) AYY ( YE− Y) = 0.05696.<br />
N<br />
Die Nachweisgrenze für den quadratischen Ansatz liegt ungefähr bei nur 80 % des linearen<br />
Ansatzes.<br />
Beispiel 5.18.4: Erfassungsgrenze<br />
Diese Grenze bezei chnet die kleinste Konzentration bei der mit vorgebbarer Wahrscheinlichkeit<br />
der Nachweis der Substanz möglich ist.<br />
Für den linearen Fall erhält man für die vorgebbare Wahrscheinlichkeit β = α die Erfassungsgrenze<br />
1 ( Yk<br />
− Y)<br />
XEG = XNG + tFG, α ⋅ SX / Y⋅ 1 + + = 0.1399.<br />
N<br />
N<br />
2<br />
( Y − Y)<br />
Für den quadratischen Fall gilt<br />
1<br />
T −1<br />
XEG = XNG + tFG, α ⋅ SX / Y⋅ 1 + + ( YE− Y) AYY ( YE− Y) = 0.11392.<br />
N<br />
∑<br />
i=<br />
1<br />
i<br />
2<br />
Beispiel 5.18.5: Bestimmungsgrenze<br />
Für diese Grenze mus s die relative Ergebnisunsicherheit, die sich aus der halben Breite des<br />
Prognoseintervalls für die Konzentration X und der Bestimmungsgrenze X BG sowohl für<br />
den linearen<br />
t<br />
1<br />
⋅ S ⋅ 1 + +<br />
N<br />
FG, α X / Y<br />
X<br />
als auch quadratischen Fall<br />
BG<br />
2<br />
( Yi<br />
− Y)<br />
N<br />
2<br />
∑ ( Yi<br />
− Y)<br />
i=<br />
1 ΔXBG<br />
XBG<br />
= = V (lin)<br />
r<br />
tFG, α ⋅ SX / Y⋅ 1<br />
T −1<br />
1 + + ( Yi− Y) AYY ( Yi<br />
N<br />
− Y)<br />
X<br />
BG<br />
ΔXBG<br />
= = Vr<br />
(quad)<br />
X<br />
BG<br />
ergibt, bestimmt werden. Dieser Quotient soll nun mit vorgegebener Wahrscheinlichkeit<br />
α einen vorher definierten Wert k annehmen, z. B. k =3. Symbolisch kann man hierfür<br />
schreiben P (V r ≥ k) = α.
5.18 Kalibrierung<br />
357<br />
In die Formeln für die Prognoseintervalle muss anstelle des beliebigen Messwertes Y i der<br />
Messwert an der Stelle der Bestimmungsgrenze eingesetzt werden. Dieser Wert ist aber unbekannt.<br />
Folglich müsste man ein approximatives Verfahren entwickeln oder eine Schätzung<br />
einsetzen. Als Schätzung wird nach dem HBU Standard der Wert Y BG = k ΔY BG verwendet.<br />
Hierfür gilt P (ΔX BG ≥ k X BG ) = α.<br />
Formt man nun die Quotienten V r um, dann erhält man für den linearen Fall die Bestimmungsgrenze<br />
1 ( k ⋅YNG<br />
− Y)<br />
XBG = k ⋅tFG, α ⋅ SX / Y⋅ 1 + + = 0.167822<br />
N<br />
N<br />
2<br />
( Y − Y)<br />
bzw. für den quadratischen Fall die Grenze<br />
∑<br />
i=<br />
1<br />
1<br />
T −1<br />
XBG = k ⋅tFG, α ⋅ SX / Y⋅ 1 + + ( k ⋅YNG− Y) AYY<br />
( k ⋅YNG<br />
− Y) = 0.065005.<br />
N<br />
Auch hier sieht man wieder die Verbesserung um ca. 250 % beim Übergang vom linearen<br />
zum quadratischen Ansatz.<br />
Schlussfolgerungen<br />
Wenn der Zusammenhang zwischen der Konzentration und dem Messwert nichtlinear ist, dann<br />
muss mit der nichtlinearen Kalibrierfunktion gearbeitet werden, da ansonsten der Verlust an<br />
Genauigkeit (Reststandardabweichung) zu groß wird und damit der kritische Messwert, die<br />
Nachweis-, Erfassungs- und Bestimmungsgrenzen zu ungenau – ebenfalls zu hoch – bestimmt<br />
werden. Die Verschlechterungen können in der Regel nicht durch die materielle Investition in<br />
Geräte aufgefangen werden und sind außerdem sehr teuer.<br />
Die DIN ISO Norm 8466-2: 2000-09 sollte mit den hier vorgestellten Verfahren vervollständigt<br />
werden, damit das Konfliktpotential bei der Ausschreibung zwischen den Kombattanten<br />
im Sinne einer klaren Entscheidung aufgrund eindeutiger statistischer Ergebnisse reduziert<br />
werden kann.<br />
In diesem Zusammenhang sollten auch die Konfliktpotentiale, die auf der Bestimmung der<br />
Kalibrierfunktion mit Wiederholungen und der Rekalibrierung basieren, diskutiert und beseitigt<br />
werden.<br />
i<br />
2