09.07.2015 Views

Studijní text [pdf] - Personalizace výuky prostřednictvím e-learningu

Studijní text [pdf] - Personalizace výuky prostřednictvím e-learningu

Studijní text [pdf] - Personalizace výuky prostřednictvím e-learningu

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Vysoká škola báňská – Technická univerzita OstravaPLÁNOVÁNÍ EXPERIMENTŮučební <strong>text</strong>Josef TošenovskýOstrava 20102


Recenze:Ing. Radomír Perzina, Ph.D.Prof. RNDr. Alena Lukasová,CSc.Název: Plánování experimentůAutor: Josef TošenovskýVydání: první, 2012Počet stran: 230Náklad: 20Studijní materiály pro studijní obor Řízení jakosti FMMIJazyková korektura: nebyla provedena.Určeno pro projekt:Operační program Vzděláváním pro konkurenceschopnostNázev: <strong>Personalizace</strong> výuky prostřednictvím e-<strong>learningu</strong>Číslo: CZ.1.07/2.2.00/07.0339Realizace: VŠB – Technická univerzita OstravaProjekt je spolufinancován z prostředků ESF a státního rozpočtu ČR© Josef Tošenovský© VŠB – Technická univerzita OstravaISBN 978-80-248-2592-2


OBSAH1. Úplný faktorový experiment se dvěma úrovněmi 71.1 Kódované proměnné 91.2 Jednofaktorový plán 101.3 Efekt faktoru 111.4 Rozptyl odhadu efektu faktoru 171.5 Test významnosti efektu 201.6 Grafické hodnocení efektu faktorů 211.7 Regresní model experimentu 231.8 Reziduální odchylky: výpočet, vlastnosti a význam 241.9 Metoda nejmenších čtverců v DOE 251.10 Grafy interakcí 272. Částečný faktorový experiment se dvěma úrovněmi 372.1 Operace s faktory a jejich vlastnosti 382.2 Nalezení zaměnitelných dvojic 392.3 Stanovení počtu zaměnitelných faktorů 462.4 Volba generátorů u středových plánů 472.5 Projekce plánu 472.6 Doplňkové frakce: tvorba a vlastnosti 492.7 Plán experimentu pro osm faktorů 523. Významné body plánu 584 Úplné kvadratické modely 614.1 Podmínky nalezení modelu 614.2 Test křivosti 624.3 Metody nalezení kvadratického modelu 634.3.1 Kombinovaný plán 634.3.2 Výpočet optimální úrovně významných faktorů 644.3.3 Box – Behnkenův plán experimentu 704.3.4 Plány pro faktory se třemi úrovněmi 715. Bloky 745.1 Konstrukce bloků 755.2 Hodnocení vlivu bloků 776. ANOVA v DOE 826.1 Rozklad reziduálního rozptylu 826.2 Test Lack-of-fit 837. Způsoby navrhování robustních výrobků 907.1 Minimalizace rozptylu Y 907.2 Zařazení šumů do plánu experimentu 968. Dynamické plánování experimentů 1079. Kvalitativní proměnné 1219.1 Konstrukce plánů s kvalitativními proměnnými 1219.2 Jak působí kvalitativní proměnné v modelu 12710. ANOVA 12910.1 Jednoduché třídění 12910.2 Dvojné třídění 13710.3 Trojné třídění (Latinské čtverce) 140


11. Širší souvislosti plánování experimentů 15111.1 Regresní analýza 15111.1.1 Základní pojmy regresní analýzy, metoda nejmenších čtverců 15111.1.2 Předpoklady regresní analýzy 15311.1.3 Vybrané věty regresní analýzy 15411.1.4 Testování předpokladů regresní analýzy 16911.1.5 Zobecněná metoda nejmenších čtverců 18211.2 Časové řady 18811.2.1 Klasická metodika analýzy časových řad 18911.2.2 Box Jenkinsova metodika analýzy časových řad 201Animace


ÚVODPlánování experimentů je jedním z nejúčinnějších nástrojů předvýrobní etapy. Umožňujenalézt faktory, které nejvýznamněji ovlivňují výrobní proces i jeho výstupy a stanovit takéjejich optimální hodnoty. Lze tedy říci, že plánování experimentů je matematickýmprostředkem, který umožní výrobcům kvantifikovat významnost vstupů, které jsou na počátkuvytypované jako pravděpodobně vlivné. Dále stanoví, jak vybrané vstupy nastavit, aby procesdosahoval požadovaných výstupů při maximální stabilitě (tedy minimální variabilitě) aodolnosti proti tzv. šumům, tj. nepředvídatelným negativním vlivům na výrobní proces.Předmět plánování experimentů využívá poznatků matematické statistiky i teoriepravděpodobnosti. V tomto <strong>text</strong>u jsou vyloženy základní pojmy a vztahy. Zájemci o hlubšístudium naleznou mnoho dalších poznatků např. v citované literatuře.


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCH1. ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOUÚROVNÍCH(Full Factorial Design at Two Levels)Čas ke studiu: 20 hodinCílem kapitoly je objasnita) princip sestavení plánu experimentub) několik způsobů výpočtu efektu faktoruc) postup při hodnocení významnosti efektůd) konstrukci lineárních a kvadratických modelů experimentue) analýzu rozptylu v plánování experimentůf) navrhování robustních výrobkůg) některé speciální postupy plánování experimentůVýkladDříve, než ukážeme na jednoduchém příkladě základy plánování experimentů, vysvětlímezákladní pojmy a cíle DOE.Pod pojmem experimentovat se dále rozumí měnit obvyklé pracovní podmínky s cílem naléztnejlepší pracovní postupy a současně získat hlubší poznatky o vlastnostech výrobku avýrobního procesu.Experimentální postupy lze rozdělit naa) experimenty neplánované (živelné),b) experimenty plánované.Plánované experimenty se řídí plánem experimentu.Plán experimentu stanovuje 3 charakteristiky („3P“)a) počet pokusů, ze kterých se experiment skládá,b) podmínky, za kterých se jednotlivé pokusy uskuteční,c) pořadí pokusů.Z uvedeného je zřejmé, že se zde rozlišuje význam pojmů:pokus = zjištění hodnoty ukazatele kvality za určitých, předem plánovaných, podmínekvýroby;experiment = systém všech pokusů.Formulaci „nejlepší pracovní postupy“ z úvodního odstavce lze precizovat takto: Označíme-lisledovaný ukazatel kvality Y (resp. ukazatele kvality Y 1 ,...,Y k ) a faktory, které jej ovlivňují7


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHA,B,C,D, ... se mohou pohybovat na různých úrovních, řekněme A 1 ,A 1 ,A 3 , .. . pro faktor A,B 1 ,B 2 ,B 3 , ... pro faktor B atd., pak cílem plánování experimentu je1) kvantifikovat míru významnosti každého z faktorů, což znamená rozhodnout, kteréz faktorů A,B,C,D, ... rozhodujícím způsobem ovlivňují ukazatel kvality Y,2) určit úrovně významných faktorů tak, aby Y bylo optimální astabilní.Příklad 1 ( [3], upraveno).Sleduje se, kolik zmáčknutí (Y) vydrží pružina až do zničení v závislosti na těchto faktorech:L = délka pružina, G = tloušťka drátu, T = typ materiálu. Má se zjistit, které faktory jsourozhodující pro životnost pružinyŘešení:Sestavíme tabulku faktorů a jejich uvažovaných úrovní (tab.1):faktor označení dolní úroveň horní úroveň- +délka pružiny L 10cm 15cmtloušťka drátu G 5mm 7mmmateriál T A BTab.1 Seznam faktorů a úrovníNyní sestavíme plán experimentu (tab.2)Existuje více způsobů jak sestavit plán, podle kterého se budou provádět jednotlivé pokusy.Mezi nejpoužívanější plány patří úplný faktorový plán, který v daném případě vypadá takto:Pokus L G T Y i1 10 5 A2 15 5 A3 10 7 A4 15 7 A5 10 5 B6 15 5 B7 10 7 B8 15 7 BY i je výsledek i-tého pokusu.Tab.2 Plán experimentu8


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCH1.1 Kódované proměnnéPlán experimentu je výhodnější psát pomocí této symboliky: Je-li každý z faktorů uvažovánna dvou úrovních, pak dolní úroveň bude značena -1 (resp. jen „-“) a horní úroveň +1 (resp.„+“). Tabulka 2 potom bude mít tvarPokus L G T Y i1 -1 -1 -12 +1 -1 -13 -1 +1 -14 +1 +1 -15 -1 -1 +16 +1 -1 +17 -1 +1 +18 +1 +1 +1Tab.3 Plán experimentu v kódovaných proměnnýchPřepočet původních proměnných na kódované proměnné se může provést nejen pro krajníhodnoty x max (= +1) a x min (= -1) takto:kde x o = proměnná x v původních jednotkách,x c = kódovaná proměnná,x max = horní úrověň x,x min = dolní úroveň x.xc=xoxmax+ x−2x − xmax min2min(1)Například přepočet (kódování) L pro dolní hodnotu 10 je15 + 1010 −Lc =215 −102= −1a pro horní úroveň G = 7 bude kódovaná hodnota7 + 57 −Gc =27 − 52= + 19


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHPro kvalitativní proměnné se vzorec (1) nepoužívá: tato proměnná nabývá jen dvou hodnot,takže nemá smysl počítat (x max + x min )/2 a ani se nemůže vyskytnout probléms dekódováním jiné hodnoty než +1 resp. -1.Počet pokusů, ze kterých je sestaven úplný experiment, se vypočítá při k faktorech pomocíkvztahu (počet variací k-té třídy ze dvou prvků s opakováním) n = 2 , takže zde, při k = 3faktorech, je počet pokusů (řádků) n = 2 3 = 8. Proto má tabulka 8 řádků.Grafickým znázorněním plánu experimentu je tzv. CPLOT. Pro dva faktory je to čtverec, protři faktory krychle se středem v počátku souřadné soustavy. Souřadnice vrcholů odpovídajíjednotlivým pokusům (podrobně a graficky viz kap.3).1.2 Jednofaktorový plánJinou možností sestavení plánu je jednofaktorový plán, při kterém se u jednoho faktoru měníúroveň z dolní na horní a u ostatních se drží na střední úrovni, která je průměrem dolní a horníúrovně a značí se symbolem „0“. V našem případě by jednofaktorový plán vypadal takto:Pokus L G T1 + 0 02 - 0 03 0 + 04 0 - 05 0 0 +6 0 0 -Tab.4 Jednofaktorový plánPočet pokusů je u tohoto typu plánu n = 2.k, zde tedy n = 2.3 = 6 pokusů (řádků).Další možností sestavení plánu je částečný faktorový plán,o kterém je pojednáno v kapitole 2.Jestliže je plánem experimentu stanoveno, za jakých podmínek se provádí jednotlivé pokusy,je možné provést celý experiment a zaznamenat hodnoty sledovaného ukazatele Y. V našempřípadě byl každý pokus opakován dvakrát. Výsledky jsou v tabulce 5:pokusfaktorvýsledek průměrL fkG T Y1 ýldkY2Y1 - - - 77 81 792 + - - 98 96 973 - + - 76 74 754 + + - 90 94 925 - - + 63 65 646 + - + 82 86 847 - + + 72 74 738 + + + 92 88 90Tab.5 Výsledky opakovaných pokusů10


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHSestavením tabulky 5 skončily přípravné a experimentální práce. Dále následují už jenvýpočty. Jejich cílem bude stanovit, které z faktorů ovlivňují významným způsobemživotnost pružiny Y.Vzhledem k tomu, že některé faktory nemusí být samostatně významné, zatímcov součinnosti s jiným faktorem (tzv. interakci) už významné jsou, doplní se tab. 5 o všechnymožné interakce. Teprve potom se počítá významnost faktorů a interakcí.Znaménka ve sloupcích LG, LT, GT, LGT se získají jako součin znamének v odpovídajícíchsloupcích (tab.6).pokus L G T LG LT GT LGT Y1 - - - + + + - 7912 + - - - - + + 973 - + - - + - + 754 + + - + - - - 925 - - + + - - + 646 + - + - + - - 847 - + + - - + - 738 + + + + + + + 90Tab.6 Faktory a jejich interakceDále se bude počítat tzv. efekt (vliv) jednotlivých faktorů.1.3 Efekt faktoruEfektem faktoru se rozumí změna ukazatele kvality Y, kterou způsobí přechod tohoto faktoruz dolní úrovně (-) na horní úroveň (+).Výpočet efektu faktoru se může provést různými způsoby.Uvedeme postupně 5 způsobů, které jsou v různých situacích užitečné:a) průměr rozdílůb) rozdíl průměrůc) znaménková metodad) Yatesova metodae) polovina regresních koeficientůPrůměr rozdílůVýpočet ukážeme např. pro efekt faktoru L. Podle definice je to změna Y při přechodu Lz úrovně „-„ na „+“, přičemž ostatní faktory se nemění. Takové přechody jsou možné čtyři sefekty:97 – 79 = 1892 – 75 = 1784 – 64 = 2090 – 73 = 1711


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHZa efekt L vezmeme průměr z těchto hodnotEfekt faktoru L označíme ef (L) = 18.1[(97 − 79) + (92 − 75) + (84 − 64) + (90 − 73)] = 184Podobně se vypočítá efekt faktoru G. Efekty jsouPrůměr těchto hodnot je efekt G:75 - 79 = -492 – 97 = -573 – 64 = 990 – 84 = 61ef ( G)= ( −4− 5 + 9 + 6) = 1,54Efekt faktoru T: Jsou 4 možné přechody z úrovně „-„ na „+“ s efekty84 – 97 = -1364 – 79 = -1590 – 92 = -273 – 75 = -2Průměr těchto hodnot je efekt faktoru T (značí se l T ):Rozdíl průměrů1ef ( T ) = ( −13−15− 2 − 2) = −84Přeskupením hodnot v závorce při výpočtu L můžeme výraz upravit na tvar1(9741+ 92 + 84 + 90) − (79 + 75 + 64 + 73) = Y+ − Y4V prvé závorce jsou hodnoty Y pro faktor na horní úrovni. Podobně ve druhé závorce jsouhodnoty Y, když je faktor na své dolní úrovni. Při výpočtu efektu metodou „průměr rozdílů“se nejprve počítaly rozdíly hodnoty Y na úrovni „+“ a „-„ a z nich pak průměr. Je možnépostupovat v opačném pořadí: nejprve vypočítat průměrné Y na horní úrovni ( Y +) resp. dolníúrovni ( Y −) a potom jejich rozdíl. Např. pro faktor L−Y+97 + 92 + 84 + 90== 90,75412


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHY−79 + 75 + 64 + 73== 72,754ef ( L)Y +− Y = 90,75 − 72,75 = 18=−Metoda „rozdíl průměrů“ je užitečnáa) při odvození rozptylu odhadu efektů faktorů (kap.1.4)b) při konstrukci grafu efektu hlavních faktorů (viz obr.1)Grafy efektů faktorů L,G a TNejprve vypočítáme průměrné Y pro dolní (-Y) a horní (+Y) úrovně, potom sestrojíme grafy:L G T Y- - - 79+ - - 97- + - 75+ + - 92- - + 64+ - + 84- + + 73+ + + 90Y−72,75 81 85,75Y+90,75 82,5 77,751Např. pro faktor L je Y−= (79 + 75 + 64 + 73) = 72, 7541a Y+= (97 + 92 + 84 + 90) = 90, 75.4Efekt L lze vypočítat jako rozdíl Y+a Y−, tj. rozdíl Y v koncových bodech grafu: ef(L) =90,75-72,75 = 18. Úhel úsečky s osou x ukazuje velikost efektu: nulový efekt odpovídáúsečce rovnoběžné s osou x.Směr rostoucí znamená, že přechodem z dolní na horní úroveň faktoru vzroste efekt, směrklesající znamená naopak pokles efektu.Data pro konstrukci grafu:Faktor -1 172,75 90,75Úsečkový graf pro faktor L: pro L na dolní úrovni je13


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHY−= 72,75 a pro L na horní úrovni Y+= 90,75.1009080706050403020100-1,5 -1 -0,5 0 0,5 1 1,5Faktor G -1 181 82,582,682,482,28281,881,681,481,28180,8-1,5 -1 -0,5 0 0,5 1 1,5Faktor T -1 185,75 77,7514


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCH8786858483828180797877-1,5 -1 -0,5 0 0,5 1 1,5Protože se Y maximalizuje (je to životnost), jsou optimální úrovně+L, +G, -T .Pozn.:1. Vždy se odečítá od ef( Y +) efekt ef( Y −).2. V kapitole o regresních modelech experimentu uvidíme, že u lineárních modelů se hledáoptimální úroveň faktorů uvedeným způsobem, zatímco u kvadratických modelů se optimálníhodnota faktoru vypočítá.Znaménková metodaMetoda výpočtu pomocí průměru z rozdílů Y je při větším počtu faktorů obtížně použitelná.Jednodušší algoritmus získáme (např. při výpočtu efektu T) takto: dosaďme za -13, -15, -2 a -2 výše uvedené rozdíly:1ef ( T ) = [(84 − 97) + (64 − 79) + (90 − 92) + (73 − 75)] = −84Seřadíme-li čísla v závorce tak, jak jsou uvedena v tabulce 5 (ovšem i se znaménky), máme1ef ( T ) = ( −79− 97 − 75 − 92 + 64 + 84 + 73 + 90) = −84Posloupnost těchto čísel a příslušných znamének odpovídá výsledkům pokusů, opatřenýchznaménky ve sloupci faktoru T. Znaménko „mínus“ znamená, že zvětšováním T se zmenšujeY.Obecný návod je tedy tento: sečtou se hodnoty ve sloupci Y, přičemž každá hodnota máznaménko, odpovídající znaménku u příslušného faktoru v odpovídajícím řádku. Součet sevydělí n/2, kde n = počet pokusů.Například pro faktor L budeL = (1/4)(-79+97-75+92-64+84-73+90) = 18.15


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHZnaménko „plus“ znamená, že zvětšováním L se zvětšuje Y.Podobně se postupuje u interakcí, například pro interakci LG znaménkovou metodou budeLG = (1/4)(79-97-75+92+64-84-73+90) = - 1.Znaménkovou metodu lze také definovat jako součin dvou vektorů,spočívající ve vynásobení (řádkového) vektoru znamének hodnoceného faktoru se sloupcem(vektorem) výsledků pokusů, např.pro faktor L je to součin vektorů⎛79⎞⎜ ⎟⎜97⎟⎜75⎟⎜ ⎟1⎜92⎟ef ( L)= ( −1,1,−1,1,−1,1,−1,1).⎜ = 18464⎟⎜ ⎟⎜84⎟⎜ ⎟⎜73⎟90⎝ ⎠který se dělí polovinou počtu pokusů.Efekt faktorů a jejich interakcí doplníme do tabulky 7.čís. L G T LG LT GT LGTYefekt faktor1 - - - + + + - 79 81,75 (1)2 + - - - - + + 97 18,0 L3 - + - - + - + 75 1,5 G4 + + - + - - - 92 -1,0 LG5 - - + + - - + 64 -8,0 T6 + - + - + - - 84 0,5 LT7 - + + - - + - 73 6,0 GT8 + + + + + + + 90 -0,5 LGTTab.7 Efekt faktorů a interakcíYatesův algoritmusDalší možností výpočtu efektu faktorů je Yatesův algoritmus.Postupuje se tak, že ve sloupci (1) je součet 1. a 2. řádku, potom součet 3. a 4. řádku, 5. a 6.řádku, 7. a 8. řádku, následuje rozdíl 2. a 1. řádku, 4. a 3. řádku, 6. a 5, řádku , 8 a 7 řádku.Stejně se postupuje ve sloupci (2) a (3). Číslovaných sloupců je tolik, kolik je faktorů. Efektje roven podílu čísla v posledním číslovaném sloupci a "dělitele". Posloupnost faktorů a16


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHinterakcí v posledním sloupci je pevná a nelze ji změnit. Odtud také pochází seřazení faktorův posledním sloupci tabulky 7.Y (1) (2) (3) dělitel efekt faktor79 176 343 654 8 81,75 průměr97 167 311 72 4 18,0 L75 148 35 6 4 1,5 G92 163 37 -4 4 -1,0 LG64 18 -9 -32 4 -8,0 T84 17 15 2 4 0,5 LT73 20 -1 24 4 6,0 GT90 17 -3 -2 4 -0,5 LGTZde se postupuje tak, že ve sloupci (1) je součet 1. a 2. řádku, potom součet 3. a 4. řádku, 5. a6. řádku, 7. a 8. řádku, následuje rozdíl 2. a 1. řádku, 4. a 3. řádku, 6. a 5, řádku , 8 a 7 řádku.Stejně se postupuje ve sloupci (2) a (3). Číslovaných sloupců je tolik, kolik je faktorů. Efektje roven podílu čísla v posledním číslovaném sloupci a "dělitele". Posloupnost faktorů ainterakcí v posledním sloupci je pevná a nelze ji změnit. Odtud také pochází seřazení faktorův posledním sloupci tabulky 7.1.4 Rozptyl odhadu efektu faktoruVýsledky jednotlivých pokusů Y 1 ,…,Y n jsou náhodné veličiny. Vektor Y=(Y 1 ,…,Y n ) jetentýž jako v regresní analýze ( Y = X .β + ε ).2Pro vektor Y bylo dokázáno: Y ~ N(EY,varY) ; předpokládá se, že varY= σ I což znamená,že všechny náhodné veličiny Yi mají- normální rozdělení2- stejný rozptyl σPředpoklad normality je významný: využívá se dále2a) při odvození rozptylu odhadu efektu se ,b) při grafickém hodnocení významnosti efektu.Nesplnění normality znamená, že není vhodný lineární model. Hledá se tedy kvadratický, kdese jinak se počítají koeficienty (vektor b), jejich rozptyl a jejich testování.S využitím výpočtu efektu jako rozdílu průměrů můžeme získat charakteristiky efektu.Jestliže každá náhodná veličina Yi má rozdělenípak pro jejich průměr platí2Y i~ N ( μ,σ ) ,2σY ~ N(μ , )n17


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHa také efekt faktoru ( neboť je lineární kombinacíparametryY+a Y−) má normální rozdělení s2ef = Y Y ⇒ ef ~ N(μ , σ ).+−−eeStřední hodnotaμe=+ −μE( Y − Y ) = μ − = 0.2Odhad rozptylu efektu σe(stejný pro všechny faktory) bude:4 σ=n22 .s e(2)kde n je celkový počet pokusů (včetně opakování).Rozptylu odhadu efektu vypočítáme takto:D( efektu) s = D( Y − Y ) = D( Y ) + D( Y )Máme tedy2σ=n22σ+n22σ= 2n22 4=e + −+ −=24σef ~ N(0,)n2σnRozptyl odhadu efektu se použije k testování významnosti efektu faktorů.Poznámka:Při výpočtu charakteristik efektu byly použity vlastnosti disperze náhodné veličinyD (k.X) = k 2 . D (X)a věta o jednom výběru z normálního rozděleníXi ∼ N (μ,σ 2 ) ⇒ X ∼ N (μ, ); i = 1,2,...,n.nV případě opakovaných pokusů se σ 2 odhadne pomocí veličiny s 2 , která se vypočítá2σν n −1,i= ini je počet opakování i-tého pokusu,s 2 je vážený rozptyl.s22ν . s + ... + ν .1 1=ν + ... + ν12ks k2si je rozptyl v i-tém pokusu.k(3)Pokud se jednotlivé pokusy neopakují, je odhad σ 2 prováděn různými způsoby, např.18


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHa) pomocí tzv. centrálních bodů (kap.3),b) jako průměr druhých mocnin efektů nejvyšších interakcí.Například budou-li sledovány čtyři faktory, označené 1,2,3,4, použije se efekt jejichnejvyšších interakcí takto:nejvyššíinterakceefektdruhámocninaefektu123 -0,75 0,5625124 0,50 0,2500134 -0,25 0,0625234 -0,75 0,56251234 -0,25 0,0625součet 1,5152Odtud rozptyl s = 1,5/ 5 = 0,3..V daném případě, protože se každý z pokusů opakoval dvakrát, je možné z dvojic výsledkůY 1 ,Y 2 vypočítat rozptyl v každém pokusu.Rozptyl lze při dvou opakováních vypočítat snadněji (než s použitím definice rozptylu)pomocí vztahuneboť2s i=12( Y1−Y2)2(4)s21 ⎡ Y1+ Y22 Y1+ Y= ( Y1) ( Y22 1⎢ − + −− ⎣ 2222 ⎤ 1) ⎥ = ( Y⎦ 21− Y2)2Po výpočtu efektu faktorů je potřeba provést vyhodnocení významnosti získaných hodnot,neboť např. není jasné. Je-li ef(L) dostatečná hodnota,abychom L prohlásili za vlivný faktor.Používají se různé metody hodnocení významnosti efektů, napříklada) testemb) graficky (normální resp. poloviční normální p-stní graf)c) pomocí ANOVADále se budeme zabývat testem a grafem pro hodnocení významnosti efektů.19


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCH1.5 Test významnosti efektuVýhodou opakování pokusů je možnost testovat významnost efektů nebo provádět analýzureziduí.Nevýhodou opakování je zvyšování počtu pokusů a tím nákladů.Jiné možnosti umožňující totéž bez opakování a tedy při nižších nákladech jsou napříklada) zdvojení měření,b) zařazení centrálních bodů do experimentu,c) projekce plánu.Zdvojení měření znamená, že při jednom pokusu se provádí více měření. Zdvojené měřenínení totéž co opakované měření.O centrálních bodech a projekci plánu je pojednáno v dalších kapitolách.V této kapitole uvedeme všechny body testu významnosti efektu.Test významnosti efektů1. Nulová hypotéza H o : efekt faktoru je bezvýznamnýAlternativní hypotéza H 1 : efekt faktoru je významný2.Testovací kriterium3. Kritická hodnotaefektt =s et n + n + + n − n1 2...( α )k(5)(6)kde n 1 , ...,n k jsou počty opakování pokusů, zde n i = 2; n je počet pokusů bez opakování, zde n= 8.4. Závěr testu: prot>t n k...( )1+nα2 + + n −nse zamítá nulová hypotéza což znamená, že efekt (a tedy faktor) je významný.V příkladě „Pružina“ jet ( n ...) =16(0,05) = 2,3061 + n2+ + n −nα tk − 8Rozptyls28 + 2 + 2 + 8 + 2 + 8 + 2 + 8=8= 520


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHa4.22 s 4.5s e= = = 1,25 ; s e = 1,12n 16Výpočty jsou uspořádány opět v tabulcečís. Y 1 Y 2 Y 1 -Y 22s efekt T = efekt/s ei1 77 81 -4 82 98 96 2 2 L= 18 16,073 76 74 2 2 G = 1,5 1,344 90 94 -4 8 LG = -1,0 -0,895 63 65 -2 2 T= -8,0 -7,146 82 86 -4 8 LT = 0,5 0,457 72 74 -2 2 GT = 6,0 5,368 92 88 4 8 LGT =-0,5 -0,45Tab.8 Testování významnosti efektuKritickou hodnotu převyšuje v absolutní hodnotě testovací kriterium faktorů L,T a interakceGT. Ostatní faktory tedy nemají vliv na životnost pružiny1.6 Grafické hodnocení efektu faktorůPokud se neprovádí opakování jednotlivých pokusů, bývá používána grafická metodaurčování významných faktorů, konkrétně normální pravděpodobnostní graf. V grafu se navodorovnou osu vynáší efekta na svislou osu relativní kumulativní četnost100(i − 0,5)Pi = ,m(7)kde i = 1,2, ..., m, m je počet faktorů a interakcí.Za významné se považují ty faktory, které se nacházejí výrazně mimo hlavní linii (znázorněnéněkdy přímkou, která představuje Gaussovu křivku na normálním pravděpodobnostnímpapíře). Při použití grafické metody je užitečné sestavit do pomocné tabulky tyto údaje:Číslo 1 2 3 4 5 6 7Efekt -8,0 -1,0 -0,5 0,5 1,5 6,0 18Faktor T LG LGT LT G GT LP i 7,14 21,42 35,71 50 64,29 78,57 92,86Tab. 9 Grafické hodnocení významnosti efektu (Pružina)Efekty ve druhém řádku jsou uspořádané vzestupně.21


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHGraf (normal probability plot), sestrojený z údajů ve druhém řádku (vodorovná osa) a večtvrtém řádku (svislá osa) je na obr.1. Hodnoty P i se vynáší na normální pravděpodobnostnípapír, takže máme normální pravděpodobnostní graf.V grafu je vidět, že mimo hlavní linii jsou ty faktory, u kterých testovací kriterium překročilokritickou hodnotu. Jsou to body L (nejvýrazněji), T a GT.Obr.1 Grafické určení vlivných faktorů ( pružina)Alternativou k tomuto grafu je poloviční normální pravděpodobnostní graf (half- normalprobability plot), kde se k jeho sestrojení použijí absolutní hodnoty efektů:Číslo 1 2 3 4 5 6 7Efekt 0,5 0,5 1,0 1,5 6,0 8,0 18Faktor LT LGT LG G GT T LP i 7,14 21,42 35,71 50 64,29 78,57 92,8622


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCH10090807060504030201000 5 10 15 20Obr.2 Poloviční pravděpodobnostní graf(half- normal probability plot)1.7 Regresní model experimentuPo nalezení vlivných faktorů lze sestavit model experimentu.Dále budeme rozlišovat tyto modely ( pro dva faktory ):a) lineární modelY = b 0 + b 1 x 1 + b 2 x 2Tento model je postačující pro modelování malých oblastí.b) úplný kvadratický modelY = b 0 + b 1 x 1 + b 2 x 2 + b 11 x 1 2 + b 22 x 2 2 + b 12 x 1 x 2Je často dostačují i pro popis komplikovaných tvarů závislosti, jeho koeficienty se snadnonaleznou, je propracovaná snadná klasifikace typů těchto modelů a existují vzorce provýpočet optimální úrovně proměnných, které figurují v těchto modelech.c) neúplný kvadratický modelY = b 0 + b 1 x 1 + b 2 x 2 + b 12 x 1 x 2Výpočet regresních koeficientů u jednotlivých modelů:U modelu a) a c) se koeficienty mohou počítat různými způsoby, např.1) Pomocí efektů , kde b o= Y , b 1 ; b 2 ,…, b k je polovinoupříslušného efektu, např. 0,5.ef(x 1 ) = b 1 .2) Metodou nejmenších čtverců23


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHPro model b) nelze použít efektů ani MNČ.Používají se např. tyto způsoby výpočtu:1) Kombinovaný plán2) Tříúrovňový plán3) Box - Behnkenův plánNeúplný kvadratický model v příkladě „Pružina“ budeY = 81,75 + 9.L -4.T + 3.G.TPřepočet na původní proměnné bude (vzorec 1)YL= 81.75 + 9.o−12.5G − 6o− 4T+ 3. . T2.51Po úpravě vycházíY = 36,75 + 3,6L o –22T + 3 G o TModel lze využít k výpočtu teoretických hodnot.Například pro L = G = T = -1 budeYˆ1 = 81,75 + 9.( −1)− 4.( −1)+ 3.( −1).(−1)= 79,75Poznámka:U nekódovaných proměnných je problém při dosazování za kvalitativní proměnné, zde např.typ materiálu: nelze je dosadit.Problém se řeší se zavedením speciálních proměnných, viz kap.9.1.8 Reziduální odchylky: výpočet, vlastnosti a významRozdíl empirické hodnoty Y (= výsledek pokusu ) a teoretické hodnoty Yˆ je reziduálníodchylka (residual error): e = Y −Yˆ.iiiYTeoretickée (rezidua)1.pokus 2.pokus hodnoty 1.rezidua 2.rezidua77 81 79,75 77-79,75=-2,7581– 79,75 =1,2598 96 97,75 0,25 -1,7576 74 73,75 2,25 0,2590 94 91,75 -1,75 2,2563 65 65,75 -2,75 -0,7582 86 83,75 -1,75 2,2572 74 71,75 0,25 2,2592 88 89,75 2,25 -1,7524


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHRezidua by měla být u správného modelua) nezávislá,a) normálně rozdělená (nenormalita rezidují znamená, že lineární model není vhodný),b) s konstantním rozptylem.Např. pro faktor L v příkladě „Pružina“ máme tato rezidua:L G T LG LT GT LGT Res-1 - - + + + - -0,75+1 - - - - + + -0,75-1 + - - + - + 1,25+1 + - + - - - 0,25-1 - + + - - + -2,25+1 - + - + - - 0,25-1 + + - - + - 1,25+1 + + + + + + 0,25Pro faktor „L“ bude graf reziduí vers. úrovně faktoru:1,7Plot of Col_3 vs Col_40,7Col_3-0,3-1,3-2,3-1 -0,6 -0,2 0,2 0,6 1Col_4Rezidua mají pro dolní úroveň faktoru L větší rozptyl než pro horní úroveň. Nekonstantnírozptyl znamená, že variabilita Y je ovlivňována úrovní faktorů a musí se vzít v úvahu.Takový graf se sestrojí pro všechny faktory L,G a T.1.9 Metoda nejmenších čtverců v DOEKoeficienty v regresním modelu lze vypočítat také MNČ pomocí známého vzorce b = (X T X) -1 X T Y. Jeho použití ukážeme na jednoduchém příkladě.Příklad 2Mějme plán 2 2 .Plán experimentu pak bude:25


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHPokus A B AB1 - 1 - 1 12 1 - 1 - 13 - 1 1 - 14 1 1 1Výpočet regresních koeficientů provedeme dle vztahub = (X T X) -1 X T Y, kde matice X a další potřebné matice jsou:⎡1⎢⎢1X =⎢1⎢⎣1−11−11−1−1111 ⎤−1⎥⎥−1⎥⎥1 ⎦X T X⎡ 1⎢⎢−1=⎢−1⎢⎣ 111−1−1⎡4⎢31−11−11⎤⎡11⎥⎢⎥⎢11⎥⎢1⎥⎢1⎦⎣1−11−110 ⎤⎥−1−13−11 0 4 0 0 1( X) = ⎢⎥ = IX T 44 ⎢30 0 4 0 ⎥ 4⎢⎥3⎢⎣0 0 0 4 ⎥⎦00111 ⎤ ⎡4−1⎥ ⎢⎥ = ⎢0−1⎥⎢0⎥ ⎢1 ⎦ ⎣0040000400⎤0⎥⎥0⎥⎥4⎦b = (X T X) -1 X T Y =1IX T Y =414⎡ 1⎢⎢−1⋅⎢−1⎢⎣ 111−1−11−11−11⎤⎡Y1⎥ ⎢⎥ ⎢Y.1⎥⎢Y⎥ ⎢1⎦⎣Y1234⎤⎥⎥⎥⎥⎦=⎡ Y1+ Y2+ Y3+ Y4⎢1 ⎢− Y1+ Y2− Y3+ Y44 ⎢−Y1− Y2+ Y3+ Y4⎢⎣ Y1− Y2− Y3+ Y4V prvém řádku dostáváme průměr z Yi, v dalších řádcích součet výsledků (Yi) se stejnýmiznaménky jako u znaménkové metody, ale čtvrtinu místo očekávané poloviny (obecně n/2). Jeto proto, že zde počítáme koeficienty, kdežto u znaménkové metody efekty.Například efekt prvního faktoru je 0,5(Y1-Y2+Y3-Y4), zde ale máme koeficient = 0,25.(Y1-Y2+Y3-Y4).Jelikož koeficient = efekt /2 , budekoeficient = 0,5 [0,5 (Y1-Y2+Y3-Y4)] = 0,25 (Y1-Y2+Y3-Y4).Pozn.: U úplného kvadratického modelu jsou sloupce b 11 a b 22 lineárně závislé, proto byvýpočet vůbec neproběhl.K čemu slouží regresní modely experimentu:1) k výpočtu Y pro libovolnou úroveň faktoru2) k určení směru dynamického plánování experimentů3) k výpočtu optimálních hodnot faktorů (u kvadratických modelů – lineární nemají extrém)4) k výpočtu teoretických hodnot⎤⎥ ⎥⎥⎥ ⎦26


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCH5) k výpočtu reziduálních odchylek1.10 Grafy interakcíPro významné interakce se sestrojují grafy, umožňující diskusi o optimální úrovnijednotlivých faktorů v závislosti na druhém faktoru. Výsledná optimální úroveň může býtdiametrálně odlišná od té, která se stanovila individuálně.Tak například pro významnou interakci GT sestrojíme graf vlivu G na ukazatel kvality Yv závislosti na faktoru T: V tabulce 6 naleznemeG T průměr- - 79 97 88+ - 75 92 83,5G T průměr- + 64 84 74+ + 73 90 81,5Tab.10 Určení krajních bodů grafu interakcíY88 -T83,574+T5 7G81,5Obr.3 Vliv G na Y v závislosti na TNa vodorovné ose je první faktor z interakce GT, tedy G, na svislé vždy Y. Sestrojí se krajníbody grafu; mají souřadnice-1 88+1 83,5-1 74+1 81,5V prvém případě bylo T záporné, ve druhém kladné. Proto jsou grafy označené –T resp. +T.Z grafu je vidět, že pro maximalizaci Y je nejlepší T na dolní úrovni27


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCH(-T) a že změna G neovlivňuje výrazně Y.Příklad 3Sestrojte graf efektu úrovní faktoru B pro plánA B Y- - 3+ - 5- + 2+ + 1Průměr ++ (5+1)/2 = 3 (2+1)/2 = 1.5Průměr -Y (3+2)/2 = 2.5 (3+5)/2 = 4Efekt A metodou „rozdíl průměrů“ ef(A) = 3 - 2.5 = 0.5. Efekt faktoru B jeef(B) = 1.5 - 4 = -2.53,132,92,82,72,62,52,4-1,5 -1 -0,5 0 0,5 1 1,5Obr.4 Graf efektu úrovní faktoru AShrnutí kapitoly 1Základní informace této kapitole jsou: jak sestavit plán experimentu a vypočítat vlivjednotlivých faktorů. Jelikož vypočítané hodnoty faktorů nelze hodnotit subjektivně, existujeexaktní metoda – test významnosti efektů. Je také možné použít grafickou metodu hodnocení.Nalezené významné faktory jsou použity k sestavení modelu experimentu. Ten může býtlineární nebo kvadratický. Při jejich sestavování jsou významné rozdíly a je proto vhodnénejprve rozhodnout, je li kvadratický model potřeba. Kvadratický model je přesnější a umožnínalézt ideální nastavení významných parametrů. Dalším zlepšením modelování procesu jepoužití dynamického plánování.Všechny tyto poznatky byly objasněny v prvé kapitole. Jejich zvládnutí si ověřte pomocíkontrolních otázek a úloh k procvičení.28


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHOtázky ke kapitole 11. Do které výrobní etapy zejména patří DOE2. Jaké jsou cíle DOE3. Co obsahuje plán experimentu4. Co je pokus a co experiment5. Napište vzorec pro kódování proměnné6. Definujte efekt faktoru7. Vyjmenujte 5 způsobů výpočtu efektu faktoru8. Jak se sestrojí graf efektu faktoru9. K čemu slouží graf efektu faktoru10. Jak se vypočítá počet pokusů v úplném plánu11. Jak se vypočítá rozptyl odhadu efektu faktoru12. Jak se odhadne rozptyl veličiny Y13. Napište vzorec pro vážený rozptyl14. Jak se počítá rozptyl odhadu efektu faktoru u neopakovaných pokusů15. Napište jednoduchý vzorec pro rozptyl dvou veličin16. Napište všechny body testu významnosti efektu17. Napište tabulku potřebnou ke grafickému hodnocení efektů18. Co je na osách při grafickém hodnocení efektů19. Jak se poznají významné faktory při grafickém hodnocení20. Jak se rozdělují regresní modely experimentu21. Jak se počítají koeficienty v lineárním modelu22. Jak se počítají koeficienty v úplném kvadratickém modelu23. K čemu slouží regresní model experimentu24. Jak se počítají reziduální odchylky25. K čemu složí reziduální odchylky26. Jaké vlastnosti musí mít reziduální odchylky27. Ukažte použití MNČ v DOE29


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHŘešené úlohy ke kapitole 1Příklad 11. Napište do tabulky poloviční plán pro faktory A,B,C:A B C Y efekt faktor2220 A17 B21 AB2. Výsledky pokusů v krychlových bodech jsou 22,20,17,21.Určit efekty A, B a C.3. Napsat lineární model pro tento plán.4. Najít teoretickou hodnotu Y pro A,B a C na dolní úrovni.5. Doplnit tento plán o hvězdicové body6. Doplnit do plánu tři centrální body a určit pure error S PE , jsou li výsledky v centrálníchbodech 26, 28 a 30.Příklad 2Sestavte úplný plán pro faktory E,F,G. Výsledky pokusů jsou 5,5,4,5,3,2,3,1.Vypočítejte efekt faktorů a interakcí dvojic a trojice.Sestavte tabulku, potřebnou pro konstrukci grafu pro hodnocení významnosti efektů.Příklad 3Napište úplný plán pro faktory A,B,C.Vypočítejte ef(A) a ef(C), jsou li výsledky jednotlivých pokusů 2,6,7,7,4,5,6,3.Napište tabulky potřebné pro graf interakcí. Proveďte nákres grafu.Jaká je optimální úroveň, když Y se minimalizuje?Příklad 4Pro faktory T,C,Ka) napište úplný plánb) vypočítejte efektyc) otestujte efektyd) vyhodnoťte efekty grafickye) napište neúplný kvadratický modelf) sestrojte úsečkové grafy a vypočítejte efekt jako rozdíl průměrůg) vypočítejte reziduaVýsledky pokusů při dvou opakováních jsou:Y 1 Y 259 6174 7050 5869 6750 5481 8546 4479 8130


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHPříklad 5Použijte Yatesův algoritmus k určení efektu dat v tabulce, získaných úplným faktorovýmplánem 2 3 .x 1 x 2 x 3 y- - - 13+ - - 11- + - 9+ + - 5- - + 11+ - + 8- + + 9+ + + 7KLÍČ K ŘEŠENÍŘešení(1):A B C Y-1 -1 1 221 -1 -1 20-1 1 -1 171 1 1 21-1,41 0 01,41 0 00 -1,41 00 1,44 00 0 -1,410 0 1,410 0 0 260 0 0 280 0 0 30ef(A) = 1, ef(B) = -2, ef(C) = 3; Y = 20Y = 20 + 0,5A – B + 1,5CY ( −1,−1,−1)= 20 − 0,5 + 1−1,5= 19S PE = 2 2 + 0 + 2 2 = 8Řešení(2):E F G Y efekt faktor1 - - - 52 + - - 5 -0,5 E3 - + - 4 -0,5 F4 + + - 5 0 EF5 - - + 3 -2,5 G6 + - + 2 -1 EG7 - + + 3 0 FG8 + + + 1 -0,5 EFG31


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHi 1 2 3 4 5 6 7Efekt -2,5 -1 -0,5 -0,5 -0,5 0 0Faktor G EG E F EFG EF FGPi 7,14 21,43 35,71 50 64,29 78,57 92,86P i100(i − 0,5)=7Řešení(3):A B C Y- - - 2+ - - 6- + - 7+ + - 7- - + 4+ - + 5- + + 6+ + + 3Y−= 5,5Y = 4,5Optimální úroveň pro C je horní úroveň.Tabulky pro konstrukci grafu interakcíA C Y Průměrné Y+ - 6;7 6,5- - 2;7 4,5A C Y Průměrné Y+ + 5;3 4- + 4;6 5+Řešení(4):Počet pokusů: n = 2 3 = 8pokus T C K TC TK CK TCK Y 1 Y 2Y1 - - - + + + - 59 61 602 + - - - - + + 74 70 723 - + - - + - + 50 58 544 + + - + - - - 69 67 685 - - + + - - + 50 54 526 + - + - + - - 81 85 837 - + + - - + - 46 44 458 + + + + + + + 79 81 80Y -52,75 66,75 63,5Y +75,75 61,75 65 Y =64,2532


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHVýpočet efektů pomocí znaménkové metodyTest významnosti efektů1) Stanovení hypotéz: H 0 : efekt faktoru je bezvýznamnýH 1 : efekt faktoru je významnýPokusy s i21 22 83 324 25 86 87 28 2Např.:2) Testovací kritérium:faktor tT 16,263C -3,536K 1,061TC 1,061TK 7,071CK 0TCK 0,354Významné faktory + jedna interakce33


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCH3) Kritická hodnota: K = t 8 (0,05) = 2,3064) Pokud je testovací kritérium v absolutní hodnotě větší, než kritická hodnota, zamítámeH 0 . Významné faktory jsou vyznačeny červeně. Jsou to T, C a TK.Grafické hodnocení efektuČíslo 1 2 3 4 5 6 7Efekt -5 0 0,5 1,5 1,5 10 23Faktor C CK TCK K TC TK TP i 7,143 21,43 35,71 50 64,286 78,57 92,857Obr.1 Graf hodnocení efektuVýznamné efekty leží mimo hlavní linii: C, TK, T.Neúplný kvadratický modely = b 0 + b T T + b C C + b TK TK¨Y = 64,5 + 11,5T – 2,5C + 5TKÚsečkový graf pro efekt Tef(T) = Y + - Y - = 75,75-52,75 = 2334


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHObr. 2 Úsečkový graf pro efekt TÚsečkový graf pro efekt Cef(C) = Y + - Y - = 61,55 – 66,75 = -5Obr. 3 Úsečkový graf pro efekt CÚsečkový graf pro efekt Kef(K) = Y + - Y - = 65 – 63,5 = 1,535


ÚPLNÝ FAKTOROVÝ EXPERIMENT NA DVOU ÚROVNÍCHObr. 4 Úsečkový graf pro efekt KVýpočet reziduíT C TK Y- - + 60,5 60 0,25+ - - 73,25 72 1,25- + + 55,25 54 1,25+ + - 68,25 68 0,25- - - 50,25 52 -1,75+ - + 83,25 83 0,25- + - 45,25 45 0,25+ + + 78,25 80 -1,75e iŘešení(5):Yatesův algoritmus:y (1) (2) (3) dělitel efekt faktor x 1 x 2 x 313 24 38 73 8 9,125 průměr - - -11 14 35 -11 4 -2,75 x 1 + - -9 19 -6 -13 4 -3,25 x 2 - + -5 16 -5 -1 4 -0,25 x 1,2 + + -11 -2 -10 -3 4 -0,75 x 3 - - +8 -4 -3 1 4 0,25 x 1,3 + - +9 -3 -2 7 4 1,75 x 2,3 - + +7 -2 1 3 4 0,75 x 1,2,3 + + +36


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMI2. ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMAÚROVNĚMI(Fractional Factorial Design at Two Levels)Čas ke studiu: 10 hodinCílem druhé kapitole je objasnit zejména:a) jak lze snížit počet pokusů v experimentub) jaké problémy přináší snížení počtu pokusů a jak se řešíVýkladV úplném faktorovém experimentu se sestavuje plán experimentu pro každý faktor. Učástečného faktorového experimentu se plán sestaví jen pro několik faktorů. Ty budemenazývat hlavní faktory. Ostatní faktory, které nazveme vedlejší faktory, se vyjádří pomocíhlavních. Tím se dosáhne snížení počtu pokusů. Označení hlavní a vedlejší nijak nesouvisís velikosti jejich vlivu na sledovaný ukazatel Y. Ten ani nelze na počátku experimentuvymezit, neboť se vychází z toho, že o vlivu faktorů se nic neví. Pokud jde o způsob vyjádřenívedlejších faktorů pomocí hlavních, je významné, jak se provede. Tomuto problému sebudeme věnovat později.Je-li 2 k označení pro úplný experiment,2 = počet úrovní faktorů,k = počet faktorů,k − ppak 2 je označení pro částečný faktorový experiment,p = stupeň snížení.Chceme-li například v plánu 2 7 , který představuje n = 128 pokusů, snížit počet pokusů napolovinu, tj.2 77 − 1= 2 ,2dostáváme částečný faktorový experiment, který představuje7 − 1n = 2 = 64pokusů, tedy p o l o v i n u. Je to nejmenší možné snížení počtu pokusů. Plány se sníženímpočtu pokusů na polovinu se nazývají poloviční plány.Stupeň snížení p může být i vyšší než 1, například2 7− 4 ,37


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIkde bude jen n = 8 pokusů. To je pro k = 7 faktorů nejvyšší možné snížení. U tzv. lineárníchplánů (plánů prvního řádu), sloužících k nalezení modelů, které obsahují jen faktory bezjejich kombinací nebo mocnin, vychází největší možné snížení z pravidla, podle kteréhopočet pokusů nesmí být menší než počet parametrů v regresním modelu, což je zde totožné spočtem faktorů.Musí tedy platitn ≥ k .Pro kvadratické plány, které jsou určené k nalezení kvadratických modelů, je podmínek více,jak uvidíme ve čtvrté kapitole.Plány s největším snížením jsou saturované (nasycené) plány. V uvedeném případě k = 7 an = 2 7 - 4 = 8, takže p = 4 je nejvyšší možný stupeň snížení.Například pro k = 15 faktorů je nejvyšší možné snížení 2 15-11 , neboť počet pokusů je při p =11 roven n = 16 a počet faktorů je k = 15. Pokud bychom provedli ještě vyšší snížení, např.2 15-12 , potom k = 15, ale n = 8, takže n < k. Mezi polovičními a nasycenými plány může býtještě řada možností snížení. Plány se stupněm snížení mezi maximálním a minimálním senazývají středové plány.Například mezi 2 7-1 a 2 7-4 jsou středové plány 2 7-2 a 2 7-3 .Částečné faktorové plány lze tedy rozdělit do tří skupin:a) plány s nejnižším snížením (poloviční)b) plány s nejvyšším snížením (saturované)c) středové plány2.1 Operace s faktory a jejich vlastnostiOznačme I faktor, obsahující jen úrovně „+ “. Takový faktor se nazývá jednotkový.Pro operace s faktory platí tyto zřejmé vztahyA.A = IA.I = I.A = A(A.B).C = A(B.C)A.B = B.A(8)(9)(10)(11)Při vyhodnocování částečných plánů se používá několik důležitých pojmů, které objasnímev následujícím obecném příkladě.Příklad 1A,B,C,D,E jsou faktory, pro které se má sestavit poloviční plán.38


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIPostupujeme tak, že určíme 4 hlavní faktory (například A,B,C,D), pro které se sestaví úplnýplán a zbývající (vedlejší) faktor E se vyjádří jako jejich kombinace, napříkladE = ABCD(12)Každá kombinace faktorů tvoří slovo. Slovo se skládá z písmen (faktorů). Počet písmen vek − pslově je délka slova. Vztah (12) se nazývá generátor. V plánu 2 je p vedlejších faktorů,z nichž každý musí být vytvořen (generován) pomocí hlavních, proto je také p generátorů.Vynásobením generátoru (12) levou stranou, tj. faktorem E,a s použitím vztahů (8) – (11) dostávámeE.E = E. ABCDI = ABCDE.(13)Slova, která jsou rovna jednotkovému faktoru I, se nazývají definiční rovnice, například (13).Jak uvidíme dále, definičních rovnic může být i více než jedna. Délka nejkratšího slovav definičních rovnicích je tzv. řešení plánu (resolution of the design) a zapisuje se k typu5 1plánu římskou číslicí jako index. Zde např. 2 −V . Z tohoto zápisu čteme: faktory jsou na dvouúrovních, počet faktorů je 5, vedlejší faktor je jeden, jedná se o poloviční plán a stupeň řešeníje V. Řešení plánu je V proto, že slovo v definiční rovnici (13) má délku (počet písmen) 5.2.2 Nalezení zaměnitelných dvojicPomocí definiční rovnice lze najít dvojice faktorů (resp.interakcí), které tvoří stejnéposloupnosti znamének a které se nazývají zaměnitelné dvojice.Například zaměnitelnou interakci k DE nalezneme vynásobením definiční rovnice toutointerakcíI = ABCDE / DEPodle (8) a (9) dostávámeDE.I = DE.ABCDEPraktické použití ilustruje následující příklad.DE = ABCPříklad 2 ([3], upraveno)Sleduje se množství barviva Y, které zůstane na látce po absolvování testů (ve srovnání sestandardním vzorkem), v závislosti na faktorech:A = pH, B = teplota, C = koncentrace, D = dokončovací teplota, E = dokončovací čas.Faktory a jejich dvě úrovně jsou v tabulce 1.39


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIFaktor Symbol - +PH A 4.5 5.5teplota B 70 0C800Ckoncentr. C 1g/l 3g/ldok.teplota D 170 0C 1900Cdok.čas E 50s. 70s.Tab.1 Faktory a jejich úrovněMá se sestrojit úplný plán a nalézt nejvýznamnější faktory, sestrojit poloviční plán, naléztnejvýznamnější faktory a porovnat výsledek polovičního plánu s úplným plánem.Řešení:Úplný faktorový plán 2 5Čís. A B C D E Y DE ABC ACDE1 - - - - - 13.1 + - +2 + - - - - 9.9 + + -3 - + - - - 8.1 + + +4 + + - - - 7.5 + - -5 - - + - - 9.0 + + -6 + - + - - 9.2 + - +7 - + + - - -1.0 + - -8 + + + - - -1.0 + + +9 - - - + - 10.6 - - -10 + - - + - 8.2 - + +11 - + - + - 11.0 - + -12 + + - + - 11.2 - - +13 - - + + - 5.1 - + +14 + - + + - 9.7 - - -15 - + + + - 4.1 - - +16 + + + + - 2.9 - + -17 - - - - + 6.4 - + -18 + - - - + 9.8 - + +19 - + - - + 9.0 - + -20 + + - - + 6.6 - - +21 - - + - + 4.9 - + +22 + - + - + 5.3 - - -23 - + + - + -5.1 - - +24 + + + - + -3.7 - + -25 - - - + + 17.3 + - +26 + - - + + 12.7 + + -27 - + - + + 12.9 + + +28 + + - + + 13.7 + - -29 - - + + + 12.4 + + -30 + - + + + 12.4 + - +31 - + + + + 3.8 + - -32 + + + + + 4.0 + + +Efekty faktorů v úplném plánu, vypočítaný znaménkovou metodou, jsou:40


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIFaktor A B C D EEfekt -0.2 -4.5 -6.0 4.0 0.3Fakt. AB AC AD AE BC BD BE CD CE DEEf. 0.0 0.9 -0.1 0.1 -3.5 1.4 -0.5 0.6 -0.8 3.0Fakt. ABC ABD ABE ACD ACE ADE BCD BCE BDE CDEEf. -0.6 0.3 0.1 0.3 -0.3 -0.7 0.4 -0.5 -1.5 0.2Fakt. ABCD ABCE ABDE ACDE BCDE ABCDEEf. -1.1 0.8 1.0 0.1 0.2 -0.4Určíme významné faktory.Protože se jednotlivé pokusy neopakují, nelze použít testu (bez opakovaní není možnévypočítat směrodatnou odchylku, která je součástí testovacího kriteria). V takovýchpřípadech se používá grafická metoda. Body, které leží mimo hlavní linii, jsou zdeC(efekt = -6.0, Pi = 1.67), B(-4.5,5), BC(-3.5,8.33), DE(3.0,95), D(4.0,98.33), (obr.1).Obr.1 Grafické určení vlivných faktorů v úplném plánuNyní sestavíme poloviční plán 2 5-1 .a) Jako hlavní faktory jsou stanoveny A,B,C,D, vedlejší je E. Ten bude vyjádřen pomocíhlavních. Generátor volíme E = ABCD.41


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIPokus A B C D E = úplný YABCD plán1 - - - - + 17 6,42 + - - - - 2 9,93 - + - - - 3 8,14 + + - - + 20 6,65 - + - - 5 9,06 + - + - + 22 5,37 - + + - + 23 -5,18 + + + - - 8 -1,09 - - - + - 9 10,610 + - - + + 26 12,711 - + - + + 27 12,912 + + - + - 12 11,213 - - + + + 29 12,414 + - + + - 14 9,715 - + + + - 15 4,116 + + + + + 32 4,0Tab.2 Poloviční plán (základní frakce)Poloviční plán tedy má 16 pokusů, ale nikoli prvních 16 z úplného plánu. Které pokusyúplného plánu jsou zde obsaženy, je patrné z předposledního sloupce („úplný plán“), kde jsoučísla řádků plánu 2 5 .Druhou polovinu úplného plánu, kterou nazýváme doplňkovou frakci, tj. zbývajících 16pokusů nalezneme, zvolíme-li generátor E = - ABCD:č. A B C D -ABCD =E úplný plán Y1 - - - - - 1 13,12 + - - - + 18 9,83 - + - - + 19 9,04 + + - - - 4 7,55 - - + - + 21 4,96 + - + - - 6 9,27 - + + - - 7 -1,08 + + + - + 24 -3,79 - - - + + 25 17,310 + - - + - 10 8,211 - + - + - 11 11,012 + + - + + 28 13,713 - - + + - 13 5,114 + - + + + 30 12,415 - + + + + 31 3,816 + + + + - 16 2,9Tab.3 Poloviční plán (doplňková frakce)42


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIVýpočet efektu faktorů pro poloviční plán, se počítá opět znaménkovou metodou. Výsledkyjsou v tabulce 4: prvé dva sloupce pro první polovinu, druhé dva sloupce pro duhou polovinuplánu.Faktor Efekt v 1.frakci Faktor Efekt ve2.frakciA+BCDE 0,0 A-BCDE -0,4B+ACDE -4,4 B-ACDE -4,6C+ABDE -5,0 C-ABDE -7,0D+ABDE 4,8 D-ABDE 3,2E+ABCD -0,8 E-ABCD 1,4AB+CDE 0,2 AB-CDE -0,2AC+BDE -0,6 AC-BDE 2,4AD+BCE -0,6 ADBCE 0,4AE+BCD 0,5 AE-BCD -0,3BC+ADE -4,2 BC-ADE -2,8BD+ACD 1,1 BD-ACD 1,7BE+ACD -0,2 BE-ACD -0,8CD+ABE 0,7 CD-ABE 0,5CE+ABD -0,5 CE-ABD -1,1DE+ABC 2,4 DE-ABC 3,6Tab.4 Efekt faktorů v obou polovičních plánechVypočítaným efektům však neodpovídá faktor, ale dvojice faktorů. V dalším budeme řešit,proč dvojice a které faktory tvoří dvojici. Nejprve však provedeme grafické vyhodnocenívýznamnosti efektů. Je na obrázku 2.Obr.2 Grafické určení vlivných faktorů v polovičním plánu43


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIZ porovnání grafů na obr.1 a obr.2 je zřejmé, že poloviční plán dává stejné hodnocení jakoúplný plán. Znamená to tedy, že snížením počtu pokusů na polovinu nedošlo ke ztrátěinformací a tím ke změně výsledků.Porovnáme-li však efekty faktorů a jejich interakcí v úplném a v polovičním plánu je vidět, ženejsou přesně stejné.Navíc, jak bylo uvedeno, jsou v tabulce 14 uváděny efekty pro s o u č t y, napříkladA + BCDE, B + ACDE apod.Součty jsou ve sloupci „faktor“ v tabulce 14 uvedeny proto, že snížením počtu pokusůdochází k tomu, že některé posloupnosti znamének u interakcí faktorů jsou stejné. Například(podle tab.12)ABC - + + - + - - + - + + - + - - +DE - + + - + - - + - + + - + - - +Jsou-li u interakcí ABC a DE stejné posloupnosti znamének je jasné, že také efekt (zdepočítaný znaménkovou metodou) je stejný. Vypočítaný efekt patří oběma interakcím, protojsou v součtu. Neznamená to ale, že na každou připadá polovina!Kdybychom, pouze teoreticky, nalezli oba poloviční plány, můžeme vypočítat, kolikz celkového efektu připadá na jednotlivé interakce v součtu (tento výpočet se v praxisamozřejmě neprovádí). V tabulce 14 je například efektB + ACDE = - 4,4aB – ACDE = - 4,6.Řešením těchto dvou rovnic dostáváme efekt připadající na B: -4,5 a na interakci ACDE: 0,1.Z těchto výsledků je vidět dva důležité poznatky:a) „čistý“ efekt B je přesně shodný s efektem B v úplném plánu,b) na interakci připadá zanedbatelně malý podíl celkové hodnoty efektu.Obecně platí, že čím delší je slovo, tím menší má efekt. Za bezvýznamný je považován efekt(interakce) o délce slova alespoň 3.Vysvětluje se také, proč efekt B + ACDE = - 4,4 není shodný s efektem B v úplném plánu(B:- 4,5). Je to proto, že efekt B je „kontaminován“ efektem interakce ACDE.Bylo již řečeno, že při sestavování polovičních plánů se jeden z faktorů vyjádří jako interakceostatních. Říkáme-li „ostatních“ neznamená to, že nutně všech ostatních. Tak například připěti faktorech A,B,C,D,E je možné vyjádřit E mnoha způsoby.Porovnejme tyto dva:a) E = AB,b) E = ABCDPříslušné definiční rovnice jsoua) I = ABEb) I = ABCDE44


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMI5 1V případě a) máme plán 2 −5 1III, v případě b) plán 2 −V. Tento druhý plán je lepší, neboť mářešení plánu V což znamená, při hledání zaměnitelných dvojic budou v součtu krátká a dlouháslova; například k A, mámea) A + BEb) A + BCDEV případě b) tvoří zaměnitelnou dvojici s A interakce více faktorů, která má proto menšípodíl na celkovém efektu, u více než dvou faktorů dokonce tak malý, že se zanedbává apracuje se jen s krátkým slovem, zde s faktorem A. Tím se usnadňuje diskuse kvypočítanému efektu.Optimální volby generátorů pro různé počty faktorů (k) a různé stupně řešení jsou uváděnyv tabulkách. Jednu z nejkratších navrhl L.W.Robinson (tab.5).V tabulce jsou 4 šipky: např. pro k = 3 a st.řešení IV: má li být řeš. IV, musí se udělat úplnýplán. Tučně jsou uvedeny počty pokusů pro dané k a stupeň řešení. Pro k = 12 až 15 nejsouuvedeny generátory.Stupeň řešeník III IV V3 3 = 1.2 4 Full 84 4 = 1.2.3 8 Full 165 4 = 1.2 8 5 = 1.2.3.4 165 = 1.36 6 = 2.3 5 = 1.2.3 16 6 = 1.2.3.4.5 326 = 1.2.47 7 = 1.2.3 7 = 1.3.4 7 = 1.2.3.4.5.6 648 8 = 2.3.4 7 = 1.2.3.4 648 = 1.2.5.69 5 = 1.2.3 16 6 = 1.2.3 32 8 = 1.2.3.4.5 1286 = 1.2.4 7 = 1.2.4 9 = 1.2.3.6.77 = 1.3.4 8 = 1.2.58 = 2.3.4 9 = 1.3.4.59 = 1.2.3.410 10 = 1.2 10 = 2.3.4.5 10 = 1.4.5.611 11 = 1.3 6 = 1.2.3 32 11 = 2.4.6.77 = 1.2.48 = 1.2.59 = 1.3.410 = 1.3.511 = 1.4.512 12 = 1.4 12 = 2.3.4 25613 13 = 2.3 13=2.3.514 14 = 2.4 14 = 2.4.515 15 = 3.4 15 = 3.4.5Tab.5 Optimální volby generátorů(L.W.Robinson, QE 15, No3, 2003, s .403-406)45


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIPoznámkaJe vždy lepší udělat poloviční plán a pak, na základě analýzy, ho případně doplnit (o dalšífrakci), než dělat ihned úplný plán.Stejné zásady jako u polovičních plánů platí pro středové a saturované plány.Saturované plány jsou ty, kdepočet parametrů (p) = počet pokusů (n)Saturovaný plán lze definovat pomocí p (počet parametrů modelu) nebo pomocí k (početfaktorů). U lineárních modelů je saturovaný plán ten, kde n = p nebolin = k + 1 , protože p = k + 1.2.3 Stanovení počtu zaměnitelných faktorůV plánu 2 k-p je p vedlejších faktorů. Proto je potřeba p generátorů a z nich lze vytvořit⎛ p⎞⎛ p⎞⎛ p⎞⎜ ⎟ + ⎜ ⎟ + ... + ⎜ ⎟⎝ 1 ⎠ ⎝ 2 ⎠ ⎝ p⎠(14)definičních rovnic (dané definiční rovnice + součin dvojic, kterých je p nad dvěma; součintrojic, kterých je p nad třemi atd.). Výraz (14) lze zapsat ve tvaru∑k=1(p∑k=p⎛ p⎞⎛ p⎞⎜ ⎟ resp.∑⎜⎟ −1= resp.⎝ k ⎠k=0 ⎝ k ⎠⎛ p⎞p−kkpp⎜ ⎟1.1 ) −1= (1 + 1) −1= 20 ⎝ k ⎠pPočet definičních rovnic v plánu 2 k-p je 2 p -1.Z každé definiční rovnice lze vytvořit k danému faktoru zaměnitelný faktor, takže v plánuk − p2 je počet zaměnitelných faktorů roven počtu definičních rovnic + daný faktor (plusjedna)Počet zaměnitelných faktorů v plánu 2 k-p je 2 p .(2 p -1) + 1 = 2 p−1Příklad 3 (nalezení definičních rovnic)Uvažujme situaci, kdy je sledováno 7 faktorů A,B,C,D,E,F,G, ovlivňujících ukazatel kvality7 4Y. Jestliže se sestavuje saturovaný plán 2 − , jsou vybrány hlavní faktory A,B,C, pro kterébude sestaven úplný plán. Zbývající 4 faktory (D,E,F,G) jsou vedlejší.Generátory jsou voleny například takto (jejich počet je p tj. 4):D = AB, E = AC, F = BC, G = ABC.46


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIpDefiniční rovnice budou (jejich počet je 2 −1= 2 4 1 = 15− ):ABD = ACE = BCF = ABCG(součin dvou)=BCDE=ACDF=CDG=ABEF=BEG = AFG(součin tří) = DEF = ADEG = BDFG = CEFG(součin čtyř) = ABCDEFGProtože místo 2 7 = 128 pokusů jich bude jen 2 7 − 4= 8 , je každý plán frakcí, která jeplánu, takže existuje 16 frakcí a v každé je 16 zaměnitelných faktorů.Například pro faktor A máme tuto skupinu zaměnitelných faktorůA+BD+CE+ABCF+BCG+ABCDE+CDF+ACDG+BEF+ABEG+FG+ADEF+DEG+ABDFG+ACEFG+BDCEFGp(jejich počet je 2 = 24= 16 )Z nich má smysl ponechat jen interakce dvou, takže pro A to budeA+BD+CE+FG42 − celého2.4 Volba generátorů u středových plánůStředové plány by měly spojovat dobré vlastnosti polovičních a nasycených plánů. Mezistředovými plány se hledá takový plán, který má méně pokusů než poloviční a pokud možnonejvýhodnější skupiny zaměnitelných faktorů. Připomeňme, že za nejlepší zaměnitelnouinterakci se považuje ta, která je tvořena největším počtem faktorů. Skladba zaměnitelnýchfaktorů souvisí s volbou generátorů.Příklad 4Porovnat výsledek různé volby generátorů u středového plánua) Generátory: E = ABCD, F = ABC, G = BCDDefiniční rovnice budouI =ABCDE = ABCF = BCDG = DEF = AEG = ADFG = BCEFG7 3Stupeň řešení plánu je zde III: 2 −b) Generátory: E = ABC, F = BCD, G = ACD,III7 32 − s faktory A,B,C,D,E,F,G.Definiční rovnice I = ABCE = BCDF = ACDG = ADEF = BDEG = CEFG = = ABFG , kde7 3stupeň řešení je IV: 2 −2.5 Projekce plánuIV .Má-li některý z faktorů nevýznamný efekt, je možné ho vynechat. Získá se tak pláns opakováním. Např. pro tři faktory A,B,C má úplný plán32 tvar47


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIA B C1 - - -2 + - -3 - + -4 + + -5 - - +6 + - +7 - + +8 + + +Vynecháním faktoru C vznikl plán s opakováním.Obecně platí, že máme li úplný plán 2 k bez opakování a jestliže v něm vynecháme h (h < k)faktorů, vznikne úplný plán pro k – h faktorů s počtem opakování 2 h .Vynechá-li se v polovičním plánu 1 faktor, vznikne úplný plán.Příklad 5Mějme plán 2 3-1 s faktory A,B a C = AB.Vynecháním C vznikne úplný plán.Podobně vynecháním B vznikne úplný plánA B C = AB- - ++ - -- + -+ + +A B C = AB- - ++ - -- + -+ + +Vynecháme-li např. v polovičním plánu 2 5-1 faktory A a E, vznikne částečný plán pro B,C a Dse dvěma opakováními:č. A B C D -ABCD =E úplný plán Y1 - - - - - 1 13,12 + - - - + 18 9,83 - + - - + 19 9,04 + + - - - 4 7,55 - - + - + 21 4,96 + - + - - 6 9,27 - + + - - 7 -1,08 + + + - + 24 -3,79 - - - + + 25 17,310 + - - + - 10 8,211 - + - + - 11 11,012 + + - + + 28 13,713 - - + + - 13 5,114 + - + + + 30 12,415 - + + + + 31 3,816 + + + + - 16 2,948


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIObecně vynechá-li se d faktorů v plánu 2 k-p bez opakování, vznikne buď úplný plán nebočástečný plán s opakováním. Vzniklý plán má tytéž definiční rovnice, které ale neobsahujívynechané faktory.Při analýze částečných plánů vznikají komplikace v důsledku součtu faktorů, kterým náležívypočítaný efekt. Při navrhování částečných plánů je proto snaha, aby v součtua) byla krátká a dlouhá slovab) bylo co nejméně slov.První cíl lze řešit správnou volbou generátorů; ta způsobí v konečném důsledku vyšší stupeňřešení; jako příklad jsme uvedli porovnání generátorů E = AB resp. E = ABCD, které vedly5 1k plánům 2 −5 1IIIresp. 2 −V, tedy stupňům řešení III resp. V.2.6 Doplňkové frakce: tvorba a vlastnostiJednou z možností jak dosáhnout cíle b) je doplnění základní frakce plánu o další, tzv.doplňkové frakce, tedy slučování frakcí (sequence).Doplňková frakce u polovičních plánůPříklad 65 1Mějme faktory 1, 2, 3, 4, 5 a poloviční plán 2 − .Generátor má tvar 5 = 1234. S tímto generátorem se vytvoří první polovina (první frakce)úplného plánu. Spolu se všemi interakcemi dvou faktorů je plán v tabulce:1 2 3 4 5 12 13 14- - - - + + + ++ - - - - - - -- + - - - - + ++ + - - + + - -- - + - - + - ++ - + - + - + -- + + - + - - ++ + + - - + + -- - - + - + + -+ - - + + - - +- + - + + - + -+ + - + - + - +- - + + + + - -+ - + + - - + +- + + + - - - -+ + + + + + + +Pokračování15 23 24 25 34 35 45 Y- + + - + - - 56- + + + + + + 53+ - - - + + + 63+ - - + + - - 65+ - + + - - + 53+ - + - - + - 55- + - + - + - 67- + - - - - + 61+ + - + - + - 6949


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIEfekt jednotlivých faktorů vychází:+ + - - - - + 45- - + + - - + 78- - + - - + - 93- - - - + + + 49- - - + + - - 60+ + + - + - - 95+ + + + + + + 821 = -2 14 = -0,752 = 20,5 15 = 1,253 = 0 23 = 1,54 = 12,25 24 = 10,755 = -6,25 25 = 1,2512 = 1,5 34 = 0,2513 = 0,5 35 = 2,2545 = -9,5V tomto plánu mají některé interakce stejné posloupnosti znamének a proto i stejný efekt,např. 123 a 45. Efekt interakce 45 je ef(45) = –9,5.Protože je to společný efekt s interakcí 123, píšemeef(45) = -9,5 → 45 + 123Druhá polovina (druhá frakce) k plánu 2 5-1 má generátortakže I = - 123455 = - 1234Zaměnitelný faktor např. k 2 je v první frakci 1345 a ve druhé frakci - 1345.Efekt faktoru 2 je v první frakcia ve druhé frakcief(2) = 20,5 → 2 + 1345ef(2) = 18,5 → 2 – 1345„Čistý“ vliv faktorů 2 a 1345 by se vypočítal jen při znalosti obou frakcí.Jelikož je k dispozici jen jedna frakce, nelze „čistý“ efekt počítat. Je proto žádoucí, abyv zaměnitelných dvojicích s faktory byly co nejdelší interakce. Toho se dosáhne tehdy, je-livysoký stupeň řešení.U polovičních plánů, sleduje-li se k faktorů 1, 2, 3, …, k, je nejlepší tento postup:a) sestavit úplný plán pro faktory 1,2,…, k-1b) k-tý faktor vyjádřit pomocí faktorů 1,2,3,…, (k-1):k = 1.2.3. … . (k-1)50


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIDoplňkové frakce u středových a saturovaných plánůV plánu 2 7-4 budou k dispozici tyto generátory pro vytvoření všech 16 frakcí (každá frakce jetvořena 8 pokusy)D = ±AB , E = ± AC , F = ± BC , G = ± ABC .Plán 2 7-4 a výsledky pokusů (pro generátory s kladnými znaménky) jsou v tabulce:A B C D = AB E = AC F = BC G=ABC Y1 - - - + + + - 692 + - - - - + + 523 - + - - + - + 604 + + - + - - - 835 - - + + - - + 716 + - + - + - - 507 - + + - - + - 598 + + + + + + + 88Druhou frakci plánu 2 7-4 vytvoříme například takto:D = -AB, E = AC, F = BC, G = ABC,takže jen u faktoru D se změnilo znaménko.Plán této frakce a výsledky pokusů jsou v následující tabulce:A B C D = -AB E = AC F = BC G = ABC YPokus9 - - - - + + - 4710 + - - + - + + 7411 - + - + + - + 8412 + + - - - - - 6213 - - + - - - + 5314 + - + + + - - 7815 - + + + - + - 8716 + + + - + + + 60U prvé frakce je například efekt faktoru A a zaměnitelné dvojiceef ( A)= 3. 5 → A + BD + CE + FG1U druhé vycházíef ( A)0.75 .2=Zaměnitelné dvojice u druhé frakce se získají z první tak, že se změní znaménka v definičníchrovnicích tam, kde je faktor D51


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIef ( A)= 0. 75 → A − BD + CE + FG2.Efekt faktoru A i zaměnitelné dvojice ve spojeném plánu lze získat jako průměr z obou frakcí11( ef1(A)+ ef2(A))= (3.5 + 0.75)→221→ [( A + BD + CE + FG)+ ( A − BD + CE + FG)]= A + CE + FG = 2,1252(ověřte výpočtem ef(A) z celého plánu)Zdůvodnění je jednoduché:Y + ... + Y8Y9+ ... + Y16Y1+ ... +( + ) =2 4 481 1Y16Výraz vlevo je průměr 1. frakce a 2. frakce, výraz vpravo je efekt počítaný z obou(sloučených) frakcí.2.7 Plán experimentu pro osm faktorůDalší cestou ke zkrácení plánu při jednoduché analýze výsledků je konstrukce speciálníchplánů. Například pro 8 faktorů je možné sestavit speciální plány v těchto krocích:a) prvních osm pokusů naplánovat stejně jako pro plán 2 7 – 4 s tím, že osmý sloupec je tvořenjen znaménky plusb) dalších osm pokusů (tj. pokusy 9 – 16 ) tvoří doplňkovou frakci s opačnými znaménkyVýhody tohoto postupu:a) nejméně pokusůb) počítá čistý efekt ( bez součtů)Pok 1 2 3 4 5 6 7 8.Y1 - - - + + + - + 14,02 + - - - - + + + 16,83 - + - - + - + + 15,04 + + - + - - - + 15,45 - - + + - - + + 27,66 + - + - + - - + 24,07 - + + - - + - + 27,48 + + + + + + + + 22,69 + + + - - - + - 22,310 - + + + + - - - 17,111 + - + + - + - - 21,512 - - + - + + + - 17,513 + + - - + + - - 15,914 - + - + - + + - 21,915 + - - + + - + - 16,716 - - - - - - - - 20,352


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMINa závěr této kapitoly uvedeme doporučení pro tvorbu částečných plánů:a) plán začít s omezeným počtem faktorů, které stačí k řízení procesub) generátory volit podle doporučení v tabulkáchc) po výpočtu efektů vynechat nevýznamné faktory (projekce)d) přidat podle potřeby vhodné doplňkové frakcee) na začátku plánování nedělat úplný plán ani plán s opakovánímf) u většího počtu faktorů, potřebných hned v úvodu, hledat speciální plányShrnutí druhé kapitolyTato kapitola je rozšířením poznatků z prvé kapitoly. Přináší zejména informace o tom,jak snížit počet pokusů a které problémy – vedle výhod – toto snížení přináší.Otázky ke kapitole 21. Jak značíme částečný faktorový experiment2. Jak stanovíme počet pokusů v částečném experimentu3. Proč se provádí částečný faktorový experiment4. Jak rozdělujeme částečné faktorové experimenty5. Co je jednotkový faktor6. Uveďte vlastnosti operací s faktory7. Jak se stanoví maximální stupeň snížení8. Co je generátor, definiční rovnice a stupeň řešení9. Co jsou a jak se naleznou zaměnitelné dvojice10. Co ovlivní volba generátoru11. Jak se zjistí optimální volba generátoru12. Jak se stanoví počet generátorů a počet definičních rovnic13. Jak se stanoví počet zaměnitelných faktorů14. Jaký je optimální generátor u polovičního plánu15. Co je projekce plánu16. Co způsobí projekce u úplného plánu17. Co způsobí projekce u polovičního plánu18. K čemu slouží doplňkové frakce19. Napište doplňkovou frakci k polovičnímu plánu s 5 faktory20. Jak se snadno stanoví zaměnitelné faktory a efekty při sloučení dvou frakcí21. Vysvětlete konstrukci plánu pro 8 faktorů53


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIÚlohy ke kapitole 2Příklad 1Napište částečný plán 2 5-2 pro faktory A,B,C,D,E, jsou li výsledky pokusů postupněpři prvém provedení 17,16,18,15,17,30,18,29,a při druhém provedení 16,18,17,16,19,31,18,28.A B C D E Y 1 Y 21 ‐ ‐ + ‐ ‐ 17 162 + ‐ ‐ ‐ + 16 183 ‐ + ‐ ‐ + 18 174 + + + ‐ ‐ 15 165 ‐ ‐ + + + 17 196 + ‐ ‐ + ‐ 30 317 ‐ + ‐ + ‐ 18 188 + + + + + 29 28Dále:a) vypočítejte efektyb) určete všechny možné zaměnitelné faktoryPříklad 2Udělejte částečný plán 2 5-2 pro faktory A,B,C,D,E, Vypočítejte efekty a sestrojtetabulku potřebnou ke grafickému hodnocení efektů.Generátory volte: D = AB a E = ACPlán a výsledky pokusů jsou v tabulce:A B C D E Y1 - - - + + 8,52 + - - - - 13 - + - - + 54 + + - + - 8,55 - - + + - 9,56 + - + - + 17 - + + - - 78 + + + + + 7,554


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIKlíč k řešení kap. 2Řešení(1):Částečný plán jeA B C = AB D E = ABD Y 1 Y 2 Y1 - - + - - 17 16 16,52 + - - - + 16 18 173 - + - - + 18 17 17,54 + + + - - 15 16 15,55 - - + + + 17 19 186 + - - + - 30 31 30,57 - + - + - 18 18 188 + + + + + 29 28 28,5a) výpočet efektů:ef (A) = = 5,375ef (B) = = -0,625ef (C+AB) = = -1,125ef (D) = = 7,125ef (E+ABD) = = 0,125Generátory jsou:Definiční rovnice:E = ABDC = ABZaměnitelné faktory:I = ABDE = ABC = CDEA + BCB + ACC + AB + DED + CEE + CDAD + BEBD + AE55


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIŘešení(2):Definiční rovnice:I = ABD, I = ACE, I = BCDEZaměnitelné faktory:Zaměnitelné faktory s A:A = BD = CE = ABCDEZaměnitelné faktory s B:B = AD = ABCE = CDEZaměnitelné faktory s C:C = ABCD = AE = BDEZaměnitelné faktory s D:D = AB = ACDE = BCEZaměnitelné faktory s E:E = ABDE = AC = BCDEfekty:ef(A) = (-8,5+1-5+8,5-9,5+1-7+7,5) / 4 = -3ef(B) = (-8,5-1+5+8,5-9,5-1+7+7,5) / 4 = 2ef(C) = (-8,5-1-5-8,5+9,5+1+7+7,5) / 4 = 0,5ef(D) = (8,5-1-5+8,5+9,5-1-7+7,5) / 4 = 5ef(E) = (8,5-1+5-8,5-9,5+1-7+7,5) / 4 = -1Tabulka pro grafické určení významnosti faktorů:1 2 3 4 5Efekt -3 -1 0,5 2 5Faktor A E C B DP i 10 30 50 70 9056


ČÁSTEČNÝ FAKTOROVÝ EXPERIMENT SE DVĚMA ÚROVNĚMIVýznamnými faktory jsou faktory A a D57


VÝZNAMNÉ BODY PLÁNU3. VÝZNAMNÉ BODY PLÁNUČas ke studiu: 1 hodinaCíl: Definovat tzv. významné body plánu a jejich vlastnostiPři hledání kvadratických regresních modelů (čtvrtá kapitola) bude potřeba doplnit plánexperimentu o body, se kterými jsme prozatím nepracovali. V této kapitole proto potřebnébody probereme.U každého z uváděných bodů je uvedeno jaké má souřadnice, doporučený počet a význam.VýkladV plánu experimentu se používají podle potřeby tři typy bodů:1) krychlové body (factorial points)2) centrální body (central points)3) hvězdicové body (axial = star points)U každého typu uvedeme počet bodů v plánu, jejich souřadnice a význam.Krychlové body jsou v plánu vždy.k − pPočet krychlových bodů je n = 2 .Souřadnice pro tři faktory: ( ± 1,± 1,± 1).Význam: slouží k výpočtu efektů faktorů.Centrální bodyDoporučený počet centrálních bodů je 3 – 5, nebo se počty určí z tabulky.Souřadnice pro tři faktory: (0,0,0)Význam:a) z Yi v centrálních bodech se počítá průměr a srovnává se s průměrem Yiv krychlových bodech (test zda postačuje lineární model = test křivosti)b) z Yi v centrálních bodech se počítá odhad rozptylu σ 2 jako náhrada za odhad σ 2 zopakovaných pokusů (příklad 1)c) z e i v centrálních bodech se počítá čistá chyba měření (pure error)Centrální body mohou být přidány k plánu 2 k-p , pokud jsou všechny faktory kvantitativní.U kvalitativních faktorů neexistuje úroveň 0.Centrální body se nepoužívají k výpočtu efektů faktorů.Hvězdicové bodyPři dvou faktorech x 1 ,x 2 leží na kružnici se středem (0,0), která prochází vrcholy čtverce.U třech faktorů jsou to body, kde kulová plocha se středem v počátku a procházejícíkrychlovými body plánu, protíná souřadné osy.Počet hvězdicových bodů: n = 2k58


VÝZNAMNÉ BODY PLÁNUSouřadnice pro tři faktory: ( ± α ,0,0),(0, ± α,0),(0,0,± α), kde doporučené α =4krychlových bodů.Význam:a) umožňují výpočet koeficientů v úplném kvadratickém modelub) zpřesňují výpočet regresních koeficientůn k, n k je početE (0, α)B (-1, 1)A (1, 1)F (-α, 0)S (0, 0)H (α, 0)C (-1, -1)G (0, -α)D (1, -1)Schéma plánu 2 2 , obsahujícího uvedené body:Obr.1 Významné body plánu 2 2x 1 x 2 Typ bodu- - C Krychlové+ - D body- + B+ + A0 0 S Centrální bodα 0 H Hvězdicové-α 0 F body0 α E0 -α GPříklad 1 (výpočet s e 2 v plánu bez opakování)Vypočítejte rozptyl odhadu efektů pomocí centrálních bodů pro následující plán experimentu.Pokus 1 2 3 Y Faktory a úrovně - 0 +1 - - - 160 1 330 480 7002 + - - 37 2 0,010 0,015 0,0223 - + - 165 3 0,049 0,070 0,1004 + + - 22 Y ukazatel kvality5 - - + 1726 + - + 357 - + + 1208 + + + 189 0 0 0 6610 0 0 0 8311 0 0 0 7112 0 0 0 8259


VÝZNAMNÉ BODY PLÁNUŘešení:Průměr Y v centrálních bodech jeY C=14( 66 + 83 + 71+82) = 75, 5Rozptyl Y v centrálních bodechs2=222( 66 − 75,5) + ( 83−75,5) + ( 71−75,5) + ( 82 − 75,5)4 −12= 69,6Rozptyl odhadu efektua směrodatná odchylkas2e=4 2snk4 ⋅ 69,6= = 34,838s e = 5,9.Shrnutí kapitoly 3Uvedli jsme tři typy bodů: krychlové, centrální a hvězdicové. U každého z nich je potřebavědět, jaké má souřadnice, jak je umístěn v grafickém znázornění plánu a jaký je jehovýznam.Otázky ke kapitole 31. Vyjmenujte typy významných bodů plánu2. Uveďte souřadnice a stanovení počtu u každého typu významných bodů3. K čemu slouží centrální body4. K čemu slouží hvězdicové body5. Nakreslete významné body pro dva faktory6. Jak se počítá rozptyl odhadu efektu pomocí centrálních bodů60


ÚPLNÉ KVADRATICKÉ MODELY4. ÚPLNÉ KVADRATICKÉ MODELYČas ke studiu: 6 hodinCíl: Objasnit postup při konstrukci úplného kvadratického modeluDosud jsme se zabývali (v prvé kapitole) metodikou nalezení lineárního regresního modelu.Protože někdy nestačí lineární model, je potřeba hledat komplexnější kvadratický model.První otázkou je, kdy je potřeba tento model, poté se řeší způsob jeho nalezení a nakonec jehovyužití k výpočtu optimálního nastavení procesu. Stručně lze říci, že ve srovnání s postupemu lineárních modelů je u kvadratických modelů všechno jinak. V této kapitole ukážeme, jak sevýše uvedené otázky řeší.Výklad4.1 Podmínky nalezení modeluPro nalezení úplného kvadratického modelu je nutné splnit minimálně tyto podmínkya) plán experimentu musí mít alespoň (1 + 2k + k(k-1))/2 bodů(viz počet členů v rovnici (1),b) každá proměnná v plánu musí mít alespoň tři úrovně (tomu lze vyhovět buďdoplněním plánu o hvězdicové body = kombinovaný plán, nebo přímo volit 3 úrovněfaktorů = tříúrovňový plán)Pozn.:Bod (a) lze formulovat obecněji: počet pokusů nesmí být menší než počet koeficientův hledaném modelu; u lineárních modelů pak dostáváme podmínku jednodušší: n ≥ k ;n = počet pokusů, k = počet faktorů.Dříve, než začneme hledat úplný kvadratický model, ověříme, je-li takový model potřeba;to je možné zjistit různými způsoby:a) testem křivostib) testem lack-of-fit (kap.6)c) pomocí ANOVA (kap.6)V této kapitole ukážeme jen test křivosti. Další dvě metody jsou obsáhlejší a je jim protověnována samostatná kapitola.61


ÚPLNÉ KVADRATICKÉ MODELY4.2 Test křivosti (curvature)K testu křivosti se používají centrální body. Jejich počet označíme n C , průměrné yv centrálních bodech je y Ca v krychlových bodech yF(F-factorial points); početkrychlových bodů označíme n F .Nulová hypotéza testu křivostitzn., není nutný kvadratický model.k∑Ho : βj=1jj= 0Testovací kriterium jeT=∑SS1( y − yiCPQC)2nC−1SS CPQ je součet čtverců odchylek kvadratického zakřivení a počítá seSSCPQ=nFnC( yF− yn + nCFC2)Kritická hodnotaProTF1,n C −α )1(≤ F1 , nα )C −1(není nutný kvadratický model.Příklad 1Y v centrálních bodech je: 40.3, 40.5, 40.7, 40.2, 40.6;průměr v centrálních bodech je yC= 40, 46 ;Y pro krychlové body: 41.5, 40, 39.3, 40.9;průměr v krychlových bodech je 40,425.Má se provést test křivostiŘešení:Testovací kriterium62


ÚPLNÉ KVADRATICKÉ MODELYT=∑SS1( y − yniCCPQ−1C)2=24.5(40,425 − 40,46) /(4 + 5)12(40,3 − 40,46) + ... + (40,6 − 40,46)5 −12= 0,063Kritická hodnotaFC1 , n −1( α ) = F1,4(0,05) = 12,22Závěr:Protože T nepřevyšuje F(0,05), Ho platí což znamená, že není potřeba kvadratický model.4.3 Metody nalezení kvadratického modeluKoeficienty úplného kvadratického modelu nejsou polovinou efektů, jak tomu bylo ulineárního a neúplného kvadratického modelu. Používají se proto jiné metody k jejichnalezení. Dále uvedeme tyto tři:a) Kombinovaný plán (Composite design)b) Tříúrovňový plán (Three – level design)c) Box – Behnkenův plán4.3.1 Kombinovaný plánKombinovaný plán tvoří:krychlové body + hvězdicové body + centrální body.B (-1, 1)A (1, 1)E (0, α)+ +F (-α, 0)H (α, 0)S (0, 0)C (-1, -1)D (1, -1)G (0, -α)U centrálních plánů, kdy je střed v bodě (0; 0), se vytvoří hvězdicový plán snadno, jenpomocí dvou nových úrovní ± α (čím méně úrovní, tím lépe).Je-li α počítáno pomocí vztahu α = 4 n k , kde n k je počet kvadratických bodů v plánu,hovoříme o rotovatelnosti plánu.63


ÚPLNÉ KVADRATICKÉ MODELYU rotovatelných plánů je rozptyl Y stejný v bodech stejně vzdálených od středu. Např. rozptylY v bodech ( ± 1; ± 1), ( ± α; 0) a (0; ± α) je stejný, neboť všechny jsou ve vzdálenosti 1 odstředu (0; 0).Pokud je α počítáno jinak, plán není rotovatelný.4.3.2 Výpočet optimální úrovně významných faktorůU kvadratických modelů se hledají- stacionární body plochy = optimální hodnoty faktorů(u lineárních modelů hovoříme o optimální úrovni faktoru: dolní resp. horní;extrémy nejsou - grafem je rovina resp. nadrovina)- oblasti stacionárních bodů- typy extrémů (max., min.) resp. sedlový bodMějme úplný kvadratický modely = βkterý lze zapsat také pomocí matickk20+ ∑ βixi+ ∑ βiixi+ ∑∑βijxixj ,i=1 i=1i


ÚPLNÉ KVADRATICKÉ MODELYDerivujme (2) podle x. Dostávámeδyˆδx= b + ( B + B ) x = b + 2Bx= 0 ⇒ x−1= B2T −1sbVektor stacionárních bodů tedy vypočítáme z rovnicex 1 s= −1 B − b .2Příslušnou hodnotuy ) s získáme dosazením x s za x do úplného kvadratického modeluˆy sTb + xT b + x Bx= 0Dostáváme1 Tyˆ s= bo+ x . b2Typ extrému se určí pomocí kořenů charakteristické rovnice matice Bdet(B – λ.I) = 0(4)Kořeny charakteristické rovnice se nazývají charakteristická čísla nebo vlastní čísla matice B.Typ extrému:a) Jsou-li všechny kořeny λ 1 ,…, λ k kladné, jedná se o minimumb) Jsou-li všechny kořeny λ 1 ,…, λ k záporné, jedná se o maximumc) Jsou-li kořeny λ 1 ,…, λ k smíšené, jedná se o sedlový bodV příkladu 2 ukážeme, že stacionární body je možné hledat také pomocí derivací rovnice (1).Příklad 2Určit optimální hodnoty významných parametrů pro úplný kvadratický model, k = 3:Postup řešení:y = bo+3∑b x+3∑i ii= 1 i=1biix2i+∑∑i


ÚPLNÉ KVADRATICKÉ MODELYd) dosadit za X do (c)Řešení:a) Rozepíšeme úplný kvadratický modelDerivujeme2 2 2y = bo + ( b1 x1+ b2x2+ b3x3)+ ( b11x1+ b22x2+ b33x3) + ( b12x1x2+ b13x1x3+ b23x2x3)δy= b1+ 2b11x1+ b12x2+ b13x3δx1δy= b2+ 2b22x2+ b12x1+ b23x3δx2δy= b3+ 2b33x3+ b13x1+ b23x2δx3Položíme rovno nule a upravíme2bx + b x + b x = −b1111221331b) Soustavu napíšeme v maticovém tvarub12x1+ 2b22x2+ b23x3= −b2b13x1+ b23x2+ 2b33x3= −b3⎡⎢b⎢b2⎢⎢ 2⎢b⎢⎣ 2111213b2bb1222232b13⎤2⎥⎥⎡x1⎤ ⎡b1⎤b23⎥⎢⎥= −⎢ ⎥⎥⎢x2⎥ ⎢b22⎥⎥⎢⎣x ⎥⎦⎢⎣⎥3b3⎦b33⎥⎦symbolicky2.B.x = -bx =−1 1B −b2Z porovnání maticového a symbolického zápisu je zřejmé, co je B a b.Příklad 3 (určení typu stacionárních bodů)Mají se najít stacionární body a jejich typ pro kvadratický model se dvěma proměnnými x 1 ,x 2 .Plán experimentu má tvar 2 2 a je doplněn o hvězdicové body a čtyři centrální body:66


ÚPLNÉ KVADRATICKÉ MODELYx 1 (min) = 200,x 1 (max) = 250,x 2 (min) = 15,x 2 (max) = 25.Plán experimentux 1 x 2 Y1 -1 -1 432 1 -1 783 -1 1 694 1 1 735 -1,414 0 486 1,414 0 767 0 -1,414 658 0 1,414 749 0 0 7610 0 0 7911 0 0 8312 0 0 81Řešení:Vychází modelY = 79,75 + 9,83x 1 + 4,22x 2 – 8,88x 12- 5,13x 2 2 -7,75x 1 x 2Odtud⎡ − 8,88 − 3,875⎤⎡9,83⎤B = ⎢⎥ a b =⎣−3,875 − 5,13⎢ ⎥⎦ ⎣4,22⎦x s1 −= − B1 b =2−1⎡−0,167982⎢⎣ 0,126890,12689 ⎤⎡9,83⎤⎡ 0,5579 ⎤⎥ =− 0,29078⎥⎢⎢ ⎥⎦⎣4,22⎦⎣−0,0101⎦Optimální kódované hodnoty (stacionární body) proměnných x 1, x 2 jsou 0.5579 a 0.0101.Při této volbě vstupů je optimální Y = 82,47.V reálných hodnotách, označených řeckými písmeny ξ 1 , ξ 2 , máme reálné optimální hodnotyTyp extrémuV našem případě je charakteristická rovniceodtudξ 1 = 225 + 25x 1 = 225 + 25. 0,5579 = 238,95ξ 2 = 20 + 5x 2 = 20 + 5.(-0,0101) = 19,95⎡−8,88 − λ − 3,85 ⎤det ⎢= 03,85 5,13⎥⎣ − − − λ⎦λ 2 + 14,01λ + 30,54 = 067


ÚPLNÉ KVADRATICKÉ MODELYa charakteristická číslaλ 1 = -11,3098 a λ 2 = -2,7002.Protože oba kořeny jsou záporné, jedná se o maximum.Kromě optimální úrovně parametrů je možné najít také optimální oblast, ve které jedosahováno nejlepší úrovně sledovaného výstupu Y a současně minimální variability. Tatooblast se nalezne jako průnik vrstevnicových grafů pro optimální Y a pro minimálnívariabilitu.Vrstevnicové grafyPříklad 4 (vrstevnicové grafy)Pro faktory A,B je sestaven úplný plán, doplněný o 5 centrálních bodů. Protože se má najítúplný kvadratický model, je plán dále doplněn a hvězdicové body. Sledují se celkem třiukazatele kvality, na které mají odběratelé tyto požadavky: Y1 > 78.5, 62


ÚPLNÉ KVADRATICKÉ MODELYVýstup Y 19,94 + 0,99*X + 0,52*Y - 1,38*X^2 - 1,00*Y^2 + 0,25*X*Y10,60,2-0,2-0,6-1-1 -0,6 -0,2 0,2 0,6 1XFunction76,076,577,077,578,078,579,079,580,080,5Výstup Y 270,00 - 0,16*X - 0,95*Y - 0,69*X^2 - 6,69*Y^2 - 1,25*X*YY10,60,2-0,2Function57,061,065,069,073,0-0,6-1-1 -0,6 -0,2 0,2 0,6 1XVýstup Y 3Y10,60,2-0,2-0,6-13386,2 + 205,1*X + 177,4*Y-1 -0,6 -0,2 0,2 0,6 1XFunction3000,03080,03160,03240,03320,03400,03480,03560,03640,03720,03800,0Optimální režim výroby představuje průnik všech vrstevnicových grafů s vymezením oblastí,které vyhovují výchozím požadavkům.Při konstrukci úplného kvadratického plánu jsme uvedli, že jsou různé možnosti sestaveníplánu: kombinovaný plán, tříúrovňový plán a Box Benkenův plán.Poslední dva probereme v této kapitole.69


ÚPLNÉ KVADRATICKÉ MODELY4.3.3 Box - Behnkenův plán experimentu (BBD)Sestavení plánu experimentu se provádí pro tři faktory takto:jeden faktor je na úrovni 0 (zde první) a pro zbývající dva faktory se sestaví úplný plán(modře):Pok. x y z1 0 - 1 - 12 0 1 - 13 0 - 1 14 0 1 15 - 1 0 - 16 1 0 - 17 - 1 0 18 1 0 19 - 1 - 1 010 1 - 1 011 - 1 1 012 1 1 013 0 0 0Další faktor je na úrovni 0 (zde druhý) a pro zbývající dva faktory se sestaví úplný plán, atd.Poslední řádek je vektor centrálních bodů.Pro čtyři faktory: vytvoří se úplný plán 2 2 postupně pro všechny dvojice faktorů, přičemžostatní jsou na úrovni 0.Pro pět faktorů:± 1 ± 1 0 0 0± 1 0 ± 1 0 0± 1 0 0 ± 1 0± 1 0 0 0 ± 10 ± 1 ± 1 0 00 ± 0 ± 1 00 ± 0 0 ± 10 0 ± 1 ± 1 00 0 ± 0 ± 10 0 0 ± 1 ± 10 0 0 0 0Tento zápis je zkrácená podoba plánu: např. v prvém řádku ± 1 , ± 1, 0, 0, 0 zápisu znamená,že pro první a druhou proměnnou se dělá úplný plán, ostatní 0. Zápis ± 1 , ± 1, 0, 0, 0 tedypředstavuje 4 řádky plánu.Poslední řádek je vektor centrálních bodů.⎛kPočet pokusů pro k = 3,4,5: n = 42 ⎟. ⎞⎜⎝ ⎠Pro dva faktory se BBD nedělá.70


ÚPLNÉ KVADRATICKÉ MODELY4.3.4 Plány pro faktory se třemi úrovněmiÚplný faktorový plán pro tři faktory na třech úrovních:Plán se sestaví podobně jako pro dvouúrovňové faktory:a) stanovíme počet pokusů: n = 3 kb) s tvorbou začneme např. u faktoru x 3 : střídáme úrovně -1, 0, 1; pokračujeme u x 2 :obměna úrovní je trojnásobek předchozí; nakonec u x 3 -obměna je trojnásobekpředchozí, tedy po devíti stejných úrovních:Pokus x 1 x 2 x 3 y1 - 1 - 1 - 12 - 1 - 1 03 - 1 - 1 14 - 1 0 - 15 - 1 0 06 - 1 0 17 - 1 1 - 18 - 1 1 09 - 1 1 110 0 - 1 - 111 0 - 1 012 0 - 1 113 0 0 - 114 0 0 015 0 0 116 0 1 - 117 0 1 018 0 1 119 1 - 1 - 120 1 - 1 021 1 - 1 122 1 0 - 123 1 0 024 1 0 125 1 1 - 126 1 1 027 1 1 1Příklad 5Sestavte úplný plán pro dva faktory A,B, které mají tři úrovně.S tvorbou začněte u faktoru A.Řešení:A B Y1 -1 -12 0 -13 1 -14 -1 05 0 071


ÚPLNÉ KVADRATICKÉ MODELY6 1 07 -1 18 0 19 1 1Pozn.: Délka tohoto plánu oproti dvouúrovňovému není příliš odlišná. U tří faktorů však jen = 3 3 = 27, kdežto pro dvě úrovně je počet pokusů n = 2 3 = 8. Proto, pokud je to možné,upřednostňujeme dvouúrovňové plány.Shrnutí kapitoly 4V této kapitole bylo vysvětleno, kdy je potřeba kvadratický model a jak se sestrojí. Celkembyly uvedeny tři způsoby možného postupu a také důvod, proč nelze uplatnit metodiku,použitou u lineárních modelů.Otázky ke kapitole 41. Jaké jsou podmínky sestavení plánu pro nalezení úplného kvadratického modelu2. Kolik je koeficientů v úplném kvadratickém modelu se dvěma faktory3. K čemu slouží test křivosti4. Napište všechny body testu křivosti5. Uveďte tři metody nalezení úplného kvadratického modelu6. Jak se stanoví α u hvězdicových bodů7. Co je rotovatelnost plánu8. Napište maticově úplný kvadratický model9. Proveďte odvození vzorce pro výpočet stacionárních bodů a uveďte potřebné pomocnévěty10. Napište prvky matice B a vektoru b11. Napište charakteristickou rovnici matice B12. Jak poznáme typ extrému u kvadratického modelu13. Jak se nalezne a k čemu slouží vrstevnicový graf14. Napište Box – Behnkenův plán pro 3,4 a 5 faktorů15. Napište plán pro 3 faktory se třemi úrovněmi16. Napište plán pro 2 faktory se třemi úrovněmiCvičení ke kapitole 4PříkladNajděte úplný kvadratický model a matice B a b k plánu:x 1 x 2 Y1 -1 -1 122 1 -1 123 -1 1 1372


ÚPLNÉ KVADRATICKÉ MODELY4 1 1 155 -1,414 0 106 1,414 0 117 0 -1,414 148 0 1,414 189 0 0 1710 0 0 1511 0 0 1612 0 0 16KLÍČ K ŘEŠENÍ KAP. 4c X 1 X 2 X 12 X 11 X 2216,0 0,42 1,20 0,50 -2,82 -0,06⎡0,42⎤⎡−2,82 0,25 ⎤b = ⎢ ⎥ , B =⎣1,20⎢⎥⎦ ⎣ 0,25 − 0,06 ⎦73


BLOKY5. BLOKYČas ke studiu: 3 hodinyCíle:a) objasnit smysl používání blokůb) ukázat postup konstrukce blokůc) vysvětlit způsob vyhodnocení vlivu blokůVýkladPři realizaci experimentu musí být provedeny všechny pokusy za stejných podmínek. Měníse jen to, co je stanoveno plánem. Pokud není možné dodržet tuto zásadní podmínku(například nelze provést celý experiment během jednoho dne, nebo z jedné dávky suroviny),provádí se rozdělení pokusů do tzv. bloků. Vytvořit bloky prakticky znamená rozdělit pokusydo skupin, ve kterých jsou stejné podmínky pro jejich provedení (např. pokusy provedenéprvní den tvoří prvý blok, pokusy z druhého dne pak druhý blok). Bloky se vytvářejí tak, abya) při výpočtu efektu byl eliminován případný vliv toho, že během experimentu nelze zajistitpro všechny pokusy stejné podmínky,b) při hodnocení výsledků experimentu bylo možné stanovit, zda bloky mají vliv navýsledek.Bloky se tvoří pomocí generátorů bloků, které jsou uvedeny v tabulkách. Máme tedykromě generátorů vedlejších faktorů a generátorů frakcí ještě generátory bloků.Výběr z tabulky generátorů bloků:Počet proměnných k Velikost bloku Generátor bloku3 4 B1=1232 B1=12, B2=134 8 B1=12344 B1=124, B2=1342 B1=12,B2=23,B3=345 16 B1=123458 B1=123,B2=3454 B1=125,B2=235,B3=3452 B1=12,B2=13,B3=34, B4=456 32 B1=12345616 B1=1236,B2=34568 B1=135,B2=1256, B3=12344 B1=126,B2=136,B3=346,B4=4562 B1=12,B2=23,B3=34, B4=45,B5=56Tab.1 Generátory bloků74


BLOKY5.1 Konstrukce blokůPříklad 1 (tři faktory, čtyři bloky)Rozdělte do 4 bloků pokusy v plánu 2 3 .Řešení:Je potřeba rozdělit 2 3 = 8 pokusů do 4 bloků, které tvoří 8/4 =2 pokusy. V tabulce pro k = 3 avelikost bloku 2 jsou generátory bloků B1=12 a B2 = 13.Existují 4 varianty znamének, které vytvoří B1, B2. Příslušné bloky očíslujeme:Máme tedy tyto bloky:1 2 3 12 13 blok-1 -1 -1 1 1 IV1 -1 -1 -1 -1 I-1 1 -1 -1 1 III1 1 -1 1 -1 II-1 -1 1 1 -1 II1 -1 1 -1 1 III-1 1 1 -1 -1 I1 1 1 1 1 IVBlok I II III IV(B1,B2) (-,-) (+,-) (-,+) (+,+)Konečné rozdělení experimentu do bloků budeExperimentální proměnné (faktory) Blokové proměnnéČ.pokusu 1 2 3 B1=12 B2=13 Č.bloku1 - - - + + IV2 + - - - - I3 - + - - + III4 + + - + - II5 - - + + - II6 + - + - + III7 - + + - - I8 + + + + + IVPříklad 2 (tři faktory, dva bloky)Mějme faktory A,B,C, pro které je proveden úplný plán:A B C AB AC BC ABC Blok1 - - - + + + - I2 + - - - - + + II3 - + - - + - + II4 + + - + - - - I5 - - + + - - + II6 + - + - + - - I7 - + + - - + - I8 + + + + + + + II75


BLOKYPokusy rozdělte do dvou bloků. Porovnejte efekty vypočítané v nerozděleném plánu, plánurozděleném do bloků správně a nesprávně.Řešení:Pro k = 3 a velikost bloku 4 je podle tab.1 generátor bloků B1 = 123.Do prvého bloku patří ty pokusy, kde ABC = -1 a do druhého ty, kde ABC = +1. Prvý blokznamená provedení pokusu prvý den, druhý blok provedení druhý den. Při grafickémznázornění tohoto plánu pomocí kvádru se ukazuje, že na každé hraně je pokus z I. a II.bloku (obr.1).Obr.1 Rozdělení plánu 2 3 do dvou blokůTakto naplánované rozdělení do bloků eliminuje vliv té nepříznivé skutečnosti, že pokusynení možné provést během jednoho dne.Vliv správného a nesprávného rozdělení do bloků ukazují následující 3 tabulky, kterépředstavujía) experiment provedený během jednoho dne(= kontrolní experiment),b) experiment provedený dle výše uvedeného plánu,c) experiment rozdělený do bloků bez generátorů.Tabulka (2a):Tabulka (2b):pokus A B C Y1 - - - 422 + - - 493 - + - 374 + + - 465 - - + 326 + - + 417 - + + 338 + + + 44Blok/ A B C YpokusI/6 + - + 41I/4 + + - 46I/1 - - - 42I/7 - + + 33II/5 - - + 38II/3 - + - 43II/8 + + + 50II/2 + - - 5576


BLOKYEfekty faktorů počítaných pro tabulky a) a b) jsou stejné:A = 9.0, B = -1.0, C = -6.0, AB = 1.0, AC = 1.0, BC = 3.0, ABC = 6.0.To znamená, že rozdělení pokusů do dvou dnů neovlivnilo výsledek. Je ovšem otázka, zdarozdělení do bloků vůbec mělo na pokusy vliv. Odpověď je pozitivní: interakce ABC jevýznamná, přitom lze předpokládat, že u vyšších interakcí je efekt zanedbatelný. Proto tutovýznamnou hodnotu vysvětlujeme jako vliv bloků. A to je také důvod, proč se rozdělení dobloků provádí pomocí interakcí více faktorů. Ve třetím případě, kdy byly pokusy rozdělenyneplánovitě, se ukazuje, že výsledek interakce BC byl ovlivněn.Tabulka (2c):Blok/pok. A B C YI/4 + + - 46I/6 + - + 41I/5 - - + 32I/3 - + - 37II/8 + + + 50II/1 - - - 48II/2 + - - 55II/7 - + + 39Efekt faktorů je zde:A = 9.0, B = -1.0, C = -6.0, AB = 1.0, AC = 1.0, BC = 9.0 (!), ABC = 0.0.5.2 Hodnocení vlivu blokůJestliže se experiment dělí na bloky, je nutné stanovit, zda rozdíly ve výsledcích pokusův jednotlivých blocích jsou významné. K tomuto účelu se z reziduálního součtu čtverců S Rvyčlení část, připadající na bloky a provede se ANOVA.Pokud rozdělení experimentu do bloků ovlivňuje výsledky pokusů, zavádí se blokováproměnná x B , takže model má potom tvarY = f(x) + d.x B + eU dvou bloků se koeficient blokové proměnné d vypočítá takto: kódované hodnoty blokovéproměnné x B se označí v prvém bloku -1 a ve druhém bloku +1. Koeficient blokové proměnnébuden = počet všech pokusůdn∑j=1=nx∑j=1BjxY2Bjj77


BLOKYPříklad 3 (hodnocení vlivu bloků)Úplný plán pro tři faktory je doplněn o dva centrální body a hvězdicové body s volbouα = ±2 . Pokusy jsou rozděleny do dvou bloků. Prvních 8 pokusů tvoří první blok (-1),druhých 8 pokusů = druhý blok (+1).X1 X2 X3 Y Blok-1 -1 -1 25,74 -11 -1 -1 48,98 -1-1 1 -1 42,78 -11 1 -1 35,94 -1-1 -1 1 41,50 -11 -1 1 50,10 -1-1 1 1 46,06 -11 1 1 27,70 -10 0 0 57,52 10 0 0 59,68 1-2 0 0 35,50 12 0 0 44,18 10 -2 0 38,58 10 2 0 28,46 10 0 -2 33,50 10 0 2 42,02 1Mají se vypočítat koeficient blokové proměnné a provést ANOVA k vyhodnocení vlivubloků. Uvažovaný model je úplný kvadratický.Řešení:Regresní koeficient blokové proměnné jed=− 25,74 − ... + 42,02 20,64=2( −1)+ ... + ( −1)162=1,29Základní ANOVASS Df rozptyl F p-valueModel SS M = 1451,62 k-1 = 9 161,29 23,29 0,0005Rezidua SS R = 41,6 n-k = 6 6,93Součet SS T = 1493,17 15k = počet parametrů: 1 absolutní člen + 3 lineární + 3 smíšené + 3 ryze kvadratické = 10n = počet bodů =1678


BLOKYVýpočet koeficientů (Statgraphics)parametr odhad s T p-valueC 41,14 2,7 15,1 0,00Blok 1,29 2,7 0,47 0,64X1 1,5 2,7 0,55 0,59X2 -2,13 2,7 -0,78 0,45X3 1,81 2,7 0,66 0,52U dvou bloků se součet čtverců odchylek, připadající na bloky, určíSS(blocks) = n.d 2SS= 16.1,29 2 = 26,6256Obecně pro m bloků jemBiSS(blocks)= ∑n2G−i= 1 in2318,8=82339,44+82−658,2416= 26,6256m = počet blokůBi = součet výsledků pokusů (Y) v i – tém blokuni = počet pokusů v i – tém blokuG součet výsledků všech pokusů (Y)n = celkový počet pokusůReziduální součet čtverců, „očištěný“ o vliv bloků, se vypočításR∑2= e − SS(blocks)iPři vyhodnocování SS B (blok) testem ANOVA se použijí stupně volnosti m – 1.Testovací kriteriumm = počet blokůT=SS(blocks) /( m −1)S /R[ df − ( m −1)]RANOVA pro vyhodnocení vlivu blokůSS df SS/df T Kritic. hodnotabloky 26,6 m-1 = 1 26,6/1 = 26,6rezidua bezbloků41,6-26,6 = 15 df R -(m-1) = 6-1 15/5 = 3 26,6/3 = 8,9 F 1,5 (0,05) = 6,6T překračuje F 1,5 (0,05) což znamená, že bloky ovlivňují výsledek pokusu.79


BLOKYShrnutí kapitoly 5Této kapitole byl objasněn smysl zavádění bloků do plánu experimentu, postup při jejichtvorbě a způsob vyhodnocení vlivu bloků na výsledky pokusů.Otázky ke kapitole 51. Kdy se pokusy rozdělují do bloků2. Jak se tvoří bloky3. Jaké generátory jste již poznali4. Jak se zjistí, zda rozdělení do bloků ovlivnilo výsledky5. Co následuje, jestliže rozdělení do bloků má vliv na výsledek pokusu6. Jak se počítá koeficient blokové proměnné u dvou bloků7. Jak se počítá součet čtverců u dvou bloků8. Jak se počítá součet čtverců u m bloků9. Napište testovací kriterium testu vlivu bloku; jaké má rozděleníÚlohy k řešení 1.1.PříkladPro 4 faktory (označené 1,2,3,4) vytvořte úplný plán a rozdělte ho do 8 bloků.KLÍČ K ŘEŠENÍ KAP. 5Řešení:Generátory podle tab.1 jsou B1 = 12, B2 = 23, B3 = 34.Tyto generátory mohou vytvořit tyto varianty znamének:blok-1 -1 -1 I1 -1 -1 II-1 1 -1 II1 1 -1 IV-1 -1 1 V1 -1 1 VI-1 1 1 VII1 1 1 VIII80


BLOKYNyní rozdělíme pokusy do bloků:1 2 3 4 12 23 34 blok-1 -1 -1 -1 1 1 1 VIII1 -1 -1 -1 -1 1 1 VII-1 1 -1 -1 -1 -1 1 V1 1 -1 -1 1 -1 1 VI-1 -1 1 -1 1 -1 -1 II1 -1 1 -1 -1 -1 -1 I-1 1 1 -1 -1 1 -1 III1 1 1 -1 1 1 -1 IV-1 -1 -1 1 1 1 -1 IV1 -1 -1 1 -1 1 -1 III-1 1 -1 1 -1 -1 -1 I1 1 -1 1 1 -1 -1 II-1 -1 1 1 1 -1 1 VI1 -1 1 1 -1 -1 1 V-1 1 1 1 -1 1 1 VII1 1 1 1 1 1 1 VIII81


ANOVA V DOE6. ANOVA V DOEČas ke studiu: 4 hodinyCíl: Ukázat způsob hodnocení kvality modelu na základě analýzy rozptyluS pojmem analýza rozptylu (ANOVA) se setkáme ještě v desáté kapitole v poněkud jinésouvislosti.VýkladV plánování experimentů se matice X sestavuje nejen s ohledem na nalezení nejlepšíhomodelu, ale také tak, aby bylo možné provést co nejlepší analýzu nalezené regresní funkce.Proto se buď plánovitě provádí opakované pokusy, nebo jsou do modelu zařazeny centrálníbody. Pak je možné provést ANOVA podrobněji, než je běžné. Počítá se součet čtvercůodchylek proa) Model: S MTento součet se rozkládá, při použití úplného kvadratického modelu, na složkulineární,ryze kvadratickou a smíšenou: S M = S Li + S Q + S S .(pro tento rozklad je třeba doplnit plán o hvězdicové body);b) Rezidua: S ROpakování pokusů resp. centrální body umožňují další rozklad S R :S R = S P + S L , kde S P je tzv. čistá chyba a S F je chyba modelu;tento rozklad vyžaduje opakované resp. zdvojené pokusy nebo centrální body;c) Bloky: S BJe-li plán rozdělen na bloky, počítá se, jaká část S R připadá na bloky (kap.5).6.1 Rozklad reziduálního rozptylu)Reziduální odchylky jsou rozdílem empirické a teoretické hodnoty ei= Yi− Yi.)Příčinou neshody Yia Yije nepřesnost měření a nedokonalost modelu.Při opakování pokusů bude výraz pro výpočet e i doplněn o index s číslem opakování.Označme Y ij j-té pozorování pro bod x i , i = 1,2,…,m; j = 1,2,…,n im = počet úrovní(všech různých tj.těch, které se neopakují); ni = počet opakování xi.Reziduální odchylka je Yij − Yi ˆ = ( Yij − Yi)+ ( Yi − Yˆi)Umocněním a po úpravě máme82


ANOVA V DOEm nim nim22∑∑( Yij − Yi)= ∑∑(Yij − Yi)+ ∑i= 1 j=1i= 1 j=1i=1ni(Yi − Yi ˆ )2První člen na pravé straně označíme S P (pure error): představuje chybu měření;druhý člen S L (lack of fit) je mírou neshody empirického modelu s teoretickým.V další kapitole ukážeme, jak rozklad∑S R= e 2 islouží k testování modelu.i6.2 Test Lack-of-fitTest je založen na rozkladu S R = S P + S L a posouzení, je-li významný rozdíl mezi S L a S P .Pokud je rozdíl významný, považujeme model za nedostatečný.Test lack of fit se může provésta) pro opakované pokusyb) pro centrální bodya to pro jednu proměnnou (x) i obecně pro k proměnných (x 1 ,…,x k ). To pak vyžaduje sledovatY pro tytéž volby regresorů (x 1 ,…,x k ), neboli stejné řádky v matici X.Hodnocení významnosti S LHo:Ho: SLSP;H1= : SL≠ SShoda S P a S L se hodnotí F testem s testovacím kriteriemPSdfLLF = =SPdfPss2L2PKritická hodnota pro hladinu významnosti 0,05: F m,n (0,05), kde m = df L , n = df P .Ho se zamítá při překročení kritické hodnoty.Výpočet stupňů volnosti df R a df LdfP=m∑i=1df R = n-p( n −1)= n − m = nidf R = df L + df PC−1df L = n-p-(n-m) = m-pn i = počet opakování i-tého pokusup = počet parametrů v regresní funkci83


ANOVA V DOEn c = počet centrálních bodům = počet různých pokusůn = počet bodůVýpočet S L a S P ukážeme v následujících příkladech pro různé situace:a) pro opakované pokusyb) pro plán s centrálními bodyPříklad 1(test lack-of-fit pro plán s opakováním)K bodům (x,Y) se má najít regresní přímka a provést ANOVA,rozložit S R na S P a S L a provést test lack-of-fit.Řešení:Regresní přímka má rovnicixY1,3 2,31,3 1,82,0 2,82,0 1,52,7 2,23,3 3,83,3 1,83,7 3,73,7 1,74,0 2,84,0 2,84,0 2,24,7 3,24,7 1,95,0 1,85,3 3,55,3 2,85,3 2,15,7 3,46,0 3,26,0 3,06,3 3,06,7 5,9Yˆ = 1,426 + 0, 316x.ANOVA, která je součástí regresní analýzy, je v tab.1.SS df Rozptyl TestovacíkriteriumS M 5,499 p-1 = 2 - 1 S M /1=5,499 T = 5,499/0,728S R 15,278 n-p = 23-2 S R /21=0,728 T = 7,56S T 20,777Kritická hodnotaF 1,21 (0,05) = 4,325Tab.1 ANOVAPřehled vzorců pro výpočet součtu čtverců odchylek (z nich některé jsou součástí ANOVAv tabulce):84


ANOVA V DOE1) = ∑( Yi − Y )S T22) S = ∑ − ˆR( Yi Yi)= ∑ei3) S M = S T - S Rnj24) S P = ∑( Yju − Yj)(viz tab.2)u=1225) S L = S R - S PVýpočet S P :V prvém sloupci jsou hodnoty x, ve kterých se prováděl opakovaně pokus.Opakovanéx jY juYjnj∑u=1( Yju − Yj)2df = n j -11,3 2.3, 1,8 2,05 0,125 12,0 2.8, 1.5 2,15 0,845 13,3 3.8, 1.8 2,80 2,000 13,7 3.7, 1.7 2,70 2,000 14,0 2.8, 2.8, 2.2 2,60 0,240 24,7 3.2, 1.9 2,55 0,845 15,3 3.5, 2.8, 2.1 2,80 0,980 26,0 3.2, 3 3,10 0,020 1suma S p = 7,055 df P = 10Tab.2 Výpočet S P a df PSS df Rozptyl Testovací kriteriumFS M 5,499 1 5,499S R 15,278 df R = 23-2 = 21 0,728S L S L = S R -S P = 8,223 df L = 21-10 = 11 8,223/11 = 0,748S P 7,055 df P = 10 7,055/10 = 0,706S T 20,777df R = n-p = 23-2 = 21m∑df P= ( n j−1)= 10 (tab.2)j=1df L = df R - df P = 21-10 = 11Kritická hodnota: F 11,10 (0,05) = 2,94Tab.3 ANOVA s rozkladem S RF = 0,748/0,706 =1,06Protože F = 1,061 < F 11,10 (0,05) = 2,94, není položka S L významná; proto je model vyhovující(dobře shodný s teoretickým).Pokud by S L bylo významné, je nalezený model nedostatečně shodný s teoretickým.Pak je potřeba pokusit se zjistit, kde a čím je tato neshoda způsobena. Příčinou může býtautokorelace nebo heteroskedasticita. Ta se zjišťuje pomocí analýzy reziduí.85


ANOVA V DOEPříklad 2 (test lack-of-fit pro plán s opakováním)Vypočítat S P a S L , je-li S R = 250,134.Data:x Y1,0 10,841,0 9,302,0 16,353,3 22,883,3 24,354,0 24,564,0 25,864,0 29,164,7 24,595,0 22,255,6 25,905,6 27,205,6 25,616,0 25,456,0 26,566,5 21,036,9 21,46Řešení:Výpočet S PX 2(ijYj)Y − d.f.1 1,1858 13,3 1,0805 14 11,2467 25,6 1,4341 26 0,6161 1suma S P = 15,5632 df P = 7S L = S R – S P = 250,134 – 15,5632 = 234,5708Příklad 3 (test lack-of-fit pro plán s centrálními body)Najít S R pro úplný kvadratický model a provést test lack-of-fit.x 1 x 2 Y-1 -1 431 -1 78-1 1 69+1 1 73-1,44 0 481,44 0 760 -1,44 650 1,44 740 0 760 0 790 0 830 0 8186


ANOVA V DOEŘešení:Yˆ= 79,7 + 9,7x2 21+ 4,1x2− 8,7x1− 5,1 x2− 7, 8S R = 36,5; S M = 1732,46; YC= 79, 75S P = (76-79,75) 2 + (79-79,75) 2 + (83-79,75) 2 + (81-79,75) 2 = 26,75 ~26,8S L = S R – S P = 36,5 – 26,8 = 9,7x1x2df rozptyl TS R 36,5 df R = n-p = 12-6 = 6S L 9,7 df L = df R -df P = 3 9,7/3 = 3,2 3,2/8,9 = 0,36S P 26,8 df P = n c -1 = 3 26,8/3 = 8,9F 3,3 (0,05) = 9,27T < 9,27; ponecháme Ho.n = 12 počet bodůp = 6 počet parametrů regresní funkcen c = 4 počet centrálních bodůPříklad 4 (test lack-of-fit pro plán s centrálními body)6 2Pro plán 2 − se 4 centrálními body, generátory E = ABC, F = BCD; provést test lack-of-fit.Pro plán experimentuE = F =A B C D ABC BCD Y-1 -1 -1 -1 -1 -1 61 -1 -1 -1 1 -1 10-1 1 -1 -1 1 1 321 1 -1 -1 -1 1 60-1 -1 1 -1 1 1 41 -1 1 -1 -1 1 15-1 1 1 -1 -1 -1 261 1 1 -1 1 -1 60-1 -1 -1 1 -1 1 81 -1 -1 1 1 1 12-1 1 -1 1 1 -1 341 1 -1 1 -1 -1 60-1 -1 1 1 1 -1 161 -1 1 1 -1 -1 5-1 1 1 1 -1 1 371 1 1 1 1 1 520 0 0 0 0 0 290 0 0 0 0 0 340 0 0 0 0 0 260 0 0 0 0 0 30byla nalezena lineární regresní funkce a provedena ANOVA:87


ANOVA V DOEANOVATest.krit.df SS SS/df F p-valS M p-1 = 6 5858,375 976,3958 14,88365 3,79E-05S R n – p =13 852,825 65,60192Celkem 19 6711,2Řešení:p = 7; n = 20YC= 29,75S P = 32,75S L = S R – S P = 852,825 – 32,75 = 820,075S(Součet čtverců) df S/df T Kritická hod.S R 852,825 df R = n-p =20-7 = 13S L 820,075 df L = df R -df P 820,075/10=82,0075 7,51 F 10,3 (0,05)= 13 – 3 = 10= 8,78S P 32,75 df P = n c -1= 3 32,75/3=10,92T < F 10,3 (0,05), S L není významně větší než S P , model se ponechává (H o se nezamítá).Shrnutí kapitoly 6V této kapitole jsme ukázali možnosti testování vhodnosti modelu na základě analýzyrozptylu. Ta byla provede pro dvě základní situace, vyskytující se v praxi.Otázky ke kapitole 61. Proveďte základní rozklad rozptylu S T při ANOVA2. Rozepište S R3. Napište všechny body testu lack-of-fit4. K čemu slouží test lack-of-fit5. Jak se počítají stupně volnosti df L a df P6. Uveďte dvě situace pro výpočet df P88


ANOVA V DOEÚlohy ke kapitole 6Příklad 1Vypočítejte S p pomocí centrálních bodů pro následující plán experimentu.S R = 1116,67; S P = 200,0; S L = 916,67Pokus 1 2 3 Y1 - - - 1402 + - - 1503 - + - 1704 + + - 1605 - - + 1206 + - + 1207 - + + 1408 + + + 1809 0 0 0 15010 0 0 0 14011 0 0 0 16012 0 0 0 150Příklad 2Proveďte test křivosti v příkladě 2KLÍČ K ŘEŠENÍ KAP. 6Řešení(1):[S p = 200]89


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮ7. ZPŮSOBY NAVRHOVÁNÍ ROBUSTNÍCH VÝROBKŮČas ke studiu: 4 hodinyCíl: Vysvětli různé přístupy k navrhování robustních výrobkůVýkladCílem plánování experimentů je nejen nalézt faktory, které nejvýznamněji ovlivňujísledovaný ukazatel kvality. To by bylo pro výrobce málo. Neméně důležité je zjistit, jakouhodnotu mají vybrané faktory mít, aby ukazatel kvality Y byl optimální.Optimalita se chápejako dosažení maxima Y (například výkon motoru), minima Y(spotřeba motoru) resp. určitécílové hodnoty. Optimální hodnotu ukazatele Y by měl produkt mít i při různýchpodmínkách užívání, při různém zacházení a dalších vnějších vlivech, které výrobcenemůže ovlivnit. Výrobky s takovými vlastnostmi se nazývají robustní a dosažení robustnostije také jedním z cílů plánování experimentů.V této kapitole se budeme zabývat různými způsoby zajišťování stability ukazatele kvality Y.7.1 Minimalizace rozptylu YV této kapitole se budeme zabývat metodami nalezení takové úrovně významných faktorů, přikterých je Y co nejstabilnější, tedy variabilita Y minimální, současně s udržením nejlepšímožné hodnoty Y.Příklad 1 ([2], upraveno)Sleduje se vrstva oxidu (Y) na membráně v závislosti na teplotě(A), čase (B), tlaku (C) aproudu plynu (D). Požadavek technologů je, aby vrstva oxidu byla mezi 390 a 410. Současněse žádá, aby C bylo na dolní úrovni a variabilita sledovaného ukazatele Y aby nepřesáhlahodnotu 2,0. Provedlo se 2 4 pokusů bez opakování, ale se čtyřmi měřeními u každéhopokusu. Je potřebaa) najít faktory, které významně ovlivňují Y a model závislosti Y na uvedenýchfaktorech,b) najít faktory, které významně ovlivňují rozptyl Y a model závislosti s 2 (Y) nauvedených faktorech,c) sestrojit vrstevnicové grafy pro a) a b).Nejprve se vypočítají průměry a rozptyly Y v jednotlivých pokusech:Výsledky měření v jednotlivých pokusech(jedná se o zdvojené měření)90


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮx 1 x 2 x 3 x 4 1.měř. 2.měř. 3.měř. 4.měř.-1 -1 -1 -1 378 376 379 3781 -1 -1 -1 415 416 417 416-1 1 -1 -1 380 379 383 3811 1 -1 -1 450 446 447 448-1 -1 1 -1 375 371 369 3721 -1 1 -1 391 390 391 390-1 1 1 -1 384 385 385 3851 1 1 -1 426 433 431 430-1 -1 -1 1 381 381 383 3801 -1 -1 1 416 420 412 415-1 1 -1 1 371 372 370 3711 1 -1 1 445 448 448 446-1 -1 1 1 377 377 379 3781 -1 1 1 391 391 400 392-1 1 1 1 375 376 377 3761 1 1 1 430 430 428 429Tab.1 Úplný plán a opakovaná měření YPrůměr a rozptyl opakovaných měření. Logaritmus rozptylu je počítán proto, aby se srovnalyřádové rozdíly.Průměr Y s 2 (rozptyly Y) ln s 2378 2 0,693416 0,67 -0,4381 3,33 1,203448 3,33 1,203372 6,67 1,898390 2 0,693385 0,67 -0,4430 8,67 2,153380 12 2,485415 14,67 2,686371 0,67 -0,4446 6 1,792378 1,33 0,285392 34 3,526376 0,67 -0,4429 1,33 0,285Tab.2 Zpracování výsledků opakovaných měřeníNyní je potřeba určit významné faktory zvláště pro Y a zvláště pro rozptyl s 2 (Y).Ukazatel YNalezneme (dvěma způsoby) významné faktory pro Y s použitím programu Statgaphics.První použitá metoda je Paterova analýza, druhá normální pravděpodobnostní graf.91


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮStandardized Pareto Chart for YA:Factor_AB:Factor_BABACC:Factor_CBDBCD:Factor_DCDAD0 10 20 30 40Standardized effectObr.1 Paretova analýza k určení vlivných faktorů+-Normal Probability Plot for Ypercentage99,99995805020510,1-8 2 12 22 32 42Standardized effectsObr.2 Normální pravděpodobnostní graf k určení vlivných faktorůVýznamné faktory a interakce jsou A,B,C,AB,AC.Ve výsledcích Statgraphics je provedena ANOVA a jsou počítány koeficienty regresníhomodelu pro všechny faktory a interakce dvojic.Hodnoty p-value potvrzují, že významnými faktory jsou A, B, C, AB a AC.92


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮAnalysis of Variance for Y--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------A:Factor_A 7439,06 1 7439,06 1053,32 0,0000B:Factor_B 1314,06 1 1314,06 186,06 0,0000C:Factor_C 430,563 1 430,563 60,96 0,0006D:Factor_D 10,5625 1 10,5625 1,50 0,2758AB 1139,06 1 1139,06 161,28 0,0001AC 451,563 1 451,563 63,94 0,0005AD 5,0625 1 5,0625 0,72 0,4358BC 60,0625 1 60,0625 8,50 0,0332BD 60,0625 1 60,0625 8,50 0,0332CD 5,0625 1 5,0625 0,72 0,4358Total error 35,3125 5 7,0625--------------------------------------------------------------------------------Total (corr.) 10950,4 15Tab.3 ANOVARovnice pro konstrukci grafu závislosti Y na těchto faktorechY = 399,19 + 21,56A + 9,06B – 5,19C + 8,44AB -5,31ACSestrojíme graf nalezení funkce.Pro konstrukci grafu mohou být jen dvě proměnné. Proto volíme v souladu s požadavkem Cna dolní úrovni (–1). Pro C = -1 má rovnice a graf tvar :404,38+26,87*x+9,06*y+8,44*x*yFunction450430410390370-1 -0,6 -0,2 0,2 0,6 1X-1 -0,6 -0,2 0,20,61YObr.3 Závislost Y na dvou faktorechVrstevnicový graf pro určení optimální technologické oblasti vznikne, provedou-li se řezynalezení plochy souřadnou rovinou (xOy).93


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮ404,38+26,87*x+9,06*y+8,44*x*yY10,60,2-0,2-0,6-1-1 -0,6 -0,2 0,2 0,6 1XFunction370,0378,0386,0394,0402,0410,0418,0426,0434,0442,0450,0Obr.4 Vrstevnicový graf k obr.3První a poslední barva vrstevnice (stupnice vpravo) není v grafu.Pro požadované výstupy Y mezi 390 a 410 jsou vrstevnice zelená a červená uprostředobrázku.2. VariabilitaDále zopakujeme uvedený postup pro ukazatel variability ln (s 2 ).Určíme faktory významné pro variabilitu.Rovnice modelující závislost s 2 (Y) na faktorech se nalezne stejně jako pro výstup Y; protoževýsledné rozptyly v jednotlivých pokusech se řádově liší, je vhodné použít logaritmus s 2 (Y)k dosažení větší homogenity výsledků; závisle proměnnou tedy bude ln s 2 (Y).Vlivné faktory je možné stanovit pomocí normálního pravděpodobnostního grafu neboANOVA.Normal Probability Plot for lnSpercentage99,99995805020510,1-2,1 -1,1 -0,1 0,9 1,9Standardized effectsObr.5 Určení vlivných faktorů pro ln s 2 (Y)94


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮAnalysis of Variance for lns2--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------A:Factor_A 2,70109 1 2,70109 2,31 0,1891B:Factor_B 2,58406 1 2,58406 2,21 0,1973C:Factor_C 0,0933303 1 0,0933303 0,08 0,7889D:Factor_D 0,646416 1 0,646416 0,55 0,4907AB 1,14811 1 1,14811 0,98 0,3673AC 0,987042 1 0,987042 0,84 0,4004AD 2,29826 1 2,29826 1,96 0,2199BC 0,59985 1 0,59985 0,51 0,5060BD 5,04003 1 5,04003 4,31 0,0926CD 1,27238 1 1,27238 1,09 0,3447Total error 5,84843 5 1,16969--------------------------------------------------------------------------------Total (corr.) 23,219 15Tab.4 ANOVA pro faktory ovlivňující ln s 2 (Y)Z normálního pravděpodobnostního grafu a také ANOVA je vidět, že žáden z faktorůneovlivňuje ln s 2 (Y) významně. Největší vliv dle grafu i ANOVA má A (vpravo nahoře) aBD (vlevo dole) v grafu.Těmto faktorům také odpovídají nejnižší hodnoty p-val v tab.4.Sestrojíme model pro A, B, D a BD a graf plochy a vrstevnic, ve kterém bude C na dolníúrovni (-1), (neboť se žádá malá koncentrace) a D na horní úrovni (+1).Rovnice modelu jelns 2 = 1,08 + 0,41.A – 0,40.B + 0,20.D – 0,56.BDodtuds 2 = exp(1,08 + 0,41.A – 0,40.B + 0,20.D – 0,56B.D )Pro D = +1 (a označení proměnných A = x, B = y pro Statgraphics) má rovnice, ke kteréhledáme graf, tvar2ln s = 1,28 + 0,41*x-0,96*yexp(1,28+0,41*x-0,96*y)Function15129630-1 -0,6 -0,2 0,2 0,6 1X-1 -0,6 -0,20,20,61 YObr.6 Graf závislosti s 2 (Y) na faktorech A a B95


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮPříslušný vrstevnicový graf budeexp(1,28+0,41*x-0,96*y)Y10,60,2-0,2-0,6-1-1 -0,6 -0,2 0,2 0,6 1XFunction0,01,53,04,56,07,59,010,512,013,515,0Obr.7 Vrstevnicový graf k obr.6Variabilita pod požadovanou hodnotu 2,0 je v oblasti nad horní fialovou vrstevnicí.7.2 Zařazení šumů do plánu experimentuV příkladě 1 byly počítány takové úrovně významných faktorů, při kterých je co nejstabilnějšíY. Neuvažovaly se však vlivy, působící nezávisle na řídícím pracovníkovi, tzv. šumy.Další snižování variability ukazatele kvality Y je možné zařazením šumů do plánuexperimentu. Potom se navrhnou takové úrovně kontrolovatelných vstupních parametrů(ovlivňujících Y), při kterých je výrobek resp. proces minimálně citlivý (robustní) nanekontrolovatelné vstupy (šum, nois).Šumy jsou sice nekontrolovatelné vlivy, působící negativně na kvalitu sledovaného ukazateleY, lze je však minimalizovat prostřednictvím plánování experimentů vhodným navrhovánímkontrolovatelných vstupů.Jsou dvě základní možnosti zařazení šumů do plánu:1) křížovým uspořádáním plánů pro faktory a šumy (crossed array) – příklad 2,2) zařazení do plánu jako ostatní faktory – příklad 3.Křížové uspořádání je uvedeno v obecné podobě v tabulce 5.Faktory jsou značeny x 1 , x 2 a šumy z 1 , z 2 .z 2 - - + + Y sx 1 x 2 z 1 - + - +- -+ -- ++ +Tab.5 Křížové uspořádání faktorů a šumů96


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮFaktory x 1 , x 2 se při křížovém uspořádání pro každou dvojici (x 1 , x 2 ) vystřídají se všemivariantami šumů (z 1 , z 2 ).V takovém plánu se každý bod (x 1 , x 2 ) vyskytuje vícekrát i bez opakování pokusů a je protomožné počítat průměr a rozptyl z Yi. Dále se nalezne model závislosti Y a s 2 na významnýchfaktorech, jejich grafy a nakonec vrstevnicové grafy.V příkladě 2 je robustnost řešena pomocí křížového uspořádání faktorů a šumů.Příklad 2 (návrh robustního výrobku, [2], upraveno)Při výrobě změkčovače prádla, který se používá při praní, je posuzována jeho kvalita podlestupně viskozity (Y). Ta podle vyjádření odborníků v daném provozu závisí na řadě faktorů:a) typ vstupní suroviny (A),b) množství ustalovač (B),c) pH (C),d) typ přísady (D),e) množství přísady (E).Vedle těchto kontrolovatelných faktorů je viskozita vyráběného změkčovače prádlaovlivňována také faktory, které nemůže výrobce ovlivnit, neboť závisí na uživateli (šumy).Zde je to napříkladf) doba vyvětrávání změkčovače (M),g) typ vody na praní (N),h) teplota vody při praní (O).Změkčovač má být vyroben tak, aby1. Měl co nejlepší užitné vlastnosti.Těch bude dosaženo při minimální viskozitě.2. Tuto vlastnost zachoval pokud možno u každého uživatele, tedy nezávisle na šumech.Změkčovač má tedy být robustní výrobek.Faktor - +A Vstupní surovina M1 M2B Množství ustalovače málo mnohoC pH 2.5 3.5D Typ přísady S1 S2E Množství přísady málo mnohoTab.6 Úroveň kontrolovatelných faktorů.Šum - +M Doba vyvětrávání pod 10 dnů nad 10 dnůN Typ vody měkká tvrdáO Teplota vody studená vlažnáTab.7 Úroveň šumů97


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮPlán experimentu s uvážením šumůM - + - +N - - + +A B C D= E= O= + - - +AB BC MN- - - + + 3200 4500 175 1560+ - - - + 37,5 42,5 300 242,5- + - - - 1600 475 137,5 60+ + - + - 1900 2200 302,5 3660- - + + - 125 112,5 965 1900+ - + - - 250 325 325 1920- + + - + 50 112,5 445 2050+ + + + + 175 97,5 492,5 340Y1 Y2 Y3 Y4Tab.8 Plán experimentu pro faktory a šumyV tabulce 4 jsou dva částečné plány: jeden pro ovlivnitelné faktory a druhý pro šumy.V následující tabulce 5 je z hodnot Y 1 , ... ,Y 4 vypočítán průměr a ukazatel variability log(s)(logaritmus směrodatné odchylky je výhodný proto, že zmenšuje rozpětí, ve kterém se často spohybuje):A B C D E Y log(s)- - - + + 2358,7 3,28+ - - - + 155,6 2,13- + - - - 568,1 2,85+ + - + - 2015,6 3,14- - + + - 775,6 2,92+ - + - - 705,0 2,90- + + - + 664,4 2,97+ + + + + 276,3 2,25Tab.9 Průměr a variabilita kontrolovatelných faktorůDále je vypočítán efekt faktorů a to jak vzhledem k průměrné viskozitě Y tak vzhledemk ukazateli variability log (s).FaktorEfektYlog(s)A+BD -303,6 -0,40B+AD+CE -117,7 -0,01C+BE -669,2 -0,09D+AB 833,3 0,18E+BC -152,3 -0,30AC+DE 74,2 0,03AE+CD -992,0 -0,53Tab.10 Efekty faktorůDefiniční rovnice zde jsou: I = ABD = BCE = ACDE. Odtud se získají zaměnitelné faktory.Následuje grafické určení nejvýznamnějších faktorů a nalezení jejich optimální úrovněvzhledem k Y a log (s). To je asi nejpodstatnější rozdíl oproti dosud uvedeným částečným98


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮfaktorovým plánům, neboť optimalizace faktorů vzhledem k ukazateli variability log(s) řešíotázku: při jakých úrovních hlavních parametrů je minimální variabilita Y, jinými slovy, zajakých podmínek je největší stabilita ukazatele Y vůči šumům.PiD+ABC+BEAE+CDefektObr.8 Určení vlivných faktorů pro YZ grafického hodnocení efektu faktorů vycházejí jako významné C a D. Je tedy pro ukazatelkvality (viskozitu Y) rozhodující pH (faktor C) a typ přísady (D). Také jejich interakce sejeví jako významná a bude proto sestrojen graf, vyjadřující vliv C na Y v závislosti na D(obr.10).i 1 2 3 4 5 6 7efekt -992 -669 -303 -152 -117 74 833faktor AE+CD C+BE A+BD E+BC B+AD+CE AC+DE D+ABPi 7,14 21,42 35,71 50 64,28 78,57 92,85PiTab.11 Údaje pro konstrukci grafu na obr.8E+BCA+BDAE+CDObr.9 Určení vlivných faktorů pro log (s)99


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮZ grafu v obr. 9 vychází jako faktory, významně ovlivňující variabilitu vstupní surovina (A)a množství přísady (E) a také jejich interakce AE, která bude vyhodnocena v grafu,vyjadřujícím vliv vstupní suroviny A na viskozitu Y v závislosti na množství přísady E(obr.11).i 1 2 3 4 5 6 7efekt -0,53 -0,40 -0,30 -0,09 -0,01 0,03 0,18faktor AE+CD A+BD E+BC C+BE B+AD+CE AC+DE D+ABPi 7,14 21,42 35,71 50 64,28 78,57 92,85Tab.12 Údaje pro konstrukci grafu na obr. 9YD+D-CObr.10 Vliv faktoru C na Y v závislosti na DZ obrázku 10 je zřejmé, že minimální průměrná viskozita Y bude dosažena při pH = 2,5 apřísady – D (dolní úroveň).Je pravda, že při právě opačných podmínkách, tj. pH = 3,5 a přísadě+ D není viskozita o mnoho větší. Jestliže by však během výrobního procesu došlo ke změněPh z 3,5 na 2,5 (například v důsledku technologické nekázně), pak dojde k obrovskémunárustu Y . Naopak při režimu 2,5 a -D se Y nezmění tak výrazně, bude-li místo pH = 2,5 znějakého důvodu náhle pH = 3,5.100


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮlog (s)+E-EM 1 M 2AObr.11 Vliv faktoru A na log(s) v závislosti na EZ obrázku 11 je vidět, že minimální log(s) (a tudíž maximální stability vzhledem k šumům) sedosáhne při těchto úrovních ovlivnitelných faktorů: vstupní surovina M2 a velkém množstvípřísad (E+).Celkově se tedy doporučuje tento technologický režim při výrobě změkčovače prádla:pH = 2,5 (C-)typ přísady S1 (D-)vstupní surovina M2 (A+)velké množství přísad (E+)Další možností práce se šumy je jejich zařazení do plánu jako faktory.Příklad 3 ([3], upraveno)Při hledání oblasti, která vyhovuje všem požadavkům technologů, se sledujea) optimální hodnota výstupu Y,b) minimální variabilita výstupu (robustní proces),Je potřeba najít model pro variabilitu v závislosti na faktorechvar (x ,z). To lze provést například tak, že se nalezne rovnice y(x,z) a z ní se vypočítávar[y(x,z)].Úplný plán se zařazeným šumem je v tab.13.101


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮšumfaktorypokus Z1 X1 X2 X3 Y1 - - - - 452 + - - - 713 - + - - 484 + + - - 655 - - + - 686 + - + - 607 - + + - 808 + + + - 659 - - - + 4310 + - - + 10011 - + - + 4512 + + - + 10413 - - + + 7514 + - + + 8615 - + + + 7016 + + + + 96Tab.13 Úplný plán pro faktory a šumyKoeficienty v neúplném kvadratickém modelu vypočítáme jako polovinu efektů⎛ 21,65 ⎞ ⎛ 9,875 ⎞y(x,z1)= 70,06 + ⎜ ⎟z1+ ⎜ ⎟x⎝ 2 ⎠ ⎝ 2 ⎠⎛18,125⎞ ⎛16,625⎞⎜ ⎟x2z1+ ⎜ ⎟x3z1⎝ 2 ⎠ ⎝ 2 ⎠2⎛14,625⎞+ ⎜ ⎟x3−⎝ 2 ⎠y ( x,z+ x z1)= 70,06 + 10,81z1+ 4,94x2+ 7,31x3− 9,06x2z18, 3131Protože E(z 1 ) = 0, je střední hodnota y x,z )(1[ y( x, z1 )] = β + β2x2+ β3x3= 70,06 + 4,94x27, 31x3Eo+Function8582797673700 0,2 0,4 0,6 0,8 1X0 0,20,40,60,81 YObr.12 Závislost y(x,z) na X a Y (x 2 a x 3 )102


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮModel variance y(x,z 1 ) je[ y ( x,z)] = var[ 70,06 + 4,94x2 + 7,31x3+ (10,81−9,06x2+ 8,31x) z]22[ y(x,z )] = σz(10,81−9,06x+ 8,31xvar3vara σ2 = 1z1 23)Model variance y(x,z 1 ) získáme výpočtemvarvar[ y ( x,z1 )] = var[ 70,06 + 4,94x2+ 7,31x3+ (10,81−9,06x2+ 8,31x3)z1]22[ y(x,z )] = σz(10,81−9,06x+ 8,31xa σ 2 = 1.1 23)Při konstrukci grafu se Statgraphics byly opět označeny proměnné x 2 a x 3 jako X a Y.Graf je na obrázku 13.zFunction40030020010000 0,2 0,4 0,6 0,8 1X0 0,20,40,60,81 YObr.13 Závislost variabilit var y(x,z 1 ) na x 2 a x 3V příkladě 3 byl zařazen jeden šum. Pro dva a více šumů může být kvadratický model,doplněný o šumy, vyjádřen v rozepsaném tvaru, nebo maticově. Dostaneme pak obecnějšípodobu kvadratického modelu.Kvadratický model s proměnnými x 1 ,x 2 , doplněný o šumy z 1 , z 2 , má rovniciy(x,z)= β + ( x β + x β ) + ( β x x+ ( γ zVyjádření v maticovém tvaru11o+ γ z ) + ( δ x z22111112121221211212+ β x1211 12+ β x ) +22222 2+ δ x z + δ x z + σ x z )22(1)ve kterém jeT T T Ty( x,z)= β0+ x β + x Bx + z γ + x Δ.z + ε ,(2)- absolutní člen β o- lineární členy x : T β⎛ β ⎞⎜x = ( ) 1x , ⎜ ⎟ 1x2⎝ β2 ⎠103


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮ- smíšené a ryze kvadratické členy x⎛ βx T Bx =1 2⎝ β12/ 2⎛ γ1⎞- lineární členy pro šumy z : z T γ = ( z1,z2) ⎜ ⎟⎝γ2 ⎠- dvoufaktorové interakce faktorů - šumů:β / 2⎞⎛xβ22⎠⎝x11 12 1( x , x ) ⎜⎟⎜⎟2⎞⎠x T. ⎛ ⎞⎛Δ . = , δ δ zz1 2⎝δ21δ22⎠⎝z11 12 1( x x ) ⎜ ⎟⎜⎟2⎞⎠=Předpokládá se, že E(z) = 0 a var(z) σ 2 I:Výpočet variance y(x,z) (rovnice 2) podle z:var11x1z1+ δ21x2z1+ δ12x1z2δ22x2z2= δ +T TT TT T[ y(x,z)] = 0 + var ( z γ + x Δ z)= var ( γ z + x Δ z)= var ( γ + x Δ z =z zzz)T T 2 T T T T T 2 T T2= ( γ + x Δ)σz( γ + x Δ)= ( γ + x Δ)σz( γ + Δ x)= l ( x)l(x)σzkdevarT[ y(x,z] l ( x).l(x)z=Tl( x)= ( γ + Δ x),(3)(4)l(x) je sloupcový vektor parciálních derivací y(x, z) podle vektoruz = (z 1 , z 2 ):⎛ δy⎞⎜ ⎟⎜ δz⎟ ⎛ l ⎞1 1l(x)= =⎜⎟⎜ δy⎟ ⎝l2⎠⎜ ⎟⎝ δz2⎠Ověříme rovnost (3).Vypočítáme-li l(x) jako derivaci (1) podle z, mámeδyδz1= γ + δ x + δ x1111122δyδz2= γ + δ x + δ x2121222takže⎛ γ1+ δ11x1+ δ12xl(x)= ⎜⎝γ2+ δ12x1+ δ22x22⎞⎟⎠104


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮRozepíšeme-li (4), dostáváme stejné l(x):⎛γ1⎞ ⎛δT11l(x)= ( γ + Δ x)= ⎜ ⎟ + ⎜⎝γ2 ⎠ ⎝δ12Tδ12⎞ ⎛ x1⎞ ⎛ γ1+ δ11x1+ δ12x2⎞⎟ ⎜ ⎟ = ⎜⎟δ22 ⎠ ⎝ x2⎠ ⎝γ2+ δ12x1+ δ22x2⎠z T = (z 1 ,z 2 ); (platí: z T γ = γ T z ; σ 2 = 1).zTento výsledek naznačuje další možnost výpočtu var y z (x,z): pomocí funkcí l(x).Příklad 4 ([2], upraveno)Předpokládá se, že y je ovlivňováno dvěma regulovatelnými faktory x 1 ,x 2 a třemi šumyz 1 ,z 2 ,z 3 , které jsou zařazeny do plánu 2 5-1 jako faktory.Úplný kvadratický model vychází ve tvaruy(x,z)= 30,37 − 2,92x2,73z12,01xz2− 2,33z12−1,43xz221+ 2,33z3− 4,13x+ 1,56xz232− 0,27xz1+ 2,60x121+ 0,89xz+ 2,18x1222+ 2,87xx+ 2,58xz13+12+Model střední hodnoty y(x,z) je22[ y( x,z)] = 30,37 − 2,92x1 − 4,13x2+ 2,60x1+ 2,18x22, 87x1x2E +Model variance y(x,z) jevarT2 2 2[ y(x,z)] = l ( x).l(x)= [ l , l , l ] l = l + l + l1 2 3.⎡l1⎤⎢ ⎥⎢2⎥⎢⎣l ⎥3⎦123δyδz1= 2,73− 0,27x+ 2,01x= l121δyδz2= −2,33+ 0,89x−1,43x= l122δyδz3= 2,33+ 2,58x+ 1,56x= l123l2221= ,45 −1,46x1+ 10,98x2+ 0,073x1+ 4,04x2−1,08l7 x x2222= ,42 − 4,14x1+ 6,66x2+ 0,79x1+ 2,04x2− 2, 545 x x1122105


ZPŮSOBY NAVRHOVÁNÍ ROBUSNÍCH VÝROBKŮl 5 + x x2223= ,42 + 12,02x1+ 7,26x2+ 6,56x1+ 2,43x28, 0412varT22[ y(x,z)] = l(x)l(x)= 18,29 + 6,42x1 + 24,9x2+ 7,42x1+ 5,51x2+ 4, 42x1x2Shrnutí kapitoly 7V této kapitole byly uvedeny dva zásadní způsoby navrhování výrobků, odolných vůči tzv.šumům, tedy robustních výrobků.Otázky ke kapitole 71. Uveďte dvě vlastnosti, které musí mít vstupní parametry procesu2. Uveďte dvě metody k určování významnosti faktorů3. Co nahrazuje opakování pokusů4. Jak se vyrovnávají řádové rozdíly v datech5. Jak se nalezne vrstevnicový graf6. K čemu slouží vrstevnicový graf7. Ke kterým modelům se hledá vrstevnicový graf8. Co jsou šumy9. Co je to robustní výrobek10. Uveďte dvě metody zařazení šumů do plánu experimentu11. Jak lze získat var[y(x,z)] bez opakování pokusů12. Napište kvadratický model doplněný o šumy v maticovém tvaru13. Rozepište matice v otázce 12 (pro dva faktory a dva šumy)14. Napište vzorec pro výpočet var[y(x,z)] pomocí parciálních derivací y(x, z)106


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮ8. DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮČas ke studiu: 6 hodinCíl: Ukázat způsob nalezení absolutně nejlepšího nastavení vstupních parametrůna principu dynamického plánování experimentůVýkladOriginální název této metody plánování experimentů je Steepest Ascent (SA)(metoda nejstrmějšího výstupu).Při plánování experimentů tak, jak bylo dosud popsáno, se sestrojil plán experimentuurčitého typu, vypočítal vliv jednotlivých faktorů a nalezl model. Ten umožní naléztoptimální hodnoty vlivných faktorů. Jedná se však pouze o lokální optimum. Pro nalezeníabsolutního optima faktorů je potřeba pokračovat v konstrukci dalších plánů a to na ploše,jejíž rovnice je vyjádřena nalezeným lineárním modelem.Hlavní etapy metody dynamického plánování jsou:1. Sestavit první plán pro lineární model, najít první rovnici lineárního modelu a z níurčit směr posuvu prvého plánu.2. V daném směru určit body „průzkumných“ pokusů a nalezení středu druhého plánu.3. Sestavení druhého plánu pro lineární model, nalezení rovnice druhého lineárníhomodelu, určení nového směru posuvu plánu, provedení průzkumných pokusů v novémsměru, atd. Postup se opakuje, dokud přináší zlepšení výstupu Y.4. Poslední plán se doplní o hvězdicové body pro nalezení úplného kvadratickéhomodelu.5. Vypočítá se optimální nastavení faktorů.Uvedený postup ukážeme v příkladě 1.Příklad 1 (data podle [1], upraveno)Sledovaný výstup Y závisí na dvou faktorech: x 1 a x 2 . Úplný plán, doplněný třemi centrálnímibody, je v tab.1.Provozní hodnotyKódované hodnotyx 1 x 2 ξ 1 ξ 2 Y1 70 127,5 -1 -1 54,32 80 127,5 1 -1 60,33 70 132,5 -1 1 64,64 80 132,5 1 1 68,05 75 130,0 0 0 60,36 75 130,0 0 0 64,37 75 130,0 0 0 62,3Tab.1 První plán metody SA107


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮNajděte lineární model, směr postupu a metodou dynamického plánování nalezněte nový středpro další plán. Cílem je maximalizace výstupu Y.Řešení:Pro potřeby kódování a dekódování hodnot faktorů je dobrou pomůckou grafické znázornění:na číselné ose jsou dolní a horní hranice a střední hodnota; nad osou jsou reálné hodnoty, podosou v kódovém označení -1, +1 a 0:70 75 80---o--------------o--------------o--- x 1-1 0 +1127,5 130 132,5---o--------------o--------------o--- x 2-1 0 +1Kódovací a dekódovací rovnicepro x 1x1− 75ξ1 = ⇒ x1= 5ξ1+ 755a pro x 2x2−130ξ2 = ⇒ x2= 2,5ξ2+ 130 .2,5Výpočet efektu faktorů:1ef ( x 1) = ( −54,3+ 60,3 − 64,6 + 68) = 4,721ef ( x 2) = ( −54,3− 60,3 + 64,6 + 68) = 9,02Průměrná hodnoty Y v prvém plánu je (počítá se i z Y v centrálních bodech)1Y1= (54,3 + 60,3 + 64,6 + 68 + 60,3 + 64,3 + 62,3) = 62,017Odhad rozptylu v centrálních bodech v prvém plánu:22[( 60,3 − 62,3) + ( 62,3 − 62,3) + ( 64,3 − 62,3)] 42 1 21=s =3 −1108


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮLineární model má rovnici4,7 9Y = 62,01+x1 + x2= 62,01+2,35x1+ 4, 5x2 22Směr pohybu plánu je určen vektorem, jehož souřadnice jsou koeficienty faktorů x 1 a x 2v lineárním modelu: (2,35; 4,5).Souřadnice upravíme pro zjednodušení dalších výpočtů:2,35 4,5( = 1; = 1,91)2,35 2,35Násobky těchto souřadnic jsou kódované hodnoty faktorů. V těchto bodech budou provedenyprůzkumné pokusy.Násobky základního směrového vektoru, tj. souřadnice pro průzkumné pokusy s výsledkemYi:2,35 4,5( 1; = 1,91)2,35 2,35( 2;2.1,91 = 3,82)( 3;3.1,91 = 5,73) … Y 3 = 86,8( 4;4.1,91 = 7,64)( 5;5.1,91 = 9,55) … Y 5 = 58,2= … Y 1 = 73,3Protože cílem je maximalizace Y, je novým středem bod s kódovanými hodnotamisouřadnic ( 3;5,73).Nové centrum v reálných hodnotách tedy je:Pro x 1 : 5.3 + 75 = 90,Pro x 2 : 2,5.5,73 + 130 = 144,3; zaokrouhlíme na x 2 = 145.Kolem nového centra stanovíme dolní a horní hranice faktorů širší než u prvého plánu. Získáse tak větší prostor k analýze.80 90 100---o--------------o--------------o--- x 1-1 0 +1Kódovací a dekódovací rovnicepro x 1140 145 150---o--------------o--------------o--- x 2-1 0 +1109


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮx1− 90ξ1 = ⇒ x1= 10ξ1+ 9010a pro x 2x2−145ξ2 = ⇒ x2= 5ξ2+ 145 .5Ve druhém plánu jsou dva centrální bodyProvozní hodnotyKódované hodnotyx 1 x 2 ξ 1 ξ 2 Y1 80 140 -1 -1 78,82 100 140 1 -1 84,53 80 150 -1 1 91,24 100 150 1 1 77,45 90 145 0 0 89,76 90 145 0 0 86,8Tab.2 Druhý plán metody SAPrůměrná hodnota v centrálních bodech je Y = 88, 25Odhad rozptylu v centrálních bodech ve druhém plánu:s=2 −1C2[( 89,7 − 88,25) + ( 86,8 − 88,25)] 4, 212 1 22=2Spojením odhadů v centrálních bodech upřesníme odhad σe:Výpočet efektů ve druhém plánu:2 2.4 + 1.4,21σe≈= 4,0731ef ( x 1) = ( −78,8+ 84,5 − 91,2 + 77,4) = −4,0521ef ( x 2) = ( −78,8− 84,5 + 91,2 + 77,4) = 2,652Průměrná hodnota Y ve druhém plánu je Y = 84, 73Model ve druhém plánu má rovniciY = 84,73-2,025x 1 + 1,325x 2 .Stejným způsobem bychom postupovali ve vytyčování nového směru dále. Postup se opakujetak dlouho, dokud nový směr přináší zlepšení výstupu Y, resp. pokud se nedostaneme zahranice možností technologického nastavení faktorů.110


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮPostup považujme v tomto případě za ukončený.Druhý plán nyní doplníme o hvězdicové body (a dva centrální body k dalšímu zlepšeníodhadu σ ) tak, aby bylo možné hledat úplný kvadratický model:2eProvozní hodnoty Kódované hodnoty Výstupx 1 x 2 ξ 1 ξ 2 Y1 80 140 -1 -1 78,82 100 140 1 -1 84,53 80 150 -1 1 91,24 100 150 1 1 77,45 90 145 0 0 89,76 90 145 0 0 86,87 76* 145 -1,41 0 83,38 104* 145 1,41 0 81,29 90 138* 0 -1,41 81,210 90 152* 0 1,41 79,511 90 145 0 0 87,012 90 145 0 0 86,0*) Výpočet reálných hodnot:Tab.3 Třetí plán metody SAPro x 1ξ1= −1,41:10. x1+ 90 = 10( −1,41)+ 90 = 75,9ξ = 1,41: 10.1,41+90 104,11=Pro x 2ξ2= −1,41:5. x2+ 145 = 5( −1,41)+ 145 = 137,95ξ = 1,41: 5.1,41+145 152,052=Průměrná hodnoty Y v centrálních bodech ve třetím plánuYC=1(876+ 86) = 86,52Odhad rozptylu v centrálních bodech σeze třetího plánu:s=2 −12[( 87 − 86,5) + ( 86 − 86,5)] 0, 52 1 23=Spojením odhadůs , s upřesníme odhad2 21s2,232σe:2 2.4 + 1.4,21+1.0,5σe≈= 3,184Úplný kvadratický model má rovnici111


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮY= 87,36−1,38xx x221+ 0,36x2− 2,14x1− 3,10x2− 4, 8712Koeficient determinace r 2 = 0,882577.Graf modelu je na obr. 1.Z důvodu konstrukce grafu se Statgraphics jsou použity proměnné x,y místo x 1 a x 2 .Function888684828078760 0,2 0,4 0,6 0,8 1 0 0,20,40,60,81XObr.1 Kvadratický model závislosti Y na x 1 a x 2YVypočítáme optimální hodnoty vstupů x 1 a x 2 .Z koeficientů kvadratického modelu sestavíme matice b, B a vypočítáme vektor optimálníchvstupů x s :⎡−1,38⎤⎡−2,14 − 2,44⎤−1 − ⎡− 3,78⎤b = ⎢ ⎥ , B =⎣ 0,36⎢⎥ , x =1 sB b =⎦ ⎣−2,44 − 3,10⎢ ⎥ ⎦ 2 ⎣ 3,04 ⎦V reálných hodnotách je x 1 = 10(-3,78) + 90 = 52,2 a x 2 = 5.3,04 + 145 = 160,2Pokud se neprovádí dynamické plánování, vychází optimální x 1 a x 2 z prvého plánu:X1 X2 Y- - 54,3+ - 60,3- + 64,6+ + 68,0Y- 59,45 57,3Y+ 64,15 66,3Při maximalizaci Y je tedy optimální volba pro horní úrovně x 1 a x 2 ; v reálných hodnotách jeto x 1 = 80 a x 2 = 132,5.Příklad 2 (data [2], upraveno)Sledovaný znak Y je ovlivněn dvěma faktory: x 1 a x 2 . Byl sestaven úplný plán se čtyřmicentrálními body. Má se najít model, určit směr postupu a nové centrum. Průzkumné pokusyjsou dvojnásobky a trojnásobky základního plánu (tab.4). Y se maximalizuje.112


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮŘešení:X 1 X 2 ξ 1 ξ 2 Y- - 1,2 275 775+ - 1,6 275 670- + 1,2 325 890+ + 1,6 325 7300 0 1,4 300 7450 0 1,4 300 7600 0 1,4 300 7800 0 1,4 300 720Tab.4 Plán experimentuModelr 2 = 0,89)Y = 758,75− 66,25x1 + 43, 75x2Směr postupu: (-66,25;43,75)Úprava směrového vektoru:⎛⎜⎝− 66,25= −1;66,2543,7566,25⎞= 0,66⎟⎠K základnímu směru vypočítáme dvojnásobky a trojnásobky, přepočítáme je na reálnéhodnoty. Pak je možné provést průzkumné pokusy a v bodě, kde je max.Y, je stanoveno novécentrum.Kódovací a dekódovací rovnicepro x 11−1,4ξ1= x0,2a pro x 22− 300ξ2= x .25Přepočet kódovaných hodnot na reálné:x1= 0,2ξ1+ 1,4a pro x 2x 2= 25ξ2+ 300 .Výsledky průzkumných pokusů jsou v tabulce č.5:113


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮFaktoryYKódované hodnoty (ξ 1 , ξ 2 ) Reálné hodnoty (x 1 ,x 2 )(-1;0,66) (1,2;318) 845(-2;1,32) (1,0;333) 950(-3;1,98) (0,8;349,5) 1040Tab.5 Průzkumné pokusyNové centrum v reálných hodnotách tedy je kolem bodu (0,8;350)Kolem nového centra stanovíme dolní a horní hranice faktorů:Pro x 1 :0,6 0,8 1,0---o--------------o--------------o--- x 1-1 0 +1Pro x 2 :325 350 375---o--------------o--------------o--- x 2-1 0 +1Pro další postup je sestaven nový plán se dvěma centrálními body:x 1 x 2 ξ 1 ξ 2 Y- - 0,6 325+ - 1,0 325- + 0,6 375+ + 1,0 3750 0 0,8 3500 0 0,8 350Tab.6 Druhý plán experimentu v novém centruPříklad 3 (data [3], upraveno)Sleduje se pórovitost materiálu(Y) v závislosti na teplotě (T = x 1 ) a tlaku (P = x 2 ). Má senajít takové T a P, aby pórovitost byla minimální. Postup je rozdělen do několika kroků.21. Byl proveden úplný plán pro dva faktory 2 , doplněný dvěma centrálnímibody T o , P o (jsou to průměrné hodnoty z x max a x min ), které představují dosudo2používané parametry T = 650 C a P = 975 kg / cm .Intervaly pro faktory: T ∈ 640, 660 , P ∈ 950, 1000 stanovil technolog.Provozní hodnotyKódované hodnotyT P ξ 1 ξ 2 Y1 640 950 -1 -1 6,092 660 950 1 -1 5,533 640 1000 -1 1 6,784 660 1000 1 1 6,165 650 975 0 0 5,936 650 975 0 0 6,12Tab.7 První plán experimentu114


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮCentrální body (T o ,P o ) umožní dálea) vypočítat rozptyl Y v pokusech ( s 2 ),b) testovat, zda je lineární modely = β o + β1x1+ β2x2vyhovující, nebo je potřeba (úplný) kvadratický model2 21x1+ β 2 x2+ β11x1+ β 22x212x1x2y = β o + β+ β2. Odhady koeficientů β o , β1,β 2 lineárního modelu se vypočítají z efektu faktorů:(b o je průměr z Yi, b 1 ,b 2 je polovina efektu – v hranaté závorce)Lineární model má rovnicib o = 1/4 [ 6.09 + 5.53 + 6.78 + 6.16] = 6.141 ⎡1⎤b 1 = ( 6.09 5.53 6.78 6.16) ≈ 0.292⎢ − + − +2⎥⎣⎦−1 ⎡1⎤b 2 = ( 6.09 5.53 6.78 6.16 = 0.332⎢ − − + +2⎥⎣⎦resp.Ŷ = 6.14 – 0.29x 1 + 0.33x 2Ŷ = 6.14 – 0.29T + 0.33P3. Test, zda lineární model je dostačující (test křivosti)Ukazatelem zakřivení plochy f(x 1 ,x 2 ) je rozdíl průměrůtestem.y − y , který může být vyhodnocenkcKompletní test rozdíluy − y bude:kca) H o : − y = 0yk c ,y k = průměrný efekt z pokusů v kvádru (6,14),y = průměrný efekt z pokusů v centru (6,025).cc) Testovací kriteriumn k = počet pokusů v kvádru (4),T=syk− ykc1 1 +n nc(1)115


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮn c = počet pokusů v centrálním bodě (2).Potřebné s se vypočítá pomocí s k a s c :s2K=14 −12222[(6.09− 6.14) + (5.53 − 6.1) + (6.78 − 6.14) + (6.16 − 6.14) ]s2 K= 0.2615s2C1=2 −122[(5.93−6.025) + (6.12 − 6.025) ]s2 C= 0.01805s23.0,2615 + 1.0,01805== 0,20063 + 1s = 0,45Dosazením do (1) dostáváme6,14 − 6,025T == 0,291 10,45 +4 2c) Kritická hodnotaK = t ( α ) = (0,05) = 4,303n + n −2t 4+2−2k cd) Protože T < 4,303 , je rozdíl yk− ycbezvýznamný a tedy lineární modelpostačující.(2)Použité hodnoty: n k = 22= 4, n c = 2, = 6, 144. Určení směru průzkumu plochy:ykcy = 1/2 (5.93 + 6.12) = 6.025.δY= −0.29,δY= 0.33δTδP(3)Směr maximálního růstu Y je určen vektorem (-0.29,0.33), takže směr maximálního poklesuY je obrácený, tj.(0.29, -0.33).Kroky pro realizaci dalších pokusů v určeném směru lze stanovit různě, například1. krok: (0.29/0.29 = 1, -0.33/ 0.29 = -1.14)2. krok je dvojnásobek prvého: (2, -2.28)3. krok: (3, -3.42)4. krok: (4, -4.56)5. krok: (5, -5.70)116


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮPřepočet kódovaných hodnot na reálné podle vztahůTTc =− 650 P − 975, Pc =1025dostáváme T = 650 + 10 Tc, P = 975 + 25 PcPro jednotlivé kroky vychází1) 650 +10.1 = 660, 975 + 25.(-1.14) = 946.5 ≈ 9502) 650 +10.2 = 670, 975 + 25.(-2.28) ≈ 9203) 650 + 10.3 = 680, 975 + 25.(-3.42) ≈ 8904) 690, 8605) 700, 830Jiná možnost stanovení kroků pro další provádění pokusů na zkoumané ploše:22vypočítá se délka vektoru (0.29,-0.33), která je 0,29 + 0,33 = 0, 44. Potom jednotkový vektorsměru postupu bude u = (0.29/0.44, -0.33/0.44) = (0.66, -0.75). Postupuje se v násobcích 2u,4u, 6u, … resp. u, 3u, 5u, …tohoto vektoru. Kódované hodnoty se nakonec dekódují.V našem případě mámeČís. pokusu Násobek u T(*) P(*) Výsl.pok.1 3u = (1.98,-2.25) 670 920 4.532 5u = (3.30,-3.75) 685 880 3.283 7u = (4.62,-5.25) 700 845 2.544 9u = (5.94,-6.75) 710 805 4.15(*) výsledky zaokrouhlovány na ± 5Y je minimální pro (T,P) = (700,845). To bude nové centrum pro plánování experimentu22 .5. Nový plán se třemi centrálními body:Provozní hodnotyKódované hodnotyT P ξ 1 ξ 2 Y1 690 820 -1 -1 2,202 710 820 1 -1 3,713 690 870 -1 1 2,864 710 870 1 1 3,495 700 845 0 0 2,536 700 845 0 0 2,307 700 845 0 0 2,54Tab.8 Plán s novým centremPro další plán experimentu nalezneme kvadratický model117


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮy = β2 2o + β1x1+ β2x2+ β11x1+ β22x2+ β x12 1x26. K výpočtu koeficientů β 11, β 22je nutné doplnit plán z bodu 5)na hvězdicový plán.Obr.2 Plán v kvádru (I) a hvězdicový plán (II)Pro dvě proměnné (T, P) má hvězdicový plán s centrálními body toto obecné schéma:-α 0α 00 -α0 α0 00 0……. …….0 0Tab.9 Obecné schéma hvězdicového plánuHodnota α a počet centrálních bodů n oe se vypočítáα =4 N c(4)kde N c = počet pokusů prvního experimentu (v kvádru resp. čtverci) bez centrálních bodů,kk− ptj. 2 resp. 2 . Další vzorec, který je možné použít, jeα =Nc(2k+ n oe )2( N c + n oc )k = počet faktorů,n oc = počet centrálních bodů kvádru (volí se),n oe = počet centrálních bodů hvězdicového plánu (počítá se).(5)118


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮSpolečným řešením obou vzorců se vypočítá alfa a n oe . V našem příkladě je=4 4 =2Hvězdicové body + centrální body má tvarα ,4(4 + n )α = oe= 2 ⇒ noe= 3 .2(4 + 3)Provozní hodnotyKódované hodnotyT P ξ 1 ξ 2 Y1 685 845 -1,41 0 2,872 715 845 1,41 0 4,123 700 810 0 -1,41 4,024 700 880 0 1,41 4,055 700 845 0 0 3,306 700 845 0 0 3,407 700 845 0 0 3,17Tab.10 Hvězdicový plán7. Z plánů v tab. 8 a 10 (jejich spojením) se vypočítají koeficienty úplného kvadratickéhomodelu:2 2Y = 2,8+ 0,48T+ 0,06P+ 0,13T+ 0,40P− 0,22T.P8. Určení extrémů modelu:a) Z parciálních derivací modelu podle T a PδYδTδY= 0,= 0 ⇒ T*,P *δPδYδTδYδT= 0 ,48 + 0,26T− 0,22P= 0= 0,048+ 0,26T− 0,22 PŘešením této soustavy dostáváme optimální kódované hodnoty faktorů T a P:T* = -2,49 a P* = -0,76.⎡T* ⎤ −1− −1⎡0,13 − 0,11⎤⎡0,48⎤⎡−2,49⎤b) Pomocí vzorce x = ⎢ ⎥ =1 sB b = ⎢⎥ ⎢ ⎥ = ⎢ ⎥⎣P* ⎦ 2 2 ⎣−0,11 0,40 ⎦ ⎣0,06⎦⎣−0,76 ⎦s−1119


DYNAMICKÉ PLÁNOVÁNÍ EXPERIMENTŮShrnutí kapitoly 8V této kapitole byl vysvětlen způsob nalezení nejlepšího možného nastavení významnýchvstupů procesu metodou Steepest Ascent, zde označenou jako dynamické plánování-nejednáse o překlad, ale jiné pojmenování, které naznačuje podstatu metody: plán experimentu jeposouván prostorem za účelem vyhledávání nejlepších podmínek nastavení faktorů,ovlivňujících proces. Dosud uváděné způsoby optimalizace vstupů byly lokálními optimy.Otázky ke kapitole 81. Uveďte hlavní kroky dynamického plánování experimentu2. Co je cílem dynamického plánování3. Znázorněte graficky a napište rovnici pro kódování pro x min = 70, x max = 80.4. Napište rovnici pro dekódování k úloze 35. Napište lineární model, je-li ef(x 1 ) = 4,7 a ef(x 2 ) = 9. Y = 62,01.6. Určete směr postupu k modelu v bodě 57. Určete další kroky postupu k úloze 68. Napište dva vzorce pro výpočet α (hvězdicový bod)9. Jak se určí směr posuvu plánu pomocí lineárního modelu a proč10. Kolikrát se opakuje posun plánu11. Jak se prověří potřeba kvadratického modelu120


KVALITATIVNÍ PROMĚNNÉ9. KVALITATIVNÍ PROMĚNNÉČas ke studiu: 3 hodinyCíl Ukázat způsob použití kvalitativních proměnných v plánech experimentu a vmodeluVýkladJsou-li v regresním modelu zařazeny proměnné, které nelze měřit, tedy kvalitativní proměnné(atributy), vznikají při sestavování plánu a nalezení modelu problémy.Obecně lze říci, že kvalitativní proměnné jsou modelovány pomocí spojitých kvantitativníchproměnných. V dalším budeme řešita) Jak se sestaví plán s kvalitativní proměnnoub) Jak se sestaví model s kvalitativní proměnnouc) Jak působí kvalitativní proměnná v modeluZpůsob modelování kvalitativní proměnné závisí na počtu těchto proměnných, na počtuúrovní a na typu modelu (lineární nebo kvadratický).9.1 Konstrukce plánů s kvalitativními proměnnýmiPříklad 1Mějme dvě kvantitativní proměnné x 1 , x 2 a jednu kvalitativní proměnnou z; všechnyproměnné mohou nabývat dvě úrovně.Uvažujme lineární model:2y = βo+ ∑ βixi+ γ . z ;Modelování kvalitativní proměnné z při sestavení matice X:z = 0, když je v plánu dolní úroveň a z = 1 pro horní úroveň.Konstrukce plánu:Sestaví se dva úplné plány pro x 1 ,x 2 a každý se doplní dolní resp. horní úrovní z:i=1x 1 x 2 z-1 -1 01 -1 0-1 1 01 1 0-1 -1 11 -1 1-1 1 11 1 1121


KVALITATIVNÍ PROMĚNNÉMatice X:X⎡1⎢⎢1⎢1⎢⎢1=⎢1⎢⎢1⎢1⎢⎢⎣1−11−11−11−11−1−111−1−1110⎤0⎥⎥0⎥⎥0⎥1⎥⎥1⎥1⎥⎥1⎥⎦Jinou možností modelování kvalitativní proměnné je pomocí kódování z = -1, když je v plánudolní úroveň a z = +1 pro horní úroveň.⎡ x⎢⎢1 −1⎢11⎢⎢1−1X = ⎢11⎢⎢1−1⎢11⎢⎢1−1⎢⎣11Žádný z uvedených způsobů není preferován.1x2z−1−111−1−111⎤−1⎥⎥−1⎥⎥−1⎥−1⎥⎥1 ⎥1 ⎥⎥1 ⎥1⎥⎦Příklad 2Mějme dvě kvantitativní proměnné x 1 ,x 2 a jednu kvalitativní z, která může nabývat tři úrovněA, B a C. Má se sestavit plán pro nalezení modelu, ve kterém jsou i všechny možné smíšenéčleny, tedy i členy, obsahující kvantitativní a kvalitativní proměnnéy = βo+ β β γ . δ δ x + β x x1x1+2x2+ z +1z.x1+2.z.21212V plánu mohou být kvalitativní proměnné:-1 -1 A-1 -1 B-1 -1 C-1 1 A-1 1 B-1 1 C1 -1 A1 -1 B1 -1 C1 1 A1 1 B1 1 C0 0 A0 0 B0 0 C122


KVALITATIVNÍ PROMĚNNÉV plánu jsou dále tři centrální body spolu s kvalitativní úrovníA, B a CMatice X nemůže obsahovat kvalitativní proměnné, neboť s ní budou prováděny potřebnématicové operace.Proto kvalitativní proměnnou z modelujeme pomocí dvou kvantitativních proměnných z 1 ,z 2definovaných takto:z 1 = 1 pro úroveň A, jinak 0z 2 = 1 pro úroveň B, jinak 0.Odtud plyne, že pro úroveň C je: z 1 = 0 (není A),z 2 = 0 (není B), takže při této volbě zbýváúroveň C. Přehledně v tabulce:z 1 z 2 Úroveň z1 0 A0 1 B0 0 CMatice X (a plán také) je sestavena tak, že úroveň (-,-) pro x 1 a x 2 je s každou úrovní z (A, B aC), podobně úroveň (-,+) s A, B a C atd.X⎡−1⎢⎢−1⎢−1⎢⎢−1⎢−1⎢⎢−1⎢ 1⎢= ⎢ 1⎢1⎢⎢ 1⎢⎢ 1⎢ 1⎢⎢ 0⎢ 0⎢⎢⎣0−1−1−1111−1−1−11110001001001001001000⎤1⎥⎥0⎥⎥0⎥1⎥⎥0⎥0⎥⎥1⎥0⎥⎥0⎥⎥1⎥0⎥⎥0⎥1⎥⎥0⎥⎦Schématicky můžeme zapsat matici X v tabulce i s označením sloupců a řádků:123


KVALITATIVNÍ PROMĚNNÉX1 X2 Z1 Z2-1 -1 1 0 A-1 -1 0 1 B-1 -1 0 0 C-1 1 1 0 A-1 1 0 1 B-1 1 0 0 C1 -1 1 0 A1 -1 0 1 B1 -1 0 0 C1 1 1 0 A1 1 0 1 B1 1 0 0 C0 0 1 0 A0 0 0 1 B0 0 0 0 CJinou možností jez 1 z 2 Úroveň z1 -1 A-1 1 B-1 -1 CMatice X v tabulkovém vyjádření:X1 X2 Z1 Z2-1 -1 1 -1 A-1 -1 -1 1 B-1 -1 -1 -1 C-1 1 1 -1 A-1 1 -1 1 B-1 1 -1 -1 C1 -1 1 -1 A1 -1 -1 1 B1 -1 -1 -1 C1 1 1 -1 A1 1 -1 1 B1 1 -1 -1 C0 0 1 -1 A0 0 -1 1 B0 0 -1 -1 CKromě standardního postupu při sestavování plánu se provádí generování s pomocí programů,které vytváří speciální zkrácené plány. Při generování takových plánu jsou různé možnosti,které však nejsou rovnocenné, např. pro dvě kvantitativní proměnné x 1 ,x 2 a jednu kvalitativníproměnnou z:124


KVALITATIVNÍ PROMĚNNÉa)z x 1 x 2 x 1 x 2 x 1 z x 2 z- - - + + +- + - - - +- - + - + -- + + - - -+ 0 0 0 0 0b)z x 1 x 2 x 1 x 2 x 1 z x 2 z- - - + + +- + - - - +- - + - + -+ + + + + +- 0 0 0 0 0Oba plány obsahují jako základ plán 2 2 pro x 1 a x 2 s jedním centrálním bodem a umožňujíodhad koeficientů u všech třech proměnných v lineárním modelu.Plány se však liší úrovněmi z, které odpovídají jednotlivým bodům plánu. To způsobí, žepokud bychom místo lineárního modelu použili neúplný kvadratický, se členy x 1 x 2 , x 1 z a x 2 z,2y = βo+ ∑βixi+ γ . z + β12x1x2+ δ1x1z+ δ2x2zi=1nebyly by plány a), b) rovnocenné:- oba plány umožní odhad b 12 členu x 1 x 2- plán b) umožní odhad d 1 členu x 1 z a d 2 členu x 2 z- plán a) neumožní odhad členů s interakcemi z.x 1 , z.x 2 proto, že v plánu jepřibližně x 2 z = (-1)x 2a x 1 z = (-1)x 1 (silná korelace těchto sloupců)Příklad 3Pro dvě kvantitativní proměnné x 1 ,x 2 a dvě kvalitativní proměnné v 1 , v 2 , každá se dvěmaúrovněmi, se použijí dvě pomocné kvantitativní proměnné z 1 , z 2 k modelování v 1 a v 2 v plánu:Úrovně v 1 a v 2 jsou modelovány takto:z 1 z 2 Úroveň v 1 ,v 21 0 (2,1)0 1 (1,2)0 0 (1,1)1 1 (2,2)Matice X pro lineární model (bez prvého sloupce rovněž plán experimentu) bude:125


KVALITATIVNÍ PROMĚNNÉX⎡⎢⎢1⎢1⎢⎢1= ⎢1⎢⎢1⎢1⎢⎢1⎢⎣1x1x2z1z−1111−1−1−11−11−1−111−11001010112 ⎤0⎥⎥0 ⎥⎥0 ⎥1 ⎥⎥0 ⎥1 ⎥⎥1 ⎥1⎥⎦V tomto plánu již není obvyklé schéma střídání znamének, plán je generován speciálnímprogramem automaticky. Zadávají se pouze vstupní parametry a požadavky na plán, např.max. počet pokusů a typ zvoleného modelu.Příklad 4Má se sestavit plán experimentu pro dvě kvalitativní proměnné z, w, které jsou na 3 úrovnícha jedna kvantitativní proměnná x se 2 úrovněmi. Počet pokusů bude 3 2 x 2 1Kódované hodnoty z 1 a z 2 modelují první kvalitativní proměnnou(z),kódované hodnoty w 1 a w 2 druhou proměnnou (w).Plán:z 1 z 2 z1 0 A0 1 B0 0 Cw 1 w 2 w1 0 A0 1 B0 0 CÚrovněx z 1 z 2 w 1 w 2z,w1,3 ± 1 1 0 0 01,2 ± 1 1 0 0 11,1 ± 1 1 0 1 02,3 ± 1 0 1 0 02,2 ± 1 0 1 0 12,1 ± 1 0 1 1 03,3 ± 1 0 0 0 03,2 ± 1 0 0 0 13,1 ± 1 0 0 1 0126


KVALITATIVNÍ PROMĚNNÉObecně pro jednu kvalitativní proměnnou s k úrovněmi se použije k-1 pomocnýchkvantitativních proměnných;k-tá úroveň je reprezentována k nulami (0,…,0).Např. kvalitativní proměnná se čtyřmi úrovněmi bude vyjádřena třemi kvantitativnímiproměnnými z i , i = 1,2,3:z 1 z 2 z 3 Úroveň z1 0 0 A0 1 0 B0 0 1 C0 0 0 DNalezení plánu pro kvadratický model s kvalitativními proměnnými je obtížnější než ulineárních.9.2 Jak působí kvalitativní proměnné v modelua) není-li kvalitativní proměnná v interakci s proměnnou kvantitativní, ovlivňuje pouzeabsolutní členb) je-li kvalitativní proměnná v interakci s proměnnou kvantitativní, ovlivňuje koeficientykvantitativních proměnnýchPříklad 5 (jak působí kvalitativní proměnná)Mějme 2 kvantitativní proměnné a jednu kvalitativní.a) Model bez interakcí x, z:ˆ1 1 2 2+y = bo + b x + b x c.z .Dosazením za z např. z = -1 bude mít rovnice tvaryˆ= ( bo − c)+ b x + b x ,1122takže dosazením za z se změnil jen absolutní člen.b) Model s interakcemi x, z:ˆ = b + b x + b x + d x z + d x z .yo 1 1 2 2 1 1 2 2Dosazením za z = -1 mámeyˆ= bo + ( b− x ,1− d1)x1+ ( b2d2)2takže se změnily koeficienty u kvantitativních proměnných.127


KVALITATIVNÍ PROMĚNNÉShrnutí kapitoly 9V této kapitole jsme ukázali, jak pracovat s kvalitativními proměnnými při sestavování plánůexperimentu a při jejich zařazení do regresního modelu. Byly probrány různé počtykvantitativních a kvalitativních proměnných s různým počtem úrovní, které jsou zařazeny domodelu.Otázky ke kapitole 91. Co jsou kvalitativní proměnné2. Napište plán pro dvě kvantitativní a jednu kvalitativní proměnnou, všechny na dvouúrovních, model je lineární.3. Napište matici X pro plán z bodu 24. Napište model pro dvě kvantitativní proměnné (x 1 ,x 2 )a jednu kvalitativní (z), vekterém jsou i smíšené členy kvalitativní proměnné s kvantitativními5. Jak působí kvalitativní proměnné v modelu128


ANALÝZA ROZPTYLU10. ANALÝZA ROZPTYLU (ANOVA)Čas ke studiu: 6 hodinCíla) ukázat analýzu rozptylu jako zobecnění dvouvýběrového t-testub) objasnit možnosti využití ANOVA k hodnocení závislosti výstupu narůzném počtu vstupních faktorůVýklad10.1 Jednoduché tříděníTest významnosti rozdílu mezi dvěma výběrovými průměry (dvouvýběrový t-test) mánulovou hypotézu Ho : μ1= μ2. Pokud se prověřuje rovnost více než dvou středních hodnot,není správné použít opakovaně dvouvýběrový t-test, neboť dochází k výraznému narůstáníchyby prvního druhu. Použije se analýza rozptylu (Analysis of Variance), která jeoznačována zkratkou ANOVA.ANOVA je test s těmito kroky:2Předpokládáme, že k dispozici je k nezávislých výběrů z rozdělení N ( , σ ) , i = 1,2,…,k.1) H0: μ1= μ2= ... = μkH 1 : Alespoň jedna rovnost neplatí.2) Testovací kriteriumSF =STR/( k −1)/( n − k)μ ikde S T a S R jsou meziskupinový resp. vnitroskupinový součet čtverců odchylek. Vzorec projejich výpočet je uveden dále.3) Kritická hodnot F ( )k − 1,n−kα4) Je-li T > ( ) , zamítá se Ho.F k −1,n−kα2Jak je patrné ze zadání (výběry z rozdělení N ( μ i, σ ) ), podmínkou použití ANOVA jenormalita dat a rovnost rozptylů ve vzorcích.129


ANALÝZA ROZPTYLUProtože velikost vzorků nebývá velká, je vhodný Shapiro Wilkův test pro ověření normality.2 22Pro rovnost rozptylů, tedy testování hypotézy Ho: σ1= σ2= ... = σk, lze použít např.Bartlettův test. Data v příkladu 1 splňují oba předpoklady.Veličinu, která bude předmětem sledování (např. sledovaný znak kvality), budeme dáleoznačovat y a rozlišovat, kolik faktorů ovlivňuje její hodnotu. Podle toho se hovoří ojednoduchém třídění (y ovlivňuje jeden faktor), dvojném třídění, atd.V této kapitole se předpokládá, že sledovaný ukazatel y závisí na jednom znaku (faktoru),který může mít k úrovní. Všechny potřebné vzorce i postup ANOVA uvedemev následujícím příkladě.Příklad 1 (jednoduché třídění)Sleduje se množství emisí (y) automobilu v závislosti na typu přísady do benzinu (A,B,C,D).Celkem byly provedeny 4 pokusy s každým typem přísady. Zjištěné emise jsou v tabulce 1.A B C D21 26 25 2020 27 26 2316 15 16 1315 20 17 20y1= 18 y2= 22 y3= 21 y4= 19y = 20Tab.1 Výsledky měření emisí s různými typy přísadMá se rozhodnout, je-li významný rozdíl mezi výběrovými průměry emisí, které odpovídajíjednotlivým typům přísad.Řešení:Z uvedených 16 výsledků je vypočítán součet čtverců odchylek S D od celkového průměru ypodle vzorceSD= ∑ k nj∑ ( yj = 1i= 1ji− y)2(1)k = počet skupin (zde jsou skupiny A,B,C a D, proto k = 4)i = číslo pokusu (zde i = 1,2,3,4)j = číslo skupiny (zde j = 1,2,3,4)n j = počet hodnot v j-té skupině ( zde všechny skupiny stejné, n j = 4)SD= (21 − 20)2+ (20 − 20)2+ ... + (13 − 20)2+ (20 − 20)2= 296S D lze rozložit na součet čtverců odchylek mezi skupinami S T a vnitroskupinový součetčtverců odchylek (reziduální) S R . Platí130


ANALÝZA ROZPTYLUS D = S T + S R(2)n j = četnost v j-té skupině (j = 1,2,…,k)y = průměr v j-té skupinějST=k∑nj=1j( yj−y)2(3)ST= 4(18 − 20)2+ 4(22 − 20)2+ 4(21−20)2+ 4(19 − 20)2= 40SR= ∑ k n j∑ ( yj = 1i= 1ji− y2j)(4)SR= (21−18)2+ ... + (15 −18)2+ (26 − 22)2+ ... + (20 − 22)2+ (25 − 21)2++ ... + (17 − 21)2+ (20 − 19)2+ ... + (20 − 19)2= 256Výsledky rozkladu podle (2) jsou v tabulce 2.Součet čtverců d.f. Rozptyl Testovací Sig.lev.kritS T = 40* k –12sT= 40/3 = 13.34 -1=32 2s / s = 0,62 0,61T RS R = 256* n–k2sR= 256/12 = 21.316-4=12S D = 296* 3+12= 15Pozn.: Počet pokusů n = 16.d.f .= degrees of freedom = stupně volnostiTab. 2 ANOVA (na PC)Pozn.(*):Indexy T, R a D souvisí s pojmy Treatment, Residual a Difference.Závěr: Průměry se významně neliší, takže nezáleží na tom, jakou přísadu do palivapoužijeme.Výpočet s programem Excel:Nástroje/Analýza dat/ANOVA:jeden faktorData: jako v tab.1131


ANALÝZA ROZPTYLUANOVAZdrojvariabilitySoučetčtverců d.f. Rozptyl FHodnotaP F kritMezi výběry 40 3 13,33333 0,625 0,61244 3,490295Uvnitřvýběrů 256 12 21,33333Celkem 296 15Poznámka: Ve výsledcích ANOVA bývá místo kritické hodnoty uváděna hodnota p-val (jinéoznačení sig.lev. nebo hodnota p). Vyhodnocení testu spočívá v porovnání p-val se zvolenouhladinou významnosti α: je-lip-val < α, byla překročena kritická hodnota a Ho se zamítá. Jiné hodnocení testu: je-li T >kritická hodnota, zamítá se Ho.Zrychlená ANOVAExistuje i jiný, početně pohodlnější, rozklad součtu čtverců odchylek (resp. rozptylu).Vyjádříme-lia dosadíme do (2), budeSD= ∑ k nj2∑ yj = 1i= 1ji2− n.y= S −SA(5)S – S A = S T + S Ra odtudS = S A + S T + S R(6)Výpočet S a S A je snadnější než S D. S R se „dopočítá“ nakonec z rovniceRozklad S podle (6) je v tabulce 3.22S A= n.y = 16.20 = 6400 .S R = S – S A – S T .Součetčtvercůd.f. Rozptyl Test. kritérium KritickáhodnotaS A = 6400 1*)2 22S T = 40 3 sT= 40/ 3 = 13. 3 s T/ s = 0.62 F 3,12 (0.05) =R3,492S R = 256 12 sR= 256/12 = 21. 3S = 6696 16 Pozn.: S A se nevyhodnocuje.Tab. 3 ANOVA (ruční výpočet)132


ANALÝZA ROZPTYLUProtože testovací kritérium nepřekračuje kritickou hodnotu, není důvod k zamítnutí nulovéhypotézy H o : Rozdíl mezi přísadami je bezvýznamný. Závěr je stejný v obou tabulkách.* Poznámka: F 3,12 (0.05) se hledá v tabulkách, nebo s Excelem: fx/FINVPravděpod. 0,05volnost1 3volnost2 12Schefeho kriteriumV případě zamítnutí Ho se konstatuje, že průměry si nejsou rovny. Z testu však není jasné,které dvojice nesplňují rovnost. Máme-li z nějakého důvodu zájem to zjistit, je možné použítnapř. Schefeho kriterium, které tak tvoří pokračování testu. Postupuje se tak, že rozdílyvýběrových průměrů v absolutní hodnotě se porovnávají s kritickou hodnotou (na pravé straněvztahu 7)yij1−1−12[( n + n )( . k −1). s F ( α)] 2− y >,ikdejsSR=n − kk −1,n−ka je-li větší, prohlásíme rozdíl mezi těmito dvojicemi za významný. Takto se musí prověřitvšechny dvojice průměrů. V software bývá příslušná dvojice nějak označena, např. * .Příklad 2 (data z lit.[4])Sleduje se výnos různých odrůd brambor (A,B,C,D). Výsledky jsou v tabulce2(7)Výpočet s programem Excel:Anova: jeden faktorA B C D0,9 1,31,3 1,10,8 11,5 1,20,6 1,31,6 10,91,11,5FaktorVýběr Počet Součet Průměr RozptylŘádek 1 4 3,2 0,8 0,02Řádek 2 3 3,6 1,2 0,03Řádek 3 5 7 1,4 0,04Řádek 4 3 3,3 1,1 0,01133


ANALÝZA ROZPTYLUANOVAZdrojvariability SS Rozdíl MS FHodnotaP F kritMezi výběry 0,816 3 0,272 9,973333 0,001805 3,587431Všechnyvýběry * 0,3 11 0,027273Celkem 1,116 14* takto je v Excelu označen součet čtverců odchylek uvnitř skupin, tedy S R .Pomocí ANOVA bylo zjištěno, že mezi průměrnými výnosy z trsu jsou významné rozdíly. Jetřeba dále zjistit, mezi kterými odrůdami. V tabulce jsou dále uvedeny rozdíly průměrů apříslušná kritická hodnota. Část kritické hodnoty2[( k − ).s ( α)]1 F k −1,n−kje stejná pro všechny dvojice průměrů a má hodnu F 3,11 (0,05) = 3,59.k (počet odrůd) = 4n (počet trsů) = 15Tabulka výsledkůNapř. pro A-C:y2[( k − ).s ( α)] = (4 −1).0,02727.3,591 F k −1,n−k−1−12[( )( )] 10,30,5n + n . k −1. s ( α)2 = [ ( 0,25 + 0,20 ).3..3,59 ] 0, 3631− y3>1 3F k −1,n−k=Dvojice Levá strana (7) Pravá strana (7)A-B 0,4 0,41381A-C 0,6 0,36345 *A-D 0,3 0,41381B-C 0,2 0,39568B-D 0,1 0,44238C-D 0,3 0,39568Tab.4 Schefeho metoda15 − 4U dvojice odrůd A a C je levá strana vzorce (7) větší než pravá. Skutečně také výnosy odrůdyA(0.8) a C(1.4) jsou největším rozdílem ve výnosech.Výpočet s programem STATGRAPHICSCompare/ ANOVA/ One Way …Ikona: Tabulator Options:Multiple range test = Schefe:Data: první sloupec Yi, druhý sloupec : ke kterému faktoru patří Yi134


ANALÝZA ROZPTYLUANOVA Table for Col_1 by Col_2Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Between groups 0,816 3 0,272 9,97 0,0018Within groups 0,3 11 0,0272727-----------------------------------------------------------------------------Total (Corr.) 1,116 14Čísla úrovnífaktorů (contrast)* označení statisticky významného rozdíluModel ANOVAyi − y j(diference)Kritická hodnota(limits)1 - 2 -0,4 0,4137861 - 3 -0,6 0,363432 *1 - 4 -0,3 0,4137862 - 3 -0,2 0,3956552 - 4 0,1 0,4423563 - 4 0,3 0,395655Teoretická četnost v i-tém řádku a j-tém sloupci y ij se modeluje jako průměr v této skupině +náhodná odchylka od skupinového průměru.yij= μ + εjijPrůměr v j-té skupině je modelován jako součet celkového průměru a vlivu této úrovněfaktoruμ = μ +jτ jμj= průměr v j-té skupině (sloupci)τj= vliv j-té úrovně faktoruμ = celkový průměrDosazením dostávámeεij= náhodná odchylkayij= μ + τ + εjijOdhad modelovaných veličin označíme stříškou:yˆ = ˆ μ + ˆ τijiMNČ se vypočítá:135


ANALÝZA ROZPTYLUˆ μ = y.. (celkový průměr)ˆ τ i= y i. − y..( yi.je skupinový průměr)Potomy ˆ = y..+ ( y . − y..)=ijiy .iModel y ij je potřeba k výpočtu reziduí:eij=yij− yˆijyijy ˆij= yi.eij21 18 320 18 216 18 -215 18 -326 22 427 22 515 22 -720 22 -225 21 426 21 516 21 -517 21 -420 19 123 19 413 19 -620 19 1Rezidua jsou potřeba ke konstrukci diagnostických grafů,kterými se ověřují předpokladyANOVA. Normalita se ověří např. graficky pomocí normálního pravděpodobnostního grafu:Normal Probability Plotpercentage99,99995805020510,1-7 -5 -3 -1 1 3 5resid136


ANALÝZA ROZPTYLU10.2 Dvojné tříděníJe-li sledovaný znak ovlivňován dvěma faktory, hovoříme o dvojném třídění. Rozklad součtučtverců S se provede analogicky jako v případě jednoduchého třídění, pouze přibude jedensčítanec. Označíme ho S B . Rozklad součtu čtverců S potom budeS = S A + S B + S T + S R(8)resp. bez použití S A ( provádí se na PC)kdeS D = S B + S T + S RSBn= k∑(yi=1i− y)2(9)(10)STk= n∑( yj=1j−y)2(11)S A=Sn. k.y= ∑∑2k n2y ijj= 1i=1(12)(13)Reziduální součet čtverců, který je nejpracnější, se vypočítá z rovnice (8)S R = S – S A – S B - S TPříklad 3 (pokračování z kap. 10.1)Sledují se emise výfukových plynů (y) v závislosti naa) typu přísady (A,B,C,D) = 1. faktor, ovlivňující y,b) vlivu řidiče (I,II,III,IV) = 2. faktor, ovlivňující y.Výsledky experimentu jsou v tabulce 5.137


ANALÝZA ROZPTYLUPřísadaŘidič A B C D průměrI 21 26 25 20II 20 27 26 23III 16 15 16 13IV 15 20 17 20průměrTab.5 Plán a výsledky experimentuVýpočet skupinových průměrů a součtu čtverců odchylek manuálně provedeme v tabulce:průměry21 26 25 202320 27 26 232416 15 16 131515 20 17 2018průměry 18 22 21 19 20Analýza rozptylu je provedena oběma způsoby: manuálním a na PC.Rozklad podle (8):Součet čtverců d.f. Rozptyl Test.krit. Krit.hod.S A = 6400 1S B = 216 n - 1 = 3 2sB=72S T = 40 k – 1 =3 2sT= 13,3S R = 40 9 2sR =4,42 2sB/ sR=16,3s s =2 2T/RF 3,9(0,05) == 3,863,0S = 2696 16 Pozn.:d.f. u S R je obecně (n -1)(k -1)Tab. 6a ANOVA (manuální výpočet)Protože jen testovací kriterium u faktoru B překračuje kritickou hodnotu, je pouze u faktoru Bvýznamný rozdíl průměrů.Rozklad podle (9) je v tabulce 6.138


ANALÝZA ROZPTYLUSoučet čtverců d.f. Rozptyl Test. krit. Sig. levelS B = 216 3 2sB= 216 / 3 = 720,00062 2S T = 40 3 2B / = 16,36sT= 40 / 3 = 13.3s s R 0,08772 2s T/ s R= 3, 022S R = 40 9 s = 40 / 9 = 4. 4S D = 296 15RPouze u B je významný rozdíl.Tab. 6b ANOVA (výpočet s PC)Lineární model pozorováníyijk= μ + β + τ + ( βτ ) + εijijijkβ vyjadřují vliv faktorů A, B a interakce ABi, τj,(βτ )ijβ i = řádkový faktorτ j = sloupcový faktor(β τ) ij = smíšený faktor (interakce)μ, β βτ se odhadnou :i, τj( )ijˆ μ = y... ( y ... = celkový průměr)β = y i.. − y... ( y .. = průměr v i-tém řádku)iiτ j= y. j. − y...( y . j. = průměr v j-tém sloupci)( ˆ β τ ) = y . − y .. − y.. y...( y . = průměr v pokusu ij = okno ij)ij ij i j+ijOdhad modelu (řecká písmena se stříškou)y ˆ = ˆijkμ + ˆ τi+ ˆ βj+ ( ˆ βτ)ij== y ... + ( yi..− y..)+ ( y.j.− y...)+ ( yij.− yi..− yij.+ y...)= yij.139


ANALÝZA ROZPTYLU10.3 Trojné třídění (Latinské čtverce)Je-li sledovaný znak y ovlivňován třemi faktory, hovoříme o tzv. Latinských čtverců (trojnémtřídění). Rozklad součtu čtverců odchylek zde buderesp. při použití PCS = S A + S B + S C + S T + S R(14-7)kdeS D = S B + S C + S T + S R2S A= k. k.y ,(15-8)(16)k je rozměr tabulky s výsledky experimentu.S B , S C , S T se počítají stejně podle vzorcekk∑i=1yije průměr v příslušné (testované) skupině.2( y i− y),(17)S R = S – S A – S B – S C – S TS=k k2∑∑y iji= 1 j = 1(18)SD=kk∑∑i= 1 j=1( yij− y)2(19)Příklad 4Sleduje se množství emisí (y) v závislosti naa) typu přísady do benzinu (A,B,C,D),b) vlivu řidiče (I,II,III,IV),c) použitém vozidle (1,2,3,4).140


ANALÝZA ROZPTYLUVýsledky experimentu jsou v tabulce 7. Protože 1. řádek a 1. sloupec jsou již obsazené, budetřetí faktor zaznamenáván do tabulky. Tato filosofie zápisu se uplatňuje i u čtyř a více faktorů.1 2 3 4I A 21 B 26 D 20 C 25II D 23 C 26 A 20 B 27III B 15 D 13 C 16 A 16IV C 17 A 15 B 20 D 20Tab. 7 Výsledky experimentu s uvážením tří faktorůVýpočty průměrů pro jednotlivá třídění jsou v pomocné tabulce 8.Řidiči Vozidla PřísadyI:23 1:19 A:18II:24 2:20 B:22III:15 3:19 C:21IV:18 4:22 D:19Tab.8 Výpočet skupinových průměrůSBS = 212+ 262+ 202+ ... + 202= 6696[(23− 20)2+ (24 − 20)2+ (15 − 20)2+ (18 − 20)2] 216= 4 =SC2222[ − 20) + (20 − 20) + (19 − 20) + (22 − 20) ] = 24= 4 (19ST2222[ − 20) + (22 − 20) + (21 − 20) + (19 − 20) ] = 40= 4 (18SA= 4.4.20 2 = 6400SR= 6696 − 6400 − 216 − 24 − 40 = 16d.f. Rozptyl Test.krit. Krit.hod.S A = 6400 1 s2 A= 6400S B = 216 k – 1 =3 22 2sB= 216/3 = 72 sB/ s R≈ 2722 2S C = 24 k – 1 =3 sC= 24 / 3 = 8 sC/ s R≈ 3, 0F 3,6(0,05) =S T = 40 k – 1 =3 22 2sT= 40/3 = 13. 3= 4,76s T/ s R≈ 5, 0S R = 16 (k-1)(k-2)= 6 2sR= 16 / 6 = 2. 67S = 6696 16Tab. 9 ANOVA (manuální výpočet)141


ANALÝZA ROZPTYLUZávěr: Nejvýznamnějším vlivem je řidič (bloková proměnná B).Rozklad podle (14):Součet čtv. d.f. Rozptyl Test.krit. Sig.lev.S B = 216 (k-1) = 3 2 2 2sB= 72 sB / s R≈ 27 0,0007S C = 24 (k-1) = 3 2 2 2sC= 8 sC / s R≈ 3, 0 0,1170S T = 40 (k-1) = 3 2 2 2s = 13. 3 s / ≈ 5, 0TTs 0,0452RS R = 16 (k-1)(k-2)= s2 R= 2.67S 6D = 296 15Jediným vlivným faktorem je faktor B.Tab. 10 ANOVA (na PC)Shrnutí kapitoly 10V této závěrečné kapitole byl vysvětlen princip analýzy rozptylu za účelem hodnocenízávislosti výstupu Y na vstupech x 1 (jednoduché třídění) resp. x 1 , x 2 dvojné třídění atd.Otázky ke kapitole 101. Jaká je souvislost dvouvýběrového t-testu a ANOVA2. Zkuste jedním slovem odpovědět na otázku: „Co je ANOVA?“3. Napište Ho, testovací kriterium a kritickou hodnotu ANOVA4. Co znamená jednoduché a dvojné třídění v ANOVA?5. Rozložte součet čtverců S D a S pro jednoduché třídění6. V čem se liší ruční a počítačový výpočet rozkladu součtu čtverců odchylek7. Napište tabulku ANOVA pro ruční výpočet (jednoduché třídění)8. Napište tabulku ANOVA výpočet na PC (jednoduché třídění)9. Co přesně znamená zamítnutí Ho v ANOVA10. Napište tabulku ANOVA pro ruční výpočet (dvojné třídění)11. Napište tabulku ANOVA pro výpočet na PC (dvojné třídění)12. K čemu slouží Schefeho kriterium; napište ho13. Napište teoretický model ANOVA pro jednoduché třídění14. Napište empirický model ANOVA pro jednoduché třídění15. Jaké vlastnosti reziduí se v ANOVA předpokládají; jak se ověří16. Rozložte součet čtverců S D a S pro dvojné třídění17. Nakreslete tabulku pro záznam výsledků pokusů u dvojného třídění18. Napište teoretický model ANOVA pro dvojné třídění19. Napište empirický model ANOVA pro dvojné třídění20. Jak je nazýváno trojné třídění21. Rozložte součet čtverců S D a S pro trojné třídění22. Nakreslete tabulku pro záznam výsledků pokusů u trojného třídění23. Vytvořte tabulku 2x2 pro trojné třídění, doplňte libovolně „naměřené“ hodnoty Y aukažte , jak budou vaše data zapsána v programu Statgraphics pro potřebu ANOVA142


ANALÝZA ROZPTYLUÚlohy ke kapitole 10Příklad 1Sleduje se závislost síly výbuchu výbušné směsi Y na čtyřech faktorech:a) pracovník, který směs připravil (1,2,3,4,5), b) dávka (I,II,III,IV,V), c) výbušná směs (A,B, C, D, E), d) vzorek (α, β, γ, δ, ε). Výsledek experimentu je v tabulce č. 1.Má se provést ANOVA na PC a manuálně.Tabulka č. 1 Výsledek experimentuDávky čistéhoPracovníkmateriálu 1 2 3 4 5I Aα 24 Bγ 20 Cε 19 Dβ 24 Eδ 24II Bβ 17 Cδ 24 Dα 30 Eγ 27 Aε 36III Cγ 18 Dε 38 Eβ 26 Aδ 27 Bα 21IV Dδ 26 Eα 31 Aγ 26 Bε 23 Cβ 22V Eε 22 Aβ 30 Bδ 20 Cα 29 Dγ 31Příklad 2Výrobce hliníkových slitin vyrábí přípravek na zjemnění zrna v ingotu. Produkt je vyráběn ve4 pecích. Každá pec má své vlastní jedinečné výrobní charakteristiky, takže každýexperiment, který je prováděn ve slévárně na více pecích, má pec jako problémovouproměnnou. Technici určili, že zásadní vliv na velikost zrna má také rychlost míchání. Každápec má 4 rychlosti míchání.Výsledné velikosti zrn jsou v tabulce. Proveďte ANOVA.RychlostPecmíchání 1 2 3 45 8 4 5 610 14 5 6 915 14 6 9 220 17 9 3 6Příklad 3Posuďte, zda se významně liší průměrné výdaje v rodinách s různým počtem dětí, máte li tytoúdaje:Počet dětí v rodině Výdaje v tis.Kč0 36.1, 36.6, 34.7, 37.9, 341 37.9, 37.4, 38.8, 37.1, 35.12 36.2, 42.2, 39.5, 38.8, 403 43.6, 41.4, 39.2, 42.2, 38.84 38.6, 43.7, 39.1, 44.2, 44.4143


ANALÝZA ROZPTYLUPříklad 4Proveďte ANOVA u jednoduchého třídění:A B C48 50 5149 50 5250 48 5052KLÍČ K ŘEŠENÍ KAP. 10Řešení(1):Vyhodnocení bylo provedeno v programu Statgraphics. Výsledky testu jsou v tabulce č. 2,Analýza rozptylu v PC.Tabulka č. 2 Analýza rozptylu v PCAnalysis of Variance for hod_mereni - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTSA:davky_cist_mat 68,0 4 17,0 2,06 0,1783B:pracovnik 150,0 4 37,5 4,55 0,0329C:vybusna_smes 330,0 4 82,5 10,00 0,0033D:test_vzorek 62,0 4 15,5 1,88 0,2076RESIDUAL 66,0 8 8,25--------------------------------------------------------------------------------TOTAL (CORRECTED) 676,0 24--------------------------------------------------------------------------------All F-ratios are based on the residual mean square error.Vyhodnocení dle tabulky č. 2:Porovnává se hodnota P-Value se zvolenou hladinou významnosti α = 0.05. Je-li P-Value < α,zamítá se H 0 o rovnosti průměrů a přijímá se alternativa H 1 .Pro faktor – dávky čistého materiálu je P-Value 0,1783 > α → přijímá se H 0Pro faktor – pracovník je P-Value 0,0329 < α → zamítá se H 0 a přijímá se H 1Pro faktor – výbušná směs je P-Value 0,0033 < α → zamítá se H 0 a přijímá se H 1Pro faktor – testovaný vzorek je P-Value 0,2076 > α → přijímá se H 0Ruční výpočet:Tabulka č. 3 Výsledek experimentu s výběrovými průměry144


ANALÝZA ROZPTYLUDávky čistéhoPracovníkmateriálu 1 2 3 4 51 Aα 24 Bγ 20 Cε 19 Dβ 24 Eδ 24 22,22 Bβ 17 Cδ 24 Dα 30 Eγ 27 Aε 36 26,83 Cγ 18 Dε 38 Eβ 26 Aδ 27 Bα 21 26,04 Dδ 26 Eα 31 Aγ 26 Bε 23 Cβ 22 25,65 Eε 22 Aβ 30 Bδ 20 Cα 29 Dγ 31 26,421,4 28,6 24,2 26,0 26,8Další průměry y i : A = 28,6 α = 27,0B = 20,2 β = 23,8C = 22,4 γ = 24,4D = 29,8 δ = 24,2E = 26,0 ε = 27,6Označení:S B – dávka, S C – pracovník, S E – výbušná směs, S T – testovací vzorky.S = S A + S B + S C + S E + S T + S RS R = S - S A + S B + S C + S E + S Tkde,je průměr v příslušné testované skupině.145


ANALÝZA ROZPTYLUS R = S - S A + S B + S C + S E + S T = 16805 – 16129 – 68 – 330 – 62 – 150 = 66Tabulka č 4 ANOVA – ruční výpočetSoučet čtvercůStupněvolnostiRozptyl Testovací kritérium Kritická hodnotaS A = 16129 1S B = 68 k – 1 = 4S C = 150 k – 1 = 4S E = 330 k – 1 = 4S T = 62 k – 1 = 4S R = 66(k-1)(k-3) =8S = 16805 25Vyhodnocení tabulky č. 4:Při ručním výpočtu se porovnává hodnota testovacího kritéria s kritickou hodnotou. Je-lihodnota testovacího kritéria menší než kritická hodnota, není důvod k zamítnutí nulovéhypotézy (příjmá se hypotézu H 0 ). Je-li hodnota testovacího kritéria větší než kritickáhodnota, přijímá se hypotéza H 1 .Pro faktor S B – dávka čistého materiálu:T = 2,06 < K = 3,838 → přijímá se H 0Pro faktor S C – pracovník:T = 4,55 > K = 3,838 → přijímá se H 1 .Pro faktor S E – výbušná směs (A, B, C, D, E):T = 10,00 > K = 3,838 → přijímá se H 1 .146


ANALÝZA ROZPTYLUPro faktor S TT = 1,88 < K = 3,838 → přijímá se H 0 .Oběma postupy (v PC i ručním výpočtem) jsme došli ke stejnému závěru.Řešení(2):Řešení na PCK analýze použijeme SW STATGRAPHICS Plus.Výpis programu:Compare – Analysis of Variance – Multifactor ANOVAAnalysis of Variance for Col_1 - Type III Sums of Squares--------------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value--------------------------------------------------------------------------------MAIN EFFECTSA:Col_2 165,188 3 55,0625 6,35 0,0133B:Col_3 22,1875 3 7,39583 0,85 0,4995RESIDUAL 78,0625 9 8,67361--------------------------------------------------------------------------------TOTAL 265,438 15--------------------------------------------------------------------------------Data se do tabulky SW Statgraphics ukládají takto:147


ANALÝZA ROZPTYLUMěření Dávky Pracovník Směs24 1 1 117 2 1 218 3 1 326 4 1 422 5 1 520 1 2 224 2 2 338 3 2 431 4 2 530 5 2 119 1 3 330 2 3 426 3 3 526 4 3 120 5 3 224 1 4 427 2 4 527 3 4 123 4 4 229 5 4 324 1 5 536 2 5 121 3 5 222 4 5 331 5 5 4Manuální řešeníRozklad součtů čtverců S se provede:S = S + S + S + S ,ABTR22kde = n.k.y = 4.5.7,69 = 946, 178S ASkk= ∑∑I = 1 j=1y 2 ij=1211,61SBSBSTST2222[(5,75− 7,69) + (8,5 − 7,69) + (7,75 − 7,69) + (8,75 7,69) ]n2. ( yi− y)= 4.−i=1= k ∑= 22,18= k∑2222[(13,25− 7,6875) + (6 − 7,6875) + (5,75 − 7,6875) + (5,75 7,6875) ]k2( yi− y)= 4.−i=1= 165,19SR= S − S − S − S = 1211 ,65−946,178−22,18−165,19= 78, 0625ABT148


ANALÝZA ROZPTYLUKritická hodnota z tabulek: F (0,05) 5, 083 ,9=Tabulka ANOVAS A = 946,178d.f. Rozptyl Testovací kriterium Kritická hodnota1S B = 22,18 32S B=22,18 / 3= 7,39S/2 2BS R= 0,85S T =165,19 32S T= 165,19 / 3 = 55,0F3 ,9(0,05) =3,86S R = 78,0625 92S R=78,0625 / 9= 8,6S/2 2TS R= 6,35S = 1211,6116Výsledky (3):(S T = 120.372, S R = 77.588, T = 7.757)Řešení(4):Y = 50n = 10, k = 3A B C48 50 5149 50 5250 48 505249 50 51S d.f. s 2 T Kritic. hodnotaS M 6 2 31,75S V 12 7 1,71F 2,7 (0,05) = 6,54S T 18S M = 3.(49-50) 2 + 4.(50-50) 2 + 3.(51-50) 2 = 6S = 25018S A = 10.50 2 = 25000S = 2500 + SM + SV; SV = 25018 - 25000 - 6 = 12149


150ANALÝZA ROZPTYLU


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ11. ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮČas ke studiu: 20 hodinCíl kapitolya) ukázat souvislosti DOE, regresní analýzy a ekonometrieb) uvést základní vzorce regresní analýzyc) definovat předpoklady regresní analýzy včetně způsobujejich testování a překonání problému při jejich nesplněníVýkladTato skripta jsou věnována plánování experimentů. Jedná se o disciplínu s širokýmimožnostmi aplikací mj. také v řízení jakosti. Současně je to však téma, související velmi úzces dalšími matematickými disciplínami, jmenovitě regresní analýzou a také ekonometrií. V tétozávěrečné kapitole bychom rádi ukázali souvislosti uvedených disciplín.V matematické statistice byla probrána kapitola regresní analýzy, zabývající se modelovánímzávislosti sledovaných výstupů (např. ukazatelů kvality) na proměnných, označovanýchv řízení procesů jako vstupy, regulovatelné faktory resp. nezávislé proměnné.Abychom mohli dále probírat problémová místa regresní analýzy, připomenemenejvýznamnější pojmy a vztahy.11.1 Regresní analýza11.1.1 Základní pojmy regresní analýzy, metoda nejmenších čtvercůrTvar závislosti y na x = ( x 1,..., x k) je v nejjednodušším případě, kdy x r = x, vyjádřen obecněy = f(x). Funkční předpis f může mít nejrůznější tvar, např. y = β 1 + β 2 x, y = β 0 + β 1 x + β 2 x 2 ,y = ln(x), atp. Při závislosti y na k proměnných máme rovnici y = f (x 1 , …,x k ) = f( x r ).Je-li tato funkce uvažována ve tvaruy = β 1 f 1 ( x r ) + β 2 f 2 ( x r ) + …+ β k f k ( x r )hovoříme o lineární regresi (lineární podle parametrů).Nejčastěji uvažujeme (1) ve tvaru:y = β 1 x 1 + β 2 x 2 + ... + β k x k151


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮV nejjednodušším případem, kdy y je lineární funkcí x, je y = β 1 + β 2 x 2 .K dispozici jsou experimentálně získané body (x 1 ,Y 1 ), (x 2 ,Y 2 ), … , (x n ,Y n ).Podstatné při hledání těchto bodů je, že x i se volí, zatímco Y i se získá měřením a je tedyzatíženo chybou měření.Y i = empirická (měřená) hodnota závisle proměnnéy i = teoretická hodnota závisle proměnnéε i = reziduální odchylkaVztah mezi empirickou hodnotou Y i a teoretickou hodnotou y i je vyjádřen rovnicíεije reziduální odchylkaMá-li teoretická regresní funkce tvarjeY i = y i + ε i ;y = β ... +1x1+ βkx k,(1)(2)ayi= β ... +1xi+ βkx1i, i = 1,2,…,nk(3)Yi= β x + ... + β x + ε1i1ki ki(4)Odhadem teoretické regresní funkce (3) je empirická regresní funkceVztah (1) potom můžeme zapsat ve tvaruY ˆ = b x ... +1 i1+ bkxik.(5)e i je empirická reziduální odchylka.Po dosazení za Yˆ do (6) mámeiY = Y ˆ + eiii(6)Y = b x ... +i1 i1+ + bkxikei; i = 1,2,…,n.(7)Soustavu rovnic (7) lze zapsat pomocí maticYr r = X . b + e(8)Matice X má tvar152


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮX⎡⎢⎢= ⎢⎢⎢⎢⎣xxx1121n1xxx1222n2.........xxx1k2knk⎤⎥⎥⎥⎥⎥⎥⎦(9)První řádek je první volbou proměnných x 1 ,…,x k, atd. až po n-tou volbu v posledním řádku.Zdůrazňujeme volba: proměnné x i se volí, hodnoty Y i jsou získány měřením.Nyní budeme hledat způsob výpočtu koeficientů b i , tedy vektoru b r ; empirický regresníkoeficient b i je bodovým odhadem teoretického regresního koeficientu βi.Kriteriem pro posouzení kvality nalezených odhadů b i je součet čtverců odchylek reziduín∑S e= e inejlepší odhad je ten, pro který je součet čtverců odchylek ∑i=12 ;ne ii=12 minimální, tedyn∑i=1e2 i=min.(10)Vztah (10), nazývaný metoda nejmenších čtverců (MNČ resp. LS), je výchozí pro nalezenívektoru b r ;v maticovém vyjádření má tvarS e = ∑=ne ii 1r r2 = e T . e = min.11.1.2 Předpoklady regresní analýzyO reziduálních odchylkách, které z pohledu teorie pravděpodobnosti představují náhodnéproměnné, se činí tyto předpoklady:1) Střední hodnota je nula: E (ε i ) = 02) Rozptyl je konstantní, nezávislý na i: D (ε i ) = σ 23) Veličiny ε i , ε j jsou nezávislé: cov (ε i , ε j ) = 04) Veličiny ε i mají normální rozdělení: ε i ∼ N(0, σ 2 )Také o matici (9) se činí jisté předpoklady. Uvedeme je v návaznosti k předpokladům oreziduích:5) matice X je nenáhodná153


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ6) sloupce v X jsou lineárně nezávisléPředpoklady o reziduích lze vyjádřit také v maticovém tvarur r1b) E ( ε ) = οr 22b) var( ε ) = σ Iv v3b) ε ~ N(ο,σ 2 I)Zápisv 2var( ε ) = σ Iobsahuje body (2) a (3), neboťr 2var( ε ) = σ I⎡ D(ε1)2= σ⎢⎢cov( ε2,ε1)⎢⎣cov( ε3,ε1)cov( ε , ε )1D(ε )322cov( ε , ε )2cov( ε1,ε3)⎤ ⎡1⎥ 2cov( ε =⎢2,ε3)⎥σ⎢0D(ε ⎥⎦⎢3)⎣001020⎤⎡σ⎢0⎥⎥= ⎢ 01⎥⎦⎢⎣ 002σ00 ⎤⎥0 ⎥2σ ⎥⎦Odtud je zřejmé, že rozptyly jsou konstantní (bod 2) a kovariance nulové (bod 3).Při hledání modelu a následném testování jeho vlastností budou použity věty regresníanalýzy, které nyní uvede.Věty zásadního významu jsou uvedeny s důkazem, ostatní pomocné věty bez důkazu.11.1.3 Vybrané věty regresní analýzyVěta 1Odhad regresních koeficientůvztahuvb = ( b 1,..., )b kTrb = ( XDosazením Y-Xb za e r do (11) dostávámemetodou nejmenších čtverců se vypočítá pomocíX )T −1TT T TT T T TSe = ( Y − Xb)( Y − Xb)= ( Y − b X )( Y − Xb)= Y Y − Y Xb − b X Y + bXTY .TXTXb(12)Protožea výraz v závorce je skalár, je YTTT T TY Xb = ( b X Y )T T T T TXb = ( b X Y ) = b X Y , můžeme psátT T T T T TT T TSe = Y Y − Y Xb − b X Y + b X Xb = Y Y − 2 b X Y + b154TXTXb


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮHledá se minimum této vektorové funkce. Pro derivace S e podle vektoru b r použijeme větyz kapitoly 4.3.2: Jsou-li ϖ a α vektory, A je matice, potomDerivováním S e dostávámeTδω α= αδϖTδϖ Aϖ= ( A + AδϖT) ϖδSeδbTT= −2 X Y + 2XXb = 0Odtudrb = ( XX )T −1XTY .Výpočet b r podle Věty 1 je bodovým odhadem regresních koeficientů β1..., βk.U bodových odhadů je potřeba zjistit, zda se jedná o nevychýlený odhad, tj. zdadále stanovit varianční matici var(b r).E br =rβ aVěta 2Odhad b r je nestranný, tzn.E(b)r= βa má varianční maticivvar( b)rrr rT −1TT −1T r T −1Ta) Eb = E(X X ) X Y = ( X X ) X E(Xβ+ ε ) = ( X X ) X Xβ= βrrT −1TT −1T r T −1b) var( b)= var( X X ) X Y = ( X X ) X var( Xβ+ ε ) X.[(X X ) ] T( XX )X σ I.X X−1= σ ( X X )T −1T 2 T2 T −1= ( )2kde σ se počítá podle V4.Věta 3Pro reziduální součet čtverců Se platí:T T −1Ta) Se = Y [ I − X ( X X ) X ]YT T Tb) Se = Y Y − b X YX2 T= σ ( X X)−1.Věta 4Nestranným odhadem parametruσ 2 je náhodná veličinas2=Sne−k155


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮVěta 5Má-li náhodný vektor r r rε normální rozdělení, tj. ε ~ N(ο,σ 2 I), potoma) Y ~ N(Xrβ , σ2 I)2 −1bv~ Nr Tβ , σ X X[ ]b) ( )Věta 6SeNáhodná veličina2 má rozdělení2χn−k .σVěta 7T −1Označme v ij prvky matice V = ( X X ) .Potombi− βi~ ts viin−kS použitím věty: Má li náhodná veličina X 1 rozdělení N(0,1) a náhodná veličina X 2 rozdělení2 X1 χn, pak ~ t n −k, sestrojíme takový zlomek pomocí V 2 ,V 4 ,V 5 :X2nbiσ− βviiiSe2σn − k=biσ− βvii2s ( n − k)2σn − kibi− βi=s vii~ tn−kVěta 7 se používáa) pro testování hypotézyHo: β = β :ioiJestližeob − βisviii> tn−k(α) ,ozamítá se H 0 . Nejčastěji se volí β = 0 .b) k intervalovému odhadu koeficientů βi:i156


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮbi− βiP [ ≤ tn−k( α)] = 1−α .s viiOdtud22[i− tn− k( α ) s vii≤ βi≤ bi+ tn−k( α ) s vii]P bVěta 8Jestližer rS ) / kβ = ο , potom náhodná veličinaYS /( n − k)emá rozdělení F k,n-k .Tato věta se používá v regresní analýze k testování modelu.Příklad 1Sledujeme závislost spotřeby elektrické energie (y) na délce elektrického vedení (x 2 ) a odběruenergie (x 3 ). Má se najít regresní funkce ve tvaru Y ˆ = b1+ b2x2+ b3x a provést predikci pro3x 1 =1.8, x 2 = 4.3 a x 1 = 1.9, x 2 = 4.4.x 2 x 3 Y1,2 3,6 3,21,3 3,7 3,31,3 3,8 3,41,4 3,8 3,51,4 3,9 3,61,5 3,9 3,61,5 4 3,71,6 4 3,81,6 4,1 3,91,7 4,2 4Řešení:Z tabulky získáme potřebné matice X a YX⎡1⎢⎢1⎢1⎢⎢1⎢1= ⎢⎢1⎢1⎢⎢1⎢1⎢⎢⎣11,21,31,31,41,41,51,51,61,61,73,6⎤3,7⎥⎥3,8 ⎥⎥3,8 ⎥3,9⎥⎥3,9⎥4 ⎥⎥4 ⎥4,1⎥⎥4,2⎥⎦⎡3,2⎤⎢ ⎥⎢3,3⎥⎢3,4⎥⎢ ⎥⎢3,5⎥⎢3,6⎥Y = ⎢ ⎥⎢3,6⎥⎢3,7⎥⎢ ⎥⎢3,8⎥⎢3,9⎥⎢ ⎥⎢⎣4 ⎥⎦157


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮJelikož v regresní funkci je absolutní člen, je x 1 = 1 a matice X doplněna o první sloupecjedniček. Proto také x-ové hodnoty v tabulce jsou označeny x 2 a x 3 .Vztah (12) vytvoříme postupně:⎡ 1⋅ X =⎢⎢1,2⎢⎣3,611,33,711,33,811,43,811,43,911,53,911,5411,6411,64,1⎡1⎢⎢1⎢1⎢⎢11 ⎤⎥⎢11,7⎥⋅ ⎢⎥⎢14,2⎦⎢1⎢⎢1⎢1⎢⎢⎣11,21,31,31,41,41,51,51,61,61,73,6⎤3,7⎥⎥3,8 ⎥⎥3,8 ⎥⎡ 103,9 ⎥=⎢⎥⎢14,53,9 ⎥⎢⎥ ⎣ 394⎥4 ⎥4,1⎥⎥4,2⎥⎦14,521,2556,839 ⎤56,8⎥⎥152,4⎥⎦X T ( )X T⋅ X−1⎡245,2=⎢⎢108⎢⎣−10310860− 50−103⎤− 50⎥⎥45 ⎥⎦X T⎡ 1⋅Y=⎢⎢1,2⎢⎣3,611,33,711,33,811,43,811,43,911,53,911,5411,6411,64,1⎡3,2⎤⎢ ⎥⎢3,3⎥⎢3,4⎥⎢ ⎥⎢3,51 ⎤⎥⎡ 36 ⎤⎥⎢3,6⎥1,7 =⎢ ⎥⎥⋅⎢⎥⎢52,56⎥⎢3,64,2⎥⎥⎦ ⎢⎣⎥⎢ ⎥140,823,7⎦⎢ ⎥⎢3,8⎥⎢3,9⎥⎢ ⎥⎢⎣4 ⎥⎦Nyní můžeme podle (12) vypočítat:⎡245,2108 −103⎤⎡ 36 ⎤ ⎡− 0,78⎤⎡b1⎤rT −1Tb = ( X ⋅ X ) ⋅ X ⋅Y=⎢⎥⋅⎢ ⎥=⎢ ⎥=⎢ ⎥⎢108 60 − 50⎥ ⎢52,56⎥ ⎢0,60⎥ ⎢b2⎥⎢⎣−103− 50 − 45 ⎥⎦⎢⎣140,82⎥⎦⎢⎣0,90 ⎥⎦⎢⎣b ⎥3 ⎦Hledaná regresní funkce má tedy rovnici Y ˆ = −0,78+ 0,60x2 + 0, 90x3.Výpočet teoretických hodnotTeoretické hodnoty Yˆ, Yˆ,..., Yˆlze vypočítat dosazením za x1 2 n2 a x 3 z prvého, druhého, … ,n-tého řádku matice X do regresní funkce, např.Yˆ1 = −0,78+0,60⋅1,2+ 0,90⋅3,6= 3,18Yˆ2 = −0,78+ 0,60⋅1,3+ 0,90⋅3,7= 3,33………………………………Y ˆ10 = −0,78+ 0,60⋅1,7+ 0,90 ⋅ 4,2 = 4,02158


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮTyto hodnoty lze získat rychleji a všechny najednou takto⎡1⎢1⎢⎢1⎢⎢1r ⎢1Yˆ= X ⋅b= ⎢⎢1⎢1⎢⎢1⎢1⎢⎢⎣11,21,31,31,41,41,51,51,61,61,73,6⎤⎡3,18⎤⎡ Yˆ⎤1⎢ ⎥3,7⎥ ⎢3,33⎥⎥ ⎢ ⎥ ⎢Yˆ2 ⎥3,8 ⎥ ⎢3,42⎥⎢ . ⎥⎥ ⎢ ⎥ ⎢ ⎥3,8 ⎥ ⎢3,48⎥⎢ . ⎥⎡− 0,78⎤3,9 ⎥⎥ ⎢ ⎥⎢ ⎥⎢3,57.⎥ ⋅ = ⎢ ⎥ = ⎢ ⎥⎢0,63,9 ⎥⎥ ⎢3,63⎥⎢ . ⎥⎢⎣⎥⎥0,94⎦ ⎢3,72⎥⎢ ⎥⎥ ⎢ ⎥ ⎢.⎥4 ⎥ ⎢3,78⎥⎢ . ⎥⎥ ⎢ ⎥ ⎢ ⎥4,13,87⎥ ⎢ ⎥ ⎢ . ⎥4,2⎥⎦⎢⎣4,02⎥⎦⎢ ˆ⎣Y⎥10⎦Výpočet reziduálních odchylekOdečtením vektorů Y a Ŷ získáme vektor empirických reziduálních odchylek e r :⎡3,2⎤⎡3,18⎤⎡ 0,02 ⎤ ⎡ e1⎤⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎢3,3⎥ ⎢3,33⎥ ⎢− 0,03⎢e⎥2⎥⎢3,4⎥⎢3,42⎥⎢−0,02⎥⎢ . ⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎢3,5⎥⎢3,48⎥⎢ 0,02 ⎥ ⎢ . ⎥⎢3,6⎥⎢3,57⎥⎢ 0,03 ⎥ ⎢ . ⎥e r = Y − Yˆ= ⎢ ⎥ − ⎢ ⎥ = ⎢ ⎥ = ⎢ ⎥⎢3,6⎥⎢3,63⎥⎢−0,03⎥⎢ . ⎥⎢3,7⎥⎢3,72⎥⎢ 0,02 ⎥ ⎢ . ⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎢3,9⎥⎢3,78⎥⎢ 0,02 ⎥ ⎢ . ⎥⎢3,9⎥ ⎢3,87⎥ ⎢0,03⎥ ⎢.⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎢⎣4 ⎥⎦⎢⎣4,02⎥⎦⎢⎣− 0,02⎥⎦⎢⎣e10⎥⎦Rozptyl odhadu regresních koeficientůProtože při výpočtu regresních koeficientů se jedná o odhady, je účelné také nalézt rozptylytěchto odhadů. Získáme je jako prvky hlavní diagonály matice:r2 T −var( b)= s ⋅ ( X ⋅ X ) 1(13)kdee r = vektor reziduálních odchyleks2=r T re ⋅ en − k(14)159


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮTe r = vektor transponovaný k e rn = počet bodůk = počet parametrůV našem případěre Tr⋅ e =⎡ 0,02 ⎤⎢0,03⎥⎢−⎥⎢−0,02⎥⎢ ⎥⎢ 0,02 ⎥⎢ 0,03 ⎥[ 0 ,02 − 0,03 − 0,02 0,02 0,03 0,03 − 0,02 0,02 0,03 − 0,02] ⋅ ⎢ ⎥ = 0, 006s2re T r⋅ e 0,006= = = 0,0008571n − k 10 − 3⎢−0,03⎥⎢−0,02⎥⎢ ⎥⎢ 0,02 ⎥⎢0,03⎥⎢ ⎥⎢⎣− 0,02⎥⎦rvar( b)= s2⋅T( X ⋅ X )−1⎡245,2= 0,0008571⋅⎢⎢108⎢⎣−10310860− 50−103⎤⎡0,2102− 50⎥=⎢⎥ ⎢0,092645 ⎥⎦⎢⎣0,08830,09260,0514− 0,0429− 0,0883⎤− 0,0429⎥⎥0,0386 ⎥⎦Podobně:D(b 2 ) = 0,0514 ⇒ s(b 2 ) = 0,2267D(b 3 ) = 0,0386 ⇒ s(b 3 ) = 0,1965D(b 1 ) = 0,2102 ⇒ s(b 1 ) = 0,4584Po nalezení rovnice regresní funkce a rozptylu odhadů regresních koeficientů píšeme obvyklevýsledné řešení tak, že pod regresní koeficienty uvádíme příslušné směrodatné odchylky.V našem případě máme:Y ˆ = − 0 ,78 + 0 ,60 x 2 + 0 , 90 x(0,4584) (0,2267) (0,1965)Při výpočtu regresních koeficientů b 1 , b 2 , …,b k se stává, že mezi koeficienty jsou až řádovérozdíly, např. b 1 = 200 a b 2 = 0,02. V takových případech stojíme před problémem, zda másmysl zařadit např. zde b 2 do regresní funkce. K objektivnímu posouzení významnostiregresních koeficientů lze použít následující test.3Test významnosti regresních koeficientů1) Nulová a alternativní hypotézaH 0 : β i = 0H 1 : β i ≠ 0160


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ2) Testovací kritériumbiTi=s b )kde b i je odhad parametru β i ,s(b i ) je směrodatná odchylka odhadu tohoto parametru.( i(15)3) Kritická hodnota t n-k (α)4) Porovnáme T a t n-k (α )Je-li ⎢T⎟ > t n-k (α), zamítáme H 0 a přijmeme alternativní hypotézu H 1 , podle kterévypočítaný koeficient je možné považovat za různý od nuly a je proto důvod projeho zařazení do regresní funkce.Zde mámeb20,60T 2 = = = 2,65s( b 2 ) 0,0514b3T = s ( b3)3=4,58t n-k (α) = t 10-3 (0,1) = 1,895Protože T 2 > 1,895 a také T 3 > 1,895, zařadíme oba koeficienty do regresní funkce.rJak bylo řečeno, výchozím předpokladem pro nalezení odhadu b = ( b1,..., b k ) koeficientůrβ = ( β1,...,β k ) je znalost matic X a Y, což znamená znalost bodů (x i1 ,x i2 ,...,x ik ,Y i ). Praktik,stojící před úlohou formulovanou v úvodu této kapitoly, však musí tyto hodnoty získat. V tétosouvislosti musí rozhodnout, jak volit hodnoty (x i1 ,x i2 ,...,x ik ) a kolik bodů je potřeba proseriózní odhad regresních koeficientů.Uvážíme-li, že jak volba bodů x ij , tak jejich počet mají rozhodující význam pro kvalituodhadu, jsou obě otázky klíčové. Další zpracování těchto údajů je už rutinní záležitostí.Uvedenou problematikou se zabývá plánování experimentů.Intervaly spolehlivostiPro parametry β 1 , …, β k , hledáme intervaly, ve kterých lze očekávat tyto parametrys pravděpodobností 1-α; vypočítáme je pomocí vztahu:〈 bi−kde:b i = odhad parametru β is(b i ) = směrodatná odchylka odhadut n-k (α) = kritická hodnota Studentova rozdělenín = počet bodůk = počet parametrůα = hladina významnosti− tn− k( α ) ⋅ s(bi), bi+ tnk( α)⋅ s(bi)〉(16)161


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮPři hladině významnosti α je stupeň spolehlivosti 1- α. S touto pravděpodobností se nacházíneznámý parametr β i v intervalu (16).Např. pro b 2 a α = 0,05(0,60 – 2,365.0,2267; 0,60 + 2,365.0,2267)(17)Test modelu (ANOVA)Tímto testem se prověřuje, je-li možné vyjádřit Y jako lineární kombinaci vybranýchproměnných. Zamítnutí H o znamená, že aspoň jedna z proměnných přispívá významněv modelování Y.1.resp. ve tvaruHo: β1= β2= ... = βk=r r r rH : β = 0 a H : β ≠ 0o102. Testovací kriteriumT=S ˆ /( k −1)Y,S /( n − k)eS)Yn )= ∑(Y − Y )1i23. Kritická hodnota()Fk− 1,n−kα4. Je-li T > ( ) , zamítá se H o .F k −1,n−kαZdeT0,594 /(3 −1)=0,006 /(10 − 3)= 346,5F 3-1,10-3 (0,05) = 4,73Protože T překročilo kritickou hodnotu, zamítá se H o což znamená, že alespoň jedno β i jenenulové, Y lze modelovat pomocí příslušné proměnné x i a model se považuje za vyhovující.PredikceJedním z hlavních poslání regresních modelů je odhad očekávaného výstupu Y i pro zvolenévstupy x i , tedy predikce Y i .Např. predikce v bodě X o = (1, x 1,0 , x 2,0 ) = (1, 1.8, 4.3) se vypočítሠ= Yˆ(X0) = Yˆ(1,x1,0,x2,0)= −0,78+ 0,60x2+ 0,90x3= −0,78+ 0,60.1,8 + 0,90.4,3 = 4,17Y o162


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮMaticově⎛ − 0,78⎞⎜ ⎟Yˆ0 = (1,1.8,4.3) ⎜ 0,60 ⎟ = 4,17⎜ 0,90 ⎟⎝ ⎠Predikce pro dva bodyˆY o⎛1= ⎜⎝11,81,9⎛− 0,78⎞4,3⎞⎜⎟ ⎛ 4,17⎞⎛Yˆ⎟⎜0,60 ⎟ = ⎜ ⎟ = ⎜4,4⎠⎝ ⎠ˆ⎜ ⎟ 4,32 ⎝Y⎝ 0,90 ⎠1,02,0⎞⎟⎠ObecněYˆ 0 = X0bRozptyl predikce (pro dva body)varYˆ0=X0var( b)X ′0=X0Se( X ′ X )n − k−1X ′02⎛ s ( Y= ⎜⎝1,0)2s ( Y2,0⎞⎟)⎠Intervalový odhad predikcePredikované výstupy jsou bodovým odhadem. Je možný také intervalový odhad středníchhodnot E Yˆ), E(ˆ ) . K jejich výpočtu je potřeba mj. také rozptyl predikce.(1,0Y2,0Např.⎛245,22 0,006 ⎜s ( Yˆ0)= (1,1.8,4.3) ⎜ 10810 − 3 ⎜⎝ −10310860− 50−103⎞⎛ 1 ⎞⎟ ⎜ ⎟− 50 ⎟.⎜1,8⎟ = 5,5711.1045 ⎟ ⎜4,3⎟⎠ ⎝ ⎠−4Eˆs ( Yˆ0) = 0,023603) ∈< Yˆ− ( ). ( ˆ ); ˆ1,0tnkα s Y1,0Y1,0+ tn−( Y1 ,0− k( α).s(Y1,0)ˆ>( Y ) 1, 0∈< 4,17 − 2,365.0,023603;4,17 + 2,365.0,023603 >=< 4.12,4. 23 >E )t10 −3(0,05)= 2, 365 ( Excel).163


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮPříklad 1 – pokračováníMá se predikovat Y se Statgraphics pro x 1 = 1.8 , x 2 = 4.3 a x 1 = 1.9, x 2 = 4.4Řešení:- zapsat do dalších řádků (= řádky 11 a 12) tyto proměnné (Y chybí),- najít model (počítá jen s úplnými řádky 1 až 10),- ikona : Tabular Options/Reports: výsledky jsou na obrazovce:Regression Results for Y------------------------------------------------------------------------------------------------------Fitted Stnd. Error Lower 95,0% CL Upper 95,0% CL Lower 95,0% CL Upper 95,0% CLRow Value for Forecast for Forecast for Forecast for Mean for Mean------------------------------------------------------------------------------------------------------11 4,17 0,037607 4,08107 4,25893 4,11419 4,2258112 4,32 0,0414039 4,2221 4,4179 4,25077 4,38923------------------------------------------------------------------------------------------------------V tabulce jsou také v posledních dvou sloupcích intervalové odhady E(Y).Vlivné bodyPodobně jako u jednorozměrného souboru, také v regresní analýze se mohou vyskytovatbody, které se výrazně liší od ostatních, zde konkrétně s extrémní y-onovou resp. x-ovousouřadnicí. Souhrnně se nazývají vlivné body.Jsou dvě cesty, jak se vyhnout problémům s vlivnými body1. Použít robustní metody, tj. metody, které nejsou ovlivněny vlivnými body2. Odhalit, vyhodnotit a odstranit vlivné bodyTo je možné dvěma způsoby:a) testemb) grafickými metodamiOba přístupy používají speciální matici H = X(X T X) -1 X T jejíž prvky na hlavní diagonále h ii seurčí pro i-tý řádekx i je i-tý řádek v X.h ii = x i (X T X) -1 x iTi h ii1 0,42 0,253 0,44 0,25 0,256 0,257 0,28 0,49 0,2510 0,4suma 3,0 = k164


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮVelikost h ii závisía) na plánub) na modeluVlastnosti h iia) 0 h ≤ 1≤ iinb) ∑ h ii= k1k = počet parametrůh ii (laverage): ukazuje velikost vlivu Yina Yˆ i ; protože Σ h ii = k, je průměr prvků na hlavnídiagonále Σ h ii / n = k/n; přesáhnutí dvojnásobku průměru, tj. 2k/n (k je počet parametrů) sepovažuje za významné.Je tedy průměrné h ii = počet parametrů / počet pokusůPro identifikaci vlivných bodů jsou dále potřebná různě modifikovaná rezidua e ia) normovaná (též standardizovaná) rezidua ei/σ: má přibližně σ =1, proto má být v int.(-3,3). Za σ se dosadí odhad s.Pozn.: σ je směrodatná odchylka teoretických reziduí ε i ; u e i je poněkud jiná – viz bod c)b) studentizovaná rezidua r i : (Internally Studentized Residua)ri=eiei=;s( ei) σ (1 − hii)r i má být v intervalu (-3,3).Pozn.: s(e i ) se vypočítá takto:ˆ 1−e = Y − Y = Y − Xb = Y − X.(X ′ X ) X ′ Y = Y − HY = ( I − H ) Y2var( e)= ( I − H ) varY( I − H )′= ( I − H ) σ Iprotože (I-H) je symetrická a idempotentní.2Potom D( e i) = (1 − h ii) σ takže s( e i) = σ 1−h ii .Jestliže se vynechá i-tý pokus (řádek matice X) nazýváme r iExternally Studentized Residua:ri =s−iei( 1−hii)165


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮc) Cookova vzdálenost D i : má být menší než 1 proto, že F p,n-p (0,5) ≈ 1Di =r2ip.(1hii− hii)d) predikovaná rezidua e (i) , PRESS (prediction error sum of squares)Vynecháme v matici Y ( a také X) i-tý řádek, i = 1,2,…,n a vypočítáme Ŷ .ˆiPotom e(i )= Y i− Y()Např.: e(1)= Y1− Yˆ(1), kde Y ˆ(1)bylo počítáno bez bodu (x 1 , Y 1 )Charakteristika PRESS pro posouzení vlivných bodůPRESS=∑e2( i)=∑⎛ ei⎜⎝1−hii⎟ ⎞⎠2Je-li v datech vlivný bod, projeví se to velkou odchylkou e i a e (i) a tedy velkou hodnotouPRESS.Velkému h ii odpovídá i velká hodnota PRESS.PRESS se používá k predikované korelaciR2PRED= 1−∑SeY2( i)= 1−PRESSSYJako ukázku zmiňovaných robustních metod uvedeme výpočet regresních koeficientů propřímku.Příklad 2 (robustní odhad přímky)Zvolíme několik bodů na přímce Y = a + b.x, kde a = 0 a b = 2:x 1 2 3 4 5 6 7 8 9 10Y 2(200) 4 6 8 10 12 14 16 18 20Postupně hledejte koeficienty regresní přímky pro zadané hodnoty a pro úmyslně chybný údajY = 200 (modře) a to klasicky a robustní metodou odhadu. Výsledky porovnejte. Vzhledemk tomu, že rovnice hledané přímky je známa, je možné ihned posoudit správnost výpočtů.Řešení:a) MNČ budeme nyní k těmto bodům hledat a,b a ověříme, je-li a = 0, b = 2:166


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮX T X⎛1= ⎜⎝11213141516171819⎛1⎜⎜1⎜1⎜⎜1⎜1 ⎞⎜1⎟10⎠⎜1⎜⎜1⎜1⎜⎜1⎜⎝11 ⎞⎟2 ⎟3 ⎟⎟4 ⎟⎟5⎟ ⎛10= ⎜6 ⎟ ⎝55⎟7 ⎟8 ⎟⎟9 ⎟10⎟⎠55 ⎞⎟385⎠det(X T X) = 3850-3025 = 825385825 ⎝−55− 551⎝1⎛ 2 ⎞⎜ ⎟⎜ 4 ⎟⎜ 6 ⎟⎜ ⎟⎜ 8 ⎟1⎜10⎟10⎠⎜12⎟⎜ ⎟⎜14⎟⎜16⎟⎜ ⎟⎜18⎟⎜ ⎟⎝20⎠110⎝770⎠T −11 ⎛ ⎞ T ⎛⎞ ⎛ ⎞( X X ) = ⎜ ⎟,( X Y ) = ⎜⎟⎜⎟ = ⎜ ⎟10⎠1213141516171819b =1825⎛ 385⎜⎝−55− 55⎞⎛110⎞⎛0⎞⎟⎜⎟ = ⎜ ⎟10 ⎠⎝770⎠⎝2⎠b) Změňme Y 1 = 2.00 na chybný údaj Y 1 = 200. MNČ (Statgraphics) nyní naleznea = 79.2, b = - 8.8c) Robustní odhad koeficientů ze správných dat bude:Kvartily x 25 = 3, x 50 = 5,5 a x 75 = 8; y 25 = 6, y 50 = 11 a y 75 = 16. Koeficientyy75− y2516 − 6b = = = 2 ; a = y 50− b. x 50= 11−2.5,5 = 0x − x 8 − 37525Pro správní data vychází tedy shodně s předchozím výpočtem.c) robustní odhad z chybných dat:nové uspořádání Y pro výpočet kvartilů:4 6 8 10 12 14 16 18 20 200167


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮKvartily: x 25 = 3, x 50 = 5,5 a x 75 = 8; y 25 = 8, y 50 = 13 a y 75 = 18.Koeficientyb = (y 75 – y 25 )/(x 75 -x 25 ) = (18-8) / (8-3) = 2, a = y 50 – b.x 50 =13-2.5,5 = 2Robustní výpočet je podstatně méně ovlivněn chybným údajem než v případě b).Na závěr této kapitoly uvádíme přehled nejdůležitějších vzorců regresní analýzy.r1. b = ( X X ) ⋅XYPŘEHLED VZORCŮ PRO REGRESNÍ ANALÝZUTr2. Yˆ= X⋅br3. e Y Yˆ=−∑−1T224. S = ( Y − Yˆ ) = e , S ( ˆ ) 2ˆ = ∑ Y − Yeirbi∑i T −5. ( ) ( ) 16.varT∑2e= ⋅n −kbii= ~sitn − k( b )Yˆk −1T = ~ FSen −krˆ = XX7.k −1,n− kSY008. bsYˆ2eTT9. ( ) ( )0S= ⋅Xn −k10. Yˆt ( α ) ⋅s( ˆ )0±n − kY0H = X⋅XX−1TT11. ( )Hi ir= xi0⋅XiXT −1r T( X X ) xiXiX−1Y⋅X0iiVzorce, uvedené v přehledu, je možné použít jen jsou-li splněny předpoklady regresníanalýzy z kapitoly 1.1.2.168


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮV této souvislosti se řeší celá řada přirozených otázek, zejménaa) jak lze ověřit splnění uvedených předpokladůb) jak postupovat v regresní analýze, nejsou-li splněnyc) co způsobí použití vzorců 1-11 při nesplnění předpokladůTěmito otázkami se budeme zabývat v následující kapitole.11.1.4 Testování předpokladů regresní analýzyPředpoklady o reziduích jsou vysloveny pro teoretická rezidua εi, která jsou všaknedostupná. Je tedy potřeba ověřit alespoň vlastnosti empirických reziduí e i . Ta však získámeaž po nalezení regresní funkce, takže vzorec pro nalezení vektoru b r je nutné použít dříve, nežbudou předpoklady ověřeny. Teprve potom se ověří. Jsou-li splněny, nalezená regresní funkcese ponechá, nejsou-li splněny, je nutné buď upravit data tak, aby byl problém odstraněn, nebopoužít jiné postupy, které jsou schopné problém překonat bez úpravy dat.Vraťte se ke kapitole 11.1.2, připomeňte si předpoklady a v dalším <strong>text</strong>u se zamyslete nadzpůsobem jejich ověření.Předpoklad č. 1 se ověří snadno: je-li součet reziduí roven nule, je také jejich průměr rovennule a podmínka je splněna.Nesplnění předpokladu č. 2 se nazývá heteroskedasticita. Nesplnění znamená, žeD(ε i ) = σ i 2 nebo jinak, D(ε i ) ≠ σ 2 .Následky heteroskedasticity:odhad je nestranný a konzistentní, ale není eficientní.Testování reziduí na heteroskedasticitu se provádí mnoha způsoby a existuje také grafickýprojev heteroskedasticity.Test 1 (párový koeficient korelace)Nulová hypotézaH 0 : ρ (|ε|, t) = 0H 1 : ρ (|ε|, t) ≠ 0Testovacím kriteriem je koeficient korelace mezi absolutní hodnotou reziduí a časem měření:r(|e|, t) .Jeho významnost je potřeba také otestovat pomocí kriteriat =r . n − 21−r2169


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ(18)s kritickou hodnotou t n – 2 (α)Závěr celého testu heteroskedasticity: je-li t < t n – 2 (α) je korelace nevýznamná a H 0 platí.Heteroskedasticita se tedy nepotvrdila.Příklad 3 (Statg, data Nowak):a) Nalezněte regresní funkci y = a + b.x a reziduab) Znázorněte v grafu body [t, abs(e t) ]c) Vypočítejte r(|e|, t) a otestujte významnost rŘešení: Y ) = 36 ,8 + 0, 34Rezidua a jejich absolutní hodnoty jsou v tabulce. Je vidět nárůst reziduí v čase.t y t x t e t ABS(e)1 43 21 -0,93 0,932 43 22 -1,27 1,273 44 25 -1,29 1,294 43 23 -1,06 1,065 48 27 2,02 2,026 46 32 -1,68 1,687 49 30 2,00 2,008 47 37 -2,39 2,399 48 38 -1,73 1,7310 52 32 4,32 4,3211 47 39 -3,07 3,0712 54 34 5,64 5,64Jak se projevuje heteroskedasticita v grafu reziduí:Osa x: čas t; osa y: absolutní hodnoty reziduálních odchylekExcel: ikona/XYbodový/č.1/DokončitData: modré sloupce tabulky.6543Řada12100 5 10 15170


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮr(|e|, t) = 0,83Excel: Nástroje/Analýza dat/KorelaceTest korelačního koeficientu (není v Excelu):0,83. 12 − 2t =21−0,83= 4,71t 12 – 2 (0,05) = 2,228139 (Excel: fx/Statistické/TINV]t > t 10 (0,05) ⇒ H 0 se zamítá, tj. rozptyl není konstantníJe-li y závislé na více proměnných, tj. y = f(x 1 ,x 2 ,…,x k ), nezjistí se tímto testem, kteráproměnná je zdrojem heteroskedasticity. To umožní test GQ.Test 2 (Goldfeld-Quandt, GQ)Základní kroky testuVynechat p prostředních hodnot (je-li n = 30, je doporučená volba p = 8 ⇒p = (n/30).8); p upravit tak, aby obě části byly stejné.Nalézt regresní funkci pro 1. a 2. část, rezidua u obou funkcí, stanovit Σe 1 2 (= součet reziduí1. poloviny), Σe 2 2 (= součet reziduí 2. poloviny)3. Testovací kriteriumT∑∑e22=2e14. Kritická hodnota F G,G (α), kde G = (n – p – 2k) /2k = počet parametrů v regresní funkcip = počet vynechaných hodnot5. T > F G,G (α) ⇒zamítá se H 0 (H o : rozptyl je konstantní)Výhodou testu G-Q je, že odhalí, která proměnná je zdrojem heteroskedasticity.Příklad 4Proveďte test G-Q pro data z příkladu 3.Řešení:Pro test G-Q se data uspořádají podle x:171


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮzadání uspořádat dle x vynechat p = 4y x y x y x43 21 43 21 43 2143 22 43 22 43 2244 25 43 23 43 2343 23 44 25 44 2548 27 48 2746 32 49 3049 30 46 3247 37 52 3248 38 54 34 54 3452 32 47 37 47 3747 39 48 38 48 3854 34 47 39 47 39Hlavní kroky testu:a) najít 2 regresní funkce a příslušné součty čtverců reziduí:4∑11222e1= 0,17; ∑ e2= 5,42b) vypočítat testovací kriterium T = 5,42 / 0,17 = 31,88;c) kritická hodnota* F2 ,2(0,05) = 19 (v Excelu: f x /Statistické/FINV)d) závěr testu: T = 31,88 > 19; jedná se o heteroskedasticituPříklad 5 (data Koutsoyianis)Pro daný soubor proveďte test G-Q podle vzoru v příkladě 4).Regresní funkce má tvar S = a + bx.9S x S(pokrač.) x90 9954 1578 24127131 10508 1654 25604122 10979 1400 26500107 11912 1829 27670406 12747 2200 28300503 13499 2017 27430431 14269 2105 29560588 15522 1600 28150898 16730 2250 32100950 17663 2420 32500779 18575 2570 35250819 19635 1720 335001222 21163 1900 360001702 22880 2100 362002300 38200172


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮOdstranění heteroskedasticitya) Předpokládáme-li, že D(ε t ) = c.x kt 2 , je potřeba najít proměnnou x k způsobujícíhetereskedasticitu.Např. je-li Y t = β 1 x 1t + β 2 x 2t + … + β k x kt + ε t a D(ε t ) = c.x 2t 2 , t = 1,2,…,nPak úprava rovnice (dat) budeY x x x ε= β + β + β + ... + β +xTato úprava vede k odstranění heteroskedasticity, neboťt 1t3tkt t1 2 3k2tx2tx2tx2tx2t⎛ εD⎜⎝ xPříklad 6 (data Nowak; Excel)Odstraňte heteroskedasticitu v příkladě 3.t2t⎞⎟ =⎠12x2tD( ε ) = ctŘešení:Excel: nejprve data seřadit podle x, poté upravitodstranění Hy/x 1/x2,04761905 0,0476191,95454545 0,0454551,86956522 0,0434781,76 0,041,77777778 0,0370371,63333333 0,0333331,4375 0,031251,625 0,031251,58823529 0,0294121,27027027 0,0270271,26315789 0,0263161,20512821 0,025641Výpočet koeficientů pro upravená dataY/x = 0,42 + 1/x 34,38 /.xOdtudY = 0,42x + 34,38Pro srovnání regresní funkce pro původní data má rovniciY= 0,34x + 36,7173


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮNesplnění předpokladu č. 3 se nazývá autokorelace.V případě autokorelace je cov(ε t , ε t – 1 ) ≠ 0Autokorelace se projeví v grafu reziduí jejich systematickým průběhem v čase.Naopak není-li autokorelace v reziduích, kolísají náhodně hodnoty reziduí kolem hodnoty 0.Příčiny autokorelace mohou být různé, např.a) Povaha dat: např. u časových řad s trendem vykazují trend také reziduab) Vynechání proměnné v modeluc) Existence endogenní zpožděné proměnné na místě regresorud) Úpravou date) Chybná volba typu regresní funkceNásledky autokorelace jsou stejné jako u heteroskedasticity:Odhad je nestranný a konzistentní, ale není eficientní.Autokorelaci lze odhalit testem Durbin-Watson.Test Durbin-Watson1. H 0 : cov(ε t , ε t – 1 ) = 0 (tj. ρ = 0)2a. r 1 = r (e t , e t – 1 )2b.d=∑( e − e )n2t= 2 t t−12∑ett=13. Kritická hodnota z tabulek: d L , d U4. Je-li d < d L ⇒ H 0 se zamítád > d U ⇒ H 0 se přijímád L < d < d U nelze tímto testem rozhodnout.Za testovací kritérium pak použijemetr.n −1−21=2 ∼ t n - 1 - 21−r1Pro r 1 < 0 bereme místo d testovací kritérium: d’ = 4 – d174


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮPříklad 7Na základě uvedených údajů proveďte diskusi o autokorelaci reziduí.r 1 = - 0,417 ; d = 2,61 ; n = 20, α = 0,05; d L = 1,2, d U = 1,41.Řešení:Protože r 1 < 0, bereme d’ = 4 – d = 1,39Jelikož 1,2 < d’ < 1,41 , nelze pomocí d´ rozhodnout.Použijeme proto hodnotu r. Testem ověříme významnost− 0,417. 20 −1−2t == 1,89 ;21−( − 0,417)t 20 – 1 – 2 (0,05) = 2,1 ⇒ H 0 se přijímá, tj. ρ = 0.Úprava testovacího kriteria DW na tvar, umožňující jeho snadný odhadPozn.:dnn2− 1 ∑ et− 2∑etet−1+2222= ==nnn222∑ et∑ et∑ et111nn222∑ ( et− et) ∑ ( et− 2etet−1+ et−1)n∑2e2t−2nn 2 et− 2 etet−1221≈ ∑et≈ ∑e22t ⇒ d =≈ 2( 1−ρ1)n2 12en∑∑1∑tnn∑2e2t−1ρ1=cov( e , e )st2et−1=1n∑21n( e − e )( e − e )tt−1∑( et− e )12Odstranění autokorelaceMějme regresní funkciY t = β 1 x 1t + β 2 x 2t + … + β k x kt + ε t175


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮV případě autokorelace se předpokládá, že(a)ε t = ρ.ε t – 1 + a t (a t … nekorelované s a t – 1 )Rovnici (a) napíšeme pro čas (t-1) a vynásobíme ρ :Y t – 1 = β 1 x 1,t-1 + β 2 x 2,t – 1 + … + β k x k,t – 1 + ε t – 1Od rovnice (a) odečteme rovnici (b)/.ρ(b)Y t - ρ.Y t – 1 = β 1 (x 1t - ρ.x 1,t - 1 ) + β 2 (x 2t - ρ.x 2,t – 1 ) + … + (ε t - ρ.ε t – 1 )t = 2,3,…,nPoslední člen je reziduální odchylka: (ε t - ρ.ε t – 1 ) = a ta t je podle předpokladu nekorelované s a t – 1 .Za ρ je zjednodušeně možno zvolit ρ = 1, takže úprava dat bude spočívat jen ve výpočtudiferencí.Při výpočtu máme k dispozici místo teoretické hodnoty ρ její odhad r.Úprava dat tedy bude:***Y, ,2= Y2− rY1 1,x21= x21− r1x11x31= x31− r1x21 atd.ve všech sloupcích.V prvém řádku, kde nelze provést předchozí úpravu, je transformace dat následující:Y*1= Y11−r , x = x 1−r , x = x 1−r21*11Příklad 8 (data Koutsoyiannis)Sleduje se závislost z = a + bx. Prověřte rezidua na autokorelacia) nalezením regresní funkce ve Statgraphics, jehož součástí je i kriterium DWb) výpočtem testovacího kriteria v Excelu (rezidua jsou dána)Řešení:1121*121221176


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮStatgraphicsAnalysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 3,26457E7 1 3,26457E7 1025,40 0,0000Residual 573069,0 18 31837,2-----------------------------------------------------------------------------Total (Corr.) 3,32188E7 19Correlation Coefficient = 0,991337R-squared = 98,2749 percentR-squared (adjusted for d.f.) = 98,179 percentStandard Error of Est. = 178,43Mean absolute error = 128,84Durbin-Watson statistic = 0,937394 (P=0,0018)Lag 1 residual autocorrelation = 0,347367z x e r = e t -e t-1 r^2 e^23748 21777 122,1739 148844010 22418 204,9988 83 6889 420253711 22308 -63,2535 -268 71824 39694004 23319 -52,8526 10 100 28094151 24180 -146,523 -94 8836 216094569 24893 72,17611 219 47961 51844582 25310 -31,3855 -103 10609 9614697 25799 -53,0729 -22 484 28094753 25886 -21,3916 32 1024 4415062 26868 13,11555 34 1156 1695669 28134 266,2377 253 64009 707565628 29091 -42,2671 -308 94864 17645736 29450 -34,6163 7 49 12255946 30705 -175,419 -140 19600 306256501 32372 -86,3864 89 7921 73966549 33152 -256,415 -170 28900 655366705 33764 -271,484 -15 225 734417104 34411 -53,3365 218 47524 28097609 35429 167,1077 220 48400 278898100 36200 442,5944 276 76176 196249536551 572550dw 0,937125Příklad 9 (data Alonso)Sleduje se závislost y = a + bx. Prověřte rezidua na autokorelacia) nalezením regresní funkce ve Statgraphics, jehož součástí je i kriterium DWb) výpočtem testovacího kriteria v Excelu (rezidua jsou dána)Řešení:177


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮStatgraphicsAnalysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 8,71999 1 8,71999 1017,17 0,0000Residual 0,128592 15 0,0085728-----------------------------------------------------------------------------Total (Corr.) 8,84858 16Correlation Coefficient = 0,992707R-squared = 98,5468 percentR-squared (adjusted for d.f.) = 98,4499 percentStandard Error of Est. = 0,0925894Mean absolute error = 0,0773324Durbin-Watson statistic = 0,634431 (P=0,0001)Lag 1 residual autocorrelation = 0,57101Excely x e (e t -e t-1 )^2 e^26,656 6,557 0,115862 0,0134246,692 6,599 0,053194 0,003927 0,002836,667 6,643 -0,07517 0,016478 0,0056516,709 6,624 0,011464 0,007506 0,0001316,825 6,647 0,073432 0,00384 0,0053927,091 6,759 0,076319 8,34E-06 0,0058257,183 6,848 -0,04076 0,013708 0,0016627,306 6,932 -0,1151 0,005526 0,0132477,518 6,992 -0,04405 0,005048 0,001947,666 7,061 -0,05815 0,000199 0,0033817,762 7,139 -0,14539 0,007611 0,0211377,896 7,180 -0,1077 0,00142 0,01168,077 7,236 -0,05826 0,002445 0,0033948,294 7,309 -0,01275 0,002071 0,0001638,507 7,367 0,063993 0,00589 0,0040958,688 7,412 0,139278 0,005668 0,0193988,844 7,485 0,123784 0,00024 0,0153220,081583 0,128592DW 0,634431Pro zjednodušení transformace dat se volí r = 1, takže se počítají jen diference.Často vede ke zlepšení ještě jednodušší úprava: na pravou stranu se zařadíy(-1), tj. zpožděná endogenní proměnná. Při kontrole autokorelace upravených dat (na pravéstraně je zpožděná proměnná) se musí provést místo DW test DurbinDW nh = ( 1−)22 1−n.s (s 2 ( ) je rozptyl koeficientu endogenní zpožděné proměnnéb ib i)178


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮPříklad 10 (Statg.; data Nowak )Proveďte úpravu dat vedoucí k odstranění autokorelace; je dáno r 1 = - 0,403Pozn.Ve Stagtgraphics :Lag 1 residual autocorrelation = -0,418766Řešení:Původní data (x,y), upravená data (y*, x*)Upravená dataDatay* x* y x15,47 33,4 16,9 36,526,71 53,81 19,9 39,127,42 59,86 19,4 44,127,72 63,27 19,9 45,526,52 67,34 18,5 4927,56 76,15 20,1 56,429,3 89,13 21,2 66,430,44 107,16 21,9 80,933,03 125,92 24,2 93,433,75 147,14 24 109,532,87 167,73 23,2 123,635,85 181,41 26,5 131,635,78 202,92 25,1 149,139,72 217,69 29,6 157,643,63 237,11 31,7 173,641,08 251,87 28,3 181,942,7 266,61 31,3 193,341,51 267,48 28,9 18944,15 266,47 32,5 190,340,1 265,59 27 188,9Předpoklad č. 4 o normalitě reziduí lze prověřit pohodlně grafickými metodami, napříkladv normálním pravděpodobnostním grafu.Tak např. pro data (x,y) v tabulce byla nalezena regresní přímka a reziduální odchylky:y x e6,656 6,557 0,1158626,692 6,599 0,0531946,667 6,643 -0,075176,709 6,624 0,0114646,825 6,647 0,0734327,091 6,759 0,0763197,183 6,848 -0,040767,306 6,932 -0,11517,518 6,992 -0,044057,666 7,061 -0,058157,762 7,139 -0,145397,896 7,180 -0,1077179


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ8,077 7,236 -0,058268,294 7,309 -0,012758,507 7,367 0,0639938,688 7,412 0,1392788,844 7,485 0,123784Příslušný normální pravděpodobnostní grafNormal Probability Plotpercentage99,99995805020510,1-0,15-0,1-0,050 0,050,10,15ePokud body „dobře přiléhají“ k přímce, mají data N rozdělení.Předpoklad č. 5 o tom, že matice X je nenáhodná, tedy že data v ní uložená nejsou zatíženánáhodnými chybami, se neprověřuje.Předpoklad č. 6 o lineární nezávislosti sloupců v matici X je velmi závažný a měl by setestovat vždy. Nesplnění předpokladu č. 6 se nazývá multikolinearita.Rozlišuje se:a) multikolinearita přesná: jedna exogenní proměnná je přesně lineární kombinací ostatních.Pak X T X je singulární ⇒ detekce je snadná: výpočet neproběhneb) multikolinearita zdánlivá: jedna exogenní proměnná je přibližně lineární kombinacíostatníchDůsledek: extrémně velký rozptyl odhadu β i180


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮJednou z možností odhalení multikolinearity je použití testu modelu, který je dostupný vždy.Jeho základní verze má tvarr r1. H o:β = or r:β ≠ oH 12.TSY= )Se/( k −1)/( n − k)3. F ( )k−1,n−kα4. Je-li T > ( ) , zamítá se H oF k −1,n−kαDosadíme-li do tohoto testu za závisle proměnnou postupně argumenty x 1 ,x 2 ,...,x k budetestem prověřeno, zda je možné modelovat příslušné x i pomocí zbývajících. Je-li to možné,pak je v matici multikolinearita.Typickým projevem multikolinearity je, že při testu významnosti koeficientů (H o : βi = 0) platírH o (= všechny koeficienty jsou nulové) a současně v testu modelu H o neplatí (H o : β ≠ 0 ).Příklad 11 (projev multikolinearity) (data Alonso)Sleduje se závislost výdajů (Y) na příjmech (x 2 ) a úsporách (x 3 ).Nalezněte regresní funkci, proveďte test koeficientů a test modelu avýsledky porovnejte (projev multikolinearity).Y 32 11 15 17 16 13 18 20 14 17 41 17 33 20 18x 2 36 12 16 18 17 14 20 23 15 18 50 19 37 22 19x 3 144 47 63 70 67 52 79 90 58 70 204 76 149 86 76Uvažuje se regresní funkce: y = β 1 + β 2 x 2 + β 3 x 3Řešení:StatgraphicsStandardTParameter Estimate Error Statistic P-Value-----------------------------------------------------------------------------CONSTANT 1,54174 0,82426 1,87045 0,0860x2 1,40731 0,724192 1,94329 0,0758x3 -0,145742 0,174853 -0,833515 0,4208-----------------------------------------------------------------------------Analysis of Variance-----------------------------------------------------------------------------Source Sum of Squares Df Mean Square F-Ratio P-Value-----------------------------------------------------------------------------Model 990,048 2 495,024 1044,85 0,0000Residual 5,6853 12 0,473775-----------------------------------------------------------------------------181


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮExcelANOVARozdíl SS MS FVýznamnostFRegrese 2 990,048 495,024 1044,851 3,46466E-14Rezidua 12 5,685297 0,473775Celkem 14 995,7333KoeficientyChyba stř.hodnotyt statHodnotaP Dolní 95%Horní95%-0,254168305 3,337649Hranice 1,54174 0,82426 1,870453 0,086001Soubor X1 1,407312 0,724192 1,943287 0,075809 -0,17056609 2,98519Soubor X2 -0,14574 0,174853 -0,83352 0,420836 -0,52671324 0,235229S poznatků uvedených dosud o regresní analýze je patrné, že výpočet regresních koeficientůje rutinní záležitost, avšak provede se až po sérií testů, které se týkají zejménaa) předpokladů regresní analýzyb) výsledků měření Y ic) regresních koeficientůd) regresního modelu11.1.5 Zobecněná metoda nejmenších čtverců (GLS)Při nesplnění druhého resp. třetího předpokladu regresní analýzy je možné postupovat dvěmazpůsobya) odstranit heteroskedasticitu resp. autokorelaci postupem, uvedeným v kap. 11.1.4 apotom použít metodu nejmenších čtverců (LS) z kap.11.1.1b) neupravovat data, tj. ponechat je s problémem heteroskedasticity resp. autokorelace apoužít zobecněnou metodu nejmenších čtverců (GLS).Zobecněné metodě nejmenších čtverců je věnována tato kapitola.Klasický model lineární regrese má tvarr r rY = X ⋅ β + ε, var (ε) =Zobecněný model lineární regrese (Aitkenův) je vyjádřen ve tvaru2σ⋅ Ir r rY = X ⋅β+ ε, var (ε) = σ2 ⋅ V , V ≠ I,V je pozitivně definitní matice, z čehož plynou dále potřebné vlastnosti182


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ−1Ta) V = P ⋅ Pb)PVPT =IVynásobením klasického modelu maticí P a po výpočtu varianční matice nových(transformovaných) reziduí dostávámer rP ⋅ Y = P ⋅ X ⋅ β + P ⋅ εr r Tvar (P ⋅ ε) = P ⋅ var(ε)⋅ Pr2 T 2var(P⋅ ε) = P ⋅ σ ⋅ V ⋅ P = σ ⋅ IOznačíme-lir r = ,P.Y = Y*, PX = X*, Pε ε *pak můžeme psátr rY* = X * ⋅ β + ε *Při odhadu β r v této rovnici je možné postupovat dvěma způsoby:a) transformovat data (tj. vypočítat X*, Y*) a použít LS:rT −1T Tβ = (X * ⋅X*)⋅ X * ⋅Y * ;Zde je potřeba matice P.b) ponechat původní data a použít GLS, kterou získáme po dosazení za X*,Y*rβ =T−1TT −1−1T −1[(PX)⋅(PX)] ⋅(PX)⋅ PY = (X V X) ⋅ X V Y = GLSZde je potřeba matice V.V dalším se soustředíme na sestavení matice P resp. V. Matice V má různý tvar proheteroskedasticitu a pro autokorelaci.;2⎡σ1Pro heteroskedasticitu, kdy D (ε i ) ≠ σ 2 ⎢, máme místo I matici V = ⎢ 0⎢ 0⎢⎢ ...0σ220...00σ23...... ⎤⎥... ⎥ ;... ⎥⎥...⎥Potom inverzní matice k V a matice P zde budou183


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ⎡ 1⎤⎢0 0 ...2σ⎥1⎢⎥⎢ 1 ⎥−10 0 ...2V = ⎢ σ ⎥ ,2⎢1 ⎥⎢ 0 0 ... ⎥2⎢ σ3 ⎥⎢ ... ... ... ...⎥⎡ 1⎢σ1⎢⎢ 0P = ⎢⎢⎢ 0⎢⎢ ...01σ20...001σ3...⎤... ⎥⎥... ⎥⎥⎥... ⎥⎥...⎥Pro autokorelaci, kdy cov (ε i ,ε j ) ≠ 0, máme místo I matici2⎡ σ⎢⎢σ21V =⎢σ31⎢⎢ ...σσσ12232...σσσ13232...⎡⎢ 1... ⎤⎥ ⎢...σ21⎥ ⎢= 2⎥ ⎢ σ...⎥ ⎢σ31...⎥ ⎢ 2σ⎢ ...σσ1221σ322σ...σσσσ1322321...⎤... ⎥ ⎡ 1⎥(1)⎢... ⎥= ⎢ρ1⎥ ⎢ρ21⎥... ⎢⎥ ⎢ ......⎥ρ1ρ11...ρρ211...... ⎤ ⎡ 1⎢...⎥(2)⎥ = ⎢ρ1⎥ ⎢2... ρ1⎥ ⎢... ⎥⎢...ρ1ρ11...ρρ2111...... ⎤⎥... ⎥... ⎥⎥...⎥Inverzní matice k V a matice P zde budou⎡ 1 − ρ10 ... ⎤⎢2 ⎥−11 ⎢− ρ11+ρ1− ρ1...V = ⋅⎥2,1−ρ ⎢ 0 − ρ 1 ... ⎥11⎢⎥⎢ ... ... ... ... ⎥P =⎡⎢1 ⎢21−ρ⎢⎢⎢1−ρ− ρ0...12101− ρ...1001...... ⎤⎥... ⎥... ⎥⎥...⎥Například pro matici V 3x3 bude v případě heteroskedasticity počítána matice V -1 v těchtokrocích:⎡ 1⎢= ⎢ ρ⎢2⎣ρρ1ρ2ρ ⎤⎥ρ ⎥1 ⎥⎦V,V=4 4 4 2 22 41+ρ + ρ + ρ − ρ − ρ = 1−2 ⋅ρ+ ρ = (1−ρ2)2A 11 = 1 - ρ 2 A 21 = ρ - ρ 3 A 31 = ρ 2 1 - ρ 2 1 = 0A 12 = ρ - ρ 3 A 22 = 1 - ρ 4 A 32 = ρ - ρ 3A 13 = ρ 2 - ρ 2 = 0 A 23 = ρ - ρ 3 A 33 = 1 – ρ 2V−1=2( 1−ρ )⎡ 1⎢⋅ ⎢−⎢⎣23− ρ − ( ρ − ρ ) 0 ⎤ ⎡ 1 − ρ 0 ⎤343 ⎥ 1( ρ − ρ ) 1−ρ − ( ρ − ρ ) = ⋅⎢⎥ ⎢− ρ 1+ρ − ρ21−ρ( ) ⎥ ⎢⎥ ⎥⎥ 320 − ρ − ρ 1−ρ⎣ 0 − ρ 1 ⎦1 22⎦184


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ⋅ P =1P T 121−ρ⎡⎢⎢⎢⎢⎣1−ρ002− ρ100 ⎤⎥− ρ⎥⋅1 ⎥⎥⎦121−ρ⎡⎢⎢⎢⎢⎣1−ρ− ρ0201− ρ0⎤⎥0⎥=1⎥⎥⎦=21−ρ2⎡1− ρ + ρ⎢⎢ − ρ⎢⎣ 0− ρ1 221+ρ− ρ0 ⎤⎥− ρ⎥= V −1 ⎥⎦Metoda GLS zdánlivě překoná problém heteroskedasticity resp. autokorelace bez potřebnétransformace dat, jak byla uvedena v kap.11.1.4. Porovnáme-li ovšem kroky GLSs transformací dat je zřejmé, že v GLS proběhne stejná úprava dat. Porovnáme nyní oběmetody na příkladě.Porovnání výsledku dat po úpravě rovnice a po násobení maticí P- pro heteroskedasticituNechť D (ε t ) = k.x 22Nejprve úprava dat:Yt= β x + β x + ... + β x1 t12 t 2k tk / .1/x t2 , t = 1, 2, 3, …,nx__________________________________t = 1:t = 2:t = n:Vstupní data mají tvarYx...tt1= β1⋅ + β2⋅ + + βkt 2xt2YxYxx1x⋅xtkt 2111= β1⋅ + β2+ ... + βk⋅12x12x2= β ⋅ 2112...k22x+ β + + β ⋅22… … …Yxnn2xn1= β1⋅ + β2+ ... + βkxn2xx1kx12x2k22x⋅xnkn2i x 1 x 2 … x k Y i1 x 11 x 12 … x 1k Y 12 x 21 x 22 … x 2k Y 23 x 31 x 32 … x 3k Y 3… … … … … …n x n1 x n2 … x nk Y n185


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮČerveně je označen proměnná, jež je příčinou heteroskedasticity.Nyní provedeme násobení matice X vektorem P:⎡ 1⎢x12⎢⎢ 0⎢X* = P ⋅ X = ⎢⎢ 0⎢⎢ ...⎢⎢ 0⎣01x220...0001x32...0...............⎤0⎥⎥ ⎡x110 ⎥ ⎢⎥ ⎢x21⎥ ⋅ ⎢x310 ⎥ ⎢⎥ ⎢ ...... ⎥ ⎢⎥ ⎣xn11x⎥n2 ⎦xxxx122232...n2...............⎡ x11x1k⎤ ⎢⎥ x⎢12x2k⎥ ⎢ x21x ⎥3k= ⎢x22⎥...⎢⎥...⎢⎥xn1xnk ⎦ ⎢⎢⎣xn2x12x12x22x22...xn2xn2xxxx131223x22...xn3n2............x1k⎤x⎥12⎥x2k ⎥x ⎥22... ⎥x ⎥nk⎥xn2 ⎥⎦Oba způsoby dávají tytéž výsledky.- pro autokorelaci dostáváme pro Y :Y *= P ⋅ Y⎡⎢=⎢⎢⎢⎢1−ρ− ρ0...201− ρ...001...............0⎤Y2⎡ 1 ⎤ ⎡ Y ...1⋅ 1−ρ ⎤⎥ ⎢Y⎥ ⎢⎥0⎥2 ⎢−ρ ⋅ Y Y ...1+2⋅ ⎢ ⎥ =⎥0⎥⎢Y⎥ ⎢3 − ρ ⋅ Y Y ⎥...2+3⎥ ⎢ ⎥ ⎢⎥...⎥ ⎢ ... ⎥⎢ ...⎥...YYY*1*2*3...což je totéž jako při výpočtu diferencí.Podobně X * = PX:*X⎡⎢= ⎢⎢⎢⎣1−ρ−ρ0201−ρ0⎤⎡x⎥0⎢⎥⋅⎢x1⎥⎥⎢⎣x⎦112131xxx122232xxx1323332⎤ ⎡ x111−ρ⎥ ⎢⎥= ⎢−ρx11+ x⎥ ⎢⎦ ⎢−ρx21+ x⎣2131x12−ρx−ρx1−ρ1222+ x2+ x2232x13−ρx−ρx1−ρ13232+ x+ x2333⎤...⎥⎥...⎥⎥...⎦xxx*1*2*3Počínaje druhým řádkem jsou v matici X* v každém sloupci rozdíly 2, 3, ... , n-tého řádkus ρ-násobkem předchozího. Z prvého řádku je nyní vidět, proč byla v kapitole Odstraněníautokorelace provedena tato úprava.Shrnutí kapitoly 11.1V této kapitole byly uvedeny základní pojmy regresní analýzy, prezentováno osmnejdůležitějších vět regresní analýzy včetně předpokladů, za kterých lze uvedené věty použít.186


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮKe všem předpokladům jsou také uvedeny způsoby jejich prověření, důsledky nesplněnípředpokladů a způsob úpravy dat, který vede k odstranění problému s nesplněnímnejzávažnějších předpokladů č. 2, 3 a 5. Byla ukázána souvislost DOE s problematikouregresní analýzy.Otázky ke kapitole 11.11. Napište teoretickou a empirickou regresní funkci. V čem se liší?2. Jak se značí empirické a teoretické reziduální odchylky?3. Znázorněte v obrázku empirickou hodnotu závisle proměnné, příslušnou teoretickouhodnotu a reziduální odchylku.4. Napište soustavu regresních rovnic v rozepsaném a maticovém tvaru5. Napište matici X6. Vyjádřete MNČ v rozepsaném tvaru a pomocí vektorů7. Napište předpoklady regresní analýzy8. Napište předpoklady regresní analýzy v maticovém vyjádření9. Napište a dokažte větu 1 o výpočtu regresních koeficientů b i .10. Napište a dokažte větu 2 o vlastnostech odhadu regresních koeficientů11. Napište pomocné věty 3 – 6. K čemu slouží?12. Napište a dokažte větu 7. Které věty použijete k důkazu?13. K čemu slouží věta 7?14. Napište větu 8. K čemu slouží?15. Jak provedete intervalový odhad β i ?16. Uveďte dva způsoby výpočtu teoretických hodnot. Jak se značí teoretické hodnoty?17. Napište všechny body testu regresních koeficientů18. Napište v maticovém tvaru vztah pro výpočet predikce.19. Jak se počítá rozptyl predikce?20. Jak se počítá matice H?21. Jak se počítá i-tý řádek matice H?22. K čemu slouží matice H?23. Uveďte dvě vlastnosti prvku h ii24. Jak se počítají normovaná a studentizovaná rezidua?25. Jak se počítá D(e i )? Dokažte.26. Jak se počítá robustní odhad regresních koeficientů v regresní přímce?27. Co je heteroskedasticita?28. Napište všechny body testu Goldfeld Quandt29. Jak se počítá a upravuje p v testu Goldfeld Quandt?30. Jak se počítá G v testu Goldfeld Quandt?31. Jak se odhalí heteroskedasticita pomocí r?32. Jak se projeví heteroskedasticita v grafu reziduí?33. Co způsobí heteroskedasticita?34. Jak se odstraní heteroskedasticita?35. Co je autokorelace, jak se projeví v grafu reziduí?36. Napište všechny body testu Durbin Watson37. Upravte testovací kriterium testu DW na tvar DW ≈ 2(1− r)38. V jakých mezích se vyskytuje DW a proč?39. Jaká hodnota DW je ideální?40. Co způsobuje autokorelace?187


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ41. Jak se odstraní autokorelace?42. Napište maticově klasický a zobecněný regresní model43. Proveďte odvození metody GLS44. Ukažte, že pro V = I je GLS = LS45. Nalezněte matici V -1 a P pro heteroskedasticitu46. Nalezněte matici V -1 a P pro autokorelaci11.2 Časové řadyCíl kapitolya) vysvětlit základní pojmy teorie časovýchb) ukázat metody modelování časových řad klasickou metodikou a Box- Jenkinsovou metodikouVýkladPo nalezení modelu, a po provedení výše uvedený testů, jsou pak možné jeho různé aplikace.Regresní modely se v ekonomických aplikacích používají zejména proto, že umožňujípredikci (extrapolaci) vývoje sledovaných ukazatelů. V technických aplikacích slouží ovšemtaké pro potřeby interpolace, regulace procesů apod.Pokud jde o predikci, je další často používanou cestou využití časových řad. Jelikož přihledání modelů časových řad je významnou součástí také regresní analýza, uvádíme tutoproblematiku v rámci širších souvislostí DOE v této kapitole.Časová řada (ČŘ) je posloupnost hodnot uspořádaných v čase od nejstarších k nejnovějším.y , x atdZnačí se { }{ } .Graf ČŘ:tty tt (čas)U ČŘ se zejménaa) počítají charakteristiky ČŘb) hledá model ČŘ188


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮJsou dvě základní strategie studia časových řad:a) klasická metodikab) Box - Jenkinsova metodikaV obou se řeší výše uvedené dvě úlohy, avšak zcela odlišným přístupem.Časové řadyKlasická metodikaBox Jenkinsova metodika1. Charakteristiky 1. Charakteristiky2. Model: y t = T t + C t + S t + e t 2. Modely: AR,MA,ARMANalezení trendové složky je možnéDalší modely např. ARIMA, SARIMA aj.a) MNČb) modifikací MNČc) jinak než s použitím MNČNalezeni C t a S t : stejněStudium ekonomických aplikací časových řad a regresní analýzy (RA) a to i za situacenesplnění předpokladů klasické regresní analýzy (modifikovaná RA) je předmětem disciplíny,která se nazývá ekonometrie.EkonometrieČasové řadyRegresní analýza(modifikovaná)Ta užívá poněkud jinou terminologii a symboliku pro proměnné.Můžeme říci, že proměnné v ekonometrii mají, ve srovnání s matematikou, tyto dvě odlišnostia) Opatřují se časovým indexem, tzn. sleduje se, z jakého pochází času.Např. x t , x t-1 , y t-2b) Jsou jinak pojmenované:1. endogenní ( = závisle proměnná): y t resp.y it např. y 1t , y 2t, …2. predeterminované ( = nezávisle proměnná)a) exogenní: x it ,x it-1 ,b) endogenní zpožděné y i,t-1 , y i,t-2 , …např. y 1,t-1 , y 2,t-2 , atd.11.2.1 Klasická metodika analýzy časových řadCharakteristiky časové řadyPopisné charakteristikyn11. Průměr ČŘ y = ∑nt = 1yt189


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮČasová řada, která nevykazuje v čase trend, ale kolísá náhodně kolem své střední hodnoty, senazývá stacionární podle střední hodnoty.Charakteristika y má smysl jen u stacionárních ČŘ.∑2. Rozptyl ČŘ s = ( y − y )2 1ynnt = 1t(20)Časová řada, která nevykazuje v čase trend rozptylu (zvětšování nebo zmenšování), se nazývástacionární podle rozptylu.Přítomnost obou stacionarit v ČŘ se posuzuje nejčastěji vizuálně.Dynamické charakteristiky3. Absolutní přírůstek: Δ yt= yt− yt −1(21)4. Koeficient růstu:Například pro obecné údaje budeKt=yytt −1(22)Rok y t Δy t K t1985 y 11986 y 2 y 2 – y 1 y 2 / y 11987 y 3 y 3 – y 2 y 3 / y 21988 y 4 y 4 – y 3 y 4 / y 31989 y 5 y 5 – y 4 y 5 / y 4Průměrný koeficient růstuyyy2 3 4 5k = 4 ⋅ ⋅ ⋅ = 41y2y3y4yyyy51(23)ObecněPrůměrný absolutní přírůstekky= n −1ny1(24)Δ =( y − y ) + ( y − y ) + ( y − y ) + ( y − y )2 1 3 2 4 3 5 4y5y14=−4(25)190


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮObecněΔ =y n− y1n −1(26)Příklad 12Pro dané údaje vypočítat průměrný absolutní přírůstek a průměrný koeficient růstu.Δy K Rok těžbay tt t1985 12861986 1363 77 1,0591987 1393 30 1,0221988 1495 102 1,0731989 1571 76 1,0511990 1610 39 1,025Řešení:1610 −1286Δ == 64,8 ⇒ za 6 let rostla těžba průměrně o 64,851610k = 5 = 1,045 ⇒ v průměru rostla těžba o 4,5%1286Modely časové řadyModely slouží zejména k predikci (prognóze, předpovědi) vývoje sledovaného znaku y.Při modelování ČŘ se u klasické metodiky analýzy řad vychází z předpokladu, že ČŘ může obsahovat 4 druhypohybu:y t = T t + C t + S t + ε tT t = trend; jeho určení je zásadní úkol v analýze ČŘC t = cyklická složka = dlouhodobé pravidelné kolísání okolo trendu(jeho sledování vyžaduje dlouhou ČŘ)S t = sezónní složka = kolísání s periodou menší než 1 rokε t = náhodné kolísání (tato složka je vždy)Následující příklad ukazuje, jak se projeví v grafu ČŘ nepřítomnost některé ze čtyř složek. Poznamenejmeovšem, že náhodná složky musí být přítomna vždy, má-li se jednat o ČŘ.Příklady průběhu časových řad, když chybí některá složka rozkladu y t :191


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮy t1. y t = T t + ε tT tεty tS t2. y t = T t + S t + ε teε tt3. y t = k + S t + ε t (nemá trend)y tε tS tkt192


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ4. y t = k + ε ty tktNalezení trendové složky T t je úloha, která může být řešena řadou metod. Jednou z nich jeregresní analýza, která byla probírána v předchozí kapitole a nebude proto dále řešena.Další možností jsou speciální postupy, z nichž uvedeme tři: logistický trend, metoduklouzavých průměrů a metodu exponenciálního vyrovnání ČŘ.a) Logistický trendy=1+kb obt1(27)patří mezi tzv. S křivky.Použití: modelování poptávky po zboží dlouhodobé spotřeby a modelování prodeje některýchdruhů výrobků.Místo MNČ se zde používá metoda vybraných bodů:Pro tři časy t 1 , t 2 a t 3 se zjistí y 1 , y 2 a y 3 . Tím se získá soustava rovnicy1=1+kb obt11y2=1+ko b bt12y3=1+ko b bt13Výhodné je volit časy t 1 , t 2 a t 3 takto: t 1 = 0, t 2 = Δ a t 3 =2 Δ,193


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮkde Δ je určitý časový úsek.Potombo=k −y12y1 ⎡ y1(k − y2) ⎤ t22y1y2y3− y2( y1+ y3), b1= ⎥ , k =21y2( k − y1)y1y3− y2⎢⎣⎦b) Klouzavé průměry:Posloupnost hodnot ČŘ nahradíme novou řadou průměrů, vypočítaných z kratších úseků ČŘ,při čemž tyto úseky postupně posouváme (kloužeme).Délka úseku, ze kterého se počítá průměr, se u neperiodických ČŘ volí jako lichý počethodnot y t , např. 3, 5,7. Lichý proto, že vypočítaný průměr se přiřadí prostřední hodnotě.U periodických ČŘ se volí délka klouzavé části shodná s délkou periody.c) Exponenciální vyrovnání:Hodnota y z času t, tzn. y t , se tzv. vyrovná (vyjádří) pomocí hodnot y 1 , y 2 , y 3 ,…, y t tak, žekaždé hodnotě se přiřadí tzv. váha w. Čím starší je y t , tím menší váha je jí přiřazena.Pro první vyrovnanou hodnotu ŷ1 se volí různé strategie, např.a) položí se rovna y 1 : y ˆ1= y1b) za 1y se dosadí průměr předchozí části ČŘDalší vyrovnané hodnoty definujeme rekurentním vztahemt = 2,3,…,ny ˆt(1) ˆ= wyt+ − w yt−1(28)Napříkladyˆ2= wy ˆ2+ (1 − w)y1yˆ3= wy ˆ3+ (1 − w)y2atd.Jak se dělá predikce u klouzavých průměrů a exp. vyrovnání:v obou případecha) dělá se jen na 1 krok dopředub) poslední klouzavý průměr resp. exponenciální vyrovnání je predikce na 1 krokdopředu194


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮyˆ (1) = ˆty tChyba predikceaˆ t + 1= yt+ 1− yt(1)Příklad 13 (logistický trend)V tabulce jsou údaje o počtu vyrobených polovodičů v letech 1985 – 95:t 85 86 87 88 89 90 91 92 93 94 95t′ 0 1 2 3 4 5 6 7 8 9 10y 5 6 9 16 22 25 32 34 41 44 45Tendenci vývoje popište logistickou trendovou funkcíky =t1+ β β 1o(29)Řešení:Zavedeme novou časovou proměnnou t′ (druhý řádek). Z časové řady vybereme tři hodnotyy 1 ,y 2 a y 3 , ve kterých položíme teoretické hodnoty rovny empirickým: y = yˆ.y 1 (0) = 5, y 2 (5) = 25 a y 3 (10) = 45, kde t ′ = , t′= 5, t′10.102 3=Nyní odhadneme parametry trendové funkce2yyk =2y3− y2( y2y y − y1322+ y3)2.5.25.45 − 25 (5 + 45)=25.45 − 251 21=50b ok − y=y150 − 5=51=9⎡ yb1= ⎢⎣ y11(t′2512k − y2) ⎤⎥( k − y1)⎦⎡5(50− 25) ⎤= ⎢25(50 5)⎥⎣ − ⎦= 0,644Odhad logistického trendu jeˆ501+9.0,644y =t′195


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮNapříklad pro rok 1996 tj. t ′ = 11 bude50y ˆ =49,61111+9.0,644=Příklad 14 (klouzavé průměry, exponenciální vyrovnání)Údaje o spotřebě pitné vody (y i ) za 3 týdny:den y i kl.průměry ex.vyrov.Po 0,64 0,640U 0,78 0,738St 0,93 0,872Č 0,66 0,896 0,724Pá 0,99 0,911 0,910So 1,22 0,890 1,127N 1,05 0,874 1,073Po 0,75 0,870 0,847U 0,63 0,914 0,695St 0,82 0,833 0,783Č 0,63 0,869 0,676Pá 1,30 0,839 1,113So 0,65 0,836 0,789N 1,30 0,819 1,147Po 0,54 0,809 0,722U 0,61 0,736 0,644St 0,70 0,829 0,683Č 0,56 0,820 0,597Pá 0,79 0,732So 1,30 1,130N 1,24 1,207a) Vyrovnat řadu prostými klouzavými průměryb) Vyrovnat ČŘ metodou exponenciálního vyrovnání; volte w = 0,7.Řešení:a) Klouzavé průměry budou počítány z týdenních hodnot a přiřazeny prostřednímu dni,tj. Čt:Výpočet (Excel):y0,64 + 0,78 + 0,93 + 0,66 + 0,99 + 1,22 + 1,05=71=0,78 + 0,93 + ... + 1,05 + 0,75y =7atd.Graf Excel: / Spojnicový (typ č.4)2=0,9110,896196


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ1,41,210,80,6Řada1Řada20,40,201 3 5 7 9 11 13 15 17 19 21Výpočet STATGRAPHICS (klouzavé průměry)1) Nalezení modelu: Special/ Time Series/ Smoothing2) Predikce: ikona Tabular Option/ Forecast TablePozn.: změna klouzavé části: pravé tlačítko myši(na graf): Pane/Optionb) exponenciální vyrovnání: w = 0,7Excel:y ˆty ˆ1= y1w.y + (1 − w).yˆ=tt−1t = 2, 3, … , n :t = 1: y ˆ1= 0, 64t = 2: y ˆ ˆ2= 0,7. y2+ (1 − 0,7). y1= 0,7.0,78 + 0,3.0,64 = 0, 738t = 3: y ˆ ˆ3= w.y3+ (1 − w).y2= 0,7.0,93 + 0,3.0,738 = 0, 872t = 4: y ˆ ˆ4= w.y4+ (1 − w).y3= 0,7.0,66 + 0,3.0,872 = 0, 724atd.Excel: Graf / Spojnicový (typ č.4)Řada 1 = y i , řada 2 = exp. vyrovnání197


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ1,41,210,80,6Řada1Řada20,40,201 3 5 7 9 11 13 15 17 19 21STATGRAPHICS (exponenciální vyrovnání)a) Special/ Time Series/ Forecastingb) Výběr modelu: Pravé tlačítko myši:Analysis Option/ Simple Exp. SmoothingRegresní metoda modelování sezónní složkyPředpokládejme aditivní dekompozici y t = T t + S t + e tSezónní složku vyjadřujeme pomocí umělých nula jedničkových proměnných, kterénabývají jedničku, nachází li se ČŘ v uvažované sezóně a jinak nulu. Např. u dvanáctiměsíčnísezónnosti budou pomocné proměnné Dj pro j = 1,2,…,12:D1 = (1,0,0,0,0,0,0,0,0,0,0,0) pro leden,D2 = (0,1,0,0,0,0,0,0,0,0,0,0) pro únor,atd.D12 = (0,0,0,0,0,0,0,0,0,0,0,1) pro prosinec.Je-li v modelu absolutní člen, vynechá se D 1 (nebo jiné D i ) kvůli multikolinearitě (součet vřádcích pro D i dává jedna = sloupci jedniček u absolutního členu).Model sezónní složky ČŘ- bez trendu (a bez absolutního členu):y +t= β1D1+ β2D2+ β3D3+ ... + β12D12a tPozn.: v tomto případě se nepoužije sloupec t (s časy 1,2,3,…). Mohou být všechna Di.- s lineárním trendem bez absolutního členu:198


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮy β0β β β ... β +t= t +1D1+2D2+3D3+ +12D12a tPozn.: mohou být všechna Di- s lineárním trendem a absolutním členem: zde je max. s-1 sezón (bez D 1 )y β0β β β ... β +t= +1t+2D2+3D3+ +12D12a tPozn.1: Nelze použít všechna Di !Pozn.2: Umělé proměnné se v regresní analýze používají např. ua) kvalitativní proměnné (viz DOE)b) složené regresní funkcePříklad 15Řada má čtvrtletní sezónnost.Najděte sezónní model s trendovou (lineární) částí a s absolutním členemmetodou využívající pomocnou proměnnouZnázorněte původní (y) a vyrovnanou (yt) č.ř (s Excelem).t y1 212 233 314 155 206 257 308 149 2210 2511 3312 2213 2114 2415 3016 16199


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮData pro modelování sezónní složky:Čas y d1 d2 d3 d4 PREDICTED1 21 1 0 0 0 20,42 23 0 1 0 0 23,653 31 0 0 1 0 30,44 15 0 0 0 1 16,155 20 1 0 0 0 20,86 25 0 1 0 0 24,057 30 0 0 1 0 30,88 14 0 0 0 1 16,559 22 1 0 0 0 21,210 25 0 1 0 0 24,4511 33 0 0 1 0 31,212 22 0 0 0 1 16,9513 21 1 0 0 0 21,614 24 0 1 0 0 24,8515 30 0 0 1 0 31,616 16 0 0 0 1 17,35Graf časové řady a jejího modelu3530252015Řada1Řada210501 2 3 4 5 6 7 8 9 10 11 12 13 14 15200


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ11.2.2 Box – Jenkinsova metodika analýzy časových řadCharakteristiky časové řadyVzájemná kovarianční funkce časových řad x t a y tcckk=tt+kE ⋅ ( x − x ) ⋅ ( y − y )= 1/n ⋅ Σ ( x − x ) ⋅ ( y+− y )(30)ttkkde střední hodnotax= 1 / n ⋅ Σ(31)x tDisperzes2x= co= 1/ n⋅ Σ( xt− x )Autokovarianční funkcecckk= E ( x − x ) ⋅ ( x+− x )ttk= 1/n ⋅ Σ ( x − x ) ⋅ ( x+− x )(32)ttkAutokorelační funkcer = c / c(33)kkoVzájemná korelační funkce časových řad { x t} a { y t}rk= c / s ⋅ s(33a)kxyRozptyl r kNejdůležitější charakteristikou je bezpochyby autokorelace. Složí k určení typu modelu, řádumodelu i koeficientů v tomto modelu. Počítá se pomocí vzorce 33.Protože r k je bodovým odhadem teoretické autokorelační funkce ρ k , má smysl zabývat serozptylem tohoto odhadu. Odhaduje se⎜⎛ k2 1 ≈ + ∑ − s ( r ) 1 2n ⎝ i=12kr i1⎞⎟⎠(33b)201


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮNapříklad2s ( r 1)1n2 1 2 2 1 2 2= , s ( r ) = [ 1+2r], s ( r ) [ 1+2r+ 2r]2n13=1 2.nIntervalový odhad ρ kVedle bodového odhadu je možný také intervalový odhad ρ k . Pro 5% hladinu významnosti je[ ∈ ( −1 ,96. s(r );1,96. s(r )] = 0, 95P ρkTest významnosti r k :Vypočítanou hodnotu r k je nutné vyhodnotit co do významnosti. Použijeme tento test:1) Nulová hypotézaHo: ρ = 0kH1 : ρ ≠ 0kkk(33c)2) Testovací kriterium T =rks r )( k3) Kritická hodnota pro α = 0,05 je 1,964) Závěr: pro T > 1, 96 se zamítá H o .Některé vlastnosti r ka) rk= r−kcož znamená, že r k je sudá funkceb) r o = 1, takže všechny autokorelační funkce procházejí bodem 1 na svislé ose.Box – Jenkinsovy modely časové řady(V dalším pro jednoduchost předpokládáme, že střední hodnota časové řady je nulová. Toholze dosáhnout centrováním všech hodnot řady).202


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮAutoregresní model řádu p: AR(p)Model AR(p) vychází se z předpokladu, že hodnotu y t lze vyjádřit jako lineární kombinacihodnot y t-1 , y t-2 , …, y t-p z časů t-1, t-2, …, t-p:y +t= f1⋅ yt−1+ f2⋅ yt−2+ K + fp⋅ yt−pat(34)kde f 1 , f 2, …, f p jsou neznámé koeficienty, a t je náhodná veličina vyrovnávající rozdíl meziy t af1⋅ yt−1+ f2⋅ yt−2+ K + fp⋅ yt−p, u které předpokládáme tyto vlastnosti:E ( a ) = 0 ,tvar (a ) = s , cov ( a , a ) = 0 pro k ≠ 0 (35){ a t} tvoří rovněž časovou řadu, která bývá v technické praxi nazývána b í l ý š u m.Vynásobením vztahu (34) veličinou y t-k dostanemet2att+kyt⋅ yt−k=f1⋅ yt−1⋅ yt−k+f2⋅ yt−2⋅ yt−k+ K +fp⋅ yt−p⋅ yt−k+ at⋅ yt−kVypočítáme-li střední hodnotu tohoto výrazu, máme(36a)ck= f ⋅ c + f ⋅ c + K +1k −12k −2fp⋅ ck − p(36b)a po vydělení c ork= f ⋅ r + f ⋅ r + K +1k−12k−2fp⋅ rk − p(36c)Odtud pro k = 1, 2, …p, uvážíme-li, že r o = 1 a r -k = r k , dostanemer K1= f1+ f2⋅ r1+ + fp⋅ rp−12= f1⋅ r1+ f2+ + fp⋅ rp−2r K (37)……………………………………r f ⋅ r + f ⋅ r + K + fp=1 p−12 p−2Tyto tzv. Yule-Walkerovy rovnice slouží k výpočtu koeficientů f 1, f 2 , …, f p modelu (34),přičemž r k vypočítáme podle (33).pPro k = 0 máme z (36a)203


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮyt⋅ yt=f1⋅ yt⋅ yt−1+f2⋅ yt⋅ yt−2+ K +fp⋅ yt⋅ yt−p+ at⋅ ytVypočítáme-li nyní střední hodnotu, přičemžmámeE ( y ⋅ y−) = c attkkE ⋅ = ,2( atyt) sac = s = f ⋅ c + f ⋅ c + K + f ⋅ c + so2y1122pp2aPo vydělení2sya úpravě1 − f ⋅ r − f ⋅ r − K − f ⋅ r =1122ppss2a2ya odtuds2Y=1 −f1⋅ r12sa− K −fp⋅ rp(38)Tento vztah se spíše využívá k odhadu2sas2a( 1 − f ⋅ r − − f ⋅ r )= sK2Y11pptj.s2a= s2Y'( 1 − r ⋅ f )kde⎡r⎢rr = ⎢⎢M⎢⎣r12⎤⎥⎥⎥⎥⎦paf⎡ f⎢f= ⎢⎢M⎢⎣ f12⎤⎥⎥⎥⎥⎦pRozptyl2sase počítá také ze vztahu204


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮs2a=n∑t = 1a2tn − p − qPrakticky nejpoužívanějšími AR modely jsou:Autoregresní model prvního řádu: AR(1)Rovnice tohoto modelu:y +t= f1⋅ yt−1at,nebo také např.yt + 1= f1⋅ yt+ at + 1yt + 2= f1⋅ yt+1+ at + 2, atd.Z rovnic (37) pro p = 1 mámef1= r1Rozptyl časové řady budes2Y2sa=1 − f21varfRozptyl odhadu koeficientu f 1( ) ( ) ( )= sf= n2− 11 11⋅−f21Je-liy +hodnota y z času ktkt + , pak její predikci budeme dále značit ( k )y ta počítáme jipro tento modelytk( k ) = f1⋅ ytPro k = 1yt( 1 ) = f 1⋅ yt205


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮPři odvození této a dalších predikčních rovnic se využívá vztahu yt( k ) E ( yt + k)( a )tk= , zaE+dosazujeme pro k > 0 nulu (neznámé hodnoty s předpokládanou střední hodnotou0), takže u AR(1) vycházíyt( 1 ) = E ( yt + 1) = f1yt+ E ( at + 1) = f1⋅ ytyt2( 2 ) = f ⋅ yt( ) = f ⋅ yt111atd.ytk( k ) = f1⋅ ytRozptyl chyby predikcetohoto modelu tvare +se počítá jako střední hodnota kvadrátu chyby predikce a má utkPro k = 1var2k22 1 − f1 2( e ) E ( y − y ( k )) = ⋅ st + k=t + kvar2 2( e ) = st + kta1 − f21aAutoregresní model druhého řádu: AR(2)Rovnice tohoto modeluNebo takéyy + at= f1⋅ yt−1+f2yt−2t + 1= f1⋅ yt+f2yt−1+ at + 1t, atp.Pro výpočet f 1 , f 2 dostáváme z (37) pro p = 1, 2r1= f1+ f2⋅ r1r +2= f1⋅ r1f2a odtud206


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮf1= r11 −⋅1 −rr221,f2=r2− r1 − r2121Rozptyl odhadu koeficientů modelus⎛= ⎜⎝12 2( f1) = s ( f2)−( f )n22⎞⎟⎠Rozptyl časové řadys2Y2sa=1 − f ⋅ r − f ⋅ r1122Z (19) bude predikční rovnice pro k = 1yytt( ) E ( y ) = f ⋅ y + f ⋅ y E ( a )1 =t + 1 1 t 2 t −1+t + 1( ) = f1⋅ yt+ f2⋅ yt 11−2 2a var ( e ) = st + 1aZavedeme-li operátor B:Byt= yt −1paky = Byt − 1ty2( Byt) B ytt − 2= Byt − 1= B =y= t − 3B3ytKy = Bt − ppytS použitím operátoru B můžeme (34) upravit23pytf1⋅ B ⋅ yt+ f2⋅ B ⋅ yt+ f3⋅ B ⋅ yt+ + fp⋅ B ⋅ yt+= KatÚpravout2p( 1 − f ⋅ B − f ⋅ B − K − fp⋅ B ) aty =12207


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮdostávámeyt⋅fp( B ) = a , f ( B ) = 1 − f ⋅ B − K − f ⋅ Bt1pOdtudyt=f− 1( B ) ⋅ atTento vztah vede k myšlence vyjádřit y t pomocí jiné časové řady { a t} a tedy k modelůmoznačovaným MA.Model klouzavých průměrů řádu q: MA(q)Model MA(q) vyjadřuje hodnoty studované časové řady pomocí hodnot jiné řady – bíléhošumu.Má základní rovniciyt= a − t ⋅ a − t ⋅ a − K − tt1t − 12t − 2q⋅ at − q(39)Kovariance u tohoto modelu budeck( y ⋅ y ) = E ( a − t ⋅ a − − t ⋅ a ) × ( a − t ⋅ a − − t ⋅ a )= EKtt − kPro k = 0 dostáváme disperzit1t − 1Kq t − q t − k 1 t − k − 1qt − q − kco2 22 2( + t + t + + t ) ⋅ s= K11 2q aProk = 1,2, K,qck2( − t + t ⋅ t + t ⋅ t + + t ⋅ t ) ⋅ s=k 1 k + 1 2 k + 2Kq − k q aAutokorelační funkce potomrkc=c− t+ t⋅ t+ t⋅ t+ K + tkk 1 k + 1 2 k + 2=2 2201 + t1+ t2+ K + tqq − k⋅ tq(40)208


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮNejčastěji používanými modely MA jsou:MA (1):yt + 1= at + 1− t1⋅ atpro který se neznámý koeficient t 1 počítá ze vztahu (40);pro k = 1 (q = 1)− tr1=1 + t121a rozptyl jeho odhadu stejně jako u AR modelůRozptyl časové řadys2( t1)1= n−⋅ (1 − t21)s2y=+ t⋅ s2 2( 11)aPredikční rovnice pro k = 1yt( 1) E ( a ) − t1=t + 1⋅ E ( at)ayt( 1)= − t1) 2t + 1⋅ avar ( e = st2aMA (2):Rovniceyt + 1= at + 1− t1⋅ at− t2⋅ at − 1Rozptyl časové řadys2y=+ t+ t⋅ s2 2 2( 11 2)aZ rovnice (40) pro k = 1 a k = 2 (q = 2) dostáváme rovnice209


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮr1=− t1+ t1⋅ t1 + t + t21222pro výpočet t 1 , t 2 .r2− t2=1 + t + t2122Rozptyl odhadu koeficientů t 1 a t 2s2( t1) = s2( t2) = n− 1⋅ (1 − t22)Z rovnice (39) bude pro k = 1 predikční rovniceyt( 1) = E ( yt) = E ( at 1)− t1⋅ E ( at) − t2E ( at 1)+ 1 +⋅−yt( 1) = − t1⋅ at− t2⋅ at − 1avar ( e = s) 2t + 12aKombinovaný model ARMA (p, q):Tento model je kombinací předchozích dvou. Má rovniciyt= f ⋅ y + f ⋅ y +− K − t1t − 12t − 2K + fp⋅ yt − p+ at− t1⋅ at − 1q⋅ at − qresp. po úpravěyt−f1⋅ yt − 1−f2⋅ yt − 2−K − fp⋅ yt − p= at− t1⋅ at − 1− t2⋅ at − 2− K − tq⋅ at − qa zavedení operátoru Byt(1 −f1⋅ B −f2⋅ B2− K −fp⋅ Bp) = at(1 − t1⋅ B − t2⋅ B2− K − tq⋅ Bq)tj.yt⋅f( B)= a ⋅ t ( B)tPrakticky se používá tento model pro p = q = 1: ARMA (1, 1)210


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮDisperze a kovariance tohoto procesu budouyt + 1= f1⋅ yt+ at + 1− t1⋅ atc0= E ( yt⋅ yt) = E ( f1= f ⋅ c − 2 ⋅ f ⋅ t2101⋅ yt − 1+ at− t⋅ E ( y ⋅ a1t − 11t − 1⋅ a) +t − 12sa2) =+ t21⋅ s2aProtože2( y ⋅ a ) sE =t − 1 t − 1 amáme2 2 2( 1 − f ) = s ( 1 + t − ⋅ f t )ca⋅0 11211odkudc01 + t=21− 2 ⋅ t1 − f211⋅f1⋅ s2aNyní určíme kovariance c 1 , c 2 , …c1( y ⋅ ( f ⋅ y + a − t ⋅ a ))= Et − 1 1 t − 1 t 1 t − 1=f1⋅ c0− t1⋅ s2a==( 1 − f ⋅ t )( f − t ) 2111 − f2111⋅ sac( yt 2⋅ ( f1⋅ yt 1+ at− t1⋅ at 1)) = f1⋅12= E−−−ca podobněck= f1⋅ ck −1Autokorelační funkce pro k = 1ra obecně1=cc10=( 1 − f ⋅ t )( f − t )1 + t1211− 2 ⋅ f11⋅ t11211


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮr pro k = 2, 3, …k= f1⋅ rk − 1takžer2= f1⋅ ra z rovnic (45), (46) určíme koeficienty f 1 a t 1 .Rozptyl odhadu jes2( 1 − t1)( − f1⋅ t1)n ⋅ ( f − t ) 22 1( t1) =112s2( 1 − f1)( − f1⋅ t1)n ⋅ ( f − t ) 22 1( f1) =112Predikční rovnice pro k = 1 se získá ze vztahu (44):yytt() 1 E ( y ) = f ⋅ y + E ( a ) − t ⋅ E ( a )=t + 1 1 tt + 1() 1 = f1⋅ yt− t1⋅ atvar2 2( e ) = st + 1a1tPři použití modelů AR, MA a ARMA se předpokládá, že střední hodnota řady nevykazujetrend (řada stacionární podle střední hodnoty) a rovněž disperze nemá trend v čase(stacionární podle disperze). Splnění těchto předpokladů je potřeba ověřit a to buď testemnebo velmi často vizuálně z realizace časové řady.Při nesplnění některého z těchto požadavků je nutné nestacionaritu odstranit.Nestacionaritu řady podle střední hodnoty lze odstranit výpočtem prvních diferencí členůřady, tj. řadu { y t} nahradíme řadou{ y − y }tt − 1a není-li ani nyní stacionární, vypočítáme opět diference členů této nové řady, tedy druhédiference. To je zpravidla postačující, diference vyššího řádu se prakticky nepočítají.Mějme například model212


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮz + at= f1⋅ zt − 1ttj.t( 1 − f1⋅ B ) atz =Je-li y − y1z , čili { }t=t t −z je řada prvních diferencí, můžeme psátt( yt− yt − 1)( 1 − f1⋅ B ) = att( 1 − B )( 1 − ft⋅ B) aty =t( 1 − B ) f ( B ) aty =Je-li dále y x − x1, mámet=t t −t( 1 − B ) f ( B ) aty =( xt− xt − 1) ( 1 − B ) f ( B ) = att2( 1 − B ) f ( B ) atx =Je vidět, že zařazením členu 1 - B do rovnicet( )ty ⋅ f B = a je totéž, jako počítat s řadouprvních diferencí, zařazení (1-B) 2 znamená počítat se druhými diferencemi atd.Obecně u d-tých diferencí budetd( 1 − B ) f ( B ) aty =Pro model ARMA (p,q) pak můžeme psátytd( 1 − B) ⋅ f ( B ) = a ⋅ t ( B )tkterý je označen ARIMA (p,d,q) a zahrnuje všechny předchozí modely.Například model ARIMA(1,0,0), zkráceně píšeme (1,0,0), odpovídá modelu AR(1), model(1,1,0) je model AR(1) pro první diference, model (0,0,2) je model MA(2) apod.Při nestacionaritě podle disperze se provádí některá z následujících transformací:y1 / 21 / 2* = ln ( ) , y = ( y ) resp. y = 1 / ( y )ty t*t t*ttVýznamnost nalezených koeficientů testujeme podobně jako v regresní analýze:213


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮNulová a alternativní hypotézaTestovací kriteriumH : f 0 resp. t = 00 k=1: fk≠H 0 t ≠ 0= f s ( f ) resp. T = t / s ( t )kkTk/kk kKritická hodnota se nalezne v tabulkách kritických hodnot Studentova rozdělení pro n-p-qstupně volnostitnp − q( α )−, α = hladina významnostiProtože při správné volbě modelu časové řady jsou reziduální odchylky nekorelované,posuzuje se vhodnost modelu nepřímo – testováním reziduí:Test Box-PierceJe-liyt(empirická) hodnota časové řady aŷ tjejí (teoretický) odhad, pak diferencey − yˆ = a tvoří také časovou řadu, můžeme vypočítat autokorelaceHt0tt( t )r apro t = 1 , 2 , . . . , k = n / 10: Všechny autokorelační koeficienty jsou nulové( r r = . . . = r 0)1=2k=Testovací kritérium budeQ = n ⋅k∑t = 12Q má rozdělení χ v případě, že reziduální odchylky jsou nekorelované.k − p − qr2a( t )Předpoklad o nekorelovatelnosti hodnot řady { a t} je ověřován u každého modelu takétestem Durbin-Watson:( at, at −) 0( a , a ) 0H0: cov1=H1: covt t 1≠−Testovací kritériumProtože přibližně platíDW=n∑( at− at −)n21/ ∑t = 2 t = 1a2t214


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮDW= 2 − 2 ⋅ ra( 1)je vidět, že při DW blízkém hodnotě 2 nejsou a t korelované. Nesplnění tohoto předpokladusignalizuje, že regresní model nebyl nalezen správně a v konečném důsledku je příčinounekvalitní predikce.Při praktickém hledání vhodného modelu jsme postupovali v těchto etapách:1) Určení typu a řádu modelu:K tomuto účelu je pro první rozhodování sestavena tabulka 1 a to podle Box-Jenkinsovymetodiky. Je připravena pro modely AR (1), AR (2), MA (1), MA (2) a ARIMA (1,1).V prvém sloupci každého modelu je znázorněn typický průběh grafu autokorelační funkce,ve druhém typické parciální korelační funkce.K objasnění pojmu parciální korelace napišme několik AR modelů, např.y +t= f11⋅ yt − 1att= f21⋅ yt − 1+ f22⋅ yt − 2att= f31⋅ yt − 1+ f32⋅ yt − 2+ f33⋅ yt − 3y +y + atPro odlišení koeficientů v jednotlivých modelech používáme dva indexy.Koeficienty f ii představují parciální korelace mezi y t a y t-i . Např. f 22 je parciální korelace meziproměnnými y t a y t-2 .Máme-li např. model AR (2), je zřejmě f 33 = f 44 = … = 0. Vypočítáme-li tedy z Y-W rovnicekoeficienty f 11 , f 22 , f 33 , …, f kk lze očekávat, že u modelu řádu p bude f kk pro k > pprakticky nulové.Při testování významnosti koeficientů f kk použijeme přibližného vztahuPrakticky se doporučuje:1 / 2( f ) 1 / nskk=je-li f kk mimo interval ( − ⋅ s ( f ),2 ⋅ s ( f ))2 , považujeme jej za nulový.kkPrůběh grafů atokorelací a parciálních korelací pro nejpoužívanější modelyAR(1),AR(2)MA(1),MA(2) a ARMA(1,1) jsou v tabulce. Podle průběhu se může rozhodnouto volbě typu a řádu modelu.2) Výpočet koeficientů vybraného modelu.Provede se podle výše uvedených vzorců podle typu modelu.215kk


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮPříklad 16Časová řada spotřeby vody v domácnosti je v tabulce.Vypočítat autokorelace a parciální korelace pro posuv p =1,2,3,4 a 5.Řešení:den y tPo 0,64U 0,78St 0,93Č 0,66Pá 0,99So 1,22N 1,05Po 0,75U 0,63St 0,82Č 0,63Pá 1,30So 0,65N 1,30Po 0,54U 0,61St 0,70Č 0,56Pá 0,79So 1,30N 1,24Autocorrelation Partial Correlation AC PAC Q-Stat Prob. | . | . | . | 1 -0.006 -0.006 0.0009 0.977. |* . | . |* . | 2 0.085 0.085 0.1756 0.916***| . | ***| . | 3 -0.372 -0.374 3.7627 0.288.**| . | .**| . | 4 -0.272 -0.317 5.7906 0.215. *| . | . *| . | 5 -0.185 -0.183 6.7942 0.236AC = autokorelacePAC = parciální korelaceSestavení predikčního modeluPo nalezení vhodného modelu časové řady se sestaví predikční model.Odhad y t+k označme y t (k).Věta 9y t (k). = E(y t+k )Postup:1. Pro dané parametry (p,d, q) sestavit model y t (1-B) d f(B) = a t .t(B)2. Vypočítat y t216


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ3. Vypočítat analogicky y t+k4. E(y t+k )Při výpočtu E(a t+k ) jepro k = …, -2, -1,0 E(a t+k ) rovno výrazu v závorce (střední hodnota minulých a současnýchhodnot), pro k = 1,2,… je E(a t+k ) rovno nule (střední hodnota budoucích časů).Příklad 17Napsat predikční rovnici řady { } ta) ARIMA(0,1,1)b) ARIMA(1,0,1)c) ARIMA(1,1,1)d) ARIMA(1,1,0)e) ARIMA(0,2,2)Řešení pro (a):z t (1-B) = a t (1-t 1 B)z t = z t-1 + a t – t 1 a t-1z pro model*) z t+k = z t+k-1 + a t+k – t 1 a t+k-1z t (k) = E(z t+k ) = z t (k-1) pro k ≥ 2k = 1 dosadíme do *)z t+1 = z t + a t+1 – t 1 a tz t (1) = z t - t 1 a tTabulka1 (Box-Jenkins) Grafy AC a PAC funkce pro vybrané modely k určení typu a řádumodelu.217


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮ218


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮShrnutí pojmů kapitoly 11.2V kapitole 11.2 byly vysvětleny dva způsoby analýzy časových řad: klasická metodika a BoxJenkinsova metodika. U obou přístupů jsou počítány charakteristiky časové řady a hledánymodely časové řady. Strategie jsou však naprosto odlišné. Při modelování trendové složkyčasové řady jsou uplatňovány poznatky regresní analýzy.Otázky ke kapitole 11.21. Definujte časovou řadu2. Uveďte dva přístupy k analýze časových řad3. Uveďte dvě základní úlohy při studiu časových řad4. Jak se značí proměnné v ekonometrii?5. Jaké je pojmenování proměnných v ekonometrii ?6. Uveďte charakteristiky č.ř. klasické metodiky7. Definujte stacionaritu č.ř. podle střední hodnoty (rozptylu8. Napište základní rozklad hodnoty yt u klasické metodiky9. Jak se určí logistický trend?10. Jak se počítají klouzavé průměry11. Uveďte vzorec pro exponenciální vyrovnání č.ř.12. Jak se modeluje sezónní složka?13. Uveďte charakteristiky č.ř. v Box jenkinsově metodice14. Uveďte vlastnosti autokorelační funkce15. jak se počítá rozptyl rk?16. Jak se stanoví intervalový odhad ρ k17. Jak se testuje r k ?18. Jaké jsou základní modely v B-J metodice?19. Napište model AR(p), MA(q), ARMA)p,q)20. Proveďte odvození Y-W rovnic21. Napište Y.W rovnice pro AR(1), AR(2), AR(3)22. Definujte operátor B23. Napište model ARIMA(p,d,q)24. Jak se odstraní trend č.ř.?25. Co představují koeficienty fii? Jaký je jejich význam?26. Jak se ověří, jsou li nenulové?27. Uveďte základní východisko pro nalezení predikčního modelu28. Uveďte základní kroky při nalezení predikčního modelu29. Nakreslete tabulku pro určení typu a řádu modelu219


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮÚlohy k procvičení1. Pro danou časovou řadu vypočítejtea) průměrný absolutní přírůstekb) průměrný koeficient růstut 1 2 3 4 5 6 7 8yt 50 53 48 47 50 59 60 582. Pro danou časovou řadu vypočítejtea) průměrný absolutní přírůstekb) průměrný koeficient růstut 1 2 3 4 5 6yt 5 9 11 10 12 143. Pro danou časovou řadu vypočítejtea) exponenciální vyrovnání, je-li w = 0,7. Napište první 3 hodnoty.b) průměrný koeficient růstut 1 2 3 4 5 6 7yt 11 15 14 12 16 18 194. Pro danou časovou řadu vypočítejtea) exponenciální vyrovnání, je-li w = 0,8. Napište první 3 hodnoty.b) vyrovnání klouzavými průměry s délkou klouzavé části 5t 1 2 3 4 5 6 7 8yt 20 22 19 20 18 17 20 225. Vypočítejte testovací kriterium DW pro posouzení autokorelace, je-li dánoTe = ( 0.02; −0.04;−0.02;−0.10;0.04)6. Vypočítejte testovací kriterium DW pro posouzení autokorelace, je-li dánoTe = ( −0.1;0.2;−0.3;−0.1;0.4)7. Vypočítejte testovací kriterium DW pro posouzení autokorelace, je-li dánoTe = ( −0.01;0.08;−0.02;−0.03;0.05)8. Vypočítejte testovací kriterium DW pro posouzení autokorelace, je-li dáno220


ŠIRŠÍ SOUVISLOSTI PLÁNOVÁNÍ EXPERIMENTŮTe= ( −0.3;0.4;−0.1;−0.2;0.4;−0.1)9. Napište rovnici pro model ARMA(4,2) a zjednodušte jej pomocí operátoru B.10. Napište rovnici pro model ARMA(3,4) a zjednodušte jej pomocí operátoru B.11. Napište rovnici pro model ARIMA(2,1,3) ve zkráceném tvaru.12. Napište Yule Walkerovy rovnice pro model AR(3)13. Otestujte koeficient f11 modelu AR(1), je-li dáno:n = 5, f11 = -0,909 a α = 0,05.14. Jsou dány autokorelace r 1 = -0,577 a r 2 = 0,458. Vypočítejte s 2 (r 1 ) a s 2 (r 2 ); n = 10.)15. Odstraňte heteroskedasticitu v modelu Yt= b1xt1+ b2xt2+ ... + bkxtk+ et, je –li příčinouheteroskedasticity proměnná x k .16. Napište vzorec pro výpočet r k a s 2 (r k ).17. Vypočítejte s 2 (r 3 ) je-li r 1 = 0.8, r 2 = 0.2 a n = 10.18. Řešte všechny body příkladu 1 pro vstupní data v tabulce:Y x 1 x 210 1 025 3 -132 4 043 5 158 7 -162 8 067 10 -171 10 2221


KLÍČ ŘEŠENÍKLÍČ K ŘEŠENÍ1) ( Δ = 1 ,14; k = 1,02)2) ( Δ = 18 ; k = 1,22)) ) )3) ( y1 = 11;y2= 13,8; y3= 13,94; k = 1,095)) ) )4) ( y1 = 20;y2= 21,6; y3= 19,52; k = 1,095)5) (DW = 2.14)6) (DW = 2.032)7) (DW = 2.38)8) (DW = 2.89)429) ( yt= f1 . yt−1+ f2.yt−2+ f3yt−3+ f4.yt−4+ at− t1.at−1− t2.at−2; f ( B ) yt= t(B ) at)3410) ( yt= f1. yt−1+ f2.yt−2+ f3yt−3+ at− t1.at−1− t2.at−2− t3.at−3− t4at−4;; f ( B ) yt= t(B ) at)2311) ( f ( B )(1 − B)yt= t(B ). at)12)( r =rr231f1= f r +1 1= f r1 2++f2 1ffr2+r+2 1f+f3 2r3 1fr3)13) ( T = 5 .0,909 = 2,03 > 1, 96 )14) ( s 2 (r 1 ) = 0,1;s 2 (r 2 ) = 0,166 )17) ( s 2 (r 3 ) = 0.236 )18)a) Odhad regresních koeficientůX T Y⎡ 368 ⎤=⎢ ⎥⎢2710⎥⎢⎣35 ⎥⎦222


KLÍČ ŘEŠENÍb r=14664⎡ 2887⎢⎢− 384⎢⎣240− 38464− 40240 ⎤ ⎡ 368 ⎤ ⎡6,47⎤− 40⎥ ⎢ ⎥=⎢ ⎥⎥.⎢2710⎥ ⎢6,59⎥608 ⎥⎦⎢⎣35 ⎥⎦⎢⎣0,26⎥⎦b) Teoretické hodnotyˆ = Y( 13.06, 25.98, 32.83, 39.68, 52.34, 59.19, 72.11, 72.89)c) Reziduae r T=( − 3.06,− 0.98, − 0.83, 3.32, 5.66, 2.81, − 5.11, −1.89)∑id) Rozptyl koeficientů e2 = 91. 65i91.65var(b r ) = .8 − 314664⎡2887⎢⎢− 384⎢⎣240− 38464− 40240⎤⎡11.35− 40⎥=⎢⎥ ⎢608⎥⎦⎢⎣0.25⎤⎥⎥2.39⎥⎦e)f) Test koeficientůY = 46 , Se = 91. 65, S = 3318. 21Yˆb16.476.59T1= = = 1.92 ,2= = 13. 18s( b 1) 3.370.5T , T = 0. 317t( ) = t8 − 3(0.05) = 2.571n − kαg) Test modeluT3< 2.571⇒ β3= 0T3318 /(3 −1)16.59== = 90.5191.65 /(8 − 3) 18.33F1 , n−k( ) = F3−1,8−3(0.05) = 5.79k −αh) PredikceX0⎡1= ⎢⎣111123⎤5⎥⎦Yˆ0⎡1= ⎢⎣11112⎡6.47⎤3⎤⎢ ⎥ ⎡79.74⎤⎥.⎢6.59⎥=5⎢ ⎥⎦⎢ ⎥⎣86.85⎦⎣0.26⎦223


LITERATURALiteratura1. Alonso,J.H.: Ejercicios de econometria. ESIC, Madrid 1989.2. Anděl,J.: Matematická statistika. SNTL Praha 1978.3. Koutsoyiannis,A.: Theory of Econometrics. MACMILLAN 1977.4. Nowak,E.: Zarys metod ekonometrii. Warszawa 1990.5. Box,G.-Hunter,W.-Hunter,S.:Statistics for experimenters. Wiley 1978.6. Myers,R.H., Montgomery,D.C. Response Surface Methodology,2 nd Ed., Wiley,NY 2002.7. Prat,A.-Tort,X.- Grima,P.-Pozutea,L.: Métodos estadísticos. Control y mejora de lacalidad. UPC, Barcelona 1992.8. Anděl,J.: Matematická statistika. Praha, SNTL 1978.9. Box,G.E.P.-Jenkins,G.M.: Time series analysis. San Francisco, 1970.224

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!