STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar
STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar
STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
EXEMPEL 3.17<br />
2007-10-08 – sida 61 – # 65<br />
3.5 LÄGESMÅTT OCH SPRIDNINGSMÅTT 61<br />
Låt Z anta värdet 0 <strong>med</strong> sannolikhet 0.5 <strong>och</strong> 1 <strong>med</strong> sannolikhet 0.5<br />
(pZ(0) = pZ(1) = 0.5). Då är alla värden i intervallet (0, 1) <strong>med</strong>ian.<br />
När ska man använda väntevärde respektive <strong>med</strong>ian?<br />
På denna fråga finns inget entydigt svar. Inte så sällan sammanfaller de (<strong>och</strong><br />
då spelar det ju ingen roll), t.ex. för symmetriska täthets- eller sannolikhetsfunktioner<br />
– <strong>med</strong>ian <strong>och</strong> väntevärde är då bägge lika <strong>med</strong> symmetripunkten.<br />
Annars är det vanligast att man använder väntevärdet, en anledning till detta<br />
är nog dess koppling till <strong>med</strong>elvärdet som är centralt inom statistiken som<br />
vi ska se senare i boken. En annan anledning är att väntevärdet har flera beräkningsmässiga<br />
fördelar gentemot <strong>med</strong>ian (mer om dessa i senare avsnitt).<br />
Ibland är det dock lämpligare att använda <strong>med</strong>ianen som lägesmått. T.ex. påpekades<br />
det tidigare att väntevärdet kan vara oändligt eller inte väldefinierat,<br />
<strong>och</strong> då är <strong>med</strong>ianen det enda valet. Men även i fall där slumpvariabler har<br />
väntevärden brukar man använda <strong>med</strong>ianen om fördelningen har s.k. tunga<br />
svansar. Med detta menas att fördelningen/slumpvariabeln kan anta mycket<br />
stora (<strong>och</strong>/eller väldigt stora negativa) värden. Dessa värden påverkar väntevärdet<br />
i mycket hög grad <strong>med</strong>an värdena mer i mitten (som har lejonparten<br />
av sannolikhetsmassan) får föga inflytande på väntevärdet vilket kanske inte<br />
är önskvärt. Liknande sker inom statistiken som vi ska se senare. När man<br />
t.ex. studerar löner är det vanligare att man redovisar <strong>med</strong>ianlön än <strong>med</strong>ellön.<br />
Orsaken till detta är att några få människors höga löner drar upp <strong>med</strong>ellönen<br />
till ett belopp som ganska få tjänar, så <strong>med</strong>ellönen avspeglar inte en typisk<br />
lön – därför redovisar man oftare <strong>med</strong>ianlönen som bättre avspeglar vad man<br />
vill (referens till inferenskapitel??).<br />
Medianen är för övrigt ett specialfall av de mer allmänna begreppen kvantil<br />
<strong>och</strong> percentil som vi passar på att definiera.<br />
DEFINITION 3.9 (KVANTIL, KVARTIL OCH PERCENTIL)<br />
För 0 < α < 1 definieras α-kvantilen xα till en slumpvariabel X som lösningen<br />
x = xα till ekvationen FX(x) = 1−α. Valen av α = 0.75 respektive<br />
α = 0.25 har liksom <strong>med</strong>ianen (α = 0.5) fått egna namn. Lösningen x0.75<br />
till FX(x) = 1 − 0.75 kallas första kvartilen (eller nedre kvartilen) <strong>och</strong><br />
betecknas <strong>med</strong> Q1 <strong>och</strong> lösningen x0.25 till FX(x) = 1 − 0.25 kallas för<br />
tredje kvartilen (eller övre kvartilen) <strong>och</strong> betecknas Q3. Andra kvartilen är<br />
detsamma som <strong>med</strong>ianen.<br />
Percentil definieras i termer av procent, men här syftar man på chansen