05.09.2013 Views

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

EXEMPEL 3.17<br />

2007-10-08 – sida 61 – # 65<br />

3.5 LÄGESMÅTT OCH SPRIDNINGSMÅTT 61<br />

Låt Z anta värdet 0 <strong>med</strong> sannolikhet 0.5 <strong>och</strong> 1 <strong>med</strong> sannolikhet 0.5<br />

(pZ(0) = pZ(1) = 0.5). Då är alla värden i intervallet (0, 1) <strong>med</strong>ian.<br />

När ska man använda väntevärde respektive <strong>med</strong>ian?<br />

På denna fråga finns inget entydigt svar. Inte så sällan sammanfaller de (<strong>och</strong><br />

då spelar det ju ingen roll), t.ex. för symmetriska täthets- eller sannolikhetsfunktioner<br />

– <strong>med</strong>ian <strong>och</strong> väntevärde är då bägge lika <strong>med</strong> symmetripunkten.<br />

Annars är det vanligast att man använder väntevärdet, en anledning till detta<br />

är nog dess koppling till <strong>med</strong>elvärdet som är centralt inom statistiken som<br />

vi ska se senare i boken. En annan anledning är att väntevärdet har flera beräkningsmässiga<br />

fördelar gentemot <strong>med</strong>ian (mer om dessa i senare avsnitt).<br />

Ibland är det dock lämpligare att använda <strong>med</strong>ianen som lägesmått. T.ex. påpekades<br />

det tidigare att väntevärdet kan vara oändligt eller inte väldefinierat,<br />

<strong>och</strong> då är <strong>med</strong>ianen det enda valet. Men även i fall där slumpvariabler har<br />

väntevärden brukar man använda <strong>med</strong>ianen om fördelningen har s.k. tunga<br />

svansar. Med detta menas att fördelningen/slumpvariabeln kan anta mycket<br />

stora (<strong>och</strong>/eller väldigt stora negativa) värden. Dessa värden påverkar väntevärdet<br />

i mycket hög grad <strong>med</strong>an värdena mer i mitten (som har lejonparten<br />

av sannolikhetsmassan) får föga inflytande på väntevärdet vilket kanske inte<br />

är önskvärt. Liknande sker inom statistiken som vi ska se senare. När man<br />

t.ex. studerar löner är det vanligare att man redovisar <strong>med</strong>ianlön än <strong>med</strong>ellön.<br />

Orsaken till detta är att några få människors höga löner drar upp <strong>med</strong>ellönen<br />

till ett belopp som ganska få tjänar, så <strong>med</strong>ellönen avspeglar inte en typisk<br />

lön – därför redovisar man oftare <strong>med</strong>ianlönen som bättre avspeglar vad man<br />

vill (referens till inferenskapitel??).<br />

Medianen är för övrigt ett specialfall av de mer allmänna begreppen kvantil<br />

<strong>och</strong> percentil som vi passar på att definiera.<br />

DEFINITION 3.9 (KVANTIL, KVARTIL OCH PERCENTIL)<br />

För 0 < α < 1 definieras α-kvantilen xα till en slumpvariabel X som lösningen<br />

x = xα till ekvationen FX(x) = 1−α. Valen av α = 0.75 respektive<br />

α = 0.25 har liksom <strong>med</strong>ianen (α = 0.5) fått egna namn. Lösningen x0.75<br />

till FX(x) = 1 − 0.75 kallas första kvartilen (eller nedre kvartilen) <strong>och</strong><br />

betecknas <strong>med</strong> Q1 <strong>och</strong> lösningen x0.25 till FX(x) = 1 − 0.25 kallas för<br />

tredje kvartilen (eller övre kvartilen) <strong>och</strong> betecknas Q3. Andra kvartilen är<br />

detsamma som <strong>med</strong>ianen.<br />

Percentil definieras i termer av procent, men här syftar man på chansen

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!