FMS601 lab3 ht08 - Matematikcentrum - Lunds Tekniska Högskola

LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK 

DATORLABORATION 3 

MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08 

Laboration 3: 

Parameterskattning och Fördelningsanpassning 

1 Syfte 

Syftet med denna datorlaboration är att undersöka 

i vilken mån några av de fördelningar som 

presenterats i kursen kan användas för att beskriva 

olika slumpmässigt varierande fenomen, som 

vi kan iaktta i vår omvärld. Vi skall främst presentera 

några enkla grafiska metoder som man kan 

använda för att undersöka vilka fördelningar som 

vårt datamaterial skulle kunna komma från. 

Vi skall främst studera normal- och exponentialfördelningen 

med hjälp av simuleringar men också 

med utgångspunkt i verkliga datamaterial. Analysen 

kommer huvudsakligen att vara grafisk, men 

vi kommer också att illustrera begreppet punktskattning. 

I kommande laborationer och på räkneövningarna 

kommer ni att träna olika metoder 

att beräkna s. k. parameterskattningar. Exempel 

på parametrar som ni kommmit i kontakt med 

är p i binomialfördelningen och m i normalfördelningen. 

Parameterskattningar behövs i denna laboration 

för att kunna anpassa den fördelning vi 

ansatt till det givna datamaterialet. I dessa sammanhang 

kan MATLAB-funktionerna mean, var 

och std ofta vara till nytta. 

Förberedelseuppgifter 

Du skall ha läst igenom hela denna handledning 

och löst förberedelseuppgifterna innan du kommer 

till laborationen. 

Hemuppgift 1: 

Antag att ni erhållit ett datamaterial, stickprovet 

x = (x 1 , x 2 , x 3 , ..., x n ) och att ni vill beskriva detta 

datamaterial med hjälp av MATLAB. Fyll i nedanstående 

tabell: 

a 

b 

c 

Aritmetiskt 

medelvärde för x 

Stickprovsstandardavvikelse 

för x 

Stickprovsvarians 

för x 

Beteckning 

i boken 

Kommando 

i MATLAB 

Antag att ni har anledning att tro att x kommer 

från en normalfördelning. Lämna förslag på 

hur man med hjälp av stickprovet x skulle kunna 

skatta väntevärdet, m, och standardavvikelsen, s, i 

denna fördelning. 

Svar: 

Hemuppgift 2: 

Med hjälp av ett stickprov, t.ex. x, från en stokastisk 

variabel, t. ex. X , kan man även skatta fördelningsfunktionen 

för X . Datapunkterna, x i sorteras 

från minsta till största. Andelen datapunkter 

som är mindre eller lika med x i plottas sedan mot 

x i . Det blir en växande trappstegsfunktion som 

tar ett skutt med höjd 1/n för varje datapunkt. 

Denna funktion kallas empirisk fördelningsfunktion 

och genom den kan bl. a. kvantilerna för X 

skattas. 

En exakt beskrivning av hur man gör en empirisk 

fördelningsfunktion följer nedan. 

Vid ett givet slumpmässigt stickprov 

x=(x 1 , x 2 ,. . . ,x n ) gör man på följande sätt: 

(a) Först sorteras stickprovet i växande ord-

Datorlaboration 3, Matstat AK för Bygg, HT-08 

ning, betecknas x (1) , x (2) ,. . . ,x (n) . 

(b) Man skattar fördelningsfunktionen F(x) 

med det vi kallar för den empiriska 

fördelningsfunktionen F n (x). Den definieras 

som: 

⎧ 

⎨ 

F n (x) = 

⎩ 

0, x < x (1) , 

i/n, x (i) ≤ x < x (i+1) , 

1, x (n) ≤ x 

(c) Därefter plottas de n stycken talparen 

(x (i) , i n 

) så att ett hopp från (i − 1)/n till 

i/n med höjd 1/n bildas för varje x (i) . 

Rita den empirska fördelningsfunktionen för 

stickprovet 

x = 

(−4.6, −1.6, −1.0, −0.8, 0.4, 0.9, 2.1, 2.7, 4.0, 4, 9) 

Vi ska snart se hur detta kan göras med hjälp av 

Matlab-kommandon. 

Skatta nu med hjälp av er figur medianen för den 

fördelning som x kommer ifrån. 

Svar: 

Vad anger y-axeln i er figur 

Svar: 

Hemuppgift 3: 

Läs om normalfördelningspapper i boken, s 274– 

277. 

Hemuppgift 4: 

Repetera avsnitt 6.3 om centrala gränsvärdessatsen 

i kursboken, s. 165–170. 

2 Fördelningspapper 

2.1 Empirisk fördelningsfunktion och 

normalfördelningspapper 

I MATLAB kan den empiriska fördelningsfuntionen, 

F n (x), ritas med hjälp av funktionen stairs. 

Nedanstående kommandorader exemplifierar tekniken 

med hjälp av 100 observationer från en stokastisk 

variabel X ∈ N (2, 1). 

>> A = normrnd(2,1,100,1); 

>> B = sort(A); 

>> Fn = (1:1:length(B))/length(B); 

% övre hörn för F_n 

>> stairs(B,Fn); 

>> grid on 

Istället för att skriva en egen m-fil som samlar 

ihop ovanstående kommandon kan man använda 

Matlabs inbyggda funktion cdfplot som automatiskt 

plockar fram den empiriska fördelningsfunktionen 

F n (x). Prova själv. Använd help för att 

komma underfund med funktionen. Plotta därefter 

den empiriska fördelningsfunktionen för stickprovet 

A. 

>> help(cdfplot) 

>> cdfplot(A); 

Uppgift 2.1: 

På y-axeln har vi F n (x). Använd denna för att skatta 

väntevärdet i den fördelning som vektorn A är 

en observation av. 

Svar: 

Uppgift 2.2: 

Eftersom vi känner m och s i det här fallet 

(se kommandot som användes för att generera 

A) kan vi komplettera figuren med den riktiga 

fördelningsfunktionen, F X (x). Gör det och glöm 

inte att använda hold on innan du plottar F X (x) 

ovanpå F n (x). 

Fördelningsfunktionen för en normalfördelning kallas i Matlab för 

normcdf(x,m, s) 

%generera först en x-vektor 

%med lämpliga ändpunkter 

>> x=min(B)-0.1:0.01:max(B)+0.1; 

>> hold on 

>> plot(x,normcdf(x,2,1)) 

>> hold off 

Om vi vet eller misstänker att stickprovet kommer 

från en normalfördelning kan vi istället plotta 

det ordnade stickprovet i ett normalfördelningspapper. 

Skalan på y-axeln i ett normalfördelningspapper 

är anpassad så att observationerna kommer 

att följa en rät linje om de är normalfördelade. 

Om vi får någon kurvatur indikerar detta 

alltså att observationerna inte är normalfördelade. 

I MATLAB kan man direkt plotta ett stickprov 

2


i ett normalfördelningspapper med kommandot 

normplot. Använd help för att komma underfund 

med funktionen. Plotta därefter stickprovet 

A i ett normalfördelningspapper. 

>> help normplot 

>> normplot(A) 

Uppgift 2.3: 

Försök lista ut hur man skattar s i en normalfördelningsplott. 

Titta gärna i boken på sidan 277. 

Verifiera tekniken med er labhandledare. Skatta 

nu väntevärdet m och standardavvikelsen s i normalfördelningsplotten. 

Stämmer det med det använda 

stickprovet 

Svar: 

2.2 Validering av fördelning – normalfördelningspapper 

Under kursens gång har du kommit i kontakt med 

ett antal olika fördelningar – modeller för slumpvariation. 

Gemensamt för dessa fördelningar är att 

de innehåller en eller flera parametrar som påverkar 

fördelningens läge och spridning (och ibland 

även form). 

I praktiska sammanhang arbetar man ofta under 

antagande om att de mätningar man gör, observationer 

av slumpvariabler, kommer från en viss 

fördelning, men man känner inte värdena av de 

aktuella parametrarna för fördelningen. Ett naturligt 

tillvägagångssätt är då att använda det insamlade 

datamaterialet till att skatta dessa parametrar. 

Varje skattning som man åstadkommer på detta 

vis blir således en funktion av det insamlade datamaterialet. 

Stickprovsmedelvärdet, ¯x, och stickprovsvariansen, 

s 2 , är exempel på sådana funktioner. 

I det här laborationsmomentet skall du i första 

hand studera fördelningen hos ett stickprov och 

då speciellt i relation till normalfördelningen. För 

att få lite rutin på hur ett stickprov ser ut när det 

inte kommer från en normalfördelning, ska du 

plotta stickprov som kommer från andra fördelningar. 

Använd MATLABs inbyggda slumptalsfunktioner, 

normrnd, rand samt exprnd, för att generera 

slumptal från normal-, rektangel- och exponentialfördelningar. 

Uppgiften kan du lösa genom att 

simulera, till exempel, 100 slumptal från respektive 

fördelning. 

Skriv gärna era kommandon först i en m.fil, för smidig 

återanvändning 

>> N = normrnd(2,1,100,1); 

% slumptal från en normalfördelning 

>> R = 4*rand(100,1); 

% rektangelfördelade på (0, 4) 

>> E = exprnd(2,100,1); 

% Exponentialfördelade slumptal 

Uppgift 2.4: 

Undersök hur den empiriska fördelningsfunktionen, 

F n (x), ser ut för ett normalfördelat, rektangelfördelat 

respektive exponentialfördelat stickprov. 

För att kunna jämföra de tre fördelningarna är det 

bra att plotta dem med subplot-funktionen. Välj 

t. ex. 

>> figure 

subplot (311) för N, 

subplot (312) för R, 

subplot (313) för E 

% Exempel för normalfördelningen % 

>> subplot(311) 

>> cdfplot(N); 

>> grid on 

>> title(’Empirisk fördelningsfunktion 

från normalfördelning’) 

Upprepa för N, R och E så att ni får alla tre fördelningarna 

i var sin subplot. Jämför de tre plottarna. 

Svar: 

Uppgift 2.5: 

Avgör därefter hur N, R, och E ser ut i ett normalfördelningspapper. 

Använd först kommandot 

(figure) så att ni får fram en ny figur. Gör sedan 

en ny figur med tre subplottar i samma ordning 

som de tidigare med kommandot (normplot). 

Märk på något sätt ut vilken subplot som hänger 

ihop med vilken fördelning (T. ex. med title). 

Beskriv resultatet: 

Svar: 

3


Uppgift 2.6: 

Skatta väntevärde och varians för var och en av de 

tre fördelningarna med hjälp av MATLAB och de 

simulerade slumptalen från respektive fördelningar 

i N, R, samt E. Använd ¯x för att skatta väntevärdet 

och s 2 för att skatta variansen, dvs kommandona 

mean och var i MATLAB . Jämför era 

parameterskattningar med respektive fördelnings 

riktiga parametrar E(·) och V(·). Dessa kan erhållas 

genom att studera era kommandon när ni 

simulerade stickproven. Använd formelsamlingen 

och kurslitteraturen för att identifiera parametrarna. 

Hur stämmer era skattningar med de riktiga parametrarna 

Svar: 

Uppgift 2.7: 

Nu skall ni studera fördelningen för medelvärdet 

i de tre fördelningarna. Från varje fördelning kan 

man få 100 medelvärden genom att i stället simulera 

100 stickprov med till exempel 1000 observationer 

och lagra slumptalen i en 1000 × 100 

matris. När man i MATLAB bildar medelvärdet 

av en matris fås en vektor med medelvärdet för 

respektive kolonn. Studera först vad som händer 

när man tar medelvärdet av en 3x2-matris: 

>> Y=[3 30;5 25; 4 20] 

>> mean(Y) 

>> NN = normrnd(2,1,1000,100); 

% slumptal från en normalfördelning 

>> RR = 4*rand(1000,100); 

% rektangelfördelade på (0, 4) 

>> EE = exprnd(2,1000,100); 

% Exponentialfördelade slumptal 

Beräkna medelvärdet av respektive kolonn i matriserna, 

NN , RR samt EE. Du får alltså 100 observationer 

av medelvärden från respektive fördelning. 

Plotta dessa i varsitt normalfördelningspapper. 

%Exempel för normalfördelningen 

>> DN = mean(NN); 

>> figure 


>> normplot(DN); 

>> title(’Medelvärden av 1000 stickprov 

från en normalfördelning’) 

Komplettera med motsvarande figurer för de andra 

fördelningarna och jämför även med den tidigare 

bilden med normalfördelningsplottar för de 

tre fördelningarna. 

Uppgift 2.8: 

Vilken fördelning skall du approximativt få enligt 

teorin kring Centrala GränsvärdesSatsen (CGS) i 

vart och ett av de tre fallen Stämmer resultatet 

med CGS 

Svar: 

Uppgift 2.9: 

Vi vet att om X 1 , ..., X n är oberoende stokastiska 

variabler med E(X i ) = m och V (X i ) = s 2 för 

i = 1, ..., n så är 

∑ n 

i=1 

E( 

X i 

) = m 

n 

och 

∑ n 

i=1 

V ( 

X i 

) = s2 

n n . 

Beräkna med hjälp av dessa uttryck väntevärde 

och varians hos var och en av de tre stokastiska variabler 

som mean(NN), mean(RR) och mean(EE) 

är observationer av. Skatta sedan, med hjälp av 

MATLAB-kommandona mean och var, väntevärde 

och varians hos dessa tre stokastiska variabler. 

Hur stämmer skattningarna med de teoretiska 

värdena 

Svar: 

3 Återanknytning till Lab 1 (* frivillig 

uppgift) 

3.1 Jordbävningar 

I laboration 1 studerade ni datamaterial över tidsavståndet 

mellan de stora jordbävningarna under 

1900-talet. Om det är så att dessa jordbävningar 

förekommer slumpmässigt i tiden så kommer 

tidsavståndet mellan två efterföljande händelser 

att vara exponentialfördelad, s.v. ∈ Exp(l). Datamaterialet 

kommer ni åt med hjälp av kommandot 

load(quakeper). 

4


Uppgift 3.1: 

Undersök ifall exponetialfördelningen eller normalfördelningen 

är en vettig modell för detta datamaterial. 

Plocka fram följande tre figurer med 

hjälp av Matlab. 

Svar: 

subplot (311) för Normerat histogram, 

subplot (312) för Empirisk fördelningsfunktion, 

subplot (313) för Koll av 

normalfördelningsantagandet 

Undersök nu om man kan anpassa en exponetialfördelning 

till datamaterialet. 

Uppgift 3.2: 

Hur skattar man väntevärdet E[x] i en exponentialfördelning. 

>> figure % Quakeperiod % 


>> hist2(quakeper,20); 

>> title(’Quakeperiod, normerat histogram’) 

>> grid on, hold on 

>> help(exppdf) 

>> ------- % Fixa en tidsaxel % 

>> ------- % Plotta täthetssfunktionen % 


>> cdfplot(quakeper); 

>> title(’Empirisk fördelningsfunktion’) 

>> grid on, hold on 

>> help(expcdf) 

>> ------- % Fixa en tidsaxel % 

>> ------- % Plotta Fördelningsfunktionen % 

Uppgift 3.4: 

Vad får ni för skattning av 10 %-kvantilen 

Svar: 

Svar: 

Uppgift 3.3: 

Hur använder man denna skattning för skatta värdet 

på parametern i exponentialfördelningen Vad 

fick ni för värde 

Svar: 

Plocka nu fram en ny figur och plotta en exponetialfördelning 

där ni som parametervärde använder 

er skattning. Täthetsfunktionen för en exponetialfördelad 

slumpvariabel heter i Matlab: exppdf 

och fördelningsfunktionen kallas för expcdf. 

4 Avslutning 

Vi har i denna datorlaboration sett exempel på 

hur man med en kombination av teori och empiri 

kan hitta fördelningar som mer eller mindre 

väl beskriver den slumpmässiga variationen hos 

verkliga händelser. Kan vi hitta en sannolikhetsfördelning 

vars teoretiska egenskaper är väl kända 

och som dessutom passar väl till de observationer 

vi gjort i verkligheten, så ger detta oss en möjlighet 

att beräkna olika sannolikheter och på mera 

objektiv grund bedöma risker, med mera. 

5


Användbara Matlab-kommandon 

help kommando ger en hjälptext till kommandot kommando 

load filnamn hämtar alla variabler från filen filnamn.mat och laddar in dem i Matlab 

whos 

ger en detaljerad lista över de variabler som finns definierade 

hist(x) 

ritar ett 10-intervalls histogram för elementen i vektorn x 

mean(x) 

beräknar aritmetiska medelvärdet av elementen i vektorn x 

mean(A) 

om A är en m × n–matris fås en 1 × n–matris innehållande aritmetiska 

medelvärdena för varje kolonn i A 

median(x) 

beräknar medianen av elementen i vektorn x 

std(x) 

beräknar standardavvikelsen av elementen i vektorn x 

var(x) 

beräknar variansen av elementen i vektorn x 

plot(x,y,str) plottar y mot x. Använder färg och form enligt strängen str 

plot(y,str) plottar de ordnade talparen (j, y j ). Använder färg och form enligt strängen str 

subplot(m,n,p) delar grafikfönstret i m × n delfönster, aktuellt fönster blir fönster nr p, 

delfönstren numreras från vänster till höger, uppifrån och ner 

title(text) skriver ut strängen text överst i grafikfönstret 

hold on 

håller kvar aktuellt grafikfönster så att man kan 

rita flera figurer i samma fönster 

hold off 

avlutar kvarhållningen av grafikfönster 

axis([v1 v2 v3 v4]) sätter axlarnas skalor så att 

x min = v1, x max = v2, y min = v3 och y max = v4 

sort(x) 

ger en vektor med elementen i vektorn x sorterade i växande ordning 

rand(m,n) ger en m × n-matris med slumptal från en rektangelfördelning på (0,1) 

normrnd(m,s,i,j) ger en i × j-matris med slumptal från en normalfördelning 

med väntevärde m och standardavvikelse s 

exprnd(m,i,j) ger en i × j-matris med slumptal från exponentialfördelning med väntevärde m 

i:j:k 

ger en följd av värden från i till j i steg om j, dvs i,i+j,i+2j,...k 

figure 

öppnar ett nytt grafikfönster 

stairs(z, x) 

ritar trappstegsdiagram över värdena i x i positionerna givna av vektorn z 

grid on 

ritar ut ett rutnät i grafikfönstret 

grid off 

tar bort rutnätet från grafikfönstret 

cdfplot(x) 

plottar den empiriska fördelningsfunktionen mot värdena i x 

normplot(x) plottar data i x i ett normalfördelningspapper 

expcdf(x,m) ger fördelningsfunktionen för en exponentialfördelad stokastisk variablel 

med väntevärde m, beräknad i punkterna i x 

exppdf(x,m) ger täthetsfunktionen för en exponentialfördelad stokastisk variablel 

med väntevärde m, beräknad i punkterna i x 

6

FMS601 lab3 ht08 - Matematikcentrum - Lunds Tekniska Högskola

Create successful ePaper yourself

Delete template?

Save as template?