Sannolikhetslära – en introduktion

Sannolikhetslära 

– 

en introduktion

Innehåll 

1 Sannolikhetslärans grunder 3 

1.1 Varförbehövssannolikhetsläran? ................ 3 

1.2 Slumpförsök............................ 4 

1.3 Mängdläranssymbolspråk.................... 6 

1.3.1 Övningsuppgifter ..................... 9 

1.4 Atttilldelasannolikhetertillhändelser ............. 9 


1.5 Kombinatorik ........................... 13 

1.5.1 Dragning med återläggning med hänsyn till ordningen . 14 

1.5.2 Dragning utan återläggning med hänsyn till ordningen 15 

1.5.3 Dragning utan återläggning utan hänsyn till ordningen 16 


1.6 Räknereglerförsannolikheter .................. 19 

1.6.1 Komplementsannolikheter ................ 19 

1.6.2 Additionssatsen...................... 20 

1.6.3 Betingadsannolikhet................... 24 

1.6.4 Oberoendehändelser................... 31 


2 Diskreta slumpvariabler 35 

2.1 Vadärenslumpvariabel?..................... 35 


2.2 Väntevärden............................ 40 

2.2.1 Sannolikhetsfördelningensmedelvärde.......... 40 

2.2.2 Sannolikhetsfördelningensspridning........... 42 


2.3 Linjärfunktioneravslumpvariabler ............... 46 

2.4 Tvåpunktsfördeladslumpvariabel ................ 49 

2.4.1 Binomialfördelningen................... 51 

2.4.2 Hypergeometriskfördelning ............... 58 

2.4.3 Samband mellan Binomial- och Hypergeometrisk fördelning 

............................ 62 


2.5 Poissonfördelningen........................ 66 

2.5.1 Poissonprocesser . . ................... 66 

2.5.2 Poissonapproximation av binomialfördelningen..... 68 

2.5.3 VäntevärdenförPoissonfördelningen .......... 71 


1

3 Kontinuerliga slumpvariabler 73 

3.1 Vadärenkontinuerligslumpvariabel?.............. 73 

3.2 Normalfördelningen........................ 79 

3.2.1 Normalfördelningensegenskaper............. 79 

3.2.2 Attanvändatabellsamlingen............... 83 

3.2.3 Standardisering...................... 88 


3.3 Normalapproximationavbinomialfördelningen......... 95 

3.3.1 Övningsuppgifter .....................101 

3.4 Centrala gränsvärdessatsen (CGS) . . . .............101 

3.4.1 Ettinledandeexempel ..................101 

3.4.2 Oberoende och likafördelade slumpvariabler (o.l.f.s.v.) . 104 

3.4.3 Väntevärden för summor och medelvärden av o.l.f.s.v. . 105 

3.4.4 Centralagränsvärdessatsen................107 

3.4.5 Hur fungerar normalapproximation av binomialfördelningen? 

..........................111 

3.4.6 Normalapproximation av Poissonfördelningen . . . . . 112 

3.4.7 Approximationsmöjligheter................113 

3.4.8 Övningsuppgifter .....................114 

3.5 Normalfördeladepopulationer ..................115 

A Formelförklaringar 119 

A.1 Beräkningsformelförvariansen .................119 

A.2 Väntevärdenavlinjärfunktioner.................119 

B Diskreta sannolikhetsfördelningar 119 

B.1 Binomialfördelningen.......................119 

B.2 Hypergeometriskfördelning ...................121 

B.3 Poissonfördelningen........................122 

B.3.1 Sannolikhetsfunktionen..................122 

B.3.2 Väntevärdeochvarians..................123 

C Svar till övningsuppgifterna 124 

2

1 Sannolikhetslärans grunder 

1.1 Varför behövs sannolikhetsläran? 

Ideflesta situationer där man använder statistiska metoder är målet att 

ta reda på hur någon egenskap (variabel) förhåller sig i en population. Det 

datamaterial man då förfogar över innehåller oftast information enbart för 

vissa individer i populationen, dvs datamaterialet representerar ett stickprov 

från den aktuella populationen. 

Exempel 1 Antag att vi vill studera intresset för ett EMU-medlemskap och 

betraktar (den kvalitativa) variabeln “Är du för ett EMU-medlemskap”. En 

totalundersökning (folkomröstning) är alldeles för kostsam och tidskrävande 

och därför tas istället ett stickprov ur den svenska väljarkåren. Frågan är hur 

man bäst går tillväga för att använda denna stickprovsinformation till att dra 

slutsatser om helheten, dvs hur variabeln “Är du för ett EMU-medlemskap” 

förhåller sig i hela populationen. ¤ 

Frågeställningen i exemplet ovan är mycket vanlig i statistiska sammanhang 

och kräver därför en lösning. Först skall man ha klart för sig att varje 

slutsats som bygger på information från ett stickprov är förknippat med en 

osäkerhet, dvs det finns alltid en risk för att man drar en felaktig slutsats. 

Vi kan ha haft en rejäl dos “otur” och fått resultat i stickprovet som inte 

överensstämmer med hur det ser ut i populationen. Den stora fördelen med 

statistiska metoder är att man kan få en uppfattning om hur stor denna risk 

är, vilket ger möjligheten att bedöma när stickprovet ger tillräckligt säkra 

resultat. 

Målet med undersökningen i exemplet ovan är antagligen att få en uppfattning 

om den verkliga andelen EMU-anhängare i den svenska väljarkåren. 

Låt oss kalla denna okända andel för π. Antag att vi tar ett (slumpmässigt) 

stickprov ur den svenska väljarkåren och får att 48% av dessa är för ett svenskt 

medlemskap i EMU. Vad kan vi dra för slutsatser om π utifrån denna 

procentandel? Antag att ett annat statistiskt institut gör en liknande undersökning 

och får motsvarande andel till 52%. En tredje undersökning ger 

andelen EMU-anhängare till 53%. Vilken av dessa undersökningar skall vi 

tro på? Ingen av dem är antagligen bättre än någon annan och anledningen 

till att dom inte ger samma resultat beror på sk slumpmässig variation. I 

och med att vi enbart använder information från ett stickprov kommer vi att 

ha ett visst mått av “otur” som gör att vi inte kommer att få exakt samma 

resultat varje gång och inte heller samma resultat som en totalundersökning 

skulle gett. Detta innebär att vi i ett stickprov antagligen kommer att 

3

få ett missvisande resultat, vilket dock inte är speciellt alarmerande (när vi 

väl vet om det inträffar). När vi tagit ett stickprov och beräknat andelen 

EMU-anhängare vet vi inte hur missvisande just detta stickprov är. Vad vi 

dock kan ta reda på är hur missvisande stickprovsresultat i regel är. För att 

utifrån stickprovsresultat kunna dra statistiskt korrekta slutsatser måste vi 

således först få en uppfattning om hur slumpmässig variation fungerar, dvs 

vi måste ta reda på vilka egenskaper ett stickprov har innan det är taget. 

Detta är sannolikhetslära. 

1.2 Slumpförsök 

Rent slumpmässigt, eller sannolikhetsmässigt, visar det sig att proceduren att 

ta ett stickprov har mycket gemensamt t.ex. med kast med tärning, slantsingling, 

eller dragandet av lotter i en tombola. 

Exempel 2 Antag t.ex. i föregående exempel att halva den svenska väljarkåren 

består av EMU-anhängare. Att slumpmässigt välja en person och 

undersöka huruvida han eller hon är EMU-anhängare är sannolikhetsmässigt 

ekvivalent med att singla en slant där t.ex. krona representerar EMUanhängare. 

¤ 

Exempel 3 I en liknande undersökning är vi intresserade av andelen moderater 

i den svenska väljarkåren. Antag att en sjättedel av väljarkåren består 

av moderater. Att slumpmässigt välja en person och undersöka huruvida han 

eller hon är moderat är sannolikhetsmässigt ekvivalent med att kasta en vanlig 

sexsidig tärning där t.ex. sidan sex representerar moderat (och de övriga 

sidorna representerar icke-moderater). ¤ 

Förutom ovanstående paralleller med verkligheten gäller dessutom att 

slantsingling och tärningskast är relativt enkla att få grepp om. Därför används 

dessa ofta som exempel vid första kontakten med sannolikhetsläran. 

Varje försök, eller experiment, där vi på förhand inte exakt kan förutse resultatet 

kallas för ett slumpförsök, eller slumpexperiment. Målet är att för ett 

sådant slumpförsök hitta en lämplig matematisk beskrivning, en s.k. slumpmodell. 

Lite luddigt formulerat bestämmer vi i en slumpmodell vad som kan 

hända och med vilka sannolikheter detta händer. Innan vi mer konkret förklarar 

vad detta innebär behöver vi lite terminologi. 

Resultatet av ett slumpförsök kallas för ett utfall. Mängden av alla tänkbara 

utfall kallas för försökets utfallsrum. Utfallsrummet brukar betecknas med 

bokstaven S och de enskilda utfallen betecknas allmänt med ei (där indexet 

i anger det i:te utfallet i den ordning vi ställt upp). 

4

Exempel 4 Vi återgår till exemplet där vi kastar en tärning. Vi har då 

utfallsrummet 

där vi använder mängdklamrar för att visa att detta är en mängd. Antag att 

vi istället singlar en slant. Utfallsrummet blir då 

¤ 

Då man anger sitt utfallsrum är det viktigt att alla tänkbara utfall finns 

medochattutfallenintekaninträffa samtidigt.Dvsexakt ett av utfallen i 

utfallsrummet kommer att inträffa närförsöketutförs. 

Vanligtvis är vi dock inte intresserade av utfallen i sig utan av någon 

eller några intressanta egenheter hos dessa. På detta sätt kommer en del 

av utfallen i olika utsträckning ha samma egenskaper vilket gör att vi kan 

“klumpa” ihop utfallen. En sådan klump eller mängd av utfall som vi av 

någon anledning anser ha någonting gemensamt kallas för en händelse. För 

att beteckna händelser används vanligtvis versaler i början av alfabetet, dvs 

exempelvis A, B och C. 

Exempel 5 Antag att vi slumpmässigt väljer en person ur föreläsningssalen. 

Det finns då lika många utfall som det finns personer i salen. Nu är vi antagligen 

inte intresserade av personerna i sig utan huruvida dom har en viss 

egenskap. T.ex. kan vi vara intresserade av huruvida den valde är man eller 

kvinna, eller huruvida den valde personen cyklade till föreläsningen. Vi kan 

då skapa händelserna 

A = Den valde är en man 

B = Den valde cyklade till skolan 

som då består av alla utfall där den valde är en man, respektive alla utfall 

där den valde cyklade till föreläsningen. Det nämndes ovan att utfall inte kan 

inträffa samtidigt. Detta är inget krav då man konstruerar sina händelser. 

Antag att den slumpmässigt valde personen blev “Conny”, dvs slumpförsökets 

utfall blev 

e = Conny 

Detta utfall ingår i händelsen A och vi säger då att händelsen A har inträffat. 

Men det är fullt möjligt att Conny cyklade till föreläsningen vilket då betyder 

att även händelsen B inträffat. ¤ 

5

Ideflesta situationer utförs sådana enkla slumpförsök om och om igen. Då 

SIFO eller något annat opinionsinstitut gör en väljarundersökning intervjuas 

normalt mellan 1500 och 2000 personer. I dessa situationer betraktas varje 

tänkbart stickprov som ett utfall. 

Exempel 6 Antag att vi slumpmässigt i tur och ordning väljer ut tre personer 

i föreläsningssalen och ställer frågan “Cyklade Du till dagens föreläsning?”. 

Låter vi J stå för Ja och N stå för Nej kan utfallsrummet beskrivas 

via 

S = {JJJ,JJN; JNJ,NJJ,JNN,NJN,NNJ,NNN} 

Frågar vi en person består utfallsrummet av enbart två utfall men om vi 

sedan utökar till tre personer får vi som i exemplet åtta utfall. Skulle vi 

ställa “EMU-frågan” till 2 000 personer i den svenska väljarkåren skulle vi 

ha 22000 tänkbara utfall vilket är ett mycket stort tal och det är inte rimligt 

att skriva upp alla dessa utfall i ett utfallsrum. Som nämndes ovan är vi dock 

antagligen inte intresserade av utfallen i sig utan av händelser. I det här fallet 

är det troligtvis av intresse att se hur många av de utvalda som cyklade till 

föreläsningen vilket t.ex. gör händelsen 

B2 = Två av de valda cyklade till föreläsningen 

intressant. Denna händelse består av utfallen 

B2 = {JJN,JNJ,NJJ} 

De övriga intressanta händelserna är B0,B1, och B3. ¤ 

I Exempel 6 ovan gäller att ingen av händelserna B0 till B3 kan inträffa 

samtidigt och dessutom att exakt en av dessa händelser kommer att inträffa. 

Dom sägs vara uttömmande (täcker hela utfallsrummet) och parvis disjunkta 

(två händelser kan inte inträffa samtidigt). Händelser med denna egenskap 

kommer vi att ha nytta av lite senare. För att på bästa sätt utnyttja händelser 

använder vi oss av mängdlärans symbolspråk. 

1.3 Mängdlärans symbolspråk 

Utfallsrummet S beskrivs oftast som en rektangel. Utfallen kan då symboliseras 

som prickar i denna rektangel men oftast utelämnas prickarna och det 

är underförstått att dom finns där. En händelse åskådliggörs nu vanligtvis 

med en cirkel (eller ellips) i rektangeln och det är åter underförstått att alla 

utfall som tillhör händelsen befinner sig inom denna cirkel. Sedan kan fler 

händelser beskrivas genom att fler cirklar ritas och det faktum att händelser 

kan inträffa samtidigt gör att cirklarna överlappar varandra. 

6

Exempel 7 Återgår vi till Exempel 5 därenpersonurföreläsningssalen 

skall väljas ut och de aktuella händelserna är 

får vi diagrammet 

¤ 


B = Den valde cyklade till skolan 

S 

A 

Diagrammet i exemplet ovan kallas för ett Venn-diagram och används 

flitigt i sannolikhetsläran då de utgör ett utmärkt stöd för förståelse av sannolikhetsmässiga 

besvärligheter. Utifrån diagrammet ser vi att cirklarna och 

rektangeln tillsammans skapar nya områden. Det är förutom cirklarna A och 

B framförallt tre av dessa områden som är av intresse. 

• Komplementet.Tillvarjehändelsefinns en komplementhändelse som 

består av alla utfall som inte tillhör händelsen. För händelsen A finns 

således en komplementhändelse A. I exemplet ovan betyder 

A = Den valde är inte en man 

= Den valda är en kvinna 

som i Venn-diagrammet åskådliggörs via 

7 

A 

B 

A

• Unionen. Vi söker nu de utfall som tillhör åtminstone en de båda 

händelserna A och B. Denna händelse betecknas med A∪B och uttalas 

“A union B” eller “A eller B” där eller skall tolkas som och/eller. I 

exemplet ovan får vi betydelsen 

A ∪ B = Den valde är man och/eller har cyklat till föreläsningen 

I Venn-diagrammet får vi att unionen utgörs av det skuggade området 

S 

A 

• Snittet. Vi söker nu de utfall som tillhör båda händelserna A och B. 

Denna händelse betecknas med A ∩ B och uttalas “A snitt B” eller “A 

och B”. I exemplet ovan får vi betydelsen 

A ∩ B = Den valde är en man som har cyklat till föreläsningen 

I Venn-diagrammet får vi att snittet utgörs av det skuggade området 

S 

A B 

Ibland kan det hända att händelserna A och B inte överlappar, vilket t.ex. 

gäller för A och A. Man säger då att händelserna är disjunkta,ellerömsesidigt 

uteslutande eller ömsesidigt oförenliga. A och B har då inga gemensamma 

utfall vilket åskådliggörs via 

A ∩ B = ∅ 

där ∅ är den tomma mängden, dvs en “mängd” utan något innehåll. 

8 

A ∩ B 

B

1.3.1 Övningsuppgifter 

Uppgift 1 Lös uppgift 113. 


1.4 Att tilldela sannolikheter till händelser 

Innan vi börjar med att fundera över hur vi skall tilldela sannolikheter till 

olika händelser bör vi ta reda på vilka regler vi måste rätta oss efter. Först 

betecknar vi sannolikheter via 

Pr (A) =sannolikheten att händelsen A inträffar 

och sannolikheter anges som tal mellan 0 och 1. 1 Vi ställer upp följande 

axiom för tilldelning av sannolikheter. 2 

1. Pr (S) =1. Utfallsrummet är en s.k. säker händelse, dvs vi vet att vad 

som än händer kommer denna händelse att inträffa. Därför tilldelas 

denna sannolikheten 1. 

2. 0 ≤ Pr (A) ≤ 1 för varje händelse A. 

3. Låt A och B vara disjunkta, dvs A ∩ B = ∅. Dågälleratt 

Pr (A ∪ B) =Pr(A)+Pr(B) 

Om A och B inte har några gemensamma utfall kan således unionsannolikheten 

bestämmas genom att addera de enskilda sannolikheterna. 

Det är axiom 3 som är något svårare att omedelbart acceptera men det 

kommer att bli klarare inom kort. Vi börjar med att illustrera med ett enkelt 

exempel. 

Exempel 8 Antag att betygsfördelningen på en viss kurs är 

Betyg U G VG 

Andel 30% 50% 20% 

Antag nu att vi slumpmässigt väljer ut en student för att notera dennes betyg. 

Då har vi ett slumpförsök med utfallsrummet 

S = {U,G,VG} 

1I vardagsspråk kan man även använda 0 till 100%. 

2Axiomsystemet konstruerades av den ryske sannolikhetsteoretikern A Kolmogorov 

omkring 1933, 30 år gammal. 

9

med sannolikheterna 

Pr ({U}) = 0.3 

Pr ({G}) = 0.5 

Pr ({VG}) = 0.2 

Vi är nu intresserade av sannolikheten att den valde klarade kursen och eftersom 

vi ser att 70% av studenterna fick betygen G eller VGdrar vi slutsatsen 

att sannolikheten för detta är 0.7. Mer formellt löser vi uppgiften på följande 

sätt. Skapa en händelse som heter 

vilket betyder att 

A = Den valde klarade kursen 

A = {G} ∪ {VG} 

Eftersom ingen student kan ha mer än ett betyg på en kurs följer att utfallen 

G och VG betraktade som händelserna {G} och {VG} är disjunkta. Enligt 

axiom 3 ovan följer därför att 

¤ 

Pr (A) =Pr({G} ∪ {VG}) =Pr({G})+Pr({VG}) =0.5+0.2 =0.7 

De enskilda utfallen är alltid disjunkta, vilket innebär att vi enligt axiom 

3 alltid 3 kan beräkna sannolikheten för en händelse genom att summera 

utfallssannolikheterna för de enskilda utfallen som ingår i händelsen. 

Eftersom utfallen utgör de minsta beståndsdelarna av ett slumpförsök kallas 

utfallssannolikheterna för elementarsannolikheter. Formellt sammanfattar vi 

ovanstående i följande definition. 

Definition 1 (Elementarsannolikheter) Betrakta ett slumpförsök med utfallsrum 

S = {e1,e2,...,eN} 

där N kan vara oändligheten (∞). Varje utfall har då en sannolikhet, dvs 

det existerar tal 

Pr (ei) ≥ 0 

3 Detta gäller under förutsättning att utfallsrummet är diskret. Förkontinuerliga utfallsrum 

kommer alla enskilda utfall att ha sannolikheten 0 varför denna metod inte fungerar. 

Vi återkommer till kontinuerliga utfallsrum i kapitel 3 

10

för alla i =1, 2,...,N. När väl slumpförsöket utförs kommer något av dessa 

utfall att inträffa vilket i axiomen ges av att Pr (S) =1.Uttrycktielementarsannolikheter 

blir detta 

X 

Pr (ei) = 

i∈S 

NX 

Pr (ei) =1 

i=1 

För att bestämma sannolikheten för en händelse A kan vi summera de ingående 

elementarsannolikheterna, dvs 

Pr (A) = X 

Pr (ei) 

¥ 

i∈A 

Genom att känna dessa elementarsannolikheter kan vi alltså bestämma 

sannolikheten för varje händelse. Hur bestämmer man då i allmänhet dessa 

elementarsannolikheter? Det finns i princip tre sätt att tilldela sannolikheter 

1. Teoretisk tilldelning. I det här fallet använder vi ett logiskt resonemang. 

Denna metod kan användas t.ex. vid tärningskast och lottodragning 

o.dyl. 

2. Empirisk tilldelning. Här använder man sig av sk relativa frekvenser, 

vilket innebär att man studerar liknande slumpförsök under en tid och 

använder sedan som sannolikheter hur ofta, relativt sett, de olika utfallen 

inträffar. Detta är vanligt t.ex. vid maskinfel och trafikolyckor. 

3. Subjektiv tilldelning. Man kan även (något mindre vetenskapligt) 

komma med egna slutsatser om chanser och risker. Man kan t.ex. bedöma 

risken för regn till 30% eller att chansen för svensk vinst i nästa 

match i VM-kvalet till 50%. 

En i praktiken inte helt ovanlig situation är att samtliga utfall är lika 

sannolika. Eftersom summan av alla elementarsannolikheter skall bli 1 måste 

då gälla att 

Pr (ei) = 1 

, i =1, 2,...,N 

N 

Att bestämma sannolikheten för en händelse är samma som att summera de 

ingående elementarsannolikheterna och låter vi 

g (A) =Antal utfall i A 

11

följer att 

Pr (A) = X 

i∈A 

Pr (ei) = 1 

N 

+ 1 

N 

+ ···+ 1 

N 

= g (A) 

N = 

AntalutfalliA 

= 

(1) 

Totala antalet utfall 

Det abstrakta problemet att bestämma sannolikheten för en händelse har 

således överförts till det konkreta problemet att räkna utfall. 

Exempel 9 Vi återgår till slumpexperimentet att kasta en tärning. Vi har 

då utfallsrummet 

Om inte tärningen är falsk är alla utfall lika sannolika och eftersom det totalt 

är sex utfall följer att 

Antag att vi är intresserade av att bestämma sannolikheten för händelsen 

Eftersom alla utfall är lika sannolika räcker det att räkna utfall och det följer 

föga överraskande att 

Pr (A) = 3 

6 =0.5 

¤ 

Nuärdetintealltidsåenkeltattsehurmångautfalldetfinns eller hur 

många utfall som ingår i en viss händelse. Dock gäller att det finns effektiva 

metoder för att räkna utfall som fungerar i många situationer vilket vi skall 

se i nästa avsnitt. 




12

1.5 Kombinatorik 

I kombinatoriken skall vi komma upp med metoder för att räkna utfall för 

en typ av händelser som uppstår i många praktiska situationer. Ett utfall i 

ett slumpförsök är oftast en sammanslagning av ett antal enklare utfall som 

resulterat av att ett enkelt slumpförsök utförts vid upprepade tillfällen eller 

att ett antal olika slumpförsök utförts. T.ex. behöver ett slumpförsök inte 

bestå i att kasta en tärning en gång utan att tärningen kastas flera gånger. Då 

vitarettstickprovfrånenstorpopulationtarvisällanbaraenpersonutan 

det enkla slumpförsöket utförs flera gånger tills vi har ett någorlunda stort 

stickprov. Det blir då besvärligare att komma fram till hur många utfall det 

totalt finns och hur många utfall det finns i dom händelser vi är intresserade 

av. Intressanta händelser utgörs ofta av dom utfall där lika många av dom 

valda har en viss egenskap. I Exempel 6 är vi t.ex. mycket intresserade av 

att ta reda på antal utfall (kombinationer av tre personer) där exakt två 

av dessa cyklade till skolan. Då man skall bestämma hur många möjligheter 

det finns att utföra ett sådant sammanslaget slumpexperiment överförs ofta 

problemet på en urnmodell, vilketinnebärattolikfärgadeellernumrerade 

bollar dras ur en urna. Problemet formuleras sedan som “På hur många sätt 

kan denna dragning ske så att...?”. Svaret beror på förutsättningarna, dvs 

urnans sammansättning och på vilket sätt bollarna dras, och det visar sig 

vara två faktorer som är speciellt viktiga. 

1. Sker dragningen med eller utan återläggning,dvsskallendragen 

boll läggas tillbaks i urnan eller inte? 

• Kastas en tärning vid upprepade tillfällen skall det finnas sex bollar 

i urnan numrerade från 1 till 6. När vi drar den första bollen 

representerar den utfallet i det första kastet. Nästa kast skall ha 

samma möjligheter som det första varför bollen måste läggas tillbaka. 

I det här fallet är det dragning med återläggning. 

• Vid varje lottodragning bestämmer apparaten DraKula veckans 

vinstrad genom att välja ut sju bollar bland de 35 i “urnan”. Varje 

nummer får dock vara med endast en gång varför en dragen kula 

inte läggs tillbaks. Vid en lottodragning är det således dragning 

utan återläggning. 

2. Sker dragning med eller utan hänsyn till ordningen, dvs spelar 

det någon roll i vilken ordning “bollarna” dras? 

• Antag att vi vill bestämma antalet tänkbara registreringsnummer 

på bilar. I det här fallet är det skillnad på t.ex. ABC123 och 

ACB123. Här tas således hänsyn till i vilken ordning bollarna dras. 

13

• Vi återgår till problemet med dragningen av lottoraden. Antag 

att DraKula i tur och ordning väljer kulorna 1,2,3,4,5,6,7. Detta 

är dock exakt samma rad som om apparaten i tur och ordning 

valt 7,6,5,4,3,2,1. Vid lottodragning är det således dragning utan 

hänsyn till ordningen. 

Lyckas man klassificera slumpförsöket utifrån dessa båda faktorer har 

man antagligen också löst problemet med att bestämma antalet utfall. Slår 

man ihop dessa båda faktorer blir det totalt fyra olika situationer av vilka 

vi på den här kursen enbart är intresserade av tre. Om inget annat anges 

förutsätts urnan bestå av N bollar varav vi skall välja ut n, dvsviskall 

successivt, på något sätt, dra n bollarururnan. 

1.5.1 Dragning med återläggning med hänsyn till ordningen 

I det här fallet lägger vi efter varje dragning tillbaks den dragna bollen och 

utför således n stycken identiska slumpförsök. Dessutom är det av vikt att 

känna till i vilken ordning bollarna dragits. Eftersom urnan innehåller N 

bollar finns det i första försöket N möjliga utfall. Lika många möjligheter 

har vi vid varje dragning och eftersom ordningen är relevant får vi att totala 

antalet möjligheter blir 

N · N ·····N = N n 

Exempel 10 Hur många möjliga stryktipsrader finns det? Vi börjar med att 

bestämma urnans innehåll. Vid varje dragning finns tre möjligheter, 1, X och 

2, vilket betyder att urnan skall innehålla tre bollar (lämpligt markerade). 

Efter varje dragning skall bollen återföras till urnan eftersom samtliga tre 

tipstecken kan förekomma flera gånger. Dessutom gäller att ordningen är av 

vikt eftersom t.ex. följden 1X1 ... skiljer sig från X11 ....Viharsåledes 

dragning med återläggning med hänsyn till ordningen där vi skall dra n =13 

bollar ur en urna med N =3bollar. Antal möjliga tipsrader ges därför av 

¤ 

3 13 = 1 594 323 rader 

En del slumpexperiment består i att vi skall dra bollar ur olika urnor och 

det är inte säkert att samtliga dessa innehåller lika många bollar. Antag att 

vi i tur och ordning skall dra bollar ur k urnor som innehåller N1,N2,...,Nk 

bollar, respektive. Från ovan följer därmed att antal möjligheter ges av 

N1 · N2 ·····Nk 

Detta resultat kallas för multiplikationsprincipen. 

14

Exempel 11 Hur många registreringsnummer finns det till svenska bilar. 

Bland bokstäverna använder vi enbart de 26 första och vi antar att det är 

tillåtet att använda samtliga bokstavs- och nummerkombinationer. Det är 

åter dragning med återläggning eftersom samma bokstav och nummer får 

förekomma fler gånger och dessutom är ordningen av betydelse. Först drar vi 

tre bollar ur den första urnan som innehåller N1 =26bollar och sedan tre 

bollar ur den andra urnan som innehåller N2 =10bollar. Enligt multiplikationsprincipen 

blir därför antalet möjliga registreringsnummer 

¤ 

26 · 26 · 26 · 10 · 10 · 10 = 26 3 · 10 3 =17576000 

1.5.2 Dragning utan återläggning med hänsyn till ordningen 

Nu ändrar vi förutsättningarna något och lägger inte tillbaka de dragna bollarna 

i urnan. I och med detta måste vi därför förutsätta att n ≤ N, dvs 

vi kan inte längre dra fler bollar än det finns i urnan. Vi förutsätter dock 

fortfarande att ordningen av de dragna bollarna är av betydelse. Eftersom 

urnans sammansättning nu ändras efter varje dragen boll kan vi se det som 

att bollarna dras ur olika urnor där den första innehåller N bollar, den andra 

N − 1 bollar osv. Den n:te bollen dras ur en urna med N − n +1bollar och 

enligt multiplikationsprincipen följer därför att antal möjligheter ges av 

N · (N − 1) · (N − 2) ·····(N − n +1) 

I specialfallet då vi drar samtliga urnans bollar, dvs då n = N, får vi antal 

möjligheter till 

N · (N − 1) · (N − 2) ·····3 · 2 · 1=N! 

där den sista beteckningen kallas för N-fakultet och är av stor vikt i sannolikhetsläran. 

Då vi utan återläggning drar bollar ur en urna och tar hänsyn 

till den ordning i vilken bollarna drogs får vi en sk ordnad delmängd eller 

permutation av urnans bollar. N-fakultet ger således hur många sådana permutationer 

det finns då samtliga urnans bollar dras. 

Exempel 12 I finalomgången av Melodischlageruttagningen finns fem kandidaterkvar.Hurmångatänkbaraföljderfinns 

det för de fem första placeringarna? 

Ett bidrag kan förstås enbart finnas på en placering och ordningen 

är av högsta betydelse vilket gör att vi söker antalet permutationer bland fem 

bidrag (bollar). Svaret ges således av 

¤ 

5 · 4 · 3 · 2 · 1=5!=120 

15

Nu är det ju som sagt inte säkert att vi vill dra urnans samtliga bollar 

utan nöjer oss i det allmänna fallet med att dra n bollarururnan.Dock 

gäller att vi kan använda fakultetsbegreppet för att underlätta beteckningen. 

Detta görs genom att utvidga utrycket så att multiplikationen sker för varje 

heltal ner till 1. För att inte resultatet skall påverkas måste vi dock införa 

en nämnarterm med motsvarande utvidgning. Antalet n-permutationer, eller 

ordnade delmängder av storlek n, ur en mängd med N objekt (bollar) ges av 

PN,n = N · (N − 1) · (N − 2) ·····(N − n +1)= 

= N · (N − 1) · (N − 2) ·····3 · 2 · 1 

(N − n) · (N − n − 1) ·····3 · 2 · 1 = 

N! 

(N − n)! 

Exempel 13 Utav tio personer skall tre personer väljas ut så att en blir 

ordförande, en blir sekreterare och en blir suppleant. På hur många sätt kan 

detta göras? Det är dragning utan återläggning och eftersom det är tre olika 

poster är det dessutom med hänsyn till ordningen. Vi kan se det som att den 

först valde är ordförande osv. Vi skall dra tre personer, dvs n =3,uren 

grupp om tio personer, dvs N =10,vilketinnebärattvisökertalet 

¤ 

P10,3 = 10! 

7! 

=10· 9 · 8=720 

1.5.3 Dragning utan återläggning utan hänsyn till ordningen 

Nu modifierar vi tillvägagångssättet ytterligare genom att inte längre bry 

oss om i vilken ordning bollarna dras. Då vi tog hänsyn till i vilken ordning 

bollarna drogs intresserade vi oss för ordnade delmängder, men nu är vi 

enbart intresserade av (oordnade) delmängder eller kombinationer.IExempel 

13 i föregående avsnitt skulle tre personer väljas till tre olika uppdrag. Antag 

nu istället att tre personer skall väljas till identiska uppdrag. Hur många 

möjligheter finns då? Eftersom uppdragen är identiska är det nu oväsentligt 

i vilken ordning personerna väljs. Antag att personerna a, b och c valts. I 

Exempel 13 skulle vi förutom detta behövt information om i vilken ordning 

dom valts. De olika möjligheterna är 

abc, acb, bac, bca, cab, cba 

Var och en av dessa sex följder skulle där gett olika resultat och måste därför 

beaktas. Nu kommer dock samtliga sex följder att ge samma resultat och skall 

därför betraktas som ett och samma utfall. Oberoende av vilka tre personer 

16

vi väljer ut kommer vi att få sex permutationer men bara en kombination. 

Dvs i det här fallet kommer antalet permutationer vara sex gånger fler än 

antalet kombinationer. Vi får därför att antalet kombinationer i det här fallet 

blir 

720 

6 =120 

Hur kommer det sig att det blev just sex gånger fler permutationer? Eftersom 

tre personer valdes finns där 3! = 6 olika sätt att ordna dessa. Skulle vi 

istället valt fyra personer hade det funnits 4! = 24 olika sätt att ordna dessa 

vilket skulle inneburit 24 gånger fler permutationer än kombinationer. I det 

allmänna fallet väljs n bollar ur urnan vilket innebär att det då finns n! fler 

permutationer än kombinationer. Det allmänna resultatet blir därmed att 

antalet n-kombinationer, eller delmängder av storlek n, urenmängdmedN 

objekt (bollar) ges av 

CN,n = PN,n 

n! = 

N! 

n! · (N − n)! = 

där den sista beteckningen uttalas “N över n”. 

µ 

N 

n 

Exempel 14 Hur många lottorader finns det? Vi har redan tidigare kommit 

fram till att dragningen av lottoraden sker utan återläggning och utan hänsyn 

till ordningen. Eftersom n =7och N =35följer att antal lottorader är 

µ 

35 

C35,7 = =6724520 

7 

¤ 

Exempel 15 Hur många (femkorts-)pokerhänder finns det? Här är det åter 

så att dragningen sker utan återläggning och ingen hänsyn tas till den ordning 

i vilken korten kom. Eftersom n =5och N =52följer att antal pokerhänder 

ges av 

¤ 

C52,5 = 

µ 

52 

=2598960 

5 

Vi kommer lite längre fram använda kombinatoriken för att bestämma 

sannolikheter för olika händelser men vi ger redan här ett smakprov på hur 

detta kommer att gå till. Då alla utfall är lika sannolika har vi tidigare kommit 

fram till att 

Pr (A) = 

Antal utfall i A 

Totala antalet utfall 

17

Exempel 16 För att i Exempel 15 kunna bestämma sannolikheter för intressanta 

pokerhänder måste vi först definiera en händelse A och sedan bestämma 

antalet gynnsamma utfall. Låt t.ex. 

A = Flushpågiven 

där Flush, eller Färg, betyder att samtliga fem kort är i samma svit (hjärter, 

spader, ruter eller klöver). Antag att vi vill att samtliga fem kort är hjärter. 

Det finns tretton hjärter och således kan fem hjärter väljas på 

µ 

13 

C13,5 = =1287 

5 

sätt. Lika många möjligheter finns förstås för de övriga tre sviterna varför 

antalet gynnsamma utfall för händelsen A ges av 

g (A) =4· 1 287 = 5 148 

Utav alla pokerhänder är det alltså 5 148 som innehåller en flush. Eftersom vi 

slumpmässigt väljer ut de fem korten är samtliga pokerhänder lika sannolika, 

dvs sannolikheten att få färg på given är 

Pr (A) = 4 · ¡ ¢ 13 

5 ¢ = 5148 

2598960 =0.00198 

¡ 52 

5 

eller ungefär en chans på 500. ¤ 






Uppgift 9 Adam och Bertil ingår i en grupp om sju personer 

a. På hur många sätt kan dessa sju personer placeras i en rad? 

b. I hur många uppställningar står Adam längst till vänster? 

c. I hur många uppställningar står Adam eller Bertil längst till vänster? 

18

d. I hur många uppställningar står Adam och Bertil på ytterplatserna? 

e. På hur många sätt kan dessa sju personer placeras i en ring? 

Uppgift 10 Jerry blir sugen på omelett och tar därför fyra ägg ur paketet. 

Vad han dock inte känner till är att bland äggpaketets tolv ägg finns två 

ruttna. Bestäm sannolikheten att Jerry inte blir magsjuk (vilket han blir om 

han råkar få med ett ruttet ägg i omeletten). Jerry som inte är så hemma 

i köket märker inte i all hast om han skulle råka få ett ruttet ägg. Ledning: 

Räkna antalet utfall. 

1.6 Räkneregler för sannolikheter 

Från Kolmogorovs tre axiom följer ett antal användbara räkneregler för hur 

man räknar med sannolikheter för händelser som innebär att vi i många situationer 

slipper gå ner på elementarsannolikhetsnivå. Det visar sig nämligen 

att vi inte alltid behöver gå den långa vägen för att bestämma sannolikheter 

utan kan utnyttja att vi redan känner sannolikheter för andra händelser. 

1.6.1 Komplementsannolikheter 

Definitionen av komplementhändelse ger att 

Av Axiom 1 följer därmed att 

A ∪ A = S 

Pr ¡ A ∪ A ¢ =Pr(S) =1 

och eftersom A och A dessutom är disjunkta ger Axiom 3 att 

1=Pr ¡ A ∪ A ¢ =Pr(A)+Pr ¡ A ¢ 

eller ekvivalent 

Pr ¡ A ¢ =1− Pr (A) 

vilket är ett fullt logiskt resultat. Händer inte A händer garanterat dess 

komplement A. Detta är en räkneregel vi skall ha stor nytta av framöver. 

Den händelse vi är intresserade av är ofta relativt komplex och det kan då 

istället vara enklare att räkna ut sannolikheten för komplementhändelsen 

varmed sannolikheten för den aktuella händelsen följer utan problem. 

19

1.6.2 Additionssatsen 

Om händelserna A och B är disjunkta ger oss Axiom 3 att 

Pr (A ∪ B) =Pr(A)+Pr(B) 

Vad gäller för unionsannolikheten Pr (A ∪ B) då A och B nödvändigtvis inte 

är disjunkta? Följande exempel visar att det lätt kan gå fel om man inte 

tänker sig för. 

Exempel 17 Vi återgår till Exempel 9 iavsnitt1.4. Betrakta händelserna 

Enligt principen att varje tärningsutfall är lika sannolikt följer att 

Pr (A) =Pr(B) = 3 

6 =0.5 

Som sannolikhetsnovis är det då enkelt att göra misstaget att 

Pr (A ∪ B) =Pr(A)+Pr(B) =0.5+0.5 =1 

dvs att A ∪ B är en säker händelse, dvs en händelse som alltid inträffar. Vi 

ser dock att så inte är fallet eftersom utfallet 2 inte är med. Istället gäller att 

dvs A ∪ B innehåller fem av de sex utfallen och därför måste 

Pr (A ∪ B) = 5 

6 

¤ 

Vad var det då som gick snett i den första beräkningen? Problemet i det 

här fallet är att utfallet 5 är med i både A och B vilket innebär att det 

utfallet räknas två gånger. Detta är ett problem i varje situation då A och B 

överlappar, dvs om dom har gemensamma utfall. Vi ser i figuren nedan att 

det är dom utfall som tillhör händelsen A ∩ B som räknas två gånger. 

S 

A B 

A ∩ B 

20

Lösningen blir därför att subtrahera sannolikheten för denna händelse en 

gång varefter alla berörda utfall räknas exakt en gång, dvs lösningen vi söker 

är 

Pr (A ∪ B) =Pr(A)+Pr(B) − Pr (A ∩ B) 

som går under benämningen additionssatsen. Överlappningsproblemet uppkommer 

inte om A och B är disjunkta men intressant är att additionssatsen 

fungerar för alla situationer. Då A och B är disjunkta gäller nämligen 

att A ∩ B = ∅, dvs den tomma mängden (utan utfall) vilket innebär att 

Pr (A ∩ B) =0och vi är tillbaka vid Axiom 3. 

Exempel 18 Vi återgår till tärningsproblematiken i Exempel 17. Vihardär 

att 

och därför måste gälla att 

Pr (A ∩ B) = 1 

6 

Additionssatsen ger nu att 

Pr (A ∪ B) = 3 3 1 5 

+ − = 

6 6 6 6 

vilket stämmer överens med den faktiska situationen. ¤ 

Vi kommer senare att huvudsakligen vara intresserade av sannolikheter av 

typen “Bestäm sannolikheten att åtminstone...” eller “Bestäm sannolikheten 

att högst...” vilket i stor utsträckning inkluderar unionssannolikheter. I fallet 

med de båda händelserna A och B representerar A ∪ B åtminstone en av 

händelserna. Som nämndes i föregående avsnitt är det vid dessa beräkningar 

ofta enklare att studera komplementhändelsen 

A ∪ B = A ∩ B 

som illustreras i figuren nedan. 

A B 

21

Exempel 19 Vid en medicinsk undersökning studerar man förekomsten av 

två gener A och B, och man är intresserade av att ta reda på hur stor andel 

av dom undersökta som har åtminstone en av generna. Det är då enklare att 

först ta reda på andelen som saknar båda generna som då utgör komplementet 

till aktuella händelsen. Det skulle t.ex. kunna se ut som 

Andelar av gruppen 

Gen B 

Ja Nej 

Gen A Ja 0.05 0.25 

Nej 0.20 0.50 

Här har vi en finare uppdelning än vad vi är vana vid vilket inses då vi 

åskådliggör den givna informationen i ett Venn-diagram 

S 

0,50 

A 

0.25 

0.05 

Vi har således fått information om sannolikheter för samtliga Venn-diagrammets 

delområden, eller snitthändelser. Nu följer därför att 

B 

0.20 

Pr (A ∪ B) =0.05 + 0.25 + 0.20 = 0.50 

vilket vi även kan få fram via komplementsannolikheten 

Pr (A ∪ B) =1− 0.50 = 0.50 

Skall vi använda additionssatsen blir det 

¤ 

Pr (A ∪ B) =0.30 + 0.25 − 0.05 = 0.50 

Ett Venn-diagram är ofta ett mycket användbart redskap då man skall 

bestämma sannolikheter, framförallt då situationen blir mer komplex. I följande 

exempel får vi en situation med tre händelser där vi bestämmer sannolikheter 

för samtliga delområden (snitthändelser). Efter att detta är gjort 

finner vi enkelt alla tänkbara sannolikheter. 

22

Exempel 20 I en marknadsundersökning är 50% av de intervjuade personerna 

män, 60% är över 40 år och 40% har en årsinkomst över 200 000 kronor. 

30% är män med en årsinkomst över 200 000 kronor. 30% är män över 40 år 

och av dessa har två tredjedelar en årsinkomst över 200 000 kronor. Av dem 

som är över 40 år och har en årsinkomst över 200 000 kronor är en tredjedel 

kvinnor. Vi vill få följande fråga besvarad. 

• Hurstorandelärkvinnorunder40 år med en årsinkomst under 200 000 

kronor? 

För att lösa uppgiften gör vi bäst i att beskriva problemet med ett Venndiagram. 

Vi ser det som att vi slumpmässigt skall välja ut en person och 

använder händelserna 


B = Den valde är över 40 år 

C = Den valde har en årsinkomst på över 200 000 

Ur informationen finner vi då först de enkla sannolikheterna 

Pr (A) = 0.5 

Pr (B) = 0.6 

Pr (C) = 0.4 

och sedan även två av de parvisa snittsannolikheterna 

Pr (A ∩ B) = 0.3 

Pr (A ∩ C) = 0.3 

Nästa del av informationen är att två tredjedelar av männen över 40 år har 

en årsinkomst över 200 000 kronor, vilket översätts till 

Pr (A ∩ B ∩ C) = 2 

· Pr (A ∩ B) =2 · 0.3 =0.2 

3 3 

Den sista pusselbiten är något besvärligare. “Av dem som är över 40 år och 

har en årsinkomst över 200 000 kronor är en tredjedel kvinnor.” Detta betyder 

att det är dubbelt så många män som kvinnor som är över 40 år och har en 

årsinkomst över 200 000 kronor. Eftersom vi precis räknat ut att 20% av 

personerna tillhör A ∩ B ∩ C måste 10% tillhöra A ∩ B ∩ C (kvinnor över 40 

år med en årsinkomst över 200 000 kronor). Nu är vi redo att fylla i Venndiagrammet 

och börjar med att fylla i de “innersta” fälten och jobbar oss 

23

utåt. Vi får då 

S B 

A 

0.2 

0.1 

0.1 

C 

0.1 

0.2 

0 

Nu finner vi enkelt den sökta sannolikheten (andelen). Vi söker A ∩ B ∩ C, 

dvs den del som inte tillhör någon av cirklarna. Vi får alltså att andelen 

kvinnor under 40 år med en årsinkomst under 200 000 kronor är samma som 

¤ 

1.6.3 Betingad sannolikhet 

Pr ¡ A ∩ B ∩ C ¢ =Pr ¡ A ∪ B ∪ C ¢ =0.2 

I föregående avsnitt fickviiochmedadditionssatsenenallmänformelför 

hur man kan beräkna unionssannolikheten Pr (A ∪ B) förutsatt att vi känner 

snittsannolikheten Pr (A ∩ B). Det är därför på tiden att vi även försöker 

klura ut hur vi finner en liknande formel för snittsannolikheter. Vi kommer 

i detta avsnitt att få fram en allmän formel som vi i nästa avsnitt finner ett 

mycket viktigt specialfall av. 

Antag att vi för ett slumpförsök är intresserade av att bestämma sannolikheten 

för en viss händelse A, dvsPr (A). Antag nu att slumpförsöket 

redan utförts och att vi fått information om att en annan händelse B inträffat. 

Detta är all information vi har tillgång till och frågan är hur detta 

påverkar vår uppfattning om sannolikheten för A? I och med att händelsen 

B inträffat vet vi att det aktuella utfallet tillhör B men inte vilket av dom 

det är. Vi kan därför se B som det nya utfallsrummet. Den “uppdatering” av 

Pr (A) som görs genom informationen om att händelsen B inträffat kallas för 

den betingade sannolikheten för A givet B och betecknas Pr (A | B). För att 

lättare förstå formeln för betingade sannolikheter börjar vi med ett exempel. 

Exempel 21 Vi återgår till Exempel 19 där vi antar att den undersökta 

gruppen bestod av 100 personer. Eftersom 30 av gruppens medlemmar har 

24 

0.1 

0.2

gen A följer att sannolikheten att en slumpmässigt vald person har gen A blir 

Pr (A) = 30 

100 =0.3 

Men antag nu att vi får reda på att den valde har gen B. Uppdatera nu 

sannolikheten för A genom att bestämma den betingade sannolikheten givet 

denna information. I och med att vi vet att den valda personen har gen B 

vet vi att personen är någon av dessa 25 personer. Bland dom är det 5 som 

även har gen A varför den betingade sannolikheten blir 

Pr (A | B) = 5 

25 =0.2 

dvs i och med den nya informationen är det nu något lägre sannolikhet att 

den valde har gen A. ¤ 

Vad är det då vi gör när vi räknar ut den betingade sannolikheten? När 

vi utan information beräknar Pr (A) kan detta ses som att vi relaterar antal 

utfall i A till det totala antalet utfall, dvs antalet utfall i utfallsrummet 

S. Nu gäller dock att det nya utfallsrummet utgörs av B och därför skall 

istället antal utfall i A ∩ B relateras till antal utfall i B, dvs den betingade 

sannolikheten för A givet B beräknas via formeln 

Pr (A | B) = 

Pr (A ∩ B) 

Pr (B) 

I ett Venn-diagram åskådliggörs denna formel genom att markera det nya 

utfallsrummet och sedan bedömma hur stor del av denna som den sökta 

händelsen utgör. 

S 

A B 

A ∩ B 

Vi kan förstås även vända på det genom att helt enkelt byta plats på A och 

B vilket ger 

Pr (A ∩ B) 

Pr (B | A) = 

Pr (A) 

25

Ett av målen var här att finna en allmän formel för snittsannolikheter och 

utifrån formeln för betingade sannolikheter löser vi ut och får 

Pr (A ∩ B) =Pr(B) · Pr (A | B) =Pr(A) · Pr (B | A) 

som kallas för sannolikhetslärans multiplikationssats. 

Exempel 22 Vi återgår än en gång till tärningsproblematiken där vi åter 

studerar de båda händelserna 

Antag att vi söker Pr (A), dvs sannolikheten att det blir ett udda utfall. Från 

tidigare vet vi att denna sannolikhet är 0.5. Antag nu att tärningen kastas och 

att vi får reda på att det blev ett “högt utfall”, dvs att händelsen B inträffat. 

Påverkar detta vår uppfattning om sannolikheten för händelsen A? Föratt 

ta reda på detta måste vi beräkna den betingade sannolikheten Pr (A | B). 

Exempel 18 gav att 

Pr (A ∩ B) = 1 

6 

varför det utifrån formeln för betingade sannolikheter följer att 

Pr (A | B) = 

Pr (A ∩ B) 

Pr (B) 

1/6 1 

= = 

3/6 3 

Sannolikheten för ett udda utfall har alltså utifrån den givna informationen 

minskat från 1/2 till 1/3. Den obetingade sannolikheten för händelsen 

A innebär att vi relaterar antal utfall i A till det totala antalet utfall (i utfallsrummet 

S). Den betingade sannolikhetsberäkningen innebär att vi istället 

relaterar antal utfall i A ∩ B till antal utfall i B. ¤ 

Låt oss studera ett något mer abstrakt exempel. 

Exempel 23 Låt A och B vara två händelser för vilka det gäller 

Pr (A) =0.6, Pr (A | B) =0.75, Pr (B | A) =0.5 

Beräkna sannolikheten att händelsen B inträffar.Studerarviformelnför 

betingade sannolikheter eller multiplikationssatsen inser vi att vi först måste 

ta reda på Pr (A ∩ B). Dennafinner vi via 

och sedan följer det att 

¤ 

Pr (A ∩ B) =Pr(A) · Pr (B | A) =0.6 · 0.5 =0.3 

Pr (B) = 

Pr (A ∩ B) 

Pr (A | B) 

26 

= 0.3 

0.75 =0.4

Det visar sig att vi kan ha ytterligare nytta av betingade sannolikheter. 

Det är vanligt att den sökta händelsen är komplex och därför svår att bestämma 

sannolikheten för. Ibland kan dock A delas upp i mindre och mer lätthanterliga 

bitar för vilka det är enklare att bestämma sannolikheter. Sedan 

är det bara att lägga ihop dessa delsannolikheter för att få den sökta sannolikheten. 

Exempel 24 Antag att vi för en viss semesterort och en viss tidsperiod skall 

bestämma risken för regn en slumpmässigt vald dag. Nu är det dock så att 

regnrisken beror på vilka väderleksförhållanden som råder och grovt kan man 

göra följande uppdelning. 

B1 = Lågtryck 

B2 = Ostadigt 

B3 = Högtryck 

Erfarenheten visar att de olika vädertyperna förekommer med sannolikheterna 

0.2, 0.3 och 0.5. Sannolikheten för regn vid de olika vädertyperna är 0.8, 

0.4 och 0.1. Vad blir då sannolikheten att det regnar en slumpmässigt vald 

dag? Vi formaliserar informationen genom att ange de första sannolikheterna 

ovan som 

Pr (B1) = 0.2 

Pr (B2) = 0.3 

Pr (B3) = 0.5 

Skapar vi sedan händelsen 

A = Regn 

får vi dessutom fram de betingade sannolikheterna 

Pr (A | B1) = 0.8 

Pr (A | B2) = 0.4 

Pr (A | B3) = 0.1 

För att bestämma den sökta sannolikheten går vi stegvis tillväga. I första 

steget anger vi väderlektstypen, de sk. apriorisannolikheterna och anger sedan 

för var och en av dessa de betingade sannolikheterna. Enligt multiplikationssatsen 

ger detta slutligen i tredje steget de snittsannolikheter vilka vi använder 

för att lösa problemet. Vissa av dessa utgör nämligen den uppdelning av 

händelsen A vi söker. Till vår hjälp i denna process använder vi oss av ett 

träddiagram. 

27

Apriorisannolikheter Betingade sannolikheter Snittsannolikheter 

Pr(B )=0.2 

1 

Pr(B )=0.3 

2 

Pr(B )=0.5 

3 

Lågtryck 

Ostadigt 

Högtryck 

Pr(A I B 1)=0.8 

Pr(A I B 1)=0.2 

Pr(A I B 2)=0.4 

Pr(A I B 2)=0.6 

Pr(A I B 3)=0.1 

Pr(A I B 3)=0.9 

Regn 

Ej regn 

Regn 

Pr(B 1)Pr(A I B 1)=0.2*0.8=0.16 

Pr(B 1 )Pr(A I B 1 )=0.2*0.2=0.04 

Pr(B 2 )Pr(A I B 2)=0.3*0.4=0.12 

Ej regn Pr(B 2)Pr(A I B 2)=0.3*0.6=0.18 

Regn 

Ej regn 

Pr(B 3)Pr(A I B 3)=0.5*0.1=0.05 

Pr(B 3)Pr(A 

I B 3)=0.5*0.9=0.45 

De inramade snittsannolikheterna utgör tillsammans alla de grenar som leder 

till regn. Tillsammans ger dessa att 

dvs risken för regn är ungefär 1/3. ¤ 

Pr (A) =0.16 + 0.12 + 0.05 = 0.33 

Metoden ovan måste formaliseras och vi måste klargöra vilka förutsättningar 

som måste vara uppfyllda för att detta skall fungera. En anledningen 

till att det fungerar är att “apriorihändelserna” B1,B2 och B3 är disjunkta 

ochuttömmande,dvsattdeinteöverlapparochattdetillsammanstäcker 

hela utfallsrummet. Vi säger att dessa mängder utgör en disjunkt uppdelning 

av utfallsrummet. Mer konkret kan vi se det som att händelserna utgör 

samtliga pusselbitar i ett pussel som utgör utfallsrummet eller att de utgör 

samtliga skärvor i den sönderslagna glasrutan S. Detta innebär att även händelsen 

A blir disjunkt uppdelad i snitthändelserna A∩B1,A∩B2 och A∩B3, 

dvs 

A =(A ∩ B1) ∪ (A ∩ B2) ∪ (A ∩ B3) 

28

vilket framgår av figurerna nedan. 

S 

B 2 

B 1 

A 

B 3 

S 

A ∩ B 2 

och av det tredje av Kolmogorovs axiom följer därför att 

A ∩ B 1 

A ∩ B 3 

Pr (A) =Pr(A ∩ B1)+Pr(A ∩ B2)+Pr(A ∩ B3) 

vilket är precis vad som använts i Exempel 24 ovan. Nu känner vi möjligen 

inte dessa snittsannolikheter direkt utan dessa måste tas fram och detta görs 

genom multiplikationssatsen som t.ex. ger att 

Pr (A ∩ B1) =Pr(B1) · Pr (A | B1) 

Det är detta steg som lämpligen åskådliggörs med träddiagram. För att kunna 

använda metoden måste vi således dels känna “apriorisannolikheterna” för 

den disjunkta uppdelningen och dels den betingade sannolikheten för den aktuella 

händelsen A på var och en av dessa “apriorihändelser”. Om båda dessa 

förutsättningar är uppfyllda fungerar metoden som går under benämningen 

Satsen om total sannolikhet. Än mer formellt sammanfattar vi detta som 

Satsen om total sannolikhet Vi är intresserade av att bestämma sannolikheten 

för händelsen A, dvsPr (A), vilketdockintegårattgöradirekt 

eftersom A är alltför komplex. Dock gäller att vi känner sannolikheten för A 

på var och en av händelserna B1,B2,...,Bk, dvsPr(A | Bi). Förutsattatt 

B1,B2,...,Bk är en disjunkt uppdelning av utfallsrummet, dvs om 

Bi ∩ Bj = ∅, i 6= j 

B1 ∪ B2 ∪ ···∪ Bk = S 

gäller enligt Axiom 3 och multiplikationssatsen att 

Pr (A) = 

kX 

Pr (A ∩ Bi) = 

i=1 

29 

kX 

Pr (Bi) · Pr(A | Bi) 

i=1

Bayes’ sats Vi kan nu vända på frågeställningen. Antag att vi en morgon 

vaknar upp och konstaterar att det regnar. Vad är under denna förutsättning 

sannolikheten att vi har ett lågtryck? Vi är därmed nu istället intresserade 

av det omvända betinget 

Pr (B1 | A) 

Utifrån definitionen av betingade sannolikheter följer att detta är samma 

som att 

Pr (A ∩ B1) 

Pr (B1 | A) = 

Pr (A) 

I och med satsen om total sannolikhet har vi ju visat att dessa båda sannolikheter 

kan skrivas på följande sätt 

Pr (B1 | A) = 

Pr(A | B1)Pr(B1) 

Pr(A | B1)Pr(B1)+Pr(A | B2)Pr(B2)+Pr(A | B3)Pr(B3) 

och mer allmänt för händelsen Bj med en disjunkt uppdelning B1,B2,...,Bk 

gäller att 

Pr (Bj | A) = Pr (Bj) · Pr(A | Bj) 

Pk i=1 Pr (Bi) · Pr(A | Bi) 

vilket är en räkneregel som går under benämningen Bayes’ sats eller Bayes’ 

regel. 

Exempel 25 Vi återgår till Exempel 24 och finner svaret på frågan om 

Pr (B1 | A). Enligt Bayes’ sats får vi att 

Pr (B1 | A) = 

0.2 · 0.8 

0.16 

= 

0.2 · 0.8+0.3 · 0.4+0.5 · 0.1 0.33 =0.485 

dvs om det regnar är det ungefär 50% chans att det är lågtryck. Nämnaren 

iuttrycketäringetannatänPr (A) och om vi först använt satsen om total 

sannolikhet får vi då denna automatiskt. I och med att vi nu vet att det 

regnar utgör A vårt nya utfallsrum och uppgiften blir att ta reda på hur stor 

del av A som B1 utgör. Med ett träddiagram använder vi först de 

inramade sannolikheterna för att bestämma sannolikheten för A. 

Bayessannolikheterna finner vi sedan genom att se hur stor del var 

och en av dessa inramade sannolikheter utgör av sannolikheten för 

A. ¤ 

Att arbeta med sannolikheter blir ofta abstrakt och speciellt vid användning 

av Bayes’ sats är det lätt att gå vilse. Det kan då vara bra att veta hur 

man gör problemet mer konkret. 

30

Exempel 26 På ett cigarettpaket läser vi följande: “Nio av tio strupcancerpatienter 

är rökare”. Anta att detta påstående är korrekt samt att i befolkningen 

10% är rökare och 0.1% drabbas av strupcancer. Vad är sannolikheten att 

en rökare drabbas av strupcancer? Här gäller det att definiera händelser. Vi 

väljer slumpmässigt ut en person ur populationen och låter 

A = Personen är rökare 

B = Personen har strupcancer 

Vi söker sannolikheten att en rökare får strupcancer, dvs vi söker Pr (B | A). 

Till vår hjälp har vi följande information: 

Pr (A) = 0.1 

Pr (B) = 0.001 

Pr (A | B) = 0.9 

Med hjälp av betingade sannolikheter (eller Bayes’ sats) finner vi den sökta 

sannolikheten till 

Pr (B | A) = 

Pr (A ∩ B) 

Pr (A) 

= Pr (B) · Pr (A | B) 

Pr (A) 

= 0.001 · 0.9 

0.1 

=0.009 

dvs nio gånger större än folk i allmänhet. Tycker man att detta tillvägagångssätt 

är för abstrakt kan det konkretiseras på följande sätt. Antag att populationen 

består av 10 000 personer. Av informationen följer då att 1000 av dessa är 

rökare och 10 drabbasavstrupcancer.Utavdom10 som drabbas av strupcancer 

är 9 rökare. Bestäm nu sannolikheten att en rökare drabbas av strupcancer. 

Utav 1000 rökare är det 9 som har strupcancer och slutsatsen blir 

därför att den sökta sannolikheten är 9/1000 = 0.009. ¤ 

1.6.4 Oberoende händelser 

Många gånger kan multiplikationssatsen 

Pr (A ∩ B) =Pr(B) · Pr (A | B) =Pr(A) · Pr (B | A) 

förenklas ytterligare på ett sätt som gör det extra bekvämt att beräkna 

snittsannolikheter. Antag att vi som förut är intresserade av att ta reda på 

sannolikheten för händelsen A. Fråganviskallställaossär:Harviisammanhanget 

någon nytta av att känna till om händelsen B inträffat, dvs kommer 

vår uppfattning om sannolikheten för A därmed att förändras? Ibland gör det 

varken från eller till med denna extrainformation vilket gör den överflödig. 

31

Om så är fallet säger vi att händelserna A och B är oberoende, och för sådana 

händelser gäller följaktligen att 

Pr (A | B) =Pr(A) 

Exempel 27 Antag att vi spelar ett tärningsspel med två tärningar där vi 

vinner om summan av tärningarna blir sju. Antag vidare att vi har möjligheten 

att kasta en av tärningarna innan vi satsar några pengar. Frågan 

är huruvida denna möjlighet förbättrar våra chanser. För att undersöka detta 

beräknar vi vinstchansen både med och utan extrainformationen och ser 

om det är någon skillnad. Det finns totalt 36 olika utfall då man kastar två 

tärningar, dvs utfallsrummet blir 

S = {(1, 1) , (1, 2) , (1, 3) ,...,(6, 5) , (6, 6)} 

Av intresse för oss är att konstruera händelsen 

A = Vinst (eller summan är 7) 

och det följer att A innehåller sex utfall 

A = {(1, 6) , (2, 5) , (3, 4) , (4, 3) , (5, 2) , (6, 1)} 

Eftersom alla utfall är lika sannolika följer att vinstchansen utan information 

är 

Pr (A) = 6 1 

= 

36 6 

Vinstchansen är 6 chanser på 36, dvs vi vinner i genomsnitt var sjätte gång. 

Antag nu att vi vet om att värdet på den första tärningen är tre och låt 

B = Utfallet på den första tärningen är tre 

Påverkar detta vinstchansen, dvs vad blir den betingade sannolikheten Pr (A | B)? 

För att vinna måste den andra tärningen visa fyra. Detta innebär att av de 

sex möjliga utfallen på den andra tärningen är det bara en som ger vinst, 

eller med andra ord 

Pr (A | B) = 1 

6 

dvs samma sannolikhet som utan informationen. A och B är här oberoende. 

För att se om extrainformationen ändå kan vara av glädje måste vi utföra 

beräkningen för alla tänkbara utfall på den första tärningen, dvs 1, 2,...,6 

och se om detta påverkar vinstchansen. Det visar sig dock (testa!) att vi får 

samma svar för samtliga utfall på den första tärningen. 

32

Skulle vi däremot vinna om summan av de båda tärningarna är åtta får 

vi ett annat svar. Nu innehåller A bara fem utfall 

A = {(2, 6) , (3, 5) , (4, 4) , (5, 3) , (6, 2)} 

och vinstchansen utan information blir därmed 

Pr (A) = 5 

36 

Det är nu inte svårt att se att denna vinstchans förändras i och med information 

om utfallet på den första tärningen. Låt t.ex. 

B = Utfallet på den första tärningen är ett 

Det finns då ingen möjlighet att summan av de båda tärningarna skall bli 

åtta varför 

Pr (A | B) =0 

I det här fallet är således A och B beroende och vi accepterar gladeligen 

möjligheten till denna extrainformation. ¤ 

Vad innebär då det faktum att två händelser A och B är oberoende 

för multiplikationssatsen? Vi får den mycket användbara räkneregeln för 

snittsannolikheter rörande oberoende händelser. 

Pr (A ∩ B) =Pr(A) · Pr (B) 

dvs snittsannolikheten blir då helt enkelt produkten av marginalsannolikheterna. 

Exempel 28 En signal skall ta sig från vänster till höger i systemen nedan 

A B 

A 

B 

33

Komponenterna A och B fungerar oberoende av varandra och sannolikheten 

att en komponent fungerar är 0.8, dvs 

Pr (A) =Pr(B) =0.8 

Bestäm sannolikheterna för att de båda systemen fungerar. I det övre seriekopplade 

systemet måste båda komponenterna fungera för att systemet 

skall fungera vilket innebär att vi där söker sannolikheten för snittet A ∩ B. 

Eftersom komponenterna fungerar oberoende av varandra får vi att 

Pr (A ∩ B) =Pr(A) · Pr (B) =0.8 · 0.8 =0.64 

I det nedre parallellkopplade systemet räcker det med att den ena komponenten 

fungerar för att systemet skall fungera varför vi söker sannolikheten för 

A ∪ B. Nu följer först av additionssatsen att 

och sedan ger oberoendet att 

¤ 

Pr (A ∪ B) =Pr(A)+Pr(B) − Pr (A ∩ B) 

Pr (A ∪ B) = Pr(A)+Pr(B) − Pr (A) · Pr (B) = 

= 0.8+0.8− 0.8 · 0.8 =0.96 






Uppgift 15 I en artikel i SDS den 14 augusti kunde man läsa att 12.6% av 

alla män och 9.9% av alla kvinnor är vänsterhänta. Låt oss anta att dessa 

uppgifter är korrekta. Låt oss vidare anta att vi studerar en stor population 

där 40% är män och 60% är kvinnor. Från den valda populationen väljs 

slumpmässigt en person. Bestäm sannolikheten att den valda personen 

a. är en vänsterhänt kvinna. 

b. är vänsterhänt. 

34

c. är en kvinna om vi vet att personen är vänsterhänt. 

Uppgift 16 I en viss population gäller att en procent av individerna är 

bärare av en viss smitta. Ett diagnostiskt test för att upptäcka smittbärare 

har en träffsäkerhet på 90% för individer som bär smittan, men även en 

5%-ig risk för feldiagnos av icke smittbärande individer. 

a. Bestäm sannolikheten att testet ger ett korrekt resultat. 

b. Antag att testet ger att individen är smittbärare. Bestäm sannolikheten 

att så verkligen är fallet. 



Uppgift 19 En torped av typ A har träffsannolikheten 0.2 medan en torped 

av typ B har träffsannolikheten 0.3. Ett mål skall beskjutas av antingen tre 

A-torpeder eller två B-torpeder. Vi förutsätter att torpedträffar (och missar) 

sker oberoende av varandra. 

a. Beräkna för de båda alternativen sannolikheten att målet blir träffat. 

b. Vad är sannolikheten att målet blir träffat om alla fem torpederna avlossas? 

2 Diskreta slumpvariabler 

2.1 Vad är en slumpvariabel? 

Innan vi går vidare med mer formella teoretiska begrepp och resultat diskuterar 

vi kort hur sannolikhetsläran kommer att användas. Det är framförallt 

i samband med stickprov och slutsatser från dessa som denna kunskap är 

oumbärlig. Antag för enkelhets skull att vårt stickprov består av en enda observation 

från någon mänsklig population. I statistiska sammanhang används 

inte det trevliga, men ack så ineffektiva, angreppssättet “Nej men tjenare Per 

var det du som blev utvald” utan nu kommer Per istället att bli värderad 

utifrån en eller flera egenskaper. Han kommer således att bli en eller ett antal 

siffror i ett datamaterial. En värderad egenskap kallas i dessa sammanhang 

för en variabel eftersom olika individer kan ha olika värden på denna egenskap. 

Antag t.ex. att vi studerar variabeln “Antal barn”. Eftersom Per råkar 

ha två barn blir han i detta avseende värderad till 2. Nuärdetjudockinte 

35

så att alla har två barn utan värdena 0, 1, 3, 4 osv. kan också förekomma. Vi 

har alltså inget större intresse för Per som person utan enbart vilka värden 

han har på de aktuella variablerna. Stickprov skall i statistiska sammanhang 

göras slumpmässigt vilket innebär att vi på förhand inte vet vem som kommer 

att bli utvald. Med andra ord; detta är ett slumpförsök där alla individer 

som kan tänkas bli valda utgör utfall. Betrakta en liten population bestående 

av sex personer 

S 

Per 

Leif 

Johan 

Kjell 

Men nu är vi inte intresserade av personerna i sig utan enbart vilket värde de 

har på någon variabel. Antag att vi studerar EMU-frågan och värderar personerna 

som 0 om dom är emot och 1 om dom är för ett EMU-medlemskap. 

Då kommer utfallsrummet (givetvis beroende på åsikten) att förändras till 

S 

1 

1 

1 

0 

Uppgiften i sannolikhetsläran är att utifrån någon variabel beskriva ett slumpförsök 

innan det utförs. Eftersom vi på förhand inte vet vilket värde den valde har 

på variabeln kallas denna för en slumpvariabel (eller stokastisk variabel). På 

kortform betecknas en slumpvariabel oftast med bokstaven X eller någon 

annan versal i slutet av alfabetet som Y,Z etc.. Vi kan då t.ex. bilda slumpvariabeln 

X = Inställning till ett EMU-medlemskap 

36 

Sofia 

1 

Annika 

0

med samma värdering som tidigare. Genom att konstruera händelser utav 

samtliga utfall som av slumpvariabeln värderas på samma sätt får man automatiskt 

en disjunkt uppdelning av utfallsrummet. Bildar vi händelsen 

får vi uppdelningen 

A = Den valde är för ett EMU-medlemskap 

A 

S 

1 

1 

1 

dvs händelsen A består av alla personer med värdet X =1ochomenperson 

väljs slumpmässigt får vi att 

Pr (X =0) = Pr ¡ A ¢ = 2 1 

= ≈ 0.33 

6 3 

Pr (X =1) = Pr(A) = 4 2 

= ≈ 0.67 

6 3 

Att på detta sätt beskriva en slumpvariabel kallas för att bestämma dess 

sannolikhetsfördelning. Då man anger en slumpvariabels sannolikhetsfördelning 

anger man således dels vilka värden som kan antas och dels med vilka 

sannolikheter dessa värden antas. 4 

Vi kan konstruera ett oändligt antal slumpvariabler för ett och samma 

slumpförsök. Betraktar vi t.ex. ett tärningskast känns det kanske mest 

naturligt att värdera utfallen efter det antal prickar tärningen visar vilket då 

ger den uppdelning av utfallsrummet som figuren visar 

4 Detta sätt att beskriva en slumpvariabels sannolikhetsfördelning fungerar enbart för 

diskreta slumpvariabler. Vi återkommer i Kapitel 3 med motsvarande representation för 

kontinuerliga slumpvariabler. 

0 

37 

1 

0 

A

S 

Nu behöver vi inte alls värdera ett tärningskast på detta sätt utan vi kan 

värdera utfallen som vi behagar. Vi kan t.ex. fokusera på utfallet sex. De 

andra utfallen är då inte värda något och värderas därför till 0 medan sexan 

förslagsvis värderas till 1. Vi får då en disjunkt uppdelning som i figuren 

nedan. 

S 

Vi har därmed för slumpförsöket att kasta en tärning studerat de båda slumpvariablerna 

X = Antal ögon tärningen visar 

Y = Sexa? 

där för Y ettJavärderastill1 och ett Nej till 0. Dessa båda slumpvariabler 

har inte samma sannolikhetsfördelning men innan vi går in på dessa skall vi 

mer noggrant specificera hur dessa skall anges. När slumpmomentet är över, 

dvs då försöket utförts, har slumpvariabeln fått ett värde och för att visa att 

så är fallet byter man då till små bokstäver, dvs x, y, z etc. Vi låter allmänt 

p (x) beteckna sannolikheten att slumpvariabeln X antar värdet x, dvs 

p (x) =Pr(X = x) 

38

p (x) som en funktion kallas för sannolikhetsfunktionen för slumpvariabeln 

X. För alla (diskreta) sannolikhetsfunktioner gäller att 

p (x) ≥ 0 

X p (x) = 1 

Exempel 29 Uppgiften i detta exempel är att bestämma sannolikhetsfördelningen 

för de båda slumpvariablerna X och Y ovan. X kan anta värdena 

1, 2, 3, 4, 5, 6 och alla dessa är lika sannolika så sannolikhetsfördelningen blir 

p (x) =Pr(X = x) = 1 

, x =1, 2, 3, 4, 5, 6 

6 

vilket åskådliggörs i figuren nedan. 

Utfall Värdering (X) Sannolikhetsfördelning 

Y kan enbart anta värdena 0 och 1 med 

vilket inses i figuren nedan 

¤ 

1 

2 

3 

4 

5 

6 

Pr(X=1)=1/6 

Pr(X=2)=1/6 

Pr(X=3)=1/6 

Pr(X=4)=1/6 

Pr(X=5)=1/6 

Pr(X=6)=1/6 

p (0) = Pr (Y =0)=5/6 

p (1) = Pr (Y =1)=1/6 

Utfall Värdering (Y) Sannolikhetsfördelning 

0 

1 

39 

Pr(Y=0)=5/6 

Pr(Y=1)=1/6



2.2 Väntevärden 

2.2.1 Sannolikhetsfördelningens medelvärde 

Då man beskriver ett statistiskt datamaterial med tabeller och diagram är 

det vanligt att man även sammanfattar detta med några få mått. De oftast 

använda måtten är medelvärde och standardavvikelse. På liknande sätt kan 

man sammanfatta en sannolikhetsfördelning. Medelvärdet för ett stickprov 

beräknas via 

x = x1 

P 

+ x2 + ···+ xn x 

= 

n 

n 

och representerar således ett genomsnitt av observationerna. Då vi skall 

beräkna medelvärdet för en sannolikhetsfördelning måste vi ta hänsyn till att 

olika värden eventuellt är olika sannolika vilket innebär att värdena måste 

viktas utifrån deras respektive sannolikheter. 

Exempel 30 Betrakta ett lotteri med 100 lotter à 1 krona. I lotteriet är 

det en 50-kronorsvinst, tre 10-kronorsvinster och fem 2-kronorsvinster. Vi 

konstruerar slumpvariabeln 

X = “Återbäring” på en slumpmässigt vald lott 

Då inses att X kan anta värdena 0, 2, 10 och 50. Vitrordockinteattden 

genomsnittliga utfallet ligger på 

0+2+10+50 

=15.50 

4 

utan variabelvärdena måste viktas utifrån hur ofta dom uppkommer. Vi har 

Antal lotter Vinst Sannolikhet 

91 0 91/100 = 0.91 

5 2 5/100 = 0.05 

3 10 3/100 = 0.03 

1 50 1/100 = 0.01 

Räknar vi samtliga lotter och tar “medelåterbäringen” får vi istället 

91 · 0+5· 2+3· 10 + 1 · 50 

100 

40 

= 90 

100 =0.9

dvs den genomsnittliga “återbäringen” på en lott är 90 öre vilket innebär att 

man i genomsnitt kommer att göra en förlust på 10 öre. Denna beräkning kan 

istället utföras med sannolikhetsfördelningen 

x 0 2 10 50 

p (x) 0.91 0.05 0.03 0.01 

där vi använder sannolikheterna som vikter 

och svaret blir korrekt. ¤ 

0 · 0.91 + 2 · 0.05 + 10 · 0.03 + 50 · 0.01 = 0.9 

När man på detta sätt beräknar medelvärdet för en sannolikhetsfördelning 

(eller för en slumpvariabel) sägs man beräkna dess väntevärde,ellerdetvärde 

vi förväntas att få om vi slumpmässigt väljer ut en individ. Väntevärdet för 

slumpvariabeln X betecknas E (X), därE står för expectation, och beräknas 

således via formeln 

E (X) = X x · p (x) 

där summeringen sker för alla de värden X kan anta. Benämningen väntevärde 

är dock något missvisande vilket framgår av följande exempel. 

Exempel 31 Vi konstaterade i Exempel 29 att för slumpförsöket att kasta 

en tärning ges sannolikhetsfördelningen för slumpvariabeln 


utav 

p (x) =Pr(X = x) = 1 

, 

6 

x =1, 2, 3, 4, 5, 6 

Det följer att väntevärdet för X blir 

E (X) =1· 1 1 1 1+2+3+4+5+6 

+2· + ···+6· = = 

6 6 6 6 

21 

6 =3.5 

dvs i det här fallet blir väntevärdet ett helt vanligt medelvärde eftersom samtliga 

variabelvärden är lika sannolika. Vi noterar att det förväntade värdet blir 

3.5. ¤ 

I ovanstående exempel såg vi att väntevärdet vid kast av en tärning är 3.5 

(då värderingen är det antal ögon tärningen visar). Detta är dock ett värde 

som aldrig kommer att uppkomma.Väntevärdet skall emellertid inte tolkas 

på detta sätt. Väntevärdet är ett populationsmedelvärde, dvs om det hade 

41

varit möjligt att mäta samtliga populationens individer och sedan beräknat 

medelvärdet för dessa på vanligt sätt skulle detta medelvärde överensstämma 

med väntevärdet. I tärningsexemplet ovan går det dock inte att mäta 

samtliga “individer”, eller tärningskast, eftersom det inte finns någon begränsning 

för hur många gånger vi kan kasta tärningen. Vad som dock gäller 

är att om vi kastar en tärning riktigt många gånger kommer medelvärdet 

av dessa kast med största sannolikhet att ligga mycket nära väntevärdet 

3.5. Stickprovsmedelvärdet x varierar från stickprov till stickprov vilket betyder 

att det är en slumpvariabel. Innan stickprovet tas skall därför stickprovsmedelvärdet 

betecknas X (vilket vi återkommer till lite längre fram). 

Populationsmedelvärdet är dock konstant, en storhet eller parameter, och 

sådana brukar betecknas med grekiska bokstäver. Populationsmedelvärdet 

betecknas vanligen med μ (my). För en diskret sannolikhetsfördelning har vi 

alltså att 

μ = E (X) = X x · p (x) 

Det är viktigt att man förstår skillnaden mellan stickprovsmedelvärdet x och 

populationsmedelvärdet μ eftersom båda dessa är viktiga i den statistiska 

teorin. 

2.2.2 Sannolikhetsfördelningens spridning 

Precis som för ett stickprov vill vi dessutom ha ett mått på hur utspridd 

sannolikhetsfördelningen (eller populationen) är. För att mäta hur utspridda 

observationerna i ett stickprov är används vanligen standardavvikelsen 

s 

P 2 

(x − x) 

s = 

n − 1 

eller dess kvadrat (stickprovs)variansen 

s 2 P 2 

(x − x) 

= 

n − 1 

Stickprovsvariansen är ett mått på det genomsnittliga kvadratavståndet mellan 

observationerna och stickprovsmedelvärdet vilket innebär att motsvarande 

spridningsmått för en sannolikhetsfördelning bör bli 

Var (X) =E ¡ (X − E (X)) 2¢ = E (X − μ) 2 

För en sannolikhetsfördelning blir således variansen det förväntade kvadratavståndet 

mellan slumpvariabeln och dess väntevärde (populationsmedelvärdet). 

Detta blir då även populationsvariansen, dvs om det hade varit möjligt 

42

att få tag i samtliga populationens individer och mäta deras genomsnittliga 

kvadratavstånd till populationsmedelvärdet skulle vi fått Var(X). Precis 

som populationsmedelvärdet är populationsvariansen en populationsparameter, 

dvs en konstant storhet, och betecknas med en grekisk bokstav. Vi har 

alltså att 

σ 2 = Var (X) =E (X − μ) 2 

Tar vi sedan kvadratroten ur populationsvariansen får vi populationsstandardavvikelsen 

σ (sigma). 

q 

σ = E (X − μ) 2 

Återigen är det viktigt att hålla isär stickprovsstandardavvikelsen S som är 

en slumpvariabel och populationsstandardavvikelsen σ som är en populationsparameter 

(konstant). 

Vi sammanfattar betydelsen av dessa båda sammanfattande mått för 

slumpvariabler. Om vi upprepar slumpförsöket i all oändlighet kommer observationerna 

i genomsnitt att ha populationsmedelvärdet μ. Alla observationer 

kommer dock inte att ha detta värde (eventuellt inte några) och populationsstandardavvikelsen 

σ anger hur långt från μ observationerna i genomsnitt 

kommer att vara. 

För att komma fram till hur man skall beräkna variansen för X börjar 

vi med att förklara lite hur man beräknar väntevärden för funktioner av 

slumpvariabler. En funktion av slumpvariabeln X skrivs allmänt som f (X) 

och kan t.ex. vara 

eller som i vårt fall 

f (X) 

f (X) 

= 

= 

3+X 

√ X 

f (X) = 4 

X 

f (X) =(X − μ) 2 

Dvs en funktion skapar en ny slumpvariabel f (X) genom att matematiskt 

manipulera med X. Frågan är hur en sådan manipulering påverkar väntevärdet. 

Detta beror starkt på funktionens utseende och vi skall se lite längre 

fram i detta avsnitt att för sk. linjärfunktioner påverkas väntevärdet på ett 

mycket angenämt sätt. Den funktion vi nu studerar är dock ingen linjärfunktion 

men man skall dock inte bli alltför skärrad, ett väntevärde är ett 

43

väntevärde och här skall det beräknas för (X − μ) 2 istället för X. För samtliga 

värden x antas nu istället värdet (x − μ) 2 med motsvarande sannolikhet 

varför 

σ 2 = Var (X) =E (X − μ) 2 = X (x − μ) 2 · p (x) 

där summeringen sker för alla de värden X kan anta. 

Exempel 32 IExempel30 med lotteriet fick vi för slumpvariabeln 


att μ =0.9. Skall variansen bestämmas beräknas först sannolikhetsfördelningen 

för f (X) =(X − μ) 2 via 

vilket ger att 

x (x − μ) 2 

p (x) 

0 (0 − 0.9) 2 =0.81 0.91 

2 (2 − 0.9) 2 =1.21 0.05 

10 (10 − 0.9) 2 =82.81 0.03 

50 (50 − 0.9) 2 =2410.81 0.01 

σ 2 = X (x − μ) 2 · p (x) = 

= 0.81 · 0.91 + 1.21 · 0.05 + 82.81 · 0.03 + 2410.81 · 0.01 = 

= 27.39 

och det följer att 

σ = √ 27.39 ≈ 5.23 

Då vi slumpmässigt drar en lott förväntas vi få tillbaka 90 öre på vår satsade 

krona. Ingen lott kommer dock att ge oss 90 öre tillbaka utan detta är 

bara ett mått på vad som i genomsnitt kommer att hända i långa loppet. 

Standardavvikelsen säger oss att i genomsnitt kommer “återbäringen” från 

en slumpmässigt vald lott att avvika från det förväntade värdet med 5 kronor 

och 23 öre. Det är den stora spridningen som gör att vi blir lockade att 

delta i dylika spel men den förväntade förlusten för lott-kunden försäkrar dock 

spelbolagen om vinst i långa loppet. ¤ 

Exempel 33 Vi återgår åter till tärningsexemplen där det för slumpvariabeln 


44

visade sig att μ = E (X) =3.5. Viharatt 

och det följer därmed att 

x (x − μ) 2 

p (x) 

1 (1 − 3.5) 2 =6.25 1/6 

2 (2 − 3.5) 2 =2.25 1/6 

3 (3 − 3.5) 2 =0.25 1/6 

4 (4 − 3.5) 2 =0.25 1/6 

5 (5 − 3.5) 2 =2.25 1/6 

6 (6 − 3.5) 2 =6.25 1/6 

σ 2 = X (x − μ) 2 · p (x) =6.25 · 1 1 

1 

+2.25 · + ···+6.25 · 

6 6 6 = 

= 17.5 

6 

35 

= ≈ 2.92 

12 


r 

35 

σ = ≈ 1.71 

12 

Kastar vi en tärning ett mycket stort antal gånger kommer vi i genomsnitt 

att få värdet 3.5. Nu vet vi dock att vi i ett enskilt kast aldrig kommer att få 

3.5 och standardavvikelsen anger att kasten i genomsnitt kommer att avvika 

från 3.5 med 1.71. ¤ 

Som vi skall se längre fram är en sannolikhetsfördelnings medelvärde och 

varians/standardavvikelse oumbärliga vid analys av statistiska datamaterial. 

Uttrycket 

σ 2 = E (X − μ) 2 

(2) 

används framförallt för förståelse av vad variansen innebär. Vid praktiska 

beräkningar är den dock något klumpig och det finns ett mer effektivt beräkningssätt. 

Vi har nämligen att 

Var (X) =E ¡ X 2¢ − μ 2 

En förklaring till detta samband ges i Appendix A.1. Vad är det då som har 

blivit enklare? I båda uttrycken måste först μ beräknas så jämförelsen skall 

göras mellan E (X − μ) 2 och E (X 2 ) där den senare är klart fördelaktig vid 

praktiska beräkningar. 

45

Exempel 34 Vi fortsätter åter med tärningsexemplet. 

x x 2 p (x) 

1 1 2 =1 1/6 

2 2 2 =4 1/6 

3 3 2 =9 1/6 

4 4 2 =16 1/6 

5 5 2 =25 1/6 

6 6 2 =36 1/6 

vilket innebär att sannolikhetsfördelningen för X 2 blir 

och därmed att 

Pr ¡ X 2 = x ¢ = 1 

, x =1, 4, 9, 16, 25, 36 

6 

E ¡ X 2¢ =1· 1 1 

1 1+4+···+36 

+4· + ···+36· = = 

6 6 6 6 

91 

≈ 15.17 

6 

Dvs om man kastar en tärning ett mycket stort (oändligt) antal gånger och 

hela tiden kvadrerar utfallen kommer man i genomsnitt att få 15.17. Nufår 

vi variansen till 

σ 2 = E ¡ X 2¢ − μ 2 = 91 

6 − 3.52 = 35 

≈ 2.92 

12 

precis som tidigare. ¤ 



Uppgift 22 Beräkna medelvärde och varians/standardavvikelse för slumpvariabeln 

Y iExempel29. Tolka dessa värden. 

2.3 Linjärfunktioner av slumpvariabler 

För att bestämma E (X − μ) 2 och E (X 2 ) måstevigåinidetaljochförst 

bestämma sannolikhetsfördelningarna för funktionerna f (X) = (X − μ) 2 

och f (X) =X 2 . Dessa sannolikhetsfördelningar beräknas utifrån motsvarande 

sannolikhetsfördelning för X. Om det enda ändamålet med den aktuella funktionen 

är att bestämma väntevärde och varians vore det dock en rejäl förenkling 

om vi istället direkt kunde använda att vi redan känner väntevärde och 

varians för X. Denna möjlighet finns inte för alla typer av funktioner, t.ex. 

46

går inte detta för de båda funktionerna ovan, men för linjärfunktioner behöver 

en ny sannolikhetsfördelning inte bestämmas. En linjärfunktion (eller 

linjärtransformation) av X är en funktion på formen 

f (X) =a + bX 

där a och b är konstanter, dvs vanliga reella tal. Då gäller nämligen att 

E (a + b · X) = a + b · E (X) (3) 

Var (a + b · X) = b 2 · Var (X) 

En matematisk förklaring till dessa båda formler ges i Appendix A.2. Här ges 

istället en mer intuitiv förklaring. Att addera en slumpvariabel med konstanten 

a innebär att hela populationen flyttas på talaxeln som i figuren nedan 

μ a+μ 

a 

Eftersom populationsmedelvärdet är ett mått på var “mittpunkten” är belägen 

är det då inte överraskande att även detta flyttas a steg, dvs 

E (a + X) =a + E (X) 

En sådan flytt påverkar däremot inte populationens spridning varför det bör 

gälla att 

Var (a + X) =Var (X) 

Om vi istället multiplicerar en slumpvariabel med en konstant b påverkas 

både populationens position och dess spridning vilket framgår av figuren 

nedan 

μ b* μ 

47

Varje individs värde multipliceras med b vilket även borde påverka medelvärdet 

på samma sätt, dvs 

E (b · X) =b · E (X) 

Spridningen påverkas på samma sätt men eftersom variansen mäter kvadrerade 

avstånd kommer 

Var (b · X) =b 2 · Var (X) 

Slår vi nu ihop dessa intuitiva formler får vi vad som angavs ovan. 

Exempel 35 Vi tar åter en titt på lotteriet i Exempel 30. För slumpvariabeln 


fann vi där att μ =0.9, dvsdenförväntadeåterbäringenpåenlottär90 

öre. Antag nu att vi istället vill bestämma den förväntade vinsten. En lott 

kostar en krona och antag dessutom att det tillkommer 30% vinstskatt vid en 

eventuell vinst. Å andra sidan får vi tillbaks 30% i“förlustskatt”omviskulle 

få en nitlott. Låt nu 

Y = Vinst på en slumpmässigt vald lott 

Hur skall då Y beskrivas? Vinsten är lottutfallet minus lottpriset, dvs X − 1. 

De gällande skattereglerna ger sedan att vi får behålla 70% av detta vilket 

innebär att Y bör bli 

Y =0.7 · (X − 1) 

När vi nu skall beräkna den förväntade vinsten, dvs E (Y ), harvinyttaav 

att Y är en linjärfunktion av X. Detta inses via omskrivningen 

Y =0.7 · (X − 1) = −0.7+0.7 · X 

Vi har alltså att Y = a + b · X där a = −0.7 och b =0.7. Det följer således 

att 

E (Y )=−0.7+0.7 · 0.9 =−0.07 

dvs vi har en förväntad förlust på 7 öre då vi köper en lott. För att någon 

skall lockas till att köpa lotter måste det vara en stor spridning på vinsten 

och vi får att 

Var (Y )=0.7 2 · 27.39 = 13.42 


σ (Y )= √ 13.42 = 3.66 

dvs i genomsnitt skiljer sig vinsten på en slumpmässigt vald lott med 3 kronor 

och 66 öre. ¤ 

48

Låt X vara en slumpvariabel med väntevärde μ och standardavvikelse σ. 

En av de allra viktigaste linjärfunktionerna är den standardiserade slump- 

variabeln 

X − μ 

Z = 

σ 

Man brukar normalt reservera bokstaven Z för just denna linjärfunktion. 

Vad är det då för speciellt med denna slumpvariabel? Skriver vi om uttrycket 

något ser vi att 

X − μ 1 

Z = = −μ + · X 

σ 

är en linjärfunktion med a = − μ 

σ 

gäller således att 

och 

och b = 1 

σ 

σ σ 

. Utifrån räknereglerna för dessa 

E (Z) =− μ 1 

μ 

+ · E (X) =−μ + 

σ σ σ σ =0 

Var (Z) = 

µ 2 

1 

σ 

· Var (X) = σ2 

=1 

σ2 och det följer att 

σ (Z) = √ 1=1 

Dvs Z är en slumpvariabel med väntevärde 0 och standardavvikelse 1.Genom 

att med X − μ subtrahera slumpvariabelns medelvärde från slumpvariabeln 

flyttar vi hela sannolikhetsfördelningen så att dess medelvärde istället hamnar 

i origo (nollpunkten). Genom att sedan dividera med standardavvikelsen 

“pressar vi ihop” (σ >1) eller “drar vi isär” (σ

där för X ett Ja värderas till 1 och ett Nej till 0. Eftersom vi väljer slumpmässigt 

bland populationens individer blir sannolikhetsfördelningen för X 

Vi räknar nu snabbt och lätt ut att 

x p (x) 

0 1 − π 

1 π 

E (X) =0· (1 − π)+1· π = π 

och 

E ¡ X 2¢ =0 2 · (1 − π)+1 2 · π = π 

Beräkningsformeln för variansen ger sedan att 

Var (X) =E ¡ X 2¢ − μ 2 = π − π 2 = π · (1 − π) 

För en tvåpunktsfördelad variabel gäller således att medelvärdet är π och 

variansen är π · (1 − π) vilket är ett viktigt resultat som vi skall använda oss 

av en hel del. (Jämför detta resultat med det i Uppgift 22.) 

Nu väljer vi dock sällan bara en individ ur populationen utan stickprovet 

kommer att bestå av n dragna individer. Den slumpvariabel vi då kommer 

att vara intresserade av är 

p = Andel individer med egenskapen i stickprovet 

dvs stickprovsandelen. Återigen har vi en viktig distinktion mellan p som 

är en slumpvariabel eftersom den varierar från stickprov till stickprov och π 

som är en populationsparameter (en konstant). Då vi studerar dom sannolikhetsmässiga 

egenskaperna hos p förenklar vi dock situationen något och 

studerar istället 

X = Antal individer med egenskapen i stickprovet 

Vi ser att 

p = X 

n 

dvs p är en enkel linjärfunktion av X och resultat för X överförs därför enkelt 

till p. 

Hur ser då sannolikhetsfördelningen för X ut? Något kryptiskt uttryckt 

beror detta på om populationen är ändlig eller oändlig. Något annorlunda 

uttryckt beror sannolikhetsfördelningen för X på om förutsättningarna 

50

förändras från dragning till dragning under urvalsprocessen. Vi har här möjlighet 

att effektivt använda oss av de metoder vi använde i samband med 

kombinatoriken i avsnitt 1.5. Populationen kan här ses som en urna med 

bollar i två färger. Vi kan t.ex. låta vita bollar representera individer med 

egenskapen och svarta bollar representera individer utan egenskapen. Andelen 

vita bollar i urnan är π och uppgiften är att välja ut n bollarururnan 

och räkna hur många vita bollar vi fick. Med språkbruk från kombinatoriken 

översätts oändlig och ändlig population till om det är dragning med eller utan 

återläggning. Dragning med återläggning är samma som att populationen är 

oändlig, dvs urnans sammansättning förblir oförändrad efter varje dragning. 

Exempel 36 Antag att vi skall kasta en tärning ett antal gånger och räkna 

antalet erhållna sexor. Varje gång vi kastar tärningen är det exakt samma 

förutsättningar som vid kastet innan, dvs exakt en sjättedels chans att få en 

sexa. Vid tärningskast förändras alltså inte urnans sammansättning vilket 

innebär att det är fråga om dragning med återläggning. ¤ 

Exempel 37 Betrakta en tombola med tio lotter varav endast en är en vinstlott. 

En person står framför dig och du är förstås oerhört intresserad av 

huruvida denne drar vinstlotten. Vi betraktar en urna med tio bollar, en vit 

och nio svarta. Dragning sker utan återläggning, vilket innebär att förutsättningarna 

förändras efter varje dragning. ¤ 

Vi behandlar de båda situationerna separat och avslutar sedan med en 

diskussion om sambanden dem emellan. 

2.4.1 Binomialfördelningen 

Vi studerar nu en situation där vi från en oändligt stor population skall välja 

ut n individer och räkna hur många av dessa som har en viss egenskap. Ur 

en urna där andelen vita bollar är π skall vi således med återläggning välja 

n bollar och studera slumpvariabeln 

X = Antalet vita bollar i urvalet 

Hur ser då sannolikhetsfördelningen för X ut? Låt oss börja med ett enkelt 

exempel. 

Exempel 38 En viss urna innehåller fem bollar där fyra är vita och en är 

svart. Ur denna urna skall vi med återläggning välja tre bollar och sedan räkna 

antalet vita bollar. Tar vi hänsyn till den ordning bollarna dras finns det 

åtta utfall vilka åskådliggörs i figuren nedan 

51

S 

VSS 

SSS 

SVS 

SSV 

SVV 

Nu är vi dock inte intresserade av i vilken ordning bollarna valts utan enbart 

av hur många av dom som är vita. Med avseende på slumpvariabeln X får vi 

därför följande uppdelning av utfallsrummet 

X=0 

X=1 

S 

VSS 

SSS 

SVS 

SSV 

SVV 

ochviserförstochfrämstattX kan anta värdena 0, 1, 2 och 3. Dessafyra 

värden skall nu associeras med sannolikheter och då måste vi först vara medvetna 

om att utfallen inte är lika sannolika. I det här fallet är t.ex. utfallet 

VVV mer sannolikt än SSS eftersom det finns fler vita än svarta bollar i 

urnan. Eftersom en dragen boll direkt återförs till urnan kommer vi i varje 

dragning ha exakt samma förutsättningar, dvs 

VSV 

VSV 

VVS 

VVV 

VVS 

VVV 

X=2 

X=3 

Pr (Dendragnabollenärvit) = 4 

5 =0.8 

Pr (Den dragna bollen är svart) = 1 

5 =0.2 


52

Utfall 

SSS 

VSS 

SVS 

SSV 

VVS 

VSV 

SVV 

VVV 

eller i utskriven form 

¤ 

Sannolikhet 

3 

0.2*0.2*0.2=0.2 

2 

0.8*0.2*0.2=0.8*0.2 

2 

0.2*0.8*0.2=0.8*0.2 

2 

0.2*0.2*0.8=0.8*0.2 

2 

0.8*0.8*0.2=0.8 *0.2 

2 

0.8*0.8*0.2=0.8 *0.2 

2 

0.8*0.8*0.2=0.8 *0.2 

3 

0.8*0.8*0.8=0.8 

Värdering (X) 

x p (x) 

0 0.008 

1 0.096 

2 0.384 

3 0.512 

0 

1 

2 

3 

Slh-fördelning 

3 

Pr(X=0)=0.2 

2 

Pr(X=1)=3*0.8*0.2 

2 

Pr(X=2)=3*0.8 *0.2 

3 

Pr(X=3)=0.8 

Då vi skall finna den allmänna sannolikhetsfördelningen finns det en hel 

del intressanta iakttagelser att göra från föregående exempel. Då vi allmänt 

skall dra n bollar ser vi t.ex. att möjliga värden på X är x =0, 1, 2,...,n. 

Samtidigt ser vi att följder som innehåller exakt lika många vita bollar alla 

är lika sannolika. För en urna där andelen vita bollar är π gäller att en viss 

följd som innehåller x vita bollar har sannolikheten 

π x · (1 − π) n−x 

eftersom dom resterande n − x bollarna följaktligen måste vara svarta. För 

att kunna beräkna sannolikheten att få en följd med x vita bollar återstår 

då endast att bestämma hur många sådana följder det finns. Detta är lite 

besvärligare och kräver lite eftertanke. Vi tänker oss urvalet som n positioner 

som skall fyllas i med antingen ett S eller ett V . För att det skall bli exakt 

x vita bollar måste vi således välja ut exakt x av dessa positioner och i 

dessa placera ett V . På hur många sätt kan detta göras? Det är dragning 

utan återläggning eftersom varje position endast kan innehålla en boll (dvs 

enbart en boll dras varje gång). Det är dragning utan hänsyn till ordningen 

eftersom vi enbart är intresserade av vilka x positioner som blivit valda (och 

53

inte i vilken ordning dom blev valda). Kombinatorikens räkneregler ger oss 

därmed att vi söker antalet kombinationer, dvs 

µ 

n 

Cn,x = 

x 

Följaktligen får vi sannolikheten att få exakt x vita bollar till 

µ 

n 

p (x) =Pr(X = x) = · π 

x 

x · (1 − π) n−x , x =0, 1, 2,...,n 

Eftersom denna sannolikhetsfördelning är vanligt förekommande i praktiken 

har den fått ett eget namn och en egen beteckning. Den kallas för binomialfördelningen 

och betecknas Bi(n, π). 

Exempel 39 Antag att vi slumpmässigt fyller i en enkelrad på en stryktipskupong. 

Det är tretton matcher som skall fyllas i med antingen 1, X eller 

2. Endast ett av dessa tecken är rätt vilket kan översättas till en urna med 

endast tre bollar där en är vit (korrekt tipstecken) och två är svarta (fel tipstecken). 

Ur urnan dras med återläggning tretton bollar och vi räknar antalet 

erhållna vita bollar, eller ekvivalent 

X = Antal rätt på tipskupongen 

Eftersom samtliga förutsättningar är uppfyllda följer att X är binomialfördelad 

med parametrar n =13och π =1/3. DvsXär Bi ¡ 13, 1 

¢ 

och 3 

µ µ x µ n−x 

13 1 2 

p (x) =Pr(X = x) = 

, x =0, 1, 2,...,13 

x 3 3 

Vi finner nu t.ex. att sannolikheten att få tio rätt ges av 

µ µ 10 µ 3 

13 1 2 

p (10) = Pr (X =10)= 

≈ 0.0014 

10 3 3 

dvs ungefär 0.14% chans. En rad med tio rätt kan ha följande utseende 

1 2 3 4 5 6 7 8 9 10 11 12 13 

54

och en sådan rad har sannolikheten 

µ 

1 

3 

10 

· 

µ 3 

2 

3 

Nu bryr vi oss dock inte om vilka tio matcher vi har tippat rätt utan enbart 

att vi har tio rätt. Det finns ¡ ¢ 13 

olika sätt att tippa tio matcher rätt (eller 

10 

tre matcher fel) och därav den angivna sannolikheten. ¤ 

I sannolikhetssammanhang är man ofta intresserade av frågor som “Bestäm 

sannolikheten att åtminstone x av bollarna är vita” eller “Bestäm sannolikheten 

att högst x av bollarna är vita”. Sådana frågor besvaras med hjälp 

av den sk. fördelningsfunktionen 

xX 

F (x) =Pr(X≤x) = p (k) 

Fördelningsfunktionen summerar således samtliga sannolikheter p (k) upp till 

och med ett visst angivet värde x. Viharsåledesatt 

F (x) =Sannolikheten att högst x av de dragna bollarna är vita 

För att beräkna den andra sannolikheten använder vi oss av komplementregeln 

Pr (X ≥ x) = Sannolikheten att åtminstone x av de dragna bollarna är vita = 

= 1−Sannolikheten att högst x − 1 av de dragna bollarna är vita = 

= 1−F (x − 1) 

I nästa exempel är det dock en omväg att gå via fördelningsfunktionen. 

Exempel 40 Vi fortsätter med Exempel 39. Vanligtvis blir det vinst om man 

åtminstone har tio rätt och vi söker därför 

k=0 

Pr (Vinst) =Pr(X ≥ 10) = 1 − Pr (X ≤ 9) = 1 − F (9) 

I fördelningsfunktionen ingår tio termer, p (0) ,p(1) ,...,p(9) och det är därför 

enklare att gå andra vägen, dvs att direkt beräkna 

Pr (Vinst) = 

= 

Pr(X≥10) = p (10) + p (11) + p (12) + p (13) = 

µ µ 10 µ 3 µ µ 13 µ 0 

13 1 2 

13 1 2 

+ ···+ 

= 

10 3 3 

13 3 3 

= 0.00165 

dvs ungefär 0.165% chans. ¤ 

55

Man inser snart att även med miniräknaren till hjälp blir beräkningarna 

snabbt betungande. Ibland kan vi ta hjälp av sannolikhetstabeller över 

binomialfördelningen. Se t.ex. Tabell 1 i “Körner: Tabeller och formler för statistiska 

beräkningar”. Här återges binomialfördelningens fördelningsfunktion 

för några olika binomialfördelningar; n =2, 3,...,20 och π =0.1, 0.2,...,0.9. 

Binomialfördelningen som förknippades med tipskupongen finns alltså inte 

här och våra beräkningar ovan var nödvändiga. 

Exempel 41 För Exempel 38 ovan finns dock sannolikhetsfördelningen med 

i tabellsamlingen. Det gäller att 


är Bi(3, 0.8) och vi ser från tabellen att 

x p (x) F (x) 

0 0.008 0.008 

1 0.096 0.104 

2 0.384 0.488 

3 0.512 1.000 

och det är lätt konstaterat att dessa sannolikheter stämmer överrens med de 

tidigare beräkningarna. 

Exempel 42 Antag att vi i föregående exempel istället med återläggning drar 

20 bollar ur urnan. Då kommer X att vara Bi(20, 0.8) som också finns angiven 

i Tabell 1. Antag vidare att vi vill att åtminstone 14 av de dragna bollarna 

skall vara vita samt att åtminstone en av bollarna är svart. Vi söker således 

Pr (14 ≤ X ≤ 19) 

vilket skrivs om i “tabellvänligt skick” via fördelningsfunktionen 

Pr (14 ≤ X ≤ 19) = F (19) − F (13) = 0.9885 − 0.0867 = 0.9018 

dvs ungefär 90% chans. För att utifrån tabellen bestämma sannolikheten för 

enstaka värden som Pr (X =14)gör vi följande omskrivning 

Pr (X =14) = Pr(X≤14) − Pr (X ≤ 13) = F (14) − F (13) = 

= 0.1958 − 0.0867 = 0.1091 

vilket också kunde beräknats via 

¤ 

Pr (X =14)= 

µ 

20 

· 0.8 

14 

14 · 0.2 6 =0.1091 

56

Tabellen är ofta användbar men räcker inte på långa vägar till för alla 

de situationer där binomialfördelningen dyker upp. Vi skall dock se att 

då de manuella beräkningarna blir alltför betungande finns det oftast goda 

approximationsmöjligheter. 

Väntevärden för binomialfördelningen 5 Det återstår nu enbart att 

finna de båda sammanfattande måtten för binomialfördelningen. Vi såg tidigare 

att då vi enbart drog en boll ur urnan och studerade slumpvariabeln 

följde att 

X = Var bollen vit? 

μ = E (X) =π 

σ 2 = Var (X) =π · (1 − π) 

Med beteckningarna ovan gäller således att dessa är de båda sammanfattande 

måtten för Bi(1,π). Hur många vita bollar förväntar vi oss då om vi 

med samma förutsättningar vid varje dragning drar n bollarururnan?Föga 

överraskande får vi svaret 

π + π + ···+ π = n · π 

Samma egenskaper visar sig gälla för variansen, dvs 

π · (1 − π)+π · (1 − π)+···+ π · (1 − π) =n · π · (1 − π) 

För Bi(n, π) gäller således att 

μ = E (X) =n · π 

σ 2 = Var (X) =n · π · (1 − π) 

Här bör man observera att samma addering inte kan utföras för standardavvikelserna. 

Exempel 43 Vi återgår till Exempel 39 där vi konstaterade att slumpvariabeln 

X = Antal rätt på kupongen 

5 De matematiskt korrekta bevisen för dessa väntevärden är besvärliga men återges för 

den intresserade och något matematiskt bevandrade läsaren i Avsnitt B.1. 

57

var Bi ¡ 13; 1 

¢ 

. Det följer således att 

3 

och följaktligen 

μ = E (X) =13· 1 

3 =4.33 

σ 2 = Var (X) =13· 1 2 

· 

3 3 =2.89 

σ = √ 2.89 = 1.7 

Om vi låter slumpen fylla i en enkelrad på stryktipset förväntas vi få 4.33 

rätt med en standardavvikelse på 1.7 rätt. Vi kan givetvis inte få exakt 4.33 

rätt och istället tolkar vi väntevärdet på följande sätt. Låter vi slumpen välja 

enkelrad vid upprepade tillfällen kommer vi i genomsnitt att få 4.33 rätt. Vi 

får dock inte exakt lika många rätt varje gång utan resultaten kommer att 

avvika från väntevärdet 4.33 med i genomsnitt 1.7 rätt. ¤ 

Vi sammanfattar binomialfördelningens egenskaper som 

Sammanfattning 1 (Binomialfördelningen) Drag med återläggning n bollar 

ur en urna där andelen vita bollar är π och studera slumpvariabeln 

Då gäller att 

och 

¥ 

p (x) =Pr(X = x) = 


µ 

n 

π 

x 

x · (1 − π) n−x , x =0, 1, 2,...,n 

μ = E (X) =n · π 

σ 2 = Var (X) =n · π · (1 − π) 

2.4.2 Hypergeometrisk fördelning 

Vi studerar nu en situation där vi utan återläggning från en ändlig population 

skall välja ut n individer och räkna hur många av dessa som har en 

viss egenskap. Ur en urna där andelen vita bollar är π skallvisåledesutan 

återläggning välja n bollar och studera slumpvariabeln 


58

Den enda skillnaden jämfört med binomialfördelningen är alltså att det nu är 

dragning utan återläggning. Eftersom π inte kommer att vara samma under 

hela dragsekvensen måste n och π kompletteras med en tredje parameter 

N = Antalet bollar i urnan 

dvs populationsstorleken. Det följer nu att 

N · π = Antalet vita bollar i urnan 

N − N · π = Antalet svarta bollar i urnan 

Hur ser då sannolikhetsfördelningen för X ut? Återigen är tillvägagångssättet 

besvärligt och det krävs en del eftertanke för att förstå proceduren. För att 

underlätta låter vi samtliga bollar vara numrerade. 

v1,v2,...,vN·π,s1,s2,...,sN−N·π 

På detta sätt kan vi nämligen se skillnad på alla bollarna och eftersom urvalet 

sker helt slumpmässigt kommer varje dragsekvens bestående av n bollar att 

vara lika sannolika. Vi kan då använda resultat (1) på sidan 12 som säger att 

Pr (X = x) = 

Antal följder med exakt x vita bollar 

Antal följder 

Itäljarenskallviberäknapåhurmångasättnbollar kan väljas ur urnan 

så att exakt x av dem är vita. Utav de N · π vita bollarna skall således x 

väljas och av de N − N · π svarta bollarna skall de resterande n − x bollarna 

väljas. Det är dragning utan återläggning och utan hänsyn till ordningen 

varför kombinatoriken ger oss att svaret blir 

Pr (X = x) = 

¡ ¢¡ N·π N−N·π 

x n−x 

¡ N 

n 

¢ 

¢ , x =0, 1, 2,...,n 

förutsatt att det finns tillräckligt med vita och svarta bollar i urnan. Även 

detta är en i praktiken ofta förekommande sannolikhetsfördelning och har 

därför även den ett eget namn och beteckning. Sannolikhetsfördelningen 

kallas för hypergeometrisk fördelning och betecknas Hyp(n, π, N) 6 . 

Exempel 44 Antag att vi fyller i en enkelrad på en lottokupong, dvs utav 

de 35 numren väljer vi ut 7. Vid dragningen skall maskinen DraKula utan 

6 En annan vanlig beteckning på hypergeometrisk fördelning är Hyp(n, N · π,N), där 

man således istället för andel vita bollar i urnan anger antal vita bollar i urnan. 

59

återläggning välja 7 bollar. Utifrån vår lottorad är det nu 7 vita och 28 svarta 

bollar i urnan. Låter vi nu 

X = Antal rätt på lottokupongen 

följer att X är Hyp ¡ 7, 7 

35 , 35¢ . sannolikheten att få sex rätt ges därför av 

¢ 

Pr (X =6)= 

eller ungefär en chans på 34 309. ¤ 

¡ ¢¡ 7 28 

6 1 ¡ 35 

7 

¢ ≈ 0.000029 

Exempel 45 Vid en statistisk kvalitetskontroll undersöks fem enheter valda 

på måfå från en förpackning med 60 enheter. Om någon av de valda enheterna 

är felaktig avvisas hela förpackningen. Antag att förpackningen innehåller 10 

felaktiga enheter. Bestäm sannolikheten att förpackningen avvisas. Låter vi 

X = Antal felaktiga enheter i urvalet 

följer att X är Hyp ¡ 5, 1 

6 , 60¢ .Visöker 

Pr (X ≥ 1) = 1 − Pr (X =0)=1− 

¡ ¢¡ 10 50 

0 5 ¡ 60 

5 

dvs ungefär 61% chans för att förpackningen avvisas. ¤ 

¢ 

¢ =0.6121 

Väntevärden för hypergeometrisk fördelning 7 Det återstår nu enbart 

att finna de båda sammanfattande måtten för den hypergeometriska fördelningen. 

Då vi endast drar en boll ur urnan går det inte att skilja på fallen 

med och utan återläggning vilket innebär att Bi(1,π) är samma som 

Hyp(1,π,N) oberoende av antal bollar i urnan. Det visar sig att det förväntade 

antalet vita bollar kommer att vara samma för hypergeometrisk fördelning 

som för binomialfördelningen, dvs 

μ = E (X) =n · π 

Variansen blir dock inte helt identisk. Man kan nämligen på matematisk väg 

visa att 

σ 2 N − n 

= Var (X) =n · π · (1 − π) · 

N − 1 

7 De matematiskt korrekta bevisen för dessa väntevärden är besvärliga men återges för 

den intresserade och något matematiskt bevandrade läsaren i Avsnitt B.2. 

60

där termen 

N − n 

N − 1 

kallas för korrektion för ändlig population. Variationen beror alltså på den 

urvalsmetod som används. Detta är inte så underligt. Då vi drar utan återläggning 

får vi efter varje dragen boll mer information om hur de återstående 

bollarna i urnan är fördelade. Mer information innebär mindre osäkerhet, dvs 

mindre spridning. Då vi drar med återläggning får vi aldrig denna merinformation 

och därför blir variansen mindre för den hypergeometriska fördelningen 

jämfört med binomialfördelningen. Låt oss studera ytterlighetsfallen i ett 

exempel. 

Exempel 46 Väntevärdet μ skall tolkas som det medevärde vi får om vi utför 

slumpförsöket ett mycket stort antal gånger. Nu får vi antagligen inte 

samma resultat varje gång utan σ anger med hur mycket utfallet i genomsnitt 

skiljer sig från detta medelvärde. Antag att vi drar samtliga bollar ur 

urnan, dvs n = N. Eftersom dragning sker utan återläggning kommer vi att 

få samma resultat (μ) varje gång, dvs det kommer då inte att förekomma 

någon spridning kring medelvärdet, vilket återspeglar sig i varianstermen 

N − N 

Var (X) =n · π · (1 − π) · 

N − 1 =0 

Om vi å andra sidan enbart drar en boll ur urnan hinner vi inte få någon 

merinformation och därför blir variansen samma som för binomialfördelnin- 

gen. 

¤ 

Var (X) =n · π · (1 − π) · 

N − 1 

= n · π · (1 − π) 

N − 1 

Dessa båda ytterligheter speglar väl dom likheter och olikheter som gäller 

mellan binomialfördelningen och hypergeometrisk fördelning vilket vi återkommer 

till i nästa avsnitt. Låt oss först bestämma väntevärde och varians för 

lottoexemplet ovan. 

Exempel 47 Vi återgår till Exempel 44 där vi konstaterade att slumpvariabeln 

X = Antal rätt på kupongen 

var Hyp ¡ 7, 7 

35 , 35¢ . Det följer således att 

μ = E (X) =7· 7 

35 =1.4 

σ 2 = Var (X) =7· 7 28 35 − 7 

· · 

35 35 35 − 1 =0.92 

61

och följaktligen 

σ = √ 0.92 = 0.96 

I långa loppet kommer vi på vår enkelrad att i genomsnitt få 1.4 rätt. Vi 

får dock inte exakt lika många rätt varje gång utan resultaten kommer att i 

genomsnitt avvika från väntevärdet 1.4 med 1 rätt. ¤ 

Vi sammanfattar den hypergeometriska fördelningens egenskaper som 

Sammanfattning 2 (Hypergeometrisk fördelning) Drag utan återläggning 

n bollar ur en urna med N bollar där andelen vita bollar är π och 

studera slumpvariabeln 

Då gäller att 

Pr (X = x) = 


¡ ¢¡ N·π N−N·π 

x n−x 

¡ N 

n 

¢ 

¢ , x =0, 1, 2,...,n 

förutsatt att det finns tillräckligt med vita och svarta bollar i urnan. Vidare 

gäller att 

¥ 

μ = E (X) =n · π 

σ 2 = Var (X) =n · π · (1 − π) · 

N − n 

N − 1 

2.4.3 Samband mellan Binomial- och Hypergeometrisk fördelning 

Ideflesta situationer då man tar stickprov kan en och samma individ enbart 

komma med en gång i urvalet, dvs det är då dragning utan återläggning. 

Detta borde således innebära att den hypergeometriska sannolikhetsfördelningen 

är mer använd än binomialfördelningen. Så är dock inte fallet och vi 

skall i detta avsnitt ge en förklaring till detta fenomen. Den hypergeometriska 

fördelningen ger snabbt besvärliga beräkningar och då population och stickprov 

är någorlunda stora kan till och med datorerna få svårt att hänga med i 

svängarna. Detta problem löser vi genom att approximera hypergeometriska 

sannolikheter med den mer lättanvända binomialfördelningen. Sedan är inte 

heller binomialfördelningen alltid speciellt enkel att arbeta med och då finns 

ytterligare approximationsmöjligheter. Vi skall se lite längre fram att det vid 

sannolikhetsberäkningar i praktiken i princip enbart förekommer approximationer. 

62

För att en approximation skall vara användbar måste den förstås ligga 

nära den verkliga sannolikheten. Vad är det då som gör att vi kan använda 

binomialsannolikheter för att approximera hypergeometriska sannolikheter? 

Den enda skillnaden mellan dem är att det i binomialfallet är dragning med 

återläggning och i det hypergeometriska fallet är dragning utan återläggning. 

I det binomiala fallet ändras således inte urnans sammansättning efter varje 

dragning vilket sker i det hypergeometriska fallet. Frågan är hur mycket 

urnan förändras vid varje dragning? 

Exempel 48 I en tombola återstår 30 lotter varav 6 är vinstlotter. Antag att 

vi tänker ta fem lotter och är intresserade av att bestämma våra vinstchanser. 

Vi konstruerar slumpvariabeln 

X = Antal vinstlotter bland de dragna 

och vi söker alltså dess sannolikhetsfördelning. Utifrån förutsättningarna står 

det klart att X är Hyp ¡ 5, 6 

30 , 30¢ ,ellerförenklatHyp(5, 0.2, 30), ochdenna 

sannolikhetsfördelning beräknas nu via formeln. Antag nu att vi istället 

approximerar med binomialfördelningen, dvs att vi tänker oss en situation 

där vi tillämpar dragning med återläggning. Vi lägger således tillbaks varje 

dragen lott i tombolan vilket innebär att X nu är Bi(5, 0.2). Vifinner då 

sannolikhetsfördelningen för X enkelt från Tabell 1 och kan göra följande 

jämförelse. 

Sannolikheter 

Antal vinstlotter Hyp(5, 0.2, 30) Bi(5, 0.2) 

0 0.2983 0.3277 

1 0.4474 0.4096 

2 0.2130 0.2048 

3 0.0387 0.0512 

4 0.0025 0.0064 

5 0.00004 0.0003 

Vi ser att i stora drag följer sannolikheterna varandra men det förekommer 

även stora skillnader. Sannolikheten att samtliga fem lotter är vinstlotter blir 

ungefär åtta gånger större utifrån binomialapproximationen jämfört med den 

exakta sannolikheten. I det här fallet är därför inte approximationen lämplig. 

¤ 

Anledningen till den stora skillnaden i föregående exempel var att urnans 

sammansättning förändrats alltför mycket jämfört med ursprungsläget. Om 

de fyra först dragna lotterna alla var vinstlotter är urnans sammansättning 

63

inför den sista lotten att endast två av de återstående 26 lotterna är vinslotter, 

dvs π =1/13 ≈ 0.077, vilket är en stor förändring från de 0.2 vi hade 

från början. För att approximationen skall vara lämplig skall en sådan kraftig 

förändring inte kunna ske. 

Exempel 49 Antag nu istället att lotteriet innehåller 100 lotter varav 20 är 

vinster. Med för övrigt samma situation som i föregående exempel har vi att 

X är Hyp ¡ 5, 20 

100 , 100¢ ,ellerHyp(5, 0.2, 100), vilket skall approximeras med 

Bi(5, 0.2) som förut. Motsvarande jämförelse blir nu 

Sannolikheter 

Antal vinstlotter Hyp(5, 0.2, 100) Bi(5, 0.2) 

0 0.3193 0.3277 

1 0.4201 0.4096 

2 0.2073 0.2048 

3 0.0478 0.0512 

4 0.0051 0.0064 

5 0.0002 0.0003 

och vi ser att respektive sannolikheter nu överensstämmer i klart högre grad. 

I det här fallet verkar approximationen fungera tillfredsställande. ¤ 

I det senaste exemplet hinner inte urnans sammansättning förändras 

alltför mycket under urvalet vilket är anledningen till att approximationen 

fungerar något sånär. Poängen är således att urvalsstorleken inte får vara 

alltför stor i jämförelse med populationsstorleken. Vi måste sätta en gräns 

för hur stor del av populationen urvalet får utgöra för att approximationen 

skall vara tillåten och ett vanligt krav är att urvalet högst får utgöra 10% av 

populationen. 8 Något annorlunda uttryckt blir kravet att 

n 

< 0.1 

N 

Den uppsatta gränsen anger när approximationen inte längre är tillåten pga 

att risken för missvisande resultat blir för stor. Ju mindre urvalsandelen är ju 

bättre blir approximationen. En i praktiken vanlig situation är väljarundersökningar 

där ett urval av den svenska väljarkåren väljs ut. Det är vanligt att 

man använder en urvalsstorlek på ungefär 2000personer vilket kan tyckas 

vara stort men med tanke på att populationen består att ett antal miljoner 

väljare blir urvalfraktionen mindre än 0.001 (eller 0.1%). 

8 En något mer restriktiv hållning som är vanlig i statistiklitteraturen är att urvalet 

högst får utgöra 5% av populationen. 

64

Exempel 50 Antag att den svenska väljarkåren består av fem miljoner personer 

och att vi ur denna skall göra ett urval på 20 personer. Antag (rent 

hypotetiskt) att hälften av väljarkåren består av EMU-anhängare. Det gäller 

att 

X = Antal EMU-anhängare i urvalet 

är hypergeometriskt fördelad. Nu gäller dock att om vi ur väljarkåren tar bort 

t.ex. 20 EMU-anhängare kommer i princip fortfarande hälften vara EMUanhängare 

varför det här fallet kan betraktas som binomialfördelat. I det här 

fallet är det oerhört besvärligt att använda den hypergeometriska fördelningen 

medan binomialfördelningen Bi(20, 0.5) bara är att läsa av ur Tabell 1. ¤ 

I situationer där det anges “stor population” kommer förutsättas att urvalsandelen 

är så liten att binomialfördelningen används som exakt sannolikhetsfördelning 

trots att strikt sannolikhetsmässigt den hypergeometriska 

fördelningen borde användas. Vi sammanfattar nu denna viktiga approximationsmöjlighet. 

Sammanfattning 3 Förutsatt att urvalet inte utgör mer än 10% av populationen 

kan Hyp(n, π, N) approximeras med Bi(n, π). Då populationen anges 

som “stor” används binomialfördelningen som exakt sannolikhetsfördelning 

trots att dragning sker utan återläggning. ¥ 







Uppgift 28 En viss statistikklass består av 84 kvinnliga och 56 manliga studenter. 

Av dessa skall fem väljas ut. Bestäm approximativt sannolikheten att 

det blir fler män än kvinnor bland de utvalda. Ange anledningen till att denna 

approximativa lösning är okej. 

65

2.5 Poissonfördelningen 

Det nämndes i föregående avsnitt att även binomialfördelningen ofta behöver 

approximeras och det visar sig att en annan diskret sannolikhetsfördelning i 

vissa situationer är användbar till just detta. Denna sannolikhetsfördelning är 

dock även användbar i sig själv och vi ger därför först en ordentlig beskrivning 

av den innan vi övergår till approximationsmöjligheterna. 

2.5.1 Poissonprocesser 

Vi tänker oss en process där händelser inträffar över tiden. Det kan gälla 

någon form av kösystem som t.ex. inkommande telefonsamtal till en telefonväxel 

eller kunder som kommer till ett bankkontor. Det kan även gälla 

trafikolyckor på någon utsatt vägsträcka. Vi tänker oss nu en slumpvariabel 

X = Antal händelser på ett enhetsintervall 

där vi specificerat vad som skall menas med ett enhetsintervall. Vanliga tidsenheter 

är minut, timme, dag etc.. Med rätt förutsättningar kommer denna 

slumpvariabel att få en användbar sannolikhetsfördelning. Vi kommer att 

förutsätta att 

1. Händelser inträffar med en viss intensitet μ. Intensitetsparametern μ 

anger hur ofta händelser inträffar i genomsnitt, som t.ex. tre gånger i 

minuten eller en gång varannan timme etc.. 

2. Antal händelser på disjunkta tidsintervall är oberoende. Omviexempelvis 

får reda på hur många händelser som inträffat under senaste 

minuten påverkar inte detta vår sannolikhetsbedömning av antal händelser 

under nästkommande minut. 

3. På ett tillräckligt kort tidsintervall gäller att sannolikheten för två eller 

fler händelser approximativt är noll. Vidare gäller att sannolikheten 

för exakt en händelse approximativt är proportionell mot intensiteten 

μ och intervallets längd h, dvs sannolikheten är approximativt μ · h. 

Således gäller att sannolikheten att ingen händelse inträffar på ett sådant 

kort intervall approximativt är 1 − μ · h. 

Om dessa förutsättningar är uppfyllda kan man visa (se Appendix B.3.1 9 ) 

att sannolikhetsfördelningen för X ges av 

p (x) =Pr(X = x) = μx · e −μ 

x! 

, x =0, 1, 2,... 

9 För bättre förståelse bör man först gå igenom binomialapproximationen nedan. Vidare 

gäller att redogörelsen matematiskt befinner sig över MaC. 

66

(där e ≈ 2.718). De tre punkterna ovan brukar kallas för de tre poissonaxiomen 

och därför kallas denna sannolikhetsfördelning för Poissonfördelningen 

och betecknas Po(μ). Rent teoretiskt kan en poissonfördelad slumpvariabel 

anta alla tänkbara icke-negativa heltalsvärden. 

Exempel 51 Till en telefonväxel inkommer telefonsamtal med en intensitet 

på två samtal i minuten. Förutsatt att även de båda andra kraven är uppfyllda 

gäller således att 

X = Antal samtal under en minut 

är poissonfördelad Po(2). sannolikheten att exakt ett samtal inkommer under 

en viss minut ges därmed av 

dvs ungefär 27% chans. ¤ 

p (1) = Pr (X =1)= 21 · e −2 

1! =2· e−2 =0.2707 

Vanligtvis är vi inte intresserade av enskilda värden utan uttryck på formen 

“Åtminstone fem händelser” eller “Högst fyra händelser” och då använder 

vi oss av fördelningsfunktionen 

F (x) =Pr(X ≤ x) = 

xX 

p (k) 

som tidigare. Man inser dock snart att även med miniräknarens hjälp blir 

dessa summeringar relativt betungande och därför har vi hjälp av att sådana 

sannolikheter finns tabellerade i Tabell 2 i “Tabeller och formler för statistiska 

beräkningar” för utvalda intensiteter. 

Exempel 52 Vi fortsätter på föregående exempel och ser t.ex. att sannolikheten 

för åtminstone tre samtal under en minut ges av 

Pr (X ≥ 3) = 1 − Pr (X ≤ 2) = 1 − F (2) = 1 − 0.6767 = 0.3233 

dvs ungefär en chans på tre. Vi kan även snabbt lösa problemet i föregående 

exempel via 

som förut. ¤ 

Pr (X =1) = Pr(X≤1) − Pr (X =0)=F (1) − F (0) = 

= 0.4060 − 0.1353 = 0.2707 

67 

k=0

Det är inte alltid vi är intresserade av att bestämma sannolikheter för 

antal händelser på intervall av just enhetslängd. Detta problem är dock lättlöst. 

Antag att vi betraktar en Po(μ)-fördelad slumpvariabel. Detta innebär 

alltså att det i genomsnitt inträffar μ händelser på ett intervall av längden 

1. Det borde då gälla att det i genomsnitt inträffar μ · t händelser på ett 

intervall av längden t. Vill vi bestämma sannolikhetsfördelningen för antal 

händelser på ett intervall av längden t skall vi således använda Po(μ · t). 

Exempel 53 Antag nu att vi i de båda föregående exemplen istället är intresserade 

av slumpvariabeln 

X = Antal händelser under en tvåminutersperiod 

Det följer då att X är Po(2 · 2) = Po(4). Sannolikheter för X fås nu från 

Tabell 2 med μ =4. ¤ 

2.5.2 Poissonapproximation av binomialfördelningen 

Hur kan då poissonfördelningen användas för att approximera binomiala sannolikheter, 

dvs hur hänger dessa båda sannolikhetsfördelningar ihop? För att 

förstå detta studerar vi antal händelser på ett enhetsintervall utifrån de tre 

poissonaxiomen. Först delar vi in enhetsintervallet i n likadana delintervall. 

1 /n 

2 /n 

3 /n 

(n-1 )/n 

0 1 

Har intervallen valts tillräckligt korta, dvs om n valts tillräckligt stort, följer 

av axiom 3 att högst en händelse kan inträffa påettsådantdelintervall 

och att sannolikheten för exakt en händelse ungefär är μ 

. Låter vi en vit 

n 

boll symbolisera att en händelse inträffat kan således händelseförloppet på 

ett delintervall approximativt beskrivas som att vi drar en boll ur en urna 

där andelen vita bollar är μ 

. Enligt axiom 2 gäller dessutom att händelseför- 

n 

loppen på olika delintervall inte påverkar varandra vilket innebär att vi har 

exakt samma förutsättningar på vart och ett av intervallen. Vi kan således 

se det som att vi med återläggning drar n bollarururnan.Vihardärföratt 

68

slumpvariabeln 

X = Antal händelser på ett enhetsintervall 

som är Po(μ) ungefärärsammasom 

X = Antal vita bollar i urvalet 

som är Bi ¡ n, μ¢ 

.Jufler delintervall vi delar in enhetsintervallet i ju min- 

n 

dre kommer sannolikheten för två eller fler händelser på ett delintervall att 

bli och ju bättre kommer därför approximationen att bli. Om vi som vanligt 

låter π beteckna andelen vita bollar i urnan blir föregående uttalande 

samma som att approximationen förbättras ju större n ärochjumindreπ 

är. Nu är det ju dock inte poissonfördelningen som skall approximeras med 

binomialfördelningen utan omvänt och för detta konstaterar vi att 

π = μ 

n 

eller ekvivalent 

μ = n · π 

Förutsatt att n är stort och π litet kan således binomialfördelningen Bi(n, π) 

approximeras med Po(n · π). Vad skall då menas med n stort och π litet? 

De villkor vi kommer att ställa här är att 

n ≥ 10 

π ≤ 0.1 

dvs vi måste dra åtminstone tio bollar ur urnan och andelen vita bollar i 

urnan får vara högst 10%. Dessa gränser är relativt löst satta och man skall 

vara medveten om att approximationen blir bättre ju större n är och ju 

mindre π är. 10 

Exempel 54 För en viss författare av skönlitterära verk har det visat sig att 

sannolikheten att en slumpmässigt vald sida innehåller ett eller flera tryckfel 

är 0.005. Hans nya bok innehåller 400 sidor och uppgiften är att bestämma 

sannolikheten att boken inte innehåller några tryckfel. Vi konstruerar slumpvariabeln 

X = Antal sidor med tryckfel 

10Andra mer restriktiva gränser som används i litteraturen är att n ≥ 100, π≤ 0.01 och 

n · π ≤ 20. 

69

och om tryckfel på olika sidor uppkommer oberoende av varandra följer att 

X är Bi(400, 0.005) och vi söker 

µ 

400 

p (0) = Pr (X =0)= · 0.005 

0 

0 · 0.995 400 =0.995 400 =0.1347 

Iochmedattnär stort och π litet kan denna sannolikhet approximeras via 

Po(400 · 0.005) = Po(2) och det följer från Tabell 2 att 

p (0) = Pr (X =0)≈ 0.1353 

vilket således är en mycket god approximation. ¤ 

Exempel 55 Ienvisskommunbordet1000 röstberättigade personer. Utav 

dessa är det 5% som är miljöpartister. Antag att vi bland kommunens väljarkår 

slumpmässigt väljer 30 personer. Bestäm sannolikheten att högst en 

av dessa är miljöpartister. Bildar vi slumpvariabeln 

X = Antal miljöpartister i urvalet 

följer att X är Hyp(30, 0.05, 1000) och den sökta sannolikheten ges av 

¡ ¢¡ ¢ 50 950 ¡ ¢¡ ¢ 50 950 

Pr (X ≤ 1) = Pr (X =0)+Pr(X =1)= 0 30 ¢ + 1 29 ¢ =0.5512 

¡ 1000 

30 

¡ 1000 

30 

vilket är en uträkning man inte vill behöva göra med enbart en miniräknare 

till hjälp. Istället noterar vi att urvalet endast utgör 3% av populationen, dvs 

n 

N 

30 

= =0.03 < 0.1 

1000 

ochdärförgällerattXapproximativt är Bi(30, 0.05) och det följer att 

µ 

30 

Pr (X ≤ 1) = · 0.05 

0 

0 · 0.95 30 µ 

30 

+ · 0.05 

1 

1 · 0.95 29 =0.5535 

vilket är en bra mycket enklare uträkning som dessutom ligger nära den riktiga 

sannolikheten. Vill man nu göra livet ännu enklare inses att 

n = 30 > 10 

π = 0.05 < 0.1 

vilket innebär att X approximativt är Po(30 · 0.05) = Po(1.5) och ur Tabell 

2 utläser vi 

Pr (X ≤ 1) = 0.5578 

som också det ligger nära sanningen. ¤ 

70

Vi sammanfattar approximationsmöjligheterna så här långt via nedanstående 

figur. 

Approximationsmöjligheter 

Hyp(n, π,N) 

n/N10 π

vilket betyder att det under en enminutsperiod i genomsnitt inkommer två 

samtal till växeln. Det kommer dock inte exakt två samtal varje minut utan 

antal samtal under en minut avviker från detta värde med i genomsnitt 1.41 

samtal. ¤ 


Uppgift 29 På en viss vägsträcka kan antal olyckor under rusningstrafik betraktas 

som en poissonprocess med i genomsnitt två olyckor i timmen. Morgonrusningen 

pågår i en och en halv timme och kvällsrusningen i två timmar. 

a. Bestäm sannolikheten att morgonrusningen blir olycksdrabbad. 

b. Bestäm sannolikheten för högst två olyckor under kvällsrusningen. 

c. Bestäm sannolikheten att det under rusningstrafikenenslumpmässigt 

vald dag inte inträffar någon olycka. 

Uppgift 30 Det är känt att en viss medicin i sällsynta fall kan orsaka bieffekter. 

Man uppskattar att detta inträffar i 0.2% av fallen. Antag att medicinen 

används av 300 personer. Låt 

X = Antal personer som får bieffekter 

a. Bestäm den exakta sannolikhetsfördelningen för X. 

b. Bestäm approximativt sannolikheten att högst tre av personerna uppvisar 

bieffekter. 

Uppgift 31 Antag att 10 000 personer kastar fem tärningar vardera och låt 

X = Antal personer för vilka samtliga tärningar är sexor 

a. Bestäm den exakta sannolikhetsfördelningen för X. 

b. Bestäm, genom att göra lämplig approximation, sannolikheten att åtminstone 

fyra personer lyckas med att få fem sexor. 

72

3 Kontinuerliga slumpvariabler 

3.1 Vad är en kontinuerlig slumpvariabel? 

De slumpvariabler vi studerat hittills har varit diskreta, dvs de har enbart 

kunnat anta ändligt eller uppräkneligt oändligt antal värden. En binomialfördelad 

slumpvariabel kan t.ex. enbart anta värdena 0, 1, 2,...,n(ändligt) 

medan en poissonfördelad slumpvariabel kan anta värdena 0, 1, 2,... (uppräkneligt 

oändligt). Det som utmärker diskreta variabler är att det är ett 

“hopp” mellan variabelvärdena, dvs det finns reella tal på talaxeln som aldrig 

kan förekomma. T.ex. kan en familj inte ha 1.72 barn, och inte heller kan det 

till en telefonväxel komma 0.59 samtal under en viss minut. Det finns dock 

variabler där varje tänkbart värde på ett intervall på talaxeln kan förekomma. 

Sådana variabler kallas för kontinuerliga variabler. 

Exempel 57 I en medicinsk undersökning är man intresserade av feberutvecklingen 

hos ett visst influensavirus. Antag att kroppstemperaturen den andra 

influensadagen är av speciellt intresse. Då vi slumpmässigt väljer ut en smittad 

person vet vi inte exakt febernivån hos den valde personen, dvs det gäller 

att 

X = Kroppstemperaturen den andra influensadagen 

är en slumpvariabel. Antag att vi med en vanlig termometer fann att den 

valde personens feber var 39.2 ◦ C. Hade vi dock haft en mer exakt termometer 

skulle vi funnit att febern var 39.23 ◦ C. En än mer exakt termometer skulle 

visat 39.228 ◦ C,osv.Medetttillräckligtnoggrantmätinstrumentkanvifåmed 

obegränsat antal decimaler i vår uppskattning av personens feber. Alla värden 

på ett intervall (t.ex. mellan 35 ◦ C och 45 ◦ C) kan förekomma och således är 

X en kontinuerlig slumpvariabel. ¤ 

Andra exempel på mänskliga egenskaper som är kontinuerliga är t.ex. 

vikt, ålder och IQ. Hur kommer det sig då att vi måste särbehandla diskreta 

och kontinuerliga slumpvariabler? För att belysa orsaken till detta utgår vi 

från ett exempel där vi studerar en diskret och en kontinuerlig slumpvariabel. 

Exempel 58 Antag att det för en viss telefonväxel gäller att inkommande 

telefonsamtal kommer med en intensitet på ett samtal i minuten, dvs 

Y = Antal samtal under en minut 

är Po(1). Nu kan vi dock vända på resonemanget och istället intressera oss 

för den tid det tar mellan två inkommande samtal. Antag att vi med ett 

stoppur mäter denna tid och finner att det tog 48 sekunder. Tittar vi extra 

73

noga på stoppuret ser vi kanske att det står 48.1 sekunder osv.. Har vi ett 

tillräckligt bra stoppur finns det ingen begränsning för hur många decimaler 

vi får med i beräkningen av tiden. Det gäller således att 

X = Väntetiden mellan två inkommande samtal 

är en kontinuerlig slumpvariabel. ¤ 

Då vi beskriver sannolikhetsfördelningen för en diskret slumpvariabel använder 

vi dess sannolikhetsfunktion 

p (y) =Pr(Y = y) 

för de värden som kan förekomma. I exemplet ovan har vi ju t.ex. att 

p (y) =Pr(Y = y) = e−1 

, y =0, 1, 2,... 

y! 

eftersom μ =1. Problemet med kontinuerliga slumpvariabler är att sådana 

sannolikhetsfunktioner inte existerar vilket resulterar i att 

Pr (X = x) =0, för alla x 

dvs alla värden har sannolikheten noll. Hur kommer sig då detta? I och med 

att en kontinuerlig slumpvariabel kan anta alla värden på ett intervall är det 

omöjligt att gissa exakt vilket värde en slumpmässigt vald individ kommer 

att ha och därmed konstaterar vi att det för kontinuerliga slumpvariabler inte 

går att mäta sannolikheter för enskilda värden. Målet är istället att finna en 

kontinuerlig motsvarighet till den diskreta sannolikhetsfunktionen. 

Det faktum att alla värden har sannolikheten noll betyder dock inte att 

alla värden ter sig lika troliga. I Exempel 57 ovan tror vi antagligen mer på en 

feber runt 39 ◦ C än en feber runt 45 ◦ C. Det är här ordet “runt” vi skall spinna 

vidare på. När vi anger 39 ◦ C menar vi inte exakt detta utan avrundar utifrån 

det tillgängliga mätinstrumentet. Men en vanlig febertermometer som mäter 

tiondels grader menar vi då antagligen intervallet från 38.95 ◦ C till 39.05 ◦ C. 

Antag t.ex. att vi i Exempel 58 söker sannolikheten att väntetiden mellan 

två samtal är en minut, dvs 

Pr (X =1) 

Om vi mäter tiden i hela sekunder menar vi med en minut antagligen tidsintervallet 

från 59.5 sekunder till 60.5 sekunder och vi söker sannolikheten 

Pr (0m 59.5s

För varje kontinuerlig slumpvariabel är det möjligt att beräkna sannolikheter 

för intervall av värden vilket är ett faktum vi skall använda för att bestämma 

den kontinuerliga motsvarigheten till sannolikhetsfunktionen. 

Låt oss fortsätta med Exempel 58 ovan. För att beskriva sannolikhetsfördelningen 

för Y kan vi använda ett stapeldiagram vilket visas i figuren 

nedan (jämför med Tabell 2, μ =1, i formelsamlingen) 

Sannolikhet 

0,4 

0,3 

0,2 

0,1 

0,0 

0 

1 

2 

Antal samtal under en minut 

3 

där vi enbart angivit värden upp till sex eftersom sannolikheterna är mycket 

små för större värden. Höjden av en stapel representerar sannolikheten för ett 

visst värde vilket innebär att ett sådant diagram inte kan konstrueras för en 

kontinuerlig variabel. Om vi däremot delar in (avrundar) värdena i intervall 

kan vi konstruera ett liknande diagram, ett sk. sannolikhetshistogram. Delas 

tidsskalan in i hela minuter kan man på teoretisk väg visa att sannolikhetshistogrammet 

Frekvens (täthet) 

0,7 

0,6 

0,5 

0,4 

0,3 

0,2 

0,1 

0,0 

0 

1 

2 

3 

Väntetid (min) 

beskriver sannolikhetsfördelningen för väntetider (i hela minuter). 11 Ett san- 

11 Den kontinuerliga slumpvariabel som uppstår genom att mäta tiden mellan två händelser 

i en poissonprocess med intensitetsparameter μ kallas för Exponentialfördelningen 

75 

4 

4 

5 

5 

6 

6

nolikhetshistogram är konstruerat så att arean av varje rektangel motsvarar 

sannolikheten att slumpvariabeln antar ett värde i det aktuella intervallet. 

Detta innebär att skalan på den lodräta axeln inte nödvändigtvis behöver 

vara sannolikheter och den kallas därför istället för frekvens eller täthet (pga 

att man på engelska använder terminologin density). (I det här fallet anger 

dock skalan sannolikheter pga att bredden på varje intervall är ett.) Med 

sannolikhetshistogrammet ovan kan vi dock enbart beräkna sannolikheter för 

tidsintervall som gäller hela minuter. Vill vi t.ex. bestämma sannolikheten 

att tiden mellan två samtal är mindre än 1.5 minuter fungerar inte detta histogram. 

För att kunna lösa den uppgiften måste vi göra en finare indelning, 

t.ex. i halvminutsintervall. Gör vi detta får vi (på teoretisk väg) följande 

sannolikhetshistogram 


0,8 

0,7 

0,6 

0,5 

0,4 

0,3 

0,2 

0,1 

0,0 

0 1 2 3 4 5 6 


och den sökta sannolikheten ges av den sammanlagda arean av de tre rektanglarna 

till vänster som framgår av följande figur 


0,8 

0,7 

0,6 

0,5 

0,4 

0,3 

0,2 

0,1 

0,0 

0 

1 

Den skuggade arean är sannolikheten 

att tiden mellan två samtal är mindre än 

1.5 minuter 

2 

3 


Söker vi sannolikheter för annat än halvminutsintervall uppstår dock samma 

problem som tidigare. Vill vi t.ex. bestämma sannolikheten att det tar 

och betecknas Exp(μ). 

76 

4 

5 

6

mindre än en minut och femton sekunder måste vi skapa ett histogram med 

ännu finare indelning som nedan där den angivna sannolikheten är angiven 


0,9 

0,8 

0,7 

0,6 

0,5 

0,4 

0,3 

0,2 

0,1 

0,0 

Arean av det skuggade området är sannolikheten 

att tiden mellan två samtal är mindre än en minut 

och 15 sekunder. 

0 1 2 3 4 5 6 


Hur fin intervallindelning vi än gör kommer det ändå att kunna uppstå intressanta 

intervall för vilka sannolikheter inte kan beräknas. Detta problem 

löser vi på matematisk väg genom sk. gränsvärden. Detta innebär att vi betraktar 

sannolikhetshistogram med finare och finare indelning vilket medför 

att “rektangeltaken” på dessa histogram mer och mer kommer att likna en 

jämn funktionskurva. Denna kurva utgör det generaliserade sannolikhetshistogram 

denna följd av histogram är på väg mot. För histogramföljden ovan 

blir denna funktionskurva som i figuren nedan. 


1,0 

0,5 

0,0 

0 

1 

2 

3 


(4) 

Med ett generaliserat sannolikhetshistogram menas ett histogram där intervallbredderna 

är oändligt små (och antal intervall oändligt många). Utifrån 

denna funktionskurva är det nu möjligt att bestämma sannolikheter för alla 

tänkbara intervall. Låt a och b vara två tal (med a

som den markerade arean i figuren nedan. 


1,0 

0,5 

0,0 

a 

Arean av det skuggade området anger 

sannolikheten att tiden mellan två 

samtal är mellan a och b minuter. 

b 


Vi går här inte in i detalj hur denna beräkning görs utan nöjer oss med att 

konstatera att en sannolikhet för en kontinuerlig slumpvariabel kan representeras 

av arean för ett bestämt område under en funktionskurva. Eftersom 

areor representerar sannolikheter är den totala arean under kurvan alltid 1. 

Precis som för diskreta slumpvariabler kan vi konstruera en fördelningsfunktion, 

dvs en funktion som mäter sannolikheten att få ett värde som högst 

är det angivna. 

F (x) =Pr(X≤x) Studerar vi innebörden av fördelningsfunktionen för kontinuerliga slumpvariabler 

finner vi via figuren 


1,0 

0,5 

0,0 

F(x) 

Arean av det skuggade området anger 

fördelningsfunktionens värde i punkten x. 

x 


att denna fås genom att beräkna arean av det område under kurvan som 

ligger under (till vänster) om den angivna punkten. Den kurva vi har använt 

oss av som exempel beskriver sannolikhetsfördelningen för den sk. Exponentialfördelningen 

och har nu gjort sitt i den här framställningen. Då kontinuerliga 

sannolikhetsfördelningar vanligtvis kräver matematikkunskaper över 

78

MaC innebär en ordentlig genomgång av dessa ett problem på dessa kurser. 

Lyckligtvis gäller dock att det går att arbeta med den viktigaste av alla kontinuerliga 

sannolikhetsfördelningar utan att gå in på de tyngre matematiska 

detaljerna. 

3.2 Normalfördelningen 

3.2.1 Normalfördelningens egenskaper 

Den utan jämförelse viktigaste sannolikhetsfördelningen är den sk. Normalfördelningen, 

vilket kan verka mycket besynnerligt eftersom det inte finns någonting 

som är normalfördelat. Normalfördelningen är en teoretiskt konstruerad sannolikhetsmodell 

som matematiskt beskrivs via funktionen 

f (x) = 1 

σ √ 1 

e− 2( 

2π x−μ 

σ ) 2 

, −∞

σ 

μ 

μ representerar som sagt populationsmedelvärdet och eftersom kurvan är helt 

symmetrisk måste därför μ ange kurvans mittpunkt. Om vi ändrar värdet på 

μ utan att förändra värdet på σ flyttar vi helt enkelt kurvan utan att på annat 

sätt ändra dess utseende. Nedan ges en jämförelse av två normalfördelningar 

med olika medelvärden men med samma standardavvikelse (σ =4). 

0 

μ=10 

10 

Populationsstandardavvikelsen anger hur utspridd populationen är och därför 

betyder ett litet σ att kurvan är mer ihoptryckt och ett stort σ att kurvan 

är mer utdragen. Ändrar vi värdet på σ utan att ändra värdet på μ “pressar 

vi ihop” eller “drar isär” kurvan utan att flytta dess mittpunkt. Nedan ges en 

jämförelse av tre normalfördelningar med olika standardavvikelser men med 

samma medelvärde (μ =20). 

80 

20 

μ=20 

30

σ=2 

σ=4 

σ=6 

0 10 20 30 40 

Normalfördelningen är helt bestämd utav sina båda parametrar, dvs om vi 

väl känner till att kurvan är normalfördelad behöver vi enbart ta reda på μ 

och σ för att exakt veta kurvans utseende. 

Då man använder en sannolikhetskurva är resonemanget som följer 

Vi vill bestämma sannolikheten att hamna i intervallet (a, b), 

vilket betyder att vi vill bestämma sannolikheten att en slumpmässigt 

vald individ har ett värde på variabeln någonstans mellan 

a och b. Detta är samma sak som att bestämma andelen individer 

i populationen som har värde någonstans mellan a och b. 

Arean under kurvan mellan punkterna a och b anger denna andel och 

därför är arean under hela kurvan lika med 1 (eller 100%). 

Sannolikheten att en 

slumpmässigt vald individ 

Andelen individer i populationen 

har ett värde mellan a och b med värde mellan a och b 

a b 

En oerhört användbar egenskap hos normalfördelningen är att oberoende av 

81

vilken normalfördelning man studerar så baseras sannolikhetsbedömningen 

på avståndet mätt i standardavvikelser från medelvärdet. För samtliga normalfördelade 

populationer gäller t ex att ca 68% av individerna ligger inom en 

standardavvikelse från medelvärdet och ca 95% inom två standardavvikelser 

från medelvärdet. Detta åskådliggörs i figuren nedan. 

μ−2σ μ−σ μ μ+σ μ+2σ 

+ 

= 68% 

= 95% 

Nu är det dock inte säkert att de värden vi vill bestämma sannolikheter 

förärjustdessapunkter.Attrenttekniskt beräkna sannolikheter för normalfördelningen 

inbegriper tyngre matematik och är ingenting vi tänker fördjupa 

oss i här. Av den föregående egenskapen har vi dock fått insikten att 

det är tillräckligt att beräkna sannolikheter för en viss utvald medlem av 

normalfördelningsfamiljen, pga att denna sedan enkelt översätts till vilken 

annan normalfördelning som helst. 

Exempel 59 Betrakta två slumpvariabler X och Y sådana att X är N (10, 4) 

och Y är N (20, 6), där vi använder notationen N (μ, σ) från ovan. Antag att 

vi för den första populationen vill bestämma andelen individer vars värde 

understiger 2, eller ekvivalent 

Pr (X

N(10,4) 

De markerade områdena 

har samma area 

N(20,6) 

0 2 8 10 20 30 40 

Då vi för just detta värde råkar veta sannolikheten (på ett ungefär) finner vi 

att 

Pr (X

vi söker 

F (1.28) = Pr (Z ≤ 1.28) 

Denna finner vi genom att i den vänstra kolumnen söka upp raden 1.2 och 

sedan i den övre raden finna kolumn 8. 

z ··· ··· 7 8 9 

. 

. 

1.1 

1.2 0.8997 

1.3 

. 

Denna rad och kolumn möts i värdet 0.8997 som är den sökta sannolikheten, 

dvs 

Pr (Z ≤ 1.28) = 0.8997 

Vi tolkar denna sannolikhet som att ungefär 90% av en normalfördelad population 

ligger högst 1.28 standardavvikelser över medelvärdet, vilket även 

framgår i figuren nedan. 

90% 

-3 -2 -1 0 1 2 3 

z 1.28 

Nu kan inte fördelningsfunktionen anges för varje tänkbart värde på z utan 

de angivna värdena är begränsade till varje hel hundradel mellan 0 och 3.1 

och sedan för varje hel tiondel till z =3.7. Dåuppstårnågrafrågorvilkavi 

besvarar i tur och ordning. 

84

• Hur beräknar vi sannolikheter för punkter som befinner sig mer än 

3.7 standardavvikelser från medelvärdet? Det är en mycket liten del 

av en normalfördelad population som befinner sig så långt bort från 

medelvärdet varför vi i dessa lägen oftast approximerar denna sannolikhet 

med noll. 

• I tabellen anges enbart positiva värden på z. Hur beräknar vi sannolikheter 

förknippade med negativa värden på z? Avsymmetriskälöverför 

vi enkelt detta problem på sannolikheter förknippade med positiva 

värden på z eftersom 

Pr (Z ≤ z) =Pr(Z ≥−z) 

vilket kanske bäst åskådliggörs med ett exempel. 

Exempel 60 Bestäm sannolikheten att hamna åtminstone en standardavvikelse 

under medelvärdet i en normalfördelning, dvs vi söker 

Pr (Z ≤−1) 

Värdet z = −1 återges dock inte av utrymmesskäl vilket är möjligt enbart 

pga att den standardiserade normalfördelningen är symmetrisk kring värdet 

0. Andelen individer som har värdet högst −1 är därför samma som andelen 

individer som har värdet åtminstone 1. Dvs 

Pr (Z ≤−1) = Pr (Z ≥ 1) 

och på detta sätt har vi nu överfört problemet till positiva värden på z. Den 

sökta sannolikheten gäller nu dock den högra svansen vilket vi löser genom 

att använda det faktum att den totala arean under kurvan är 1 och således 

blir den sökta sannolikheten 

Pr (Z ≤−1) = Pr (Z ≥ 1) = 1 − Pr (Z

¤ 

Det är denna 

sannolikhet som 

söks 

α 

Denna sannolikhet är 

identisk med den som 

söks 

-3 -2 -1 0 1 2 3 

z 

α 

Det är denna sannolikhet 

som ges i tabellen 

1−α 

-3 -2 -1 0 1 2 3 

z 

• Hur gör vi om den sökta sannolikheten inte rör en exakt hundradel? 

Hur bestämmer vi t.ex. sannolikheten förknippad med z =1.054? Hundradelar 

befinner sig sannolikhetsmässigt nära varandra varför vi utan 

någon större skada kan avrunda till närmaste hundradel vilket i det här 

fallet är z =1.05 och således gäller att 

Pr (Z ≤ 1.054) ≈ Pr (Z ≤ 1.05) = 0.8531 

Den sökta sannolikheten ligger mellan sannolikheterna förknippade med 

z =1.05 och z =1.06 och vi kan göra något bättre ifrån oss genom att 

interpolera, dvs genom att beräkna ett vägt medelvärde mellan dessa 

båda sannolikheter. Eftersom z =1.054 ligger närmare z =1.05 bör 

denna väga lite tyngre och interpolationsformeln blir 

Pr (Z ≤ 1.054) ≈ 0.6 · Pr (Z ≤ 1.05) + 0.4 · Pr (Z ≤ 1.06) = 

= 0.6 · 0.8531 + 0.4 · 0.8554 = 0.8540 

vilket kan jämföras med den exakta sannolikheten 

Pr (Z ≤ 1.054) = 0.8541 

Vid mer komplicerade beräkningar kan det vara en fördel att dela upp 

problemet i enklare delar 

Exempel 61 Bestäm 

Pr (−0.3

För att kunna använda oss av tabellen måste vi skriva om så att sannolikheterna 

är på formen Pr (Z

α

en slumpvariabel med medelvärde 0 och standardavvikelse 1. För normalfördelningen 

har vi dessutom den viktiga egenskapen 

Resultat 1 Varje linjärfunktion av en normalfördelad slumpvariabel är själv 

normalfördelad. Låt X vara N (μ, σ). Dåföljerav(3) iavsnitt2.3 att 

Y = a + b · X är N (a + b · μ, | b |·σ) 

där | b | är absolutbeloppet av b, dvsdetpositivavärdet.¥ 

Detta betyder alltså att Z är N (0, 1). Det är detta faktum som gör det 

möjligt att arbeta med samtliga normalfördelningar på samma sätt. En standardisering 

av en normalfördelning innebär att vi genom subtraktionen X −μ 

först flyttar hela sannolikhetsfördelningen μ steg till vänster (eller åt höger 

om μ är negativ), dvs till att ha sitt centrum i origo. Genom att sedan dividera 

med σ “pressar vi ihop” eller “drar isär” sannolikhetsfördelningen så 

att den får exakt den form som den kurva som används i tabellsamlingen. 

Tillvägagångssättet beskrivs i figurerna nedan 

0 

Subtraktion X - μ 

x-värden 

μ 

Standardiserad form 

Ursprunglig form 

-5 

-4 

-3 

-2 

Division med σ 

-1 

0 

1 

x-värden 

Det vanligaste sättet att åskådliggöra en standardisering grafiskt är dock att 

använda samma kurva men med två olika skalor vilket visas i figuren nedan 

μ−3σ 

-3 

μ−2σ 

-2 

μ−σ 

-1 

μ μ+σ μ+2σ μ+3σ 

0 

89 

1 

2 

3 

Originalskala 

Standardiserad 

skala 

2 

3 

4 

5

Härnäst kommer några exempel på hur man sköter notationen vid standardisering 

av normalfördelningen. 

Exempel 63 Intelligenskvoten IQ är en egenskap som brukar betraktas som 

approximativt normalfördelad i en stor population. Den genomsnittliga IQkvoten 

är 100 med en standardavvikelse på 15. Låter vi 

X = IQ för en slumpmässigt vald person 

blir således X en normalfördelad slumpvariabel N (100, 15). 

1. Beräkna sannolikheten att en slumpmässigt vald person har en IQ över 

118. Förattkunnabestämmadennasannolikhetmåstevitaredapåhur 

många standardavvikelser över 100 värdet 118 befinner sig. Vi finner 

detta via kvoten 

118 − 100 

z = =1.2 

15 

dvs det är 1.2 standardavvikelser över medelvärdet. Vi finner nu den 

sökta sannolikheten via Tabell 3a till 

Pr (Z >1.2) = 1 − Pr (Z ≤ 1.2) = 1 − 0.8849 = 0.1151 

dvs det är ca. 11.5% chans att en slumpmässigt vald person har en IQ 

över 118. Vi kan också tolka resultatet som att ca. 11.5% av befolkningen 

har en IQ över 118. Då man beräknar denna sannolikhet använder man 

vanligtvis följande notation. 

µ 

X − 100 

Pr (X >118) = Pr > 

15 

118 − 100 

 

=Pr(Z>1.2) 

15 

och sedan är det bara att använda tabellen som ovan eftersom 

X − 100 

Z = 

15 

är N (0, 1). Åskådliggör vi detta grafiskt får vi figuren 

55 

-3 

70 

-2 

90 

85 

-1 

100 115 130 145 

0 

1 

Arean av det skuggade 

området är 0.1151 

2 

3 

IQ 

Z

2. Inträdeskravet i föreningen Mensa är den intelligensnivå som bara de 

översta två procenten av populationen presterar. Vilken IQ-nivå innebär 

detta? Hur många standardavvikelser över medelvärdet måste vi minst 

ta oss för att endast två procent av populationen skall ha en högre intelligenskvot? 

Vi söker i Tabell 3b ochfinner värdet 

¤ 

z0.02 =2.0537 

vilket omräknat till IQ-standardavvikelser blir 

2.0537 · 15 = 30.81 

och således måste man ha en IQ på åtminstone 

100 + 2.0537 · 15 = 130.81 ≈ 131 

Då man skriver ner detta använder man oftast följande notation. Vi 

söker det värde a sådant att 

µ 

X − 100 

0.02 = Pr (X >a)=Pr > 

15 

a − 100 

µ 

 

a − 100 

=Pr Z> 

15 

15 

ITabell3b fannviattz0.02 =2.0537 vilket betyder att 

och 

som tidigare. 

a − 100 

15 =2.0537 

a =2.0537 · 15 + 100 = 130.8 ≈ 131 

Det är inte alltid det är en direkt standardisering av normalfördelningen 

som söks. Det faktum att varje linjärfunktion av en normalfördelad slumpvariabel 

själv är normalfördelad ger fler möjligheter. 

Exempel 64 Antag att febertemperaturen mätt i ◦ C för en influensasjuk 

person kan ses som en normalfördelad slumpvariabel X som är N (39, 1). 

En amerikansk besökare vill dock få sannolikheterna uttryckta för Fahrenheitskalan 

istället. Nu råkar det vara så att om Y representerar ◦ F har vi 

följande samband mellan de båda slumpvariablerna 

Y =32+1.8 · X 

91

dvs Y är en linjärfunktion av X med a =32och b =1.8. Eftersom X är 

normalfördelad blir även Y detta och det gäller att 

Y är N (32 + 1.8 · 39, 1.8 · 1) = N (102.2, 1.8) 

Sannolikhetsfördelningen kan nu beskrivas med de två skalorna 

¤ 

36 

96.8 

37 

98.6 

38 

100.4 

39 40 41 42 

102.2 

104.0 

105.8 

107.6 

Celsius 

Fahrenheit 

I och med att vi nu både kan arbeta med normalfördelningen och binomialfördelningen 

gör det möjligt att konstruera mer komplicerade exempel 

där vi kombinerar dessa båda sannolikhetsfördelningar. 

Exempel 65 Bestäm sannolikheten att någon av tjugo slumpmässigt valda 

personer har Mensa-potential. Vi såg i Exempel 63 att andelen personer med 

Mensa-potential är 2% vilket innebär att vi kan se det som en urna innehållande 

ett mycket stort antal bollar där 2% av dessa är vita (representerande 

personer med Mensa-potential). Vi skall slumpmässigt välja 20 bollar ur denna 

urna och det följer att 

X = Antal vita bollar i urvalet = 

= Antal personer i urvalet med Mensa-potential 

är binomialfördelad, Bi(20, 0.02). Vi söker sannolikheten 

Pr (X ≥ 1) = 

µ 

20 

1 − Pr (X =0)=1− 

0 

= 1−0.98 20 =0.3324 

0.02 0 0.98 20 = 

dvs det är ungefär en chans på tre att någon av de utvalda har Mensapotential. 

¤ 

92

Exempel 66 Dåenvisstypavtorpedavfyrasmotett250 meter brett mål 

gällerattdenigenomsnittträffar mitt i målet med en standardavvikelse på 

100 meter. Dessutom gäller att träffbilden kan ses som normalfördelad. Låter 

vi 

X = En torpeds träffpunkt 

blir X en slumpvariabel med sannolikhetsfördelning N (0, 100) där värdet 0 

representerar “mitt i prick”. 

1. Bestäm sannolikheten att en torped träffar målet. Detta är nu ekvivalent 

med att för X bestämma sannolikheten 

Pr (−125

¤ 

dvs det är mer än 99% chans att målet blir oskadliggjort. 


Uppgift 32 Vi betraktar nu en standardiserad normalfördelning, dvs en fördelning 

där μ =0och σ =1. Bestäm för var och en av figurerna arean av det 

skuggade området. 

i) 

iii) 

-3 

-3 

-2 

-2 

-1 

-1 

0 

0 

1 

1 

2 

2 

3 

3 

ii) 

iv) 

Uppgift 33 Vi betraktar åter en standardiserad normalfördelning. Bestäm 

för var och en av figurerna värdet av punkten z. 

i) 

z 

2,5% 

Uppgift 34 Vi betraktar nu en normalfördelning med μ =10och σ =4. 

Bestäm för var och en av figurerna arean av det skuggade området. 

94 

ii) 

-3 

-3 

-2 

-2 

-1 

-1 

0 

0 

1 

1 

33% 

2 

z 

2 

3 

3

i) 

0 

10 

20 

ii) 

6 10 15 

Uppgift 35 Variabeln X är normalfördelad med parametrar μ och σ. 

a. Antag att vi känner att μ =104. Vidare är det känt att sannolikheten 

att hamna över 116 är 0.0668. Bestäm σ utifrån denna information. 

b. Antag att vi känner att σ =4. Vidare är det känt att sannolikheten att 

hamna under 10 är 0.1515. Bestäm μ utifrån denna information. 

Uppgift 36 Vid en tomatodling sorteras tomaterna efter vikt. Vikten av en 

tomat kan anses som normalfördelad med μ =50och σ =10(enhet: gram). 

Man vill sortera tomaterna i tre storleksklasser, så att 25% bedöms som små, 

50% som medelstora och 25% som stora. Hur skall dessa gränser väljas? 



3.3 Normalapproximation av binomialfördelningen 

Vi nämnde tidigare att normalfördelningens största förtjänst är att den kan 

användas till att approximera sannolikheter i en mängd viktiga situationer. 

Vi tänker i detta avsnitt att redogöra för en sådan situation för att 

sedan i nästa avsnitt generalisera detta och redovisa det resultat som gör 

normalfördelningen till den i särklass viktigaste sannolikhetsfördelningen. Vi 

har redan i avsnitt 2.5.2 sett att vi i vissa situationer kan använda Poissonfördelningen 

för att approximera binomiala sannolikheter. Detta fungerar 

dock enbart om andelen individer med den aktuella egenskapen är liten, dvs 

om fördelningen mellan vita och svarta bollar i urnan är tillräckligt sned. 

Hur gör vi då om så inte är fallet? Det visar sig att detta är en situation 

där normalfördelningen blir användbar. Det visar sig nämligen att om bara 

urvalet är tillräckligt stort, dvs om antal dragna bollar är tillräckligt många, 

kommer stapeldiagrammet över de binomiala sannolikheterna att med god 

approximation överensstämma med en normalfördelning. Låt oss visa detta 

med ett exempel. 

95

Exempel 67 Antag att var femte svensk är moderat, dvs att andelen moderater 

i den svenska väljarkåren är 20%. Eftersom väljarkåren är mycket stor 

kommer 

X = Antal moderater i urvalet 

att vara binomialfördelad Bi(n, 0.2). Vikanalltsåseurvaletsomattvimed 

återläggning drar n bollar ur en urna innehållande fem bollar varav en är vit. 

Binomiala sannolikhetsfördelningar kan alltid beskrivas med stapeldiagram 

och för ett antal olika urvalsstorlekar fås följande diagram 

Sannolikhet 

0 1 2 3 4 5 

Antal moderater i urvalet, n=5 

Sannolikhet 

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 


Sannolikhet 

0 1 2 3 4 5 6 7 8 9 10111213141516171819 


Vi ser utifrån dessa diagram att sannolikhetsfördelningen för X blir mer 

och mer symmetrisk och normalfördelningslik då urvalsstorleken ökar. Med 

god approximation borde vi därför vid större urval kunna använda en normalfördelningskurva 

för att beräkna binomiala sannolikheter vilket framgår 

då vi anpassar en normalfördelningskurva till det högra stapeldiagrammet. 

¤ 


1 

2 

3 

4 

5 

6 

7 

8 

9 10 11 12 13 14 15 16 

Antal moderater i urvalet 

Nu uppstår två frågor som måste besvaras. 

• Vilken normalfördelning skall användas för approximationen? 

Normalfördelningen är helt bestämd av sina båda parametrar, μ och 

σ, ochförattfinna den normalfördelning som bäst approximerar den 

96

aktuella binomialfördelningen måste vi finna dessa båda parametervärden, 

dvs medelvärde och standardavvikelse. Vi såg i avsnitt 2.4.1 att 

för Bi(n, π) är 

μ = n · π 

σ = p n · π · (1 − π) 

varför den sökta normalfördelningen är 

³ 

N n · π, p ´ 

n · π · (1 − π) 

Exempel 68 Vi återgår till föregående exempel där X är Bi(40, 0.2) varför 

den sökta normalfördelningen är 

³ 

N 40 · 0.2, √ ´ 

40 · 0.2 · 0.8 = N (8, 2.53) 

¤ 

• Hur stort måste urvalet vara för att approximationen skall 

vara acceptabel? Det visar sig att detta beror på hur symmetrisk 

populationen är med avseende på den aktuella egenskapen. Antag att 

vi hos de utvalda förutom egenskapen “Moderat?” även är intresserade 

av huruvida man är för eller emot ett EMU-medlemskap. Antag 

vidare att halva väljarkåren är för ett EMU-medlemskap. Då vi betraktar 

tvåpunktsfördelade variabler kan populationen alltid beskrivas med 

ett stapeldiagram med endast två staplar, en för dom med egenskapen 

och en för dom som saknar den. I de båda exempel vi hittills använt 

oss av beskrivs populationen (den svenska väljarkåren) via 

Andel av väljarkåren 

Moderat Ej moderat 

Andel av väljarkåren 

EMU-anhängare EMU-motståndare 

och vi ser att populationens utseende beror på den studerade variabeln. 

I EMU-exemplet har vi det mest symmetriska utseende en population 

kan ha för en tvåpunktsfördelad egenskap, nämligen 50—50, medan 

97

vi i moderat-exemplet har en snedfördelning, 20—80. Av denna anledning 

blir för given urvalsstorlek normalapproximationen bättre i EMUexemplet. 

Hur stort urval måste vi då ta för att stapeldiagrammet över 

de binomiala sannolikheterna skall uppvisa tillräcklig symmetri? Detta 

blir förstås en subjektiv bedömning men erfarenheten har visat att om 

n · π · (1 − π) ≥ 5 

dvs att variansen för den aktuella binomialfördelningen överstiger 5, 

eller ekvivalent att 

5 

n ≥ 

π · (1 − π) 

kommer approximationen i de flesta fall att bli tillfredsställande. I 

EMU-exemplet krävs t.ex. att n ≥ 5 =20medan det i moder- 

0.5·0.5 

atexemplet krävs att n ≥ 5 =31.25, dvsca32 personer. 

0.2·0.8 

Sammanfattningsvis gäller alltså att om vi för en tvåpunktsfördelad egenskap 

känner värdet på π och har ett tillräckligt stort urval kan sannolikhetsberäkningar 

för antal individer i urvalet med den aktuella egenskapen med 

god approximation göras via normalfördelningen. En mer teoretisk förklaring 

till varför normalfördelningen kan användas till att approximera binomiala 

sannolikheter ges i nästa avsnitt. 

Innan vi tar ett exempel på normalapproximation av binomialfördelningen 

finns en liten finjustering för att göra approximationen ännu bättre. I 

och med att binomialfördelningen är diskret beskrivs dess sannolikhetsfördelning 

med ett stapeldiagram och sannolikheter beräknas utifrån dessa staplars 

höjder. För den kontinuerliga normalfördelningen beräknas emellertid sannolikheter 

utifrån areor under normalkurvan och för att även de binomiala 

sannolikheterna skall bli areor delas talaxeln in i diskreta heltalsklasser. 

0 1 2 3 4 5 6 

vilket t.ex. innebär att det diskreta heltalsvärdet 4 motsvaras av den heltalsklassen 

4, dvs det kontinuerliga intervallet (3.5, 4.5). Allmänt motsvaras 

98

det diskreta heltalsvärdet k av klassen ¡ k − 1 

¢ 

1 ,k+ . På detta sätt över- 

2 2 

förs stapeldiagrammet till ett sannolikhetshistogram 


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 


Stapeldiagrammet... 

...blir ett sannolikhetshistogram 


0 

5 

10 


där de binomiala sannolikheterna som önskat beräknas som areor under rektanglarna. 

Nu inses något mycket intressant. Antag att vi söker sannolikheten 

att åtminstone 10 av de valda är moderater. Denna sannolikhet motsvaras 

av följande area 


0 

5 

9.5 

10 


Arean av det skuggade området 

är sannolikheten att åtminstone 

10 av de valda är moderater 

och vi ser att den kontinuerliga beräkningen inte skall börja i punkten 10 utan 

i punkten 9.5. Detta beror på att det diskreta heltalsvärdet 10 motsvaras av 

det kontinuerliga intervallet (9.5, 10.5). Normalapproximationen kommer då 

att bli 

Pr (X ≥ 10) 

| {z } 

Xär binomial 

15 

≈ Pr (X ≥ 9.5) 

| {z } 

Xär normal 

Denna lilla finjustering kallas för kontinuitetskorrektion, dvs en korrektion 

för att förbättra approximationen av en diskret sannolikhetsfördelning med 

en kontinuerlig. 

Exempel 69 Vi återgår till Exempel 67 där vi antar att vi har ett urval om 

n =150personer ur väljarkåren. Detta innebär alltså att 

X = Antal moderater i urvalet 

99 

15

är Bi(150, 0.2). Bestäm sannolikheten att åtminstone 35 av de utvalda är 

moderater. Tabell 1 räcker inte till och att utifrån binomialformeln beräkna 

denna sannolikhet är ingenting man gärna ger sig i kast med. Dessutom gäller 

att andelen moderater i väljarkåren, π, är för stor för poissonapproximation. 

Vi undersöker därför möjligheterna för en normalapproximation och finner 

att 

n · π · (1 − π) =150· 0.2 · 0.8 =24> 5 

varför detta är tillåtet. Den normalfördelning vi skall använda är 

³ 

N 150 · 0.2, √ ´ 

150 · 0.2 · 0.8 = N (30, 4.9) 

Vi söker 

Pr (X ≥ 35) 

vilket med kontinuitetskorrektion motsvaras av 

Pr (X ≥ 34.5) 

vilket framgår av följande figur där vi markerat en utvald del av sannolikhetshistogrammet 

för Bi(150, 0.2) tillsammans med normalkurvan N (30, 4.9). 


30 

34.5 

35 

Arean av det skuggade området 

anger sannolikheten att åtminstone 

35 av de valda är moderater. 

40 


Detta problem löses nu genom att standardisera och läsa ur normalfördelningstabellen 

(Tabell 3a). Vi får att 

µ 

X − 30 34.5 − 30 

Pr (X ≥ 35) ≈ Pr (X ≥ 34.5) =Pr ≥ =Pr(Z≥0.92) = 

| {z } | {z } 4.9 4.9 

Xär binomial 

Xär normal 

= 1−Pr (Z





Uppgift 42 En maskin som tillverkar vinkorkar producerar korkar vars diameter 

kan betraktas som normalfördelad med medelvärde 3 cm och standardavvikelse 

0.1 cm. En kork är acceptabel om dess diameter ligger mellan 2.9 

cm och 3.1 cm. 

a. Bestäm sannolikheten att en slumpmässigt vald kork är acceptabel. 

b. Antag att vi har 60 (ej bedömda) korkar i lager och att vi behöver 40 

acceptabla korkar för en omgång vinflaskor. Bestäm sannolikheten att vi 

kan korka flaskorna utan att behöva låta maskinen tillverka nya korkar. 

Uppgift 43 Denna uppgift är en utökad version av uppgift 508 i boken. En 

maskin fyller konservburkar med linssoppa. Vikten av en burks soppinnehåll 

kan betraktas som normalfördelad med standardavvikelsen 20 gram. 

a. Vilket medelvärde skall man inrikta sig på för att i långa loppet 99% av 

burkarna skall innehålla minst 750 gram linssoppa? 

b. Antag att vi använder oss av medelvärdet från a-uppgiften. Vi tänker 

nu göra ett stickprov om 200 burkar från produktionen. Bestäm sannolikhetsfördelningen 

för 

X = Antal burkar i urvalet som väger mindre än 750 gram 

c. Bestäm, genom att göra en lämplig approximation, sannolikheten att 

stickprovet i b-uppgiften åtminstone innehåller fyra burkar som väger 

mindre än 750 gram. (Vilken typ av approximation är tillåten?) 

3.4 Centrala gränsvärdessatsen (CGS) 

3.4.1 Ett inledande exempel 

I föregående avsnitt såg vi att normalfördelningen kan användas som approximativ 

sannolikhetsmodell för binomialfördelningen. I det här avsnittet skall 

vi se att normalfördelningens approximativa egenskaper sträcker sig mycket 

längre än så. Låt oss belysa problematiken med ett exempel. 

101

Exempel 70 Man planerar att bygga ett nytt bostadsområde för 100 familjer 

och vill veta hur många parkeringsplatser man skall förse detta bostadsområde 

med. Antag att det för den familjetyp som flyttar till sådana bostadsområden 

gäller att egenskapen 

X = Antal bilar i en familj 

kan ses som en slumpvariabel med sannolikhetsfördelning 

x 0 1 2 

p (x) 0.3 0.5 0.2 

En familj har således antingen 0, 1 eller 2 bilar. Nu är det ju dock inte sannolikhetsfördelningen 

för antal bilar i en familj som är av intresse utan det 

sammanlagda antalet bilar i hundra familjer. Låter vi X1,X2,...,X100 representera 

antalet bilar i var och en av dessa hundra familjer följer att 

Y = Det sammanlagda antalet bilar i hundra familjer = 

= X1 + X2 + ···+ X100 

Att bestämma sannolikhetsfördelningen för slumpvariabeln Y visar sig vara 

lättare sagt än gjort. Låt oss börja lite försiktigt att bestämma sannolikhetsfördelningen 

för det sammanlagda antalet bilar i två familjer. Vi förutsätter 

att familjerna väljs slumpmässigt och att det föreligger samma förutsättningar 

vid båda dessa slumpförsök. För 

Y = X1 + X2 

får vi då följande sannolikhetsfördelning 

dvs 

Utfall 

00 

10 

01 

11 

20 

02 

21 

12 

22 

Sannolikhet 

0.3*0.3=0.09 

Värdering (Y) 

Pr(Y=0)=0.09 

0.5*0.3=0.15 

0.3*0.5=0.15 

0.5*0.5=0.25 

1 Pr(Y=1)=0.30 

0.2*0.3=0.06 

0.3*0.2=0.06 

2 Pr(Y=2)=0.37 

0.2*0.5=0.1 

0.5*0.2=0.1 

3 Pr(Y=3)=0.20 

0.2*0.2=0.04 4 Pr(Y=4)=0.04 

0 

Slh-fördelning 

y 0 1 2 3 4 

p (y) 0.09 0.30 0.37 0.20 0.04 

102

Motsvarande beräkning för sammanlagt antal bilar i tre familjer 

Y = X1 + X2 + X3 

ger efter viss möda sannolikhetsfördelningen 

y 0 1 2 3 4 5 6 

p (y) 0.027 0.135 0.279 0.305 0.186 0.060 0.008 

Man inser snart att utifrån detta angreppssätt finna sannolikhetsfördelningen 

för sammanlagt antal bilar i hundra familjer är utsiktslöst. Vi måste 

helt enkelt släppa tanken att beräkna den exakta sannolikhetsfördelningen 

och istället söka en approximativ lösning. För att få en idé om en sådan 

studerar vi de stapeldiagram som dessa sannolikhetsfördelningar ger. Sannolikhetsfördelningarna 

för sammanlagt antal bilar i en, två samt tre familjer 

åskådliggörs nedan. 

Sannolikhet 

0 

En familj 

1 

Antal bilar 

2 

Sannolikhet 

0 

Två familjer 

1 2 

Antal bilar 

3 

4 

Sannolikhet 

0 

1 

Tre familjer 

Vi tycker oss skönja en viss symmetri i det högra diagrammet och då vi 

efter stor möda lyckas få fram exakta sannolikhetsfördelningar för sammanlagt 

antal bilar i fem respektive tio familjer besannas våra förhoppningar i de 

associerade stapeldiagrammen nedan 

Sannolikhet 

0 

1 

2 

Fem familjer 

3 

4 

5 

Antal bilar 

6 

7 

8 

9 

10 

Sannolikhet 

Tio familjer 

2 

3 

Antal bilar 

0 1 2 3 4 5 6 7 8 9 1011121314151617181920 

Antal bilar 

Sannolikhetsfördelningenförsammanlagtantalbilarverkarblimerochmer 

normalfördelningslik ju fler familjer vi har med och därför borde normalfördelningen 

kunna användas för att approximera den sökta sannolikhetsfördelningen. 

Vi återkommer med beräkningar angående dessa parkeringsplatser. ¤ 

103 

4 

5 

6

Vad är det som gör att normalapproximation fungerar i den här situationen? 

3.4.2 Oberoende och likafördelade slumpvariabler (o.l.f.s.v.) 

Utifrån ovanstående exempel uppstår två frågor vars svar kommer att lösa 

många problem som uppstår vid praktiska sannolikhetsberäkningar. 

1. I vilka situationer kan vi använda normalfördelningen som approximativ 

sannolikhetsfördelning? 

2. Hur finner vi i en specifik situation den normalfördelning som skall 

användas för approximationen? 

Det faktum som gör det möjligt att använda normalfördelningen i exemplen 

ovan är att vi där summerar resultaten av ett stort antal likadana 

slumpförsök. Vi hade fått ett liknande resultat om vi istället för summan 

hade beräknat medelvärdet av slumpvariablerna, eftersom medelvärdet endast 

är en enkel linjärfunktion av summan 

X = X1 + X2 + ···+ Xn 

n 

P 

X 

= 

n 

dvs en förflyttning och sammanpressning av sannolikhetsfördelningen för 

P X. Att det är ett stort antal likadana slumpförsök uttrycks mer sannolikhetsmässigt 

som att slumpvariablerna X1,X2,...,Xn är oberoende och 

likafördelade slumpvariabler, eller förkortat o.l.f.s.v. 12 .Attdomäroberoende 

innebär att resultatet i ett slumpförsök inte påverkar resultatet i något av de 

andra slumpförsöken, dvs antal bilar i en familj som flyttarinpåverkarinte 

antal bilar hos någon av de andra inflyttande familjerna. Att slumpvariablerna 

är likafördelade innebär att sannolikhetsfördelningen är exakt densamma 

vid varje slumpförsök, dvs vi gör exakt samma sannolikhetsbedömning 

angående antal bilar för samtliga inflyttande familjer. Vi formulerar något 

diffust följande delresultat. 

Summan (eller medelvärdet) av ett stort antal oberoende och 

likafördelade slumpvariabler är approximativt normalfördelad. Approximationen 

blir bättre ju fler av dessa slumpvariabler som ingår. 

12 I engelsk/amerikansk litteratur används terminologin independent and identically distributed 

random variables, eller förkortat i.i.d.r.v. 

104

Nästa fråga att besvara är således vilken normalfördelning vi skall använda 

för att approximera summan (eller medelvärdet). Normalfördelningen 

bestäms av sina båda parametrar, μ och σ, vilket innebär att vi finner den 

sökta normalfördelningen genom att finna medelvärde och standardavvikelse 

för den aktuella summan (eller medelvärdet). 

3.4.3 Väntevärden för summor och medelvärden av o.l.f.s.v. 

Vi antar nu att n oberoende och likafördelade slumpvariabler skall summeras. 

Att dom är likafördelade innebär att dom alla följer en och samma sannolikhetsfördelning 

vilket i sin tur innebär att alla har samma medelvärde och 

samma standardavvikelse. Vi antar att dessa gemensamma parametrar är μ 

och σ. Det gäller att 

³X ´ 

E X = E (X1 + X2 + ···+ Xn) = 

= E (X1)+E (X2)+···+ E (Xn) = 

= μ + μ + ···+ μ = n · μ 

och att 

³X ´ 

Var X 

= Var (X1 + X2 + ···+ Xn) = 

= Var (X1)+Var (X2)+···+ Var (Xn) = 

= σ 2 + σ 2 + ···+ σ 2 = n · σ 2 

vilket därmed innebär att summans standardavvikelse blir 

r ³X ´ 

Var X = √ n · σ2 = √ n · σ 

För att beräkna motsvarande parametrar för medelvärdet använder vi de 

resultat vi fann i ekvation (3) i avsnitt 2.3 (se sid 47). Det följer att 

E ¡ X ¢ µP 

X 

= E = 

n 

1 

³X ´ 

· E X = 

n n · μ 

= μ 

n 

och 

Var ¡ X ¢ µP 

X 

= Var = 

n 

1 

³X ´ 

· Var X = 

n2 n · σ2 

n2 σ2 

= 

n 

och således följer att medelvärdets standardavvikelse blir 

q 

Var ¡ X ¢ r 

σ2 = 

n = σ √ 

n 

vilka alla är resultat vi skall använda oss mycket av i fortsättningen. 

105

Exempel 71 Vid tillverkning av byggelement varierar dessas längder slumpmässigt 

och kan ses som utfall av o.l.f.s.v. med medelvärde μ =2meter och 

standardavvikelse σ =0.005 meter (eller 5 mm). Vid ett tillfälle vill man ha 

tio element som skall placeras intill varandra till en sammanlagd längd av 20 

meter. Man väljer mellan följande två metoder. 

1. Välj slumpmässigt ut ett element och slipa därefter ytterligare nio element 

till att ha exakt samma längd som det första elementet. 

2. Välj slumpmässigt ut tio element. 

Vilken av dessa båda metoder kommer i genomsnitt att ge det bästa resultatet, 

i den mening att det hamnar nära 20 meter? 

1. Här är det enbart längden av det första elementet som är en slumpvariabel, 

X, och den sammanlagda längden Y ges av 

Y =10· X 

Räknereglerna för väntevärden av linjärfunktioner (se ekvation (3) på 

sidan 47) geratt 

E (Y ) = E (10 · X) =10· E (X) =10· 2=20 

Var (Y ) = Var (10 · X) =10 2 · Var (X) =10 2 · 0.005 2 =0.0025 

2. Här utgör längden av var och en av byggelementen slumpvariabler 

X1,X2,...,X10 och eftersom dom är o.l.f.s.v. följer att 

E (Y ) = E (X1 + X2 + ···+ X10) =10· 2=20 

Var (Y ) = Var (X1 + X2 + ···+ X10) =10· 0.005 2 =0.00025 

Vi finner således att båda metoderna i genomsnitt kommer att ge korrekt 

sammanlagd längd på de tio byggelementen. Dock gäller att variansen för den 

första metoden blir tio gånger större än vad den blir med den andra metoden. 

För att med stor sannolikhet hamna nära 20 meter bör man således välja den 

andra metoden. ¤ 

Vad är anledningen till den stora skillnaden mellan de båda metoderna 

i exemplet ovan. Slumpen medför att längden av ett byggelement inte blir 

exakt två meter. Blir elementet kortare än två meter kommer i den första 

metoden samtliga tio element att bli kortare än två meter vilket medför att 

den sammanlagda längden antagligen hamnar relativt långt från 20 meter. 

106

Det slumpmässiga felet ackumuleras. I den andra metoden kommer troligtvis 

vissa element att bli kortare än två meter och vissa element bli längre än två 

meter vilket medför att dessa fel i viss utsträckning tar ut varandra. Detta 

är ett mycket viktigt resultat som framträder t.ex. i standardavvikelsen för 

medelvärdet X. Väljer vi slumpmässigt en individ kommer vi i genomsnitt att 

hamna i populationsmedelvärdet μ. Pga att det förekommer en viss spridning 

i populationen kommer dock den valde individens värde att avvika från detta 

värde med i genomsnitt σ. Väljervislumpmässigtutn individer kommer 

deras medelvärde i genomsnitt att hamna i populationsmedelvärdet μ. Dock 

kommer några av observationerna att hamna över μ och några att hamna 

under μ vilket medför att något större avstickare från detta värde i högre grad 

elimineras och att medelvärdet därmed i regel hamnar närmare μ än vad en 

enskild observation gör. Detta faktum återspeglar sig i att standardavvikelsen 

för medelvärdet X är σ/ √ n. 

3.4.4 Centrala gränsvärdessatsen 

Vi är nu redo att sammanfatta våra upptäckter från de senaste avsnitten i 

det viktigaste resultatet i hela sannolikhetsteorin. 

Resultat 2 (Centrala gränsvärdessatsen) Låt X1,X2,...,Xn vara ett stort 

antal oberoende och likafördelade slumpvariabler som alla har medelvärde μ 

och standardavvikelse σ. Dågällerattsumman 

X X = X1 + X2 + ···+ Xn 

approximativt är normalfördelad N (n · μ, √ n · σ). Vidare gäller att även medelvärdet 

P 

X 

X = 

n = X1 + X2 + ···+ Xn 

n 

³ 

approximativt är normalfördelat N μ, σ ´ 

√ 

n . ¥ 

Om bara slumpvariablerna är oberoende och följer samma sannolikhetsfördelning 

spelar det således ingen roll vilken sannolikhetsfördelning dom följer. 

Är dom bara tillräckligt många kommer summan (och medelvärdet) av 

dom ändå att vara approximativt normalfördelad. Inte nog med att det inte 

spelar någon roll vilken sannolikhetsfördelning dom följer, vi har dessutom 

inget behov av att känna dess utseende helt och fullt. Den enda information 

vi behöver om denna sannolikhetsfördelning är dess medelvärde μ och dess 

standardavvikelse σ. 

107

Vad menas då med tillräckligt många slumpvariabler? Centrala gränsvärdessatsen 

är en process som successivt gör att sannolikhetsfördelningen för summan 

(eller medelvärdet) blir normalfördelningslik. Då normalfördelningen är 

helt symmetrisk är det inte överraskande att denna process går snabbare om 

den ursprungliga sannolikhetsfördelningen själv är symmetrisk. Är den ursprungliga 

fördelningen själv normalfördelad räcker det förstås med en enda 

observation medan det för svårt asymmetriska fördelningar kan krävas hundratals 

observationer innan tillräckligt symmetri uppnås. Problemet är att vi 

ofta inte vet hur den ursprungliga fördelningen ser ut och då är det svårt att 

bedöma hur många observationer som krävs. Av erfarenhet har man funnit 

att för de flesta ursprungsfördelningar är 30 observationer (eller fler) tillräckligt 

för att summans (och medelvärdets) sannolikhetsfördelning skall kunna 

approximeras med normalfördelningen. 

Vi är nu redo att ta oss an det exempel vi lämnat ofullständigt löst i 

avsnitt 3.4.1 

Exempel 72 Antag att vi i Exempel 70 vill bestämma sannolikheten att det 

är tillräckligt med 100 parkeringsplatser. Eftersom vi studerar slumpvariabeln 

Y = Det sammanlagda antalet bilar i hundra familjer 

kan vår sökta sannolikhet uttryckas i termer av Y som 

Pr (Y ≤ 100) 

Vi söker således sannolikheter associerade med slumpvariabeln 

Y = X1 + X2 + ···+ X100 

där X1,X2,...,X100 är o.l.f.s.v.. Eftersom vi har fler än 30 sådana slumpvariabler 

är villkoren för normalapproximation uppfyllda och vi behöver enbart 

ta reda på medelvärde och standardavvikelse för ursprungsfördelningen. 

Denna sannolikhetsfördelning ges av 

och det följer därför att 

och eftersom 

x 0 1 2 

p (x) 0.3 0.5 0.2 

μ = E (X) =0· 0.3+1· 0.5+2· 0.2 =0.9 

E ¡ X 2¢ =0 2 · 0.3+1 2 · 0.5+2 2 · 0.2 =1.3 

108

följer att 

Var (X) =1.3 − 0.9 2 =0.49 

och således att 

σ = p Var (X) = √ 0.49 = 0.7 

Denna familjetyp har alltså i genomsnitt 0.9 bilar med en standardavvikelse 

på 0.7 bilar. Centrala gränsvärdessatsen ger därför att Y approximativt är 

³ 

N 100 · 0.9, √ ´ 

100 · 0.7 = N (90, 7) 

Innan vi beräknar sannolikheten konstaterar vi att Y är en diskret slumpvariabel 

varför normalapproximationen blir bättre om vi använder kontinu- 

itetskorrektion. Vi får att 

Pr (Y ≤ 100) 

| {z } 

Y är diskret 

µ 

Y − 90 

≈ Pr (Y ≤ 100.5) =Pr 

| {z } 7 

Y är normal 

= Pr(Z≤1.5) = 0.9332 

≤ 

 

100.5 − 90 

= 

7 

dvs det är ungefär 93% chans att 100 parkeringsplatser kommer att räcka. ¤ 

Vi fortsätter med ytterligare två exempel. 

Exempel 73 Antag att vi sätter vår dator till att lösa femtio uppgifter (av 

samma typ) innan vi går på vår entimmes lunchrast. Antag att det för datorn 

i genomsnitt tar en minut att lösa denna typ av uppgift. Dock tar det 

inte alltid exakt samma tid utan vi har dessutom en standardavvikelse på en 

minut. Bestäm sannolikheten att datorn är färdig när vi kommer tillbaks från 

lunchrasten. Eftersom 

Y = Sammanlagd datortid för att lösa 50 uppgifter 

följer att den sökta sannolikheten kan uttryckas i termer av Y via 

Pr (Y ≤ 60) 

Vi söker således sannolikheter associerade med slumpvariabeln 

Y = X1 + X2 + ···+ X50 

där X1,X2,...,X50 är o.l.f.s.v.. Eftersom vi har fler än 30 sådana slumpvariabler 

är villkoren för normalapproximation uppfyllda. Vi har dessutom 

fått information om att det för X-variablerna gäller 

μ = σ =1 

109

Centrala gränsvärdessatsen ger sedan att sannolikhetsfördelningen för Y approximativt 

är ³ 

N 50 · 1, √ ´ 

50 · 1 = N (50, 7.07) 

Vi finner därmed att 

Pr (Y ≤ 60) ≈ Pr 

µ Y − 50 

7.07 

 

60 − 50 

≤ =Pr(Z≤1.414) = 0.9213 

7.07 

där vi interpolerat i Tabell 3a. I det här exemplet går det att på teoretisk väg 

finna den verkliga sannolikhetfördelningen för Y som ger den sökta sannolikheten 

är 

Pr (Y ≤ 60) = 0.9156 

vilket innebär att approximationen är fullt acceptabel. ¤ 

Exempel 74 För en viss lärare tar det i genomsnitt 20 minuter att rätta en 

skrivning i statistik. Nu är det dock inte så att alla skrivningar tar lika lång 

tid utan det föreligger en relativt stor spridning vilket framgår av att standardavvikelsen 

är 12 minuter. På söndagsförmiddagen klockan 10.00 sätter 

sig läraren med de sista 36 skrivningarna. Bestäm sannolikheten att samtliga 

skrivningar är rättade innan sporten börjar 20.30. Låter vi X1,X2,...,X36 

representera den tid det tar att rätta var och en av skrivningarna följer att 

Y = Total rättningstid = 

= X1 + X2 + ···+ X36 

Förutsätter vi nu (något tveksamt) att rättningstiden för en skrivning inte 

påverkar rättningstiden för en annan följer att X1,X2,...,X36 är o.l.f.s.v. 

och vi kan använda normalapproximation för att bestämma sannolikhetsfördelningen 

för Y . Eftersom det för ursprungsfördelningen gäller att 

μ = 20 

σ = 12 

följer att sannolikhetsfördelningen för Y kan approximeras med 

³ 

N 36 · 20, √ ´ 

36 · 12 = N (720, 72) 

Den tid läraren har på sig innan sporten börjar är 10.5 timmar eller 630 

minuer varför sannolikheten ges av 

µ 

Y − 720 630 − 720 

Pr (Y ≤ 630) ≈ Pr ≤ =Pr(Z≤−1.25) = 

72 72 

= Pr(Z≥1.25) = 1 − Pr (Z

3.4.5 Hur fungerar normalapproximation av binomialfördelningen? 

Vi såg i avsnitt 3.3 att normalfördelningen i vissa situationer kan användas för 

att approximera binomiala sannolikheter. Detta är en direkt följd av Centrala 

gränsvärdessatsen. Vi vet att om vi med återläggning drar n bollar ur en urna 

där andelen vita bollar är π och betraktar slumpvariabeln 

Y = Antal vita bollar i urvalet 

kommer Y att vara binomialfördelad Bi(n, π). Vi upprepar alltså exakt samma 

slumpförsök n gånger och låter vi X1,X2,...,Xn representera antalet vita 

bollar i var och en av dragningarna kommer 

Y = X1 + X2 + ···+ Xn 

dvs en summa av n o.l.f.s.v. som alla är Bi(1,π) (eller sk. Bernoullifördelade, 

Be(π)). Vi såg i avsnitt 2.4 att det för dessa slumpvariabler gäller att 

μ = π 

σ = p π · (1 − π) 

vilket om n är tillräckligt stort medför att sannolikhetsfördelningen för Y 

approximativt är ³ 

N n · π, p ´ 

n · π · (1 − π) 

som även konstaterades i avsnitt 3.3. Centrala gränsvärdessatsen arbetar 

olika snabbt beroende på ursprungsfördelningens form och eftersom denna 

symmetri för binomialfördelningen bestäms av parametern π använder vi för 

binomialfördelningen ett speciellt mått på vad som skall menas med att n är 

tillräckligt stort. Då π är nära 0.5 är fördelningen som mest symmetrisk och 

då räcker det med runt 20 dragningar. Skulle dock π vara nära 0 eller 1 är 

fördelningen svårt asymmetrisk och det kan krävas hundratals observationer. 

För att normalapproximation skall få användas bör det gälla att 

n · π · (1 − π) > 5 

I dessa situationer är man ofta intresserade av den närbesläktade slumpvariabeln 

p = Andelen individer i urvalet med den aktuella egenskapen = Y 

n 

111

och utifrån våra kunskaper om egenskaper hos linjärfunktioner av slumpvariabler 

följer att 

µ 

Y 

E (p) = E = 

n 

1 

E (Y )=nπ = π 

n n 

µ 

Y 

Var (p) = Var = 

n 

1 

(1 − π) 

Var (Y )=nπ 

n2 n2 = π (1 − π) 

n 

Vidare vet vi att varje linjärfunktion av normalfördelade slumpvariabler själv 

är normalfördelad varför det följer att p approximativt är 

Ã r ! 

π (1 − π) 

N π, 

n 

3.4.6 Normalapproximation av Poissonfördelningen 

Det visar sig att även Poissonfördelningen kan skrivas som en summa av 

o.l.f.s.v.. Betraktar vi en process där händelser inträffar med intensiteten μ 

gäller att 

Y = Antal händelser på ett enhetsintervall 

är Po(μ). Ett enhetsintervall kan dock delas upp i mindre intervall och om 

vi låter X1,X2,...,Xn representera antal händelser på vart och ett av dessa 

intervall kommer dessa, enligt resonemang i slutet av avsnitt 2.5.1, att vara 

o.l.f.s.v. som alla är Po ¡ ¢ μ 

. Eftersom 

n 

Y = X1 + X2 + ···+ Xn 

ger därför Centrala gränsvärdessatsen att normalapproximation kan användas 

om n är tillräckligt stort. Här måste vi dock vara försiktiga eftersom ju 

större vi väljer n ju mindre kommer μ 

att bli, vilket medför att den ursprungs- 

n 

fördelning, Po ¡ ¢ μ 

, som Centrala gränsvärdessatsen har att arbeta med blir 

n 

mer asymmetrisk. Det hjälper således inte att välja n stort utan den enda 

möjligheten är att intensiteten μ är tillräckligt stor. Om så är fallet kan vi 

välja n stort samtidigt som att ursprungsfördelningen Po ¡ ¢ μ 

är tillräckligt 

n 

symmetrisk. Erfarenheten har visat att om μ>5 blir normalapproximationen 

acceptabel. Ju större μ är ju bättre blir approximationen. I avsnitt 2.5.3 

fann vi att 

E (Y )=Var (Y )=μ 

varför vi för Po(μ) kan använda N ¡ μ, √ μ ¢ som approximativ sannolikhetsfördelning. 

112

Exempel 75 Vi återgår nu till att studera problemet i Exempel 73 med att 

bestämma sannolikheten att datorn är färdig med sina 50 uppgifter då vi 

återkommer till arbetet efter lunchrasten. Eftersom det handlar om väntetider 

kan vi förutsätta att 

är Po(1). Låter vi nu 

X = Antal utförda uppgifter under en minut 

Y = Antal utförda uppgifter på en timme 

följer enligt resonemang i slutet av avsnitt 2.5.1 att Y är Po(60). Normalapproximation 

är tillåten och den aktuella normalfördelningen ges av 

³ 

N 60, √ ´ 

60 = N (60, 7.746) 

Vi söker sannolikheten 

Pr (Y ≥ 50) 

och eftersom Poissonfördelningen är diskret använder vi kontinuitetskorrektion 

för att förbättra approximationen. Vi får 

Pr (Y ≥ 50) 

| {z } 

≈ 

µ 

Y − 60 49.5 − 60 

Pr (Y ≥ 49.5) =Pr ≥ = 

| {z } 7.746 7.746 

Y är poisson 

Y är normal 

= Pr(Z≥−1.356) = Pr (Z ≤ 1.356) = 0.9124 

där vi använt interpolation i Tabell 3a. Här kan vi med rätt hjälpmedel finna 

den exakta sannolikheten med Po(60) som ges av 

Pr (Y ≥ 50) = 0.9156 

som överensstämmer med den exakta beräkning som presenterades i Exempel 

73. ¤ 

3.4.7 Approximationsmöjligheter 

Som avslutning på detta viktiga avsnitt om Centrala gränsvärdessatsen presenterar 

vi en sammanfattning av de vanligaste approximationsmöjligheterna 

i sannolikhetsläran. 

113



Approximationsmöjligheter 

n>10 

π5 N( μ, μ) 

Uppgift 45 I en hiss står angivet “Högst 10 personer eller 800 kg”. Antag 

att det för typiska hissresenärer gäller att vikten är normalfördelad med 

medelvikten 75 kg och standardavvikelsen 12 kg. 

a. Bestäm sannolikheten att en personmässigt fylld hiss inte klarar det andra 

villkoret. Vi förutsätter att det inte finns något viktmässigt beroende 

mellan hissresenärerna. 

b. Hur mycket måste man förbättra hissen (höja viktgränsen till) för att 

en personmässigt fylld hiss med 99%-sannolikhet klarar viktgränsen. 

Uppgift 46 Vid en godisfabrik packas “200g-påsar” med storsäljaren “chokladdoppade 

sockerbomber” i lådor om 100 påsar i varje. Det har visat sig att 

påsarna i genomsnitt endast väger 198g med en standardavvikelse på 12g. 

a. Bestäm sannolikheten att innehållet i en låda väger mer än 20kg. 

b. Enligt nya EU-regler måste innehållet i åtminstone 1/3 av lådorna väga 

det dom utsäger sig att göra, vilket i det här fallet är 20kg. Vad måste 

man ställa om ifyllningsanordningen för godispåsarna till för att uppfylla 

detta krav? Vi förutsätter att standardavvikelsen för innehållet i 

påsarna förblir oförändrad. 

114

Uppgift 47 Innan du går på din entimmes lunchrast sätter du din dator till 

att lösa 40 matematiska problem. Du vet att datorn i genomsnitt löser denna 

typ av problem på 1.4 minuter med en standardavvikelse på 0.4 minuter. När 

datorn har löst en uppgift startar den omedelbart med nästa. 

a. Bestäm sannolikheten att datorn är färdig när du återvänder från lunchrasten. 

b. Hur lång lunchrast måste du ta om du vill att datorn med 99% sannolikhet 

skall vara färdig när du kommer tillbaka? 

Uppgift 48 Antal fel som uppstår i en viss maskin under en arbetstimme 

kan ses som en stokastisk variabel X med sannolikhetsfunktion 

⎧ 

⎨ 0.3 , x =0 

p (x) = 0.6 

⎩ 

0.1 

, 

, 

x =1 

x =2 

a. Bestäm medelvärde och varians för X. 

b. Bestäm approximativt sannolikheten att det under en arbetsvecka (dvs 

40 arbetstimmar) uppstår högst 30 fel i maskinen. Ange även de antaganden 

du gör för att beräkna sannolikheten. 

Uppgift 49 I ett visst tärningsspel skall man ta sig 100 steg (eller längre). 

Bestäm approximativt sannolikheten att det räcker med 30 kast för att komma 

imål. 

3.5 Normalfördelade populationer 

Som avslutning på sannolikhetsläran och som övergång till inferensläran några 

ord om populationer och dess fördelningar. Då man pratar om en population 

tänker man instinktivt på en population av människor, som t.ex. 

den svenska väljarkåren eller patienterna i en hälsoundersökning. Så behöver 

alls inte vara fallet. Andra tänkbara populationer är “Volvo 740”,“Konservburkar”, 

“Lottokombinationer” etc. Vidare gäller att den sannolikhetsfördelning 

man associerar med en population beror på vilken variabel man 

studerar. Det finns variabler som för en mänsklig population ger upphov 

till normalfördelningen (eller åtminstone ungefär). Intelligenskvoten “IQ” är 

en variabel som brukar betraktas som (approximativt) normalfördelad med 

parametrar μ = 100 och σ =15. Den genomsnittlige medborgaren har alltså 

en IQ på 100. Dock har inte alla en IQ på 100 utan standardavvikelsen 15 

115

anger den genomsnittliga avvikelsen från medelvärdet. I och med att vi anger 

att IQ är normalfördelad har vi dessutom bestämt formen på denna spridning 

i populationen. Då man arbetar med normalfördelningen är det dock oftast 

inte den “vanliga” (eller ursprungliga) populationen som syftas på. För de 

flesta variabler är populationen i sig inte normalfördelad, och några exempel 

på sådana fördelningar vi studerat här är 

Den svenska väljarkåren har följande fördelning 

Andel av väljarkåren med avseende på variabeln "Moderat?" 

Moderat 

Ej moderat 

Sannolikhet 

En viss familjetyp har följande fördelning 

med avseende på variabeln "Antal bilar" 

0 1 2 

Antal bilar 


Den tid det tar en dator att lösa en 

viss typ av uppgift har följande 

sannolikhetsfördelning. 

0 1 2 3 4 5 6 

vilka alla är långt ifrån att vara normalfördelade. Normalfördelningens roll 

kommer i och med Centrala gränsvärdessatsen istället då vi har tillgång till 

ett stort antal observationer från denna grundfördelning pga av att både summan 

och medelvärdet av observationerna då är approximativt normalfördelade. 

I statistiken cirkulerar mycket kring informationen i stickprov och då 

stickprov ofta kan ses som ett stort antal observationer från en och samma 

fördelning följer att det är här normalfördelningen kommer in i bilden. Vi 

skall se att det för kvantitativa variabler är stickprovsmedelvärdet x som 

är av intresse. För att på bästa sätt kunna använda den information x innehåller 

måste vi känna dom sannolikhetsegenskaper X har innan stickprovet 

är taget. Nu råkar vi veta att om stickprovet är stort är stickprovsmedelvärdet 

X approximativt normalfördelat, dvs 

µ 

X är approximativt N μ, σ 

√ 

n 

Återgår vi till figuren över den tid det tar för datorn att lösa uppgifter och 

för denna istället studerar stickprovsmedelvärdets fördelning får vi för några 

stickprovsstorlekar. 

116 

Tid (min)

Stickprovsmedelvärdet sannolikhetsfördelning 


n=10 

n=5 

Tid (minuter) 

Fortsätter vi att studera stickprovsmedelvärdets sannolikhetsfördelning för 

ytterligare några stickprovsstorlekar, där vi dessutom markerat populationsmedelvärdet 

μ, får vi följande diagram 


n=2 

Stickprovsmedelvärdets sannolikhetsfördelning 

n=40 

n=20 

n=10 

μ 

Tid (minuter) 

och vi ser (åtminstone) två intressanta egenheter i diagrammen. 

• Den normalfördelning som skall användas för stickprovsmedelvärdet 

skall alltid centreras i populationsmedelvärdet medan dess form beror 

på stickprovsstorleken. Större stickprov ger lägre standardavvikelse för 

stickprovsmedelvärdet. 

• Normalfördelningen används som en approximation av den verkliga 

sannolikhetsfördelningen och vi ser att den symmetriska formen blir 

mer påtaglig ju större stickprovet är. Vi drar därför slutsatsen att approximationen 

blir bättre ju större storlek vi väljer på stickprovet. 

Vi ser därmed två fördelar med att ta stora stickprov. Dels blir sannolikhetsapproximationen 

pålitligare och dels kommer stickprovsmedelvärdet 

med större sannolikhet att hamna i närheten av populationsmedelvärdet. 

Således gäller att den population vi vanligtvis förknippar med normalfördelningen 

består av “Tänkbara stickprovsmedelvärden för stickprovsstorleken 

117

n”. Antag att vi studerar en population och där är intresserade av en variabel 

med populationsmedelvärde μ och populationsstandardavvikelse σ. Antag 

vidare att vi har tillgång till alla tänkbara stickprov av storlek n och för 

var och en av dessa beräknar medelvärdet x. Då har vi ett datamaterial för 

en population där individerna består av stickprovsmedelvärden. För denna 

population gäller att populationsmedelvärdet är μ och populationsstandardavvikelsen 

är σ √ n . Detta resultat hade dock varit relativt ointressant om inte 

Centrala gränsvärdessatsen funnits. För om stickprovet är tillräckligt stort 

gäller ju dessutom att själva formen, eller fördelningen, för denna population 

är mycket lik en normalfördelning. 

118

A Formelförklaringar 

A.1 Beräkningsformel för variansen 

Vi förklarar här beräkningsformeln (2) för variansen som angavs i avsnitt 2.2. 

Vi börjar med att skriva variansen som en summa och utveckla kvadraten 

genom kvadratkomplettering. 

Var (X) = X (x − μ) 2 · p (x) = X ¡ x 2 − 2xμ + μ 2 ¢ · p (x) = 

Nu kan detta uttryck delas upp i tre summor och eftersom populationsmedelvärdet 

μ är en konstant kan det flyttas utanför summationen. 

X x 2 p (x) − 2μ X xp (x)+μ 2 X p (x) = 

Den vänstra termen anger det förväntade värdet av X2 ,dvsE (X2 ),och 

uttrycket i den mittersta summan är inget annat än E (X) =μ. Den sista 

summan adderar samtliga sannolikheter varför det måste gälla att P p (x) = 

1. Vifårsåledesatt 

Var (X) = X x 2 p (x) − 2μ X xp (x)+μ 2 X p (x) = 

= E ¡ X 2¢ − 2μ 2 + μ 2 = E ¡ X 2¢ − μ 2 

vilket också var påståendet. 

A.2 Väntevärden av linjärfunktioner 

E (a + b · X) = X (a + b · x) · p (x) =a X p (x)+b X x · p (x) = 

= a + b · E (X) =a + b · μ 

Var (a + b · X) = X [a + b · x − (a + b · μ)] 2 · p (x) = 

= X [b · (x − μ)] 2 · p (x) = 

= b 2 X (x − μ) 2 · p (x) =b 2 · Var (X) =b 2 · σ 2 

B Diskreta sannolikhetsfördelningar 

B.1 Binomialfördelningen 

Vi ger här ett matematiskt bevis för väntevärde och varians för binomialfördelningen. 

I bevisen använder vi ett välkänt knep för väntevärdesberäkningar. 

119

Oftakanmanstuvaomtermernaochflytta några utanför summatecknet så 

att det som blir kvar är sannolikheter. Summerar man därtill över samtliga 

värden måste ju summan bli 1. 

E (X) = 

nX 

µ 

n 

x π 

x 

x=0 

x (1 − π) n−x nX n! 

= x · 

x!(n − x)! 

x=0 

πx (1 − π) n−x = 

= 

nX n! 

(x − 1)! (n − x)! 

x=1 

πx (1 − π) n−x = 

= 

nX (n − 1)! 

nπ 

(x − 1)! (n − x)! 

x=1 

πx−1 (1 − π) n−x = 

= 

nX 

µ 

n − 1 

nπ 

π 

x − 1 

x=1 

x−1 (1 − π) n−x = 

= 

Xn−1 

µ 

n − 1 

nπ 

π 

x 

x (1 − π) n−1−x = nπ 

x=0 

eftersom termerna i summan är sannolikheter för Bi(n − 1,π) och därför 

måste summera till 1. Detta knep använder vi oss också av då variansen skall 

bestämmas. Först konstaterar vi att 

vilket betyder att 

E [X (X − 1)] = E ¡ X 2 − X ¢ = E ¡ X 2¢ − E (X) 

Var (X) = E ¡ X 2¢ − [E (X)] 2 = E ¡ X 2¢ − E (X)+E (X) − [E (X)] 2 = 

= E [X (X − 1)] + EX − [E (X)] 2 

och eftersom E (X) redan är bestämd räcker det att finna 

E [X (X − 1)] = 

nX 

µ 

n 

x (x − 1) π 

x 

x=0 

x (1 − π) n−x = 

= 

nX n! 

(x − 2)! (n − x)! 

x=2 

πx (1 − π) n−x = 

= 

n (n − 1) π 2 

nX 

µ 

n − 2 

π 

x − 2 

x=2 

x−2 (1 − π) n−x = 

= 

n (n − 1) π 2 

Xn−2 

µ 

n − 2 

π 

x 

x (1 − π) n−2−x = n (n − 1) π 2 

x=0 

120

där summan blir 1 eftersom det är en summering av alla sannolikheter för 

Bi(n − 2,π). Vifårdåatt 

Var (X) =n (n − 1) π 2 + nπ − n 2 π 2 = nπ − nπ 2 = nπ (1 − π) 

B.2 Hypergeometrisk fördelning 

Vi ger här ett matematiskt bevis för väntevärde och varians för hypergeometrisk 

fördelning. I bevisen använder vi samma knep för väntevärdesberäkningar 

som användes för binomialfördelningen i Avsnitt B.1 ovan. 

E (X) = 

nX 

x · 

x=0 

= n 

N 

· Nπ 

¡ ¢¡ ¢ 

Nπ N−Nπ 

nX 

¡ ¢¡ ¢ 

Nπ−1 N−Nπ 

x n−x 

x−1 n−x 

¡ ¢ = Nπ ¡ ¢ = 

N 

N 

n 

x=1 n 

nX 

¡ ¢¡ ¢ ¡ ¢¡ Nπ−1 N−Nπ Xn−1 


x−1 n−x 

x n−1−x 

¡ ¢ = nπ ¡ N−1 

N−1 

x=1 n−1 

x=0 n−1 

¢ 

¢ = nπ 

eftersom termerna i summan är sannolikheter för Hyp(n − 1,π,N − 1) och 

därför måste summera till 1. Detta knep använder vi oss också av då variansen 

skall bestämmas. 

E [X (X − 1)] = 

nX 

x (x − 1) · 

x=0 

= Nπ(Nπ − 1) 

= n (n − 1) 

= n (n − 1) π (Nπ − 1) 

= n (n − 1) π (Nπ − 1) 

· Nπ(Nπ − 1) 

N (N − 1) 

N − 1 

N − 1 

¡ ¢¡ ¢ 

Nπ N−Nπ 

x n−x 

¡ ¢ N = 

n 

nX 

¡ ¢¡ ¢ 


x−2 n−x 

¡ ¢ = 

N 

x=2 n 

nX 

¡ ¢¡ Nπ−2 N−Nπ 

x−2 n−x 

¡ N−2 

x=2 n−2 

¡ ¢¡ ¢ 

Xn−2 


x n−2−x 

¡ ¢ = 

N−2 

x=0 n−2 

121 

¢ 

¢ =

eftersom termerna i summan är sannolikheter för Hyp(n − 2,π,N − 2) och 

därför måste summera till 1.Vi får då att 

Var (X) = 

n (n − 1) π (Nπ − 1) 

+ nπ − n 

N − 1 

2 π 2 = 

= 

µ 

(n − 1) (Nπ − 1) 

nπ 

+1− nπ = 

N − 1 

= 

1 

nπ [(n − 1) (Nπ − 1) + N − 1 − nπ (N − 1)] = ···= 

N − 1 

= 

N − n 

nπ (1 − π) 

N − 1 

B.3 Poissonfördelningen 

B.3.1 Sannolikhetsfunktionen 

Det spelar således ingen roll hur korta delintervall vi än väljer, sannolikheten 

ovan kommer ändå bara att vara en approximation. Dock gäller att denna 

approximation blir bättre ju kortare intervall vi väljer, dvs ju större vi låter 

n vara. Exakt sannolikhetsfördelning kan därför fås genom att bestämma 

gränsvärdet för sannolikhetsfördelningen då n →∞,dvs 

µ 

n 

³μ ´ x ³ 

pX (x) = lim 

1 − 

n→∞ x n 

μ 

´ n−x 

n 

För att finna detta gränsvärde stuvar vi om lite i uttrycket och får istället 

μ 

lim 

n→∞ 

x n (n − 1) ···(n − x +1) 

· 

x! nx ³ 

· 1 − μ 

´ n ³ 

1 − 

n 

μ 

´ −x 

n 

Räknereglerna för hur man bestämmer gränsvärden ger att vi kan studera 

termvis. μx och x! påverkas inte i gränsvärdet och eftersom μ 

→ 0 då n →∞ 

n 

kommer ³ 

1 − μ 

´ −x 

→ (1 − 0) 

n 

−x =1. 

Sedan använder vi det välkända matematiska faktum att 

³ 

lim 1+ 

n→∞ 

x 

´ n 

= e 

n 

x 

vilket alltså betyder att ¡ 1 − μ¢ 

n −μ → e . Slutligen studerar vi 

n 

n (n − 1) ···(n − x +1) 

lim 

n→∞ nx n − 1) (n − x +1) 

= lim ·(n ·· · ·· =1·1 ···1=1 

n→∞ n n 

n 

Följaktligen får vi att sannolikhetsfördelningen blir 

som angavs i texten. 

pX (x) = μx e −μ 

x! 

122 

x =0, 1, 2,...

B.3.2 Väntevärde och varians 

Vi är nu intresserade av sammanfattande mått på Poissonfördelningen. För 

dessa väntevärdesberäkningar använder vi samma knep som vid motsvarande 

beräkningar för binomial- och hypergeometrisk fördelning i Avsnitt B.1 och 

B.2 ovan. 

Eftersom 

E (X) = 

E [X (X − 1)] = 

följer att 

∞X 

x=0 

∞X 

x=0 

x · μx e −μ 

x! = 

∞X 

x=1 

x (x − 1) · μx e −μ 

x! = 

μ x e −μ 

(x − 1)! 

∞X 

x=2 

= μ 

∞X 

x=1 

μ x e −μ 

(x − 2)! 

Var (X) =μ 2 + μ − μ 2 = μ 

μ x−1 e −μ 

(x − 1)! 

= μ2 

∞X 

x=2 

= μ 

μ x−2 e −μ 

(x − 2)! 

= μ2 

För Poissonfördelningen gäller således att väntevärde och varians samma. De 

sammanfaller båda med intensitetsfaktorn μ. 

123

C Svar till övningsuppgifterna 

Här följer svar till dom övvningsuppgifter som presenteras i kompendiet. För 

övriga uppgifter finns svar i läroboken Statistisk dataanalys. 

9. a) 7!, b) 6!, c) 2*6!, d) 2*5!, e) 6! 

10. 0.424 

15. a) 0.0594, b) 0.1098, c) 0.541 

16. a) 0.9495, b) 0.1538 

19. a) 0.488 respektive 0.51, b) 0.749 

22. E(X)=1/6, Var(X)=5/36 

28. X är Hyp(5,0.4,140), men approx Bi(5,0.4). Pr(X>=3)=0.3174. 

29. a) 0.9502, b) 0.2381, c) 0.0009 

30. a) X är Bi(300,0.002), b) 0.9966 

31. a) X är Bi(10000,(1/6)^5), b) 0.0431 

32. i) 0.3413, ii) 0.1359, iii) 0.8186, iv) 0.1587 

33. i) z=1.96, ii) z=-0.44 

34. i) 0.0124, ii) 0.7357 

35.a)8,b)14.12 

36. 43.26, 56.74 

42. a) 0.6826, b) 0.6554 (interpolering: 0.657) (exakt Bi: 0.6619) 

43. a) 796.5g, b) X är Bi(200,0.01), c) 0.1429 (exakt: 0.1420) 

45. a) 0.0934, b) 838.3 kg 

46. a) 0.0475, b) 199.5 g 

47. a) 0.9429, b) 61.9 min (dvs ca 62 min) 

48. a) E(X)=0.8, Var(X)=0.36, b) 0.3464 (interpolation) 

49. 0.7224 

124

Sannolikhetslära – en introduktion

Create successful ePaper yourself

Delete template?

Save as template?