Innehåll 1 Sannolikhetsteori - Matematikcentrum
Innehåll 1 Sannolikhetsteori - Matematikcentrum
Innehåll 1 Sannolikhetsteori - Matematikcentrum
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK<br />
ÖVNINGSUPPGIFTER<br />
MATEMATISK STATISTIK AK FÖR M, FMS 035, VT-11<br />
<strong>Innehåll</strong><br />
1 <strong>Sannolikhetsteori</strong> 1<br />
2 Inferensteori 11<br />
3 Svar 20<br />
4 Fullständiga lösningar till ∗-märkta uppgifter 23<br />
1 <strong>Sannolikhetsteori</strong><br />
1. De möjliga sättningarna för de tre brostöden till en bro, som visas i figuren, är enligt följande<br />
brostöd A: 0 tum, 1 tum, 2 tum<br />
brostöd B: 0 tum, 2 tum<br />
brostöd C: 0 tum, 1 tum, 2 tum<br />
(a) Beskriv utfallsrummet som representerar alla möjliga sättningar hos de tre brostöden, t.ex.<br />
(1, 0, 2) betyder att A sätter sig 1 tum, B sätter sig 0 tum och C sätter sig 2 tum.<br />
(b) Låt E vara händelsen att man på minst ett ställe får 2 tum i sättningsskillnad mellan intilliggande<br />
stöd. Bestäm utfallen hos händelse E.<br />
2. A cylindrical tank is used to store water for a town (see figure).<br />
The available supply is not completely predictable. In<br />
any one day, the inflow is equally likely to fill 6, 7, or 8 feet<br />
of the tank. The demand for water is also variable, and may<br />
(with equal probabilities) require an amount equivalent to<br />
5, 6, or 7 feet of water in the tank.<br />
(a) What are the possible combinations of inflow and outflow in a day<br />
(b) Assuming that the water level in the tank is 7 feet at the start of a day, what are the possible<br />
water levels in the tank at the end of the day What is the probability that there will be at least<br />
9 feet of water remaining in the tank at the end of the day<br />
3. En ubåt avfyrar två torpeder mot ett mål. Varje torped för sig träffar med sannolikheten 0.7 och<br />
sannolikheten att båda gör det är 0.64.<br />
(a) Träffar torpederna oberoende av varandra<br />
(b) Beräkna sannolikheten för att en men inte två torpeder träffar.<br />
(c) Beräkna sannolikheten att minst en träffar.<br />
4. (a) En villaägare köpte en stor påse blandade lökar i höstas. Enligt förpackningen är en tredjedel<br />
påskliljor och resten tulpaner. Alla påskliljorna och en fjärdedel av tulpanerna är gula, resten<br />
är röda. Villaägaren grävde ner en slumpmässigt vald lök utanför köksfönstret. Hur stor är<br />
sannolikheten att blomman är gul
1 SANNOLIKHETSTEORI<br />
(b) För händelserna A och B gäller att P(A) = 1/3, P(B | A) = 1 och P(B | A ∗ ) = 1/4. Beräkna<br />
P(B).<br />
(c) Övertyga dig själv om att (a) och (b) egentligen är exakt samma uppgift. [Båda gavs samtidigt<br />
på samma tentamen för V och L (och M) 2002-03-08. Det var inte alla skrivande som hade<br />
samma svar på båda.]<br />
(d) (Forts. på (a)) Hur stor är den betingade sannolikheten att blomman är en påsklilja, givet att<br />
den är gul<br />
5. [∗] Vid en bestämd plats kommer kraftiga vindar från någon riktning mellan rakt östligt (=0 ◦ )<br />
och rakt nordligt (=90 ◦ ). Alla icke-negativa värden på vindhastigheten V är möjliga.<br />
(a) Beskriv utfallsrummet för vindhastigheten och vindriktningen, t.ex. genom att rita en figur.<br />
(b) Låt<br />
A<br />
B<br />
= {V > 20 km/h}<br />
= {12 km/h < V ≤ 30 km/h}<br />
C = {≤30 ◦ }<br />
Identifiera händelserna A, B, C och A ∗ i utfallsrummet beskrivet i (a).<br />
(c) Identifiera följande händelser<br />
D<br />
E<br />
F<br />
= A∩C<br />
= A∪B<br />
= A∩B∩C<br />
(d)<br />
Är händelserna D och E oförenliga Hur är det med händelserna A och C<br />
6. [∗] En låda innehåller två mynt, ett vanligt med krona på ena sidan och klave på den andra samt<br />
ett med krona på båda sidorna. Ett mynt väljs slumpvis och kastas varvid krona kommer upp. Med<br />
vilken sannolikhet är den andra sidan på myntet också krona<br />
7. [∗] Before the design of a tunnel through a rocky<br />
region, geological exploration was conducted to investigate<br />
the joints and the potential slip surface that<br />
exists in the rock strata (see figure). For economic reasons,<br />
only portions of the strata are explored. In addition<br />
the measurement recorded by the instruments<br />
are not perfectly reliable. Thus the geologist can only<br />
conclude that the condition of the rock may be either<br />
highly fissured (H), medium fissured (M), or slightly<br />
fissured (L) with relative likelihoods of 1:1:8.<br />
Based on this information, the engineer designs the tunnel and estimate that if the rock condition is<br />
L, the reliability of the proposed design is 99.9 %. However, if it turns out that the rock condition<br />
is M, the probability of failure will be doubled; similarly, if the rock condition is H, the probability<br />
of failure will be 10 times that for condition L.<br />
(a) What is the reliability of the proposed tunnel design<br />
(b) A more reliable device is subsequently used to improve the prediction of rock condition. Its<br />
results indicate that a highly fissured condition for the rock around the tunnel is practically<br />
impossible, but it cannot give better information on the relative likelihood between rock conditions<br />
M and L. In light of this new information, what would be the revised reliability of the<br />
proposed tunnel design<br />
2
1 SANNOLIKHETSTEORI<br />
(c) If the tunnel collapsed, what should be the updated probabilities of M and L<br />
8. [∗] The preliminary design of a bridge spanning a river<br />
consists of four girders and three piers as shown<br />
in the figure. From consideration of the loading and<br />
resisting capacities of each structural element the failure<br />
probability for each girder is 10 −5 and for each<br />
pier 10 −6 .<br />
Assume that failures of the girders and piers are statistically independent. Determine:<br />
(a) The probability of failure in the girder(s).<br />
(b) The probability of failure in the pier(s).<br />
(c) The probability of failure of the bridge system. It seems as if the answers are the sum of the<br />
probabilities. Why does it seem so Recalculate with other much higher probabilities.<br />
9. [∗] Transportmöjligheter skall upprättas mellan<br />
två städer som ligger 200 mil ifrån varandra. Alternativen<br />
är motorväg (H), järnväg (R), eller<br />
flyg (A); det sista betyder anläggandet av flygplatser<br />
i de bägge städerna, se figur. På grund<br />
av de relativa förtjänsterna och kostnaderna, är<br />
chansen att planeringskommitén kommer att<br />
besluta sig for R, H, eller A är 1 till 2 till 3.<br />
Bara ett av dessa tre alternativ kan byggas.<br />
Emellertid, om kommittén beslutar att bygga en järnväg R, så är sannolikheten 50 % för att denna<br />
kommer att vara klar inom ett år; om de beslutar sig för en motorväg H, är motsvarande sannolikhet<br />
75 %; och om de beslutar sig för flyg, är sannolikheten 90 % att flygplatserna kommer att vara klara<br />
inom ett år.<br />
(a) Vad är sannolikheten att de två städerna kommer att ha någon förbindelse inom ett år<br />
(b) Om en förbindelse är upprättad inom ett år mellan de två städerna, vad är då sannolikheten<br />
att denna är en flygkommunikation A<br />
(c) Om kommittén beslutar till fördel för landkommunikation, vad är sannolikheten att det slutliga<br />
beslutet kommer att vara en motorväg H<br />
10. [∗] At a quarry, the time required to load crushed rocks onto a truck is equally likely to be either<br />
2 or 3 minutes (see figure). Also the number of trucks in a queue waiting to be loaded at any time<br />
varies considerably, as reflected in the following set of 30 observations taken at random. The time<br />
No of trucks No of Relative<br />
in queue observations frequency<br />
0 6 0.2<br />
1 3 0.1<br />
2 9 0.3<br />
3 9 0.3<br />
4 3 0.1<br />
5 0 0.0<br />
Total: 30<br />
required to load a truck is statistically independent of the queue size. Use the relative frequencies as<br />
estimates of the corresponding probabilities.<br />
3
1 SANNOLIKHETSTEORI<br />
(a) If there are two trucks in the queue when a truck arrives at the quarry, what is the probability<br />
that its “waiting time” will be less than 5 minutes<br />
(b) Before arriving at the quarry (and thus not knowing the size of the queue), what is the probability<br />
that the waiting time of a particular truck will be less than 5 minutes<br />
11. [∗] Two cables are used to lift a load W (see figure). However,<br />
normally only cable A will be carrying the load; cable B is slightly<br />
longer than A, so normally it does not participate in carrying the<br />
load. But if cable A breaks, then B will have to carry the full load,<br />
until A is replaced. The probability that A will break is 0.02. The<br />
probability that B will fail if it has to carry the load by itself is<br />
0.30, but is 0 as long as A carries the load.<br />
(a) What is the probability that both cables will fail<br />
(b) If the load remains lifted, what is the probability that none of the cables have failed<br />
12. [∗] Ett nytt test för att avslöja en allvarlig sjukdom har tagits fram. Det ger positivt utslag med<br />
sannolikheten 0.99 om personen har sjukdomen fast med sannolikheten 0.05 även om personen<br />
inte har den. Det anses vara känt att 1 % av patientmaterialet har sjukdomen.<br />
(a) Beräkna den intressanta sannolikheten att en patient har sjukdomen om testet är positivt.<br />
(b) Vilken egenskap hos testet ska man försöka ändra för att få en högre sannolikhet i (a) Ska<br />
man försöka få 0.05 att bli 0 eller 0.99 att bli 1<br />
(c) Antag att testet istället används i ett land där 50 % har sjukdomen. Vilket svar ger då frågan i<br />
(a)<br />
13. A contractor is submitting bids to 3 jobs, A, B and C. The probabilities that he will win the jobs<br />
are P(A) = 0.5, P(B) = 0.8 and P(C) = 0.2, respectively. Assume events A, B, C are statistically<br />
independent. Let X be the total number of jobs the contractor will win.<br />
(a) What are the possible values of X Compute and plot the probability mass function (sannolikhetsfunktionen)<br />
of the random variable X .<br />
(b) Determine P(X ≤ 2).<br />
(c) Determine P(0 < X ≤ 2).<br />
14. Ett lokaltåg skall ankomma till en station kl 13.03 men brukar vara något försenat. Förseningen<br />
(enhet: minut) varierar så att den kan betraktas som en s.v. X , som har täthetsfunktionen f X (x) =<br />
1/5 om 0 ≤ x ≤ 5. Hur stor är sannolikheten att tåget kommer senare än 13.06 Hur stor är<br />
sannolikheten att det kommer mellan 13.04 och 13.05<br />
15. The settlement of a structure has the probability density<br />
function (täthetsfunktion) shown in the figure.<br />
(a) What is the probability that the settlement is less<br />
than 2 cm<br />
(b) What is the probability that the settlement is<br />
between 2 and 4 cm<br />
(c) If the settlement is observed to be more than<br />
2 cm, what is the probability that it will be less<br />
than 4 cm<br />
f (x) X<br />
h<br />
0 2 4 6<br />
x, settlement in cm<br />
4
1 SANNOLIKHETSTEORI<br />
16. Antalet förbipasserande bilar under tidsintervallet [0, t] är poissonfördelat med väntevärdeÐt.<br />
(a) Beräkna sannolikheten att inga bilar passerar under tidsintervallet [0, t].<br />
(b) Beräkna sannolikheten att minst en bil passerar under tidsintervallet [0, t].<br />
(c) Låt T vara den slumpmässiga tid det tar tills första bilen dyker upp. Bestäm täthetsfunktionen<br />
f T (t) för T .<br />
(d) Vilken slags fördelning har T <br />
17. Karakteristisk bärförmåga definieras som 5 %-kvantilen av bärförmågan, dvs sannolikheten att den<br />
verkliga bärförmågan understiger den karakteristiska är 0.95. Bestäm den karakteristiska bärförmågan<br />
om bärförmågan är Weibullfördelad med fördelningsfunktionen<br />
F X (x) = P(X ≤ x) =<br />
{ 0 för x ≤ 0,<br />
1−e −(x/10)5 för x > 0.<br />
18. [∗] Suppose the duration (in months) of a construction job can be modeled as a continuous random<br />
variable T whose cumulative distribution function (fördelningsfunktion) is given by<br />
⎧<br />
⎨ t 2 − 2t + 1, 1 ≤ t ≤ 2<br />
F T (t) = P(T ≤ t) = 0, t < 1<br />
⎩<br />
1, t > 2<br />
(a) Determine the corresponding density function (täthetsfunktion) f T (t).<br />
(b) Compute P(T > 1.5).<br />
19. [∗] In order to repair the cracks that may exist in a 10-feet weld, a nondestructive testing device<br />
(NDT) is first used to detect the location of cracks. Because cracks may exist in various shapes and<br />
sizes, the probability that a crack will be detected by the NDT device is only 0.8. Assume that the<br />
events of each crack being detected are statistically independent and that the NDT does not give<br />
false alarms.<br />
(a) If there are two cracks in the weld, what is the<br />
probability that they would not be detected<br />
(b) The actual number of cracks N in the weld<br />
is not known. However, its PMF (sannolikhetsfunktion)<br />
is given as in the figure. What is the<br />
probability that the NDT device will detect 0<br />
cracks in this weld<br />
(c) If the device detects 0 cracks in the weld, what is<br />
the probability that the weld is flawless (that is,<br />
no crack at all)<br />
p N<br />
(n)<br />
0.3<br />
0.6<br />
0.1<br />
0 1 2<br />
n, number of cracks<br />
20. [∗] Two reservoirs are located upstream of a town; the water is held back by two dams A and B.<br />
Dam B is 40 m high. (See figure) During a strong-motion earthquake, dam A will suffer damage<br />
and water will flow downstream into the lower reservoir. Depending on the amount of water in the<br />
upper reservoir when such an earthquake occurs, the lower reservoir water may or may not overflow<br />
dam B. Suppose that the water level at reservoir B, during an earthquake, is either 25 m or 35 m,<br />
as shown in the bottom left figure; and the increase in the elevation of water level in B caused by<br />
the additional water from reservoir A is a continuous random variable with the probability density<br />
function (täthetsfunktion) given in the bottom right figure.<br />
5
1 SANNOLIKHETSTEORI<br />
p Y<br />
(y)<br />
f X<br />
(x)<br />
0.7<br />
a<br />
0.3<br />
0 25 35<br />
y (m)<br />
0 5 10 15 20<br />
x, Increase in Water Level in Reservoir B<br />
(a) Determine the value of a in the bottom right figure.<br />
(b) What is the probability of overflow at B during a strong-motion earthquake<br />
(c) If there were no overflow at B during an earthquake, what is the probability that the original<br />
water level in reservoir B is 25 m<br />
21. [∗] The bearing capacity of the soil under a column-footing foundation is known to vary between 6<br />
and 15 kN/m 2 . Its probability density (täthetsfunktion) within this range is given as<br />
{ 1<br />
f X (x) = 2.7 (1− x ), 6 ≤ x ≤ 15<br />
15<br />
0, elsewhere<br />
If the column is designed to carry a load of 7.5 kN/m 2 , what is the probability of failure of the<br />
foundation<br />
22. Den tid som en kraft belastar en viss konstruktion varierar<br />
på ett sätt som beskrivs av täthetsfunktionen i<br />
figuren.<br />
(a) Bestäm konstanterna a och b.<br />
f T<br />
(t)<br />
b<br />
a t 2<br />
(b) Beräkna väntevärde och median för belastningstiden<br />
T .<br />
(c) Beräkna sannolikheten att T är minst 6 sek, dvs<br />
P(T ≥ 6).<br />
0 12 16<br />
t, sec.<br />
23. The delay time of a construction project is described with a random variable X . Suppose that X is<br />
a discrete variate with probability mass function (sannolikhetsfunktionfunktion) given in the table.<br />
The penalty for late completion of the project depends on the number of day of delay; that is,<br />
penalty = g(x i ). The penalty function is also given in the table, in unit of $100, 000.<br />
PMF of X Penalty funktion<br />
x i p X (x i ) g(x i )<br />
(in days) ($100, 000)<br />
1 0.5 5<br />
2 0.3 6<br />
3 0.1 7<br />
4 0.1 7<br />
6
1 SANNOLIKHETSTEORI<br />
(a) Calculate the mean penalty for this project.<br />
(b) Calculate the standard deviation of the penalty.<br />
24. Låt X ha sannolikhetsfunktionen<br />
k 0 1 3 5<br />
p X (k) 0.1 0.2 0.3 0.4<br />
(a) Beräkna P(2 ≤ X ≤ 7).<br />
(b) Beräkna väntevärdet E(X ).<br />
(c) Beräkna variansen V(X ).<br />
(d) Beräkna standardavvikelsen D(X ).<br />
(e) Beräkna E(e X ).<br />
25. Låt X vara en stokastisk variabel med täthetsfunktion f X (x) = 2x för 0 ≤ x ≤ 1, och 0 för övrigt,<br />
och beräkna väntevärde, varians och täthetsfunktion för Y = (1−X ) 2 .<br />
26. Vid vätskekontrollen i Mångsbodarna dricker var och en av Vasaloppsåkare 0, 1 eller 2 muggar<br />
blåbärssoppa med sannolikheterna 0.3, 0.1 respektive 0.6, oberoende av de andra åkarna.<br />
27. [∗]<br />
(a) Beräkna väntevärde och varians för antalet muggar en slumpmässigt vald åkare dricker.<br />
(b) Beräkna sannolikheten att skidåkare A dricker färre muggar blåbärssoppa än skidåkare B.<br />
(c) Beräkna sannolikheten att skidåkare A och skidåkare B dricker precis lika många muggar<br />
blåbärssoppa.<br />
(d) Beräkna sannolikheten att skidåkare A och skidåkare B tillsammans dricker minst 2 muggar<br />
blåbärssoppa.<br />
(a) Surhetsgraden i ett vattendrag bestäms varje måndag med hjälp av en pH-meter. Därvid uppstår<br />
ett fel Y med väntevärdetoch standardavvikelsen×=0.05. Här börvara 0 men på<br />
grund av att kalibrering ej gjorts är detta systematiska fel 0.4. Beräkna väntevärde och standardavvikelse<br />
för mätresultatet om det rätta pH-värdet är 5.8.<br />
(b) Antag att vattnets sanna surhetsgrad varierar från måndag till måndag som en s.v. X med<br />
väntevärdet 5.8 och standardavvikelsen 0.5. Beräkna väntevärde och standardavvikelse för<br />
mätresultatet, Z, en godtycklig måndag.<br />
(c) Antag att man varje måndag tar ett vattenprov ur ån. På detta vattenprov gör man sedan<br />
tre mätningar Z 1 , Z 2 och Z 3 och bildar medelvärdet. Beräkna standardavvikelsen för detta<br />
medelvärde om de slumpmässiga felen vid de tre mätningarna är oberoende och X varierar<br />
från måndag till måndag som i (b).<br />
(d) Det finns tre källor till avvikelser från 5.8 hos värdet Z i (b). Vilka Vilken/vilka av dessa går<br />
att påverka genom den medelvärdesbildning som sker i (c)<br />
28. [∗] Antalet avåkningar under en snöstorm kan beskrivas av en Poissonprocess med intensitetÐ<br />
avåkningar per kilometer vägsträcka. Det innebär bland annat att antalet avåkningar, X t , på en t km<br />
lång sträcka är Po(Ðt)-fördelat. Man räknar antalet olyckor på tre olika vägsträckor som är 2, 3 resp.<br />
5 km långa och får alltså oberoende observationer av X 2 ∈ Po(2Ð), X 3 ∈ Po(3Ð) och X 5 ∈ Po(5Ð).<br />
Man vill uppskatta intensitetenÐoch väljer mellan två varianter. Antingen uppskattar man förstÐ<br />
på var och en av vägsträckorna och bildar sedan medelvärdet av de tre uppskattningarna (Y ). Eller<br />
så betraktar man de tre sträckorna som en lång sträcka och gör en gemensam uppskattning (Z).<br />
Uttryckt i formler blir det alltså<br />
Y = 1 3<br />
(<br />
X2<br />
2 + X 3<br />
3 + X 5<br />
5<br />
)<br />
och Z = X 2 + X 3 + X 5<br />
2+3+5 .<br />
7
1 SANNOLIKHETSTEORI<br />
(a) Beräkna väntevärdet av Y och av Z.<br />
(b) Beräkna variansen av Y och av Z. Vilken av de två varianterna verkar lämpligast<br />
(c) Under den senaste snöstormen fck man observationerna x 2 = 8, x 3 = 5 och x 5 = 14. Använd<br />
Ð∗ = Z för att konstruera ett approximativt 95 % konfidensintervall förÐ.<br />
29. Om årsnederbörden X i en stad är en normalfördelad variabel med ett väntevärde på 50 tum och en<br />
variationskoefficient på 0.2, beräkna följande:<br />
(a) standardavvikelsen för X ,<br />
(b) P(X < 30),<br />
(c) P(X > 60),<br />
(d) P(40 < X ≤ 55),<br />
(e) sannolikheten att X är inom 5 tum från medelårsnederbörden,<br />
(f) värdet x 0 sådant att sannolikheten av årsnederbörden överskrider x 0 är bara 1/4 av den att inte<br />
överskrida x 0 .<br />
30. The force in the cable of the truss shown in the figure,<br />
when subjected to a load W given by<br />
F ac =<br />
√<br />
h 2 + l 2<br />
W<br />
h<br />
(a) If the load W is a normal variate N(ÑW,×W ), determine the distribution of the force F ac .<br />
(b) IfÑW = 20 metric tons,×W = 5 metric tons, and h = 1 2l, what is the probability that the<br />
force F ac will exceed 30 tons<br />
31. [∗] A simple structure consisting of a cantilever beam<br />
AB and a cable BC is used to carry a load S (see figure).<br />
The magnitude of the load varies daily, and its<br />
monthly maximum has been observed to be Gaussian<br />
with a mean of 25 000 kg, and a coefficient of variation<br />
of 30 %.<br />
(a) If the cable BC and beam AB are designed to<br />
withstand a 10-month maximum load (that is, a<br />
maximum load with a return period of 10 months)<br />
with factors of safety of 1.25 and 1.40, respectively,<br />
what are the probabilities of failure of<br />
the cable and of the beam<br />
(c) Assuming statistical independence between the failures of the beam and cable, what is the<br />
probability of failure of the structure (that is, that it will be unable to carry the load)<br />
(d) If (instead of part (a)) the strength of the cable were random N(50 000 kg, 10 000 kg), what<br />
would be its failure probability under the load S<br />
8
1 SANNOLIKHETSTEORI<br />
32. [ ∗ ] The cantilever beam shown in the figure is subjected to a random concentrated load P and a<br />
random distributed load W . Assume<br />
P is N(5, 1), in kN<br />
W is N(1, 0.2), in kN/m<br />
(a) Determine the mean and variance of the applied bending moment M a = 50W+10P. Assume<br />
thatÖW,P = 0.5 (that is, the loads are correlated).<br />
(b) The resisting moment of the beam M r which is statistically independent of the applied moment<br />
M a , is also Gaussian N(200, 50) in kNm. Determine the probability of failure of the<br />
beam, P(M r < M a ) assuming that M a is Gaussian.<br />
33. [∗] The figure shows a schematic procedure of the treatment system for the waste from a factory before<br />
it is dumped into a nearby river. Here X denotes the concentration of a pollutant feeding into<br />
the treatment system, and Y denotes the concentration of the same pollutant leaving the system.<br />
Suppose that for a normal day, X has a log-normal distribution with median 4 mg/l and the coefficient<br />
of variation (COV, variationskoefficient) is 20 %. Because of the erratic nature of biological<br />
and chemical reactions, the efficiency of the treatment system is unpredictable. Hence the fraction<br />
of the influent pollutant remaining untreated, denoted by F, is also a random variable. Assume F is<br />
also a log-normal variate with a median of 0.15 and COV of 10 %. Assume X and F are statistically<br />
independent.<br />
(a) Determine the distribution of Y and the values of its parameters. Note that Y = F · X .<br />
(b) Suppose that the maximum concentration of the pollutant permitted to be dumped into the<br />
river is specified to be 1 mg/l. What is the probability that this specified standard will be<br />
exceeded on a normal day<br />
(c) On some working days, owing to heavy production in the factory, the influent X will have<br />
a median of 5 mg/l instead. Assume that the distribution of X is still log-normal with the<br />
same coefficient of variation and that the efficiency of the treatment system does not change<br />
statistically. Suppose that such a heavy work day happens only 10 % of the time. Then, on a<br />
given day selected at random, what is the probability that the specified standard of 1 mg/l for<br />
Y will be exceeded<br />
34. The maximum annual flood level of a river is denoted<br />
by H (in meters). Assume that the probability density<br />
of H is described by the triangular distribution shown<br />
in the figure.<br />
f H<br />
(h)<br />
(a) Determine the flood height h 20 which has a mean<br />
recurrence interval (return period) of 20 years.<br />
(P(H > h 20 ) = 1/20)<br />
5 6 7<br />
h, m<br />
(c) What is the probability that during the next 20 years the river height H will exceed h 20 at least<br />
once<br />
(d) What is the probability that during the next 5 years the value of h 20 will be exceeded exactly<br />
once<br />
(e) What is the probability that h 20 will be exceeded at most twice during the next 5 years<br />
9
1 SANNOLIKHETSTEORI<br />
35. (a) Översvämningar modelleras av en Poissonprocess. Om medelintensiteten för översvämningar<br />
för en region A är en gång per åtta år, bestäm sannolikheten för att det inte blir några<br />
översvämmningar under en tioårsperiod; en översvämmning under tioårsperioden; mer än<br />
tre översvämmningar under tioårsperioden.<br />
(b) En byggnad är placerad i området A. Sannolikheten att den kommer att vattenskadas, när en<br />
översvämning inträffar, är 0.05. Beräkna sannolikheten att byggnaden kommer att klara sig<br />
om översvämning ej inträffar; om en översvämning inträffar; om n översvämningar inträffar.<br />
Antag statistiskt oberoende mellan översvämningarna.<br />
(c) Beräkna sannolikheten att byggnaden kommer att klara sig från vattenskador över en 10-<br />
årsperiod.<br />
36. [∗] The following is a 20-year record of the annual maximum wind velocity V in town A (in<br />
kilometers per hour, kph).<br />
Year V (kph) Year V (kph)<br />
1950 78.2 1960 78.4<br />
1951 75.8 1961 76.4<br />
1952 81.8 1962 72.9<br />
1953 85.2 1963 76.0<br />
1954 75.9 1964 79.3<br />
1955 78.2 1965 77.4<br />
1956 72.3 1966 77.1<br />
1957 69.3 1967 80.8<br />
1958 76.1 1968 70.6<br />
1959 74.8 1969 73.5<br />
(a) Based on this record, estimate the probability that V will exceed 80 kph in any given year.<br />
(b) What is the probability that in the next 10 years there will be exactly 3 years with annual<br />
maximum wind velocity exceeding 80 kph<br />
(c) A temporary structure is designed to resist a maximum wind velocity of 80 kph. What is the<br />
probability that this wind velocity will be exceeded during the 3 year lifetime of the structure<br />
(d) How would the answer in part (c) change, if the design wind velocity is increased to 85 kph<br />
37. [∗] Den genomsnittliga livslängden per mil vägbeläggning,<br />
se figuen, beskrivs som en lognormalvariabel med<br />
en median på 3 år och variationskoefficient på 50 %.<br />
Livslängden anger den användbara tiden till dess reparationer<br />
fordras. Antag att livslängderna hos två olika<br />
vägavsnitt på vardera en mil är statistiskt oberoende.<br />
Density<br />
Lognormal<br />
µ=3<br />
δ=50%<br />
0 2 4 6 8<br />
Life per mil, years<br />
(a) Vad är sannolikheten att en vägsträcka på en mil kommer att behöva repareras inom ett år<br />
(b) Antag att dimensioneringstiden utgörs av 5 %-percentilslivslängden x 0.05 (dvs, vägens livslängd<br />
kommer att vara mindre än dimensioneringstiden med sannolikheten 5 %). Beräkna dimensioneringstiden.<br />
(c) Vad är sannolikheten att det inte kommer att behövas några reparationer inom det första året<br />
av en 4-mils sträcka av vägen<br />
(d) Vad är sannolikheten att 2 av de 4 milen kommer att behöva repareras inom det första året<br />
(e) Vad är sannolikheten för att reparation behövs av 4-milssträckan inom de första 3 åren<br />
10
2 INFERENSTEORI<br />
(f) Vad är sannolikheten att den första reparationen av 4-milssträckan kommer att inträffa inom<br />
2:a året (Notera att förhållandena vid 2:a året inte är oberoende av det 1:a året.)<br />
38. [∗] Traffic on a one-way street that leads to a toll bridge is to be studied. The volume of the traffic<br />
is found to be 120 vehicles per hour on the average and out of which 2/3 are passenger cars and<br />
1/3 are trucks. The toll at the bridge is $0.50 per car and $2 per truck. Assume that the arrivals of<br />
vehicles constitute a Poisson process.<br />
(a) What is the probability that in a period of 1 minute, more than 3 vehicles will arrive at the<br />
toll bridge<br />
(b) What is the expected total amount of toll collected at the bridge in a period of 3 hours<br />
2 Inferensteori<br />
39. Antag att maximala våghöjden (H) på ett visst ställe ett visst år kan anses vara Rayleighfördelad, dvs<br />
täthetsfunktionen ges av<br />
{ x<br />
f H (x) = a e−x2 /(2a)<br />
för x ≥ 0,<br />
0 för x < 0.<br />
där a är en okänd positiv parameter. Man har under 8 år observerat följande maximala våghöjder (i<br />
meter):<br />
2.5 2.9 1.8 0.9 1.7 2.1 2.2 2.8<br />
(a) Beräkna ML-skattningen av a under förutsättning att de åtta observationerna kan anses vara<br />
oberoende observationer av H.<br />
(b) Beräkna med hjälp av skattningen av a, en skattning av 1000-årsvågen, med vilket menas en<br />
våg som är så hög att den i genomsnitt bara inträffar en gång per 1000 år.<br />
40. (forts. på 11.24) Ange skattningens väntevärde och beräkna dess medelfel.<br />
41. Ett mycket stort parti av enheter har felkvoten p, där p är högst 0.04. Man vill ta ut n enheter<br />
slumpmässigt ur partiet och på grundval härav konstruera en skattning av p med en standardavvikelse<br />
på högst 0.02. Hur stort måste n vara<br />
42. Ett föremål består av två delar A och B som har vägts ett antal gånger varvid man fick resultaten:<br />
A 12.07 12.01 12.04<br />
B 18.34 18.36 18.35 18.32<br />
Vidare har hela föremålet vägts två gånger varvid man fick:<br />
A+B 30.35 30.39<br />
Vägningarna är behäftade med oberoende slumpmässiga fel från samma fördelning. Beräkna med<br />
minsta-kvadrat-metoden en skattning av vikten hos hela föremålet.<br />
43. In the measurement of daily dissolved oxygen (DO) concentrations in a stream, let p denote the<br />
probability that the DO-concentration will fall below the required standard on a single day. DOconcentration<br />
is measured daily until unsatisfactory stream quality is encountered, and the number<br />
of days in this sequence of measurement is recorded. Suppose 10 sequences have been observed and<br />
the length of each sequence is 2, 5, 6, 4, 6, 6, 8, 5, 10, 1 days. Determine the maximum likelihood<br />
estimator for p, and estimate p on the basis of the observed data.<br />
11
2 INFERENSTEORI<br />
44. [∗] The distribution of wave height has been suggested to follow a Rayleigh density function<br />
(täthetsfunktion),<br />
⎧<br />
⎪⎨<br />
h2 f H (h) =<br />
e− 1 2 (h/) 2 , h ≥ 0,<br />
⎪⎩<br />
0, h < 0.<br />
with parameter. Suppose the following measurements on wave heights were recorded: 1.5, 2.8, 2.5,<br />
3.2, 1.9, 4.1, 3.6, 2.6, 2.9, 2.3 m. Estimate the parameterby the method of maximum likelihood.<br />
45. [∗] De oberoende stokastiska variablerna X i och Y j har väntevärden E(X i ) = 2a respektive E(Y j ) = a<br />
och känd varians V(X i ) = V(Y j ) = 1. Man vill skatta a med hjälp av n x mätningar av X i och n y<br />
mätningar av Y j .<br />
(a) Visa att (den oviktade) minsta-kvadrat-skattningen, a ∗ av a ges av a ∗ = 2∑ n x<br />
i=1 x i + ∑ n y<br />
j=1 y j<br />
4n x + n y<br />
.<br />
(b) Beräkna väntevärde och varians för a ∗ och ange en approximativ fördelning för a ∗ , under<br />
förutsättning att man gör många mätningar av X i och Y j .<br />
(c) Man har gjort 150 mätningar av X i och fått¯x = 14.5. Man har också gjort 100 mätningar av<br />
Y j och fått ȳ = 6.4. Beräkna ett värde på a ∗ tillsammans med ett approximativt 95 % tvåsidigt<br />
konfidensintervall för a.<br />
46. Data på nederbördens intensitet (i tum) är samlat mellan åren 1918 och 1946 i ett flodområde,<br />
enligt följande:<br />
År intensitet År intensitet År intensitet År intensitet<br />
1918 43.30 1925 43.90 1932 50.37 1939 42.96<br />
1919 53.02 1926 46.77 1933 54.91 1940 55.77<br />
1920 63.52 1927 59.12 1934 51.20 1941 41.31<br />
1921 45.93 1928 54.49 1935 39.91 1942 58.83<br />
1922 48.26 1929 47.38 1936 53.29 1943 48.21<br />
1923 50.51 1930 40.78 1937 67.59 1944 44.67<br />
1924 49.57 1931 45.05 1938 58.71 1945 67.72<br />
1946 43.11<br />
(a) Beräkna punktskattningar för väntevärdetÑoch variansen×2 .<br />
(b) Beräkna ett 95 % konfidensintervall för väntevärdetÑ. Antag att årsnederbördens intensitet är<br />
normalfördelad, och×=8.<br />
47. The daily dissolved oxygen concentration (DO) for a location A downstream from an industrial<br />
plant has been recorded for 10 consecutive days.<br />
Day DO (mg/l)<br />
1 1.8<br />
2 2.0<br />
3 2.1<br />
4 1.7<br />
5 1.2<br />
6 2.3<br />
7 2.5<br />
8 2.9<br />
9 1.6<br />
10 2.2<br />
12
2 INFERENSTEORI<br />
(a) Assume that the daily DO-concentration has a normal distribution N(Ñ,×); estimate the<br />
values ofÑand×.<br />
(b) Determine the 95 % confidence interval for the true meanÑ.<br />
(c) Determine the 95 % lower confidence limit ofÑ.<br />
48. Consider the annual maximum wind velocity (V ) data are given in the following table.<br />
Year V (kph) Year V (kph)<br />
1950 78.2 1960 78.4<br />
1951 75.8 1961 76.4<br />
1952 81.8 1962 72.9<br />
1953 85.2 1963 76.0<br />
1954 75.9 1964 79.3<br />
1955 78.2 1965 77.4<br />
1956 72.3 1966 77.1<br />
1957 69.3 1967 80.8<br />
1958 76.1 1968 70.6<br />
1959 74.8 1969 73.5<br />
(a) Calculate the sample mean and sample variance of V .<br />
(b) Determine an approximate 99 % confidence interval for the mean velocity.<br />
49. Två maskiner A och B levererar under en viss dag enheter som har dimensionerna N(m 1 ,×) resp<br />
N(m 2 ,×), okända parametrar. Man vill jämföra medeldimensionerna m 1 och m 2 och samlar därför<br />
in följande material:<br />
A 12.37 12.32 12.41 12.34 12.23 12.36<br />
B 12.41 12.39 12.46 12.35 12.39 12.33<br />
Bestäm ett 95 % konfidensintervall för differensen m 2 − m 1 .<br />
50. [∗] En konstruktion är dimensionerad att vila på 100 stolpar. Nio provstolpar drevs ner vid slumpvis<br />
valda platser i marken till de knäcktes. Resultatet finns i följande tabell.<br />
Provstolpar Stolpkapacitet (ton)<br />
1 82<br />
2 75<br />
3 95<br />
4 90<br />
5 88<br />
6 92<br />
7 78<br />
8 85<br />
9 80<br />
(a) Beräkna medelvärdet och standardavvikelsen för de individuella stolparnas kapacitet.<br />
(b) Bestäm ett 98 % konfidensintervall för medelstolpskapaciteten. Antag×=6 är känd och att<br />
variationen i stolpkapaciteten är normalfördelad.<br />
(c) Beräkna ett 98 % konfidensintervall för medelstolpskapaciteten på grundval av okänd varians<br />
men med normalfördelad stolpkapacitet.<br />
13
2 INFERENSTEORI<br />
51. [∗] En fysiker har gjort fem mätningar för att bestämma en fysikalisk konstant m. Mätningarna<br />
kan anses vara observationer av en normalfördelad stokastisk variabel med väntevärde m och känd<br />
standardavvikelse. Hon fick ett 90 % konfidensintervall (7.02, 7.14), vilket hon tyckte var för brett<br />
och hade för låg konfidensgrad. Hur många fler mätningar behövs för att få ett konfidensintervall<br />
som har konfidensgrad<br />
(a) 90 % och som är hälften så brett<br />
(b) 95 % och som har ungefär samma bredd<br />
52. [∗] The distance between A and C is measured in 2 stages: namely, AB and BC as shown in the<br />
figure. Measurements on AB and BC are recorded as follows:<br />
AB: 100.5, 99.6, 100.1, 100.3, 99.5 m<br />
BC: 50.2, 49.8, 50.0 m<br />
A B C<br />
(a) Compute the sample mean and sample variance of the measured distances for AB.<br />
(b) Compute the standard error of the estimated distance of AB.<br />
(c) Establish an approximate 98 % confidence interval for the actual distance AB.<br />
(d) If the distance AC is given by the sum of the estimated distances AB and BC, that is AC = AB<br />
+ BC, what is the standard error of the estimated total distance between A and C<br />
(e) Establish an approximate 98 % confidence interval on the actual length AC.<br />
53. Assume hypothetically that the concentration of dissolved solids and the turbidity of a stream are<br />
measured simultaneously for five separate days, selected at random throughout a year. The data are<br />
as follows.<br />
Day Dissolved solids Turbidity<br />
(mg/l) (JTU)<br />
1 400 5<br />
2 550 30<br />
3 700 32<br />
4 800 58<br />
5 500 20<br />
Because turbidity is easier to measure, a regression equation may be used to predict the concentration<br />
of dissolved solids on the basis of known turbidity. Assume that the variance of dissolved solid<br />
concentration is constant with turbidity.<br />
(a) What are the values of the intercept and slope parameters (and) of the regression line<br />
(b) Estimate the standard deviation of dissolved solid concentration about the regression line.<br />
54. Antag att data på vattenkonsumtion per dag och per capita har insamlats för fyra städer och sammanställts<br />
i tabell enligt följande (se också figur)<br />
14
2 INFERENSTEORI<br />
x<br />
y<br />
Stad Befolkning Vattenkonsumtion<br />
(i 10 4 ) per capita<br />
(i 100 liter/dag)<br />
1 1.0 1.0<br />
2 4.0 1.3<br />
3 6.0 1.3<br />
4 9.0 1.4<br />
Vattenkonsumtion per capita<br />
y<br />
1.4<br />
1.3<br />
1.2<br />
1.1<br />
1<br />
0 5 10<br />
Befolkning / 10 4<br />
x<br />
(a) Om befolkningsstorleken ignoreras, vad blir då stickprovsvariansen s 2 y <br />
(b) Från observerade data tycks finnas en generell trend att vattenkonsumptionen per capita ökar<br />
med befolkningen i staden. Använd regressionsmodellen<br />
Y (x i ) =+x i +i<br />
däri ∈ N(0,×) och antas vara oberoende av varandra.<br />
i. Beräkna minsta-kvadrat-skattningarna avoch.<br />
ii. Uppskatta×.<br />
55. Sträckgränsen för betong kan mätas i ett splittertest i vilken en betongcylinder placeras i en testanordning<br />
där den utsätts för diametral kompression (ASTM C496-66). Kompression och sträckstyrka<br />
hos lättbetong och ordinär betong som funktion av ålder för en speciell blandning rapporteras av J.<br />
A. Hanson 1 :<br />
Lättbetong<br />
Betong<br />
Ålder Kompressions- Sträck- Kompressions- Sträck-<br />
(dagar) styrka gräns styrka gräns<br />
3 2620 276 2050 232<br />
7 3300 343 3250 282<br />
14 4320 407 3830 373<br />
28 5120 420 4560 336<br />
90 5850 458 5240 448<br />
180 6620 494 5390 454<br />
365 6840 513 5530 524<br />
2år 6760 492 5570 506<br />
(a) Gör en regressionsanalys av tillväxten av kompressionsstyrka med tiden. Använd en modell av<br />
formen: Styrka = a·tid b ·därär en lognormalfördelad stokastisk variabel.<br />
(b) Skatta standardavvikelsen hos kompressionsstyrkan som funktion av tiden.<br />
56. I en tillverkningsprocess vill man undersöka hur utbytet (y) påverkas av den tid (x) processen pågår.<br />
Resultat:<br />
1968<br />
x (tid (min)) 1 2 3 4 5 6 7 8 9 10 11 12<br />
y (utbyte) 58.1 59.7 61.9 61.0 60.5 60.3 59.0 54.7 49.0 44.9 37.3 29.3<br />
Man har ansatt en linjär regressionsmodell: y i =0 +1x i +i däri ∈ N(0,×). Parameterskattningarna<br />
har beräknats med hjälp av ett statistikprogram (STATA). Resultat:<br />
1 J. A. Hanson: Effects of Curing and Drying Environments on Splitting Tenside Strength of Concrete, ACI J., Table 3, July<br />
15
2 INFERENSTEORI<br />
--------------------------------------------------------------<br />
y | Coef. Std.Err. P>|t| [95% Conf. Interval]<br />
---------+----------------------------------------------------<br />
beta_0 | 69.25 3.67 0.000 61.07 77.43<br />
beta_1 | -2.50 XXXX 0.001 XXXX XXXX<br />
--------------------------------------------------------------<br />
Dessutom får vi att×∗ = 5.97 och kovariansmatrisen för parameterskattningarna<br />
) (<br />
Var((∗ 0 13.48 −1.62<br />
) = ∗<br />
1 −1.62 0.25<br />
)<br />
(a) Tyvärr var delar av utskriften oläslig (XXXX). Beräkna det saknade medelfelet (Std.Err.) för<br />
∗<br />
1 samt tillhörande 95 %-iga konfidensintervall för parametern1.<br />
(b) Gör ett 95 % konfidensintervall för medelutbytet då x = 4.<br />
57. [∗] Ett belastningstest har utförts på ett aluminiumprov. Den applicerade belastningen och motsvarande<br />
förlängning av prov vid olika etapper av testen är registrerat enligt följande.<br />
Belastning Förlängning<br />
(kN) (10 −3 tum)<br />
x<br />
y<br />
1 9<br />
2 20<br />
3 28<br />
4 41<br />
5 52<br />
6 63<br />
(a) Antag att belastningsförlängningsrelationen hos aluminium över den här räckan av last är<br />
linjär. Beräkna minstakvadratskattningarna av Youngmodulen för det här aluminiumprovet.<br />
Tvärsektionsytan hos provet är 0.1 tum 2 och längden är 10 tum. Youngmodulen ges av lutningen<br />
hos belastningsförlängningskurvan. (tum/kN).<br />
(b) Antag förutom en linjär relation mellan styrka och förlängning att ingen belastning skulle<br />
motsvarande ingen förlängning; dvs regressionslinjen som antas vara<br />
E(Y (x)) =x<br />
Vad blir minsta-kvadrat-uppskattningen av Youngmodulen i det här fallet<br />
58. Under perioden 1988–1997 hände det att det var minusgrader i Målilla under 187 av de 310 marsdagarna<br />
och 64 av de 310 majdagarna. Antag, lite orealistiskt, att det blir minusgrader olika dagar<br />
oberoende av varandra.<br />
(a) Beräkna ett tvåsidigt, approximativt 95 % konfidensintervall för skillnaden mellan sannolikheten<br />
att det blir minusgrader en slumpmässigt vald dag i mars jämfört med en dag i maj.<br />
(b) Beräkna ett tvåsidigt, approximativt 95 % konfidensintervall för den förväntade skillnaden i<br />
totala antalet dagar med minusgrader i mars och maj ett visst år.<br />
59. Vi vill uppskatta hur vanligt det är att det snöar i april i Målilla och konstaterar att under de 300<br />
aprildagarna under perioden 1988–1997 så snöade det under 71 dagar. Antag att olika dagar är<br />
oberoende av varandra.<br />
16
2 INFERENSTEORI<br />
(a) Beräkna ett approximativt 95 % konfidensintervall för sannolikheten att det snöar en slumpmässigt<br />
vald aprildag i Målilla.<br />
(b) Skatta sannolikheten att det inte snöar alls i april ett visst år och utnyttja intervallet i (a) till<br />
att göra ett 95 % tvåsidigt konfidensintervall för denna sannolikhet.<br />
60. För att undersöka om man kan modifiera tekniken att tillverka mineralull så att den blir behagligare<br />
att hanskas med (inte ”sticks”) låter man 16 försökspersoner i en blindprovning känna på två typer<br />
av ull, den ena tillverkad enligt gammal beprövad metod, den andra enligt en ny metod. Det visade<br />
sig att 12 personer föredrar den nya typen medan 4 föredrar den gamla. Sätt upp en lämplig statistisk<br />
modell och testa en hypotes som betyder att metoderna är likvärdiga, mot hypotesen att den nya<br />
metoden är bättre.<br />
61. Stickprov av mycket rent järn berett med två olika metoder A och B hade följande smältpunkter:<br />
A ( ◦ C) 1493 1519 1518 1517 1512 1514 1489 1508 1494<br />
B ( ◦ C) 1509 1494 1512 1483 1507 1491<br />
Formulera en statistisk modell baserad på normalfördelning och lika varians.<br />
(a) Testa hypotesen att de två metoderna ger samma medelsmältpunkter.<br />
(b) Konstruera ett konfidensintervall för skillnaden mellan de två medelsmältpunkterna. Konfidensgrad:<br />
95 %.<br />
62. Med avsikten att undersöka om gasskuren resp. maskinbearbetad fog påverkade slagseghetsegenskaperna<br />
i den värmepåverkande zonen hos svetsförband, tog man ut 10 par provplåtar av olika<br />
tjocklekar. För varje plåttjocklek tillverkades en gasskuren och en maskinbearbetad svetsfog.<br />
Slagseghetsprovstavar togs ur varje färdigsvetsat svetsprov. Följande värden erhölls för de 10 olika<br />
plåttjocklekarna.<br />
Plåttjocklek (kategori) 1 2 3 4 5 6 7 8 9 10<br />
Brottgräns:<br />
Gasskuren (MPa) 387 545 390 610 530 358 605 546 510 230<br />
Maskinbearbetad (MPa) 402 547 385 615 528 367 611 551 508 245<br />
Testa huruvida det föreligger någon skillnad mellan gasskuren och maskinbearbetad fog avseende<br />
slagseghet samt gör ett 95 % konfidensintervall för denna skillnad om sådan föreligger. Vilken typ<br />
av fog skulle du rekommendera Ange de antaganden som du gjort.<br />
63. (forts. på uppg. 62) I en tidigare analys av samma datamaterial glömde man bort (struntade i) att<br />
plåtarna hade olika tjocklek och betraktande alltså slagseghetsmätningarna på gasskuren respektive<br />
maskinbearbetade fogar som två helt oberoende stickprov med samma varians×2 men väntevärdena<br />
ÑGas respektiveÑMaskin.<br />
Testa, med denna mindre välbetänkta modell, huruvida det föreligger någon skillnad mellan gasskuren<br />
och maskinbearbetad fog avseende slagseghet. Vad är det som blir annorlunda nu<br />
64. Det stryker omkring mårror i Ensliga bergen. Mårror är kalla och ju ensammare en mårra känner sig<br />
desto snabbare sprider sig kölden ut från henne. Hemulen (som har tröttnat på att samla frimärken<br />
och nu samlar på mårror istället) misstänker att det finns ett samband mellan en mårras storlek (mätt<br />
i hennes bottenyta x m 2 ) och hur ensam hon känner sig (mätt i köldutbredningshastighet i marken<br />
y m 2 /h). Hemulen har samlat in följande material från några slumpmässigt valda mårror vid olika<br />
tillfällen:<br />
mårra (i) 1 2 3 4 5 6 7 8 9 10<br />
bottenyta (x i ) 2.7 2.0 2.7 2.4 2.3 1.7 1.6 1.9 2.0 2.5<br />
köldutbredningshastighet (y i ) 5.1 6.1 5.3 3.6 4.7 6.1 5.4 5.2 4.6 5.1<br />
17
2 INFERENSTEORI<br />
kldutbredningshastighet, y (m 2 /h)<br />
7<br />
6<br />
5<br />
4<br />
3<br />
1 1.5 2 2.5 3<br />
bottenyta, x (m 2 )<br />
Han har dessutom räknat ut<br />
∑ 10<br />
∑ 10<br />
∑ 10<br />
i=1 (x i −¯x) 2 = 1.416,<br />
i=1 (x i −¯x)(y i − ȳ) = −1.046,<br />
i=1 (y i − ȳ) 2 = 4.796.<br />
Testa, på något lämpligt sätt, om det finns ett signifikant linjärt<br />
samband mellan köldutbredning och storlek hos mårror. Ange<br />
tydligt modell, hypoteser och vald signifikansnivå.<br />
65. Vi vill undersöka om fluorhalten i vattenprov från en gårdbrunn understiger gränsvärdet 0.2 (ppm).<br />
Om flourhalten är för låg bör man nämligen, av tandhälsoskäl, tillsätta fluor till vattnet. LåtÑ(ppm)<br />
vara den verkliga fluorhalten i vattnet. Ange om följande påståenden är sanna eller falska. (Du får<br />
1 poäng för ett korrekt svar, 0 poäng om du inte ger något svar och −1 om du anger ett felaktigt<br />
svar. Totalt kan du dock få lägst 0 poäng på uppgiften.)<br />
(a) Nollhypotesen H 0 :Ñ=0.2 respektive mothypotesen H 1 :Ñ
2 INFERENSTEORI<br />
(b) Suppose further that good workmanship is defined as no more than 3 % of the welds contain<br />
flaws. If the risk of rejecting welds with good workmanship is limited to 10 % devise a sampling<br />
plan that will satisfy the producer’s and consumer’s risk requirements. Use any pertinent data<br />
of part (a) as necessary.<br />
(c) Consider a sampling plan that requires inspection of 25 welds and at least 24 welds must be<br />
flawless for acceptance. Those welds that are rejected are required to be repaired. Determine<br />
the AOQ curve and AOQL corresponding to this sampling plan.<br />
70. I en industri tillverkar man enheter som vid kontroll klassificeras som antingen korrekta eller defekta.<br />
Processen anses vara under kontroll om antalet defekta enheter är högst 20 %. Ett kontrolldiagram<br />
konstrueras nu genom att varje gång man kontrollerat 100 nya enheter ritar man in antalet defekta<br />
av dessa i diagrammet. Gör detta om antalet defekta enheter är<br />
12 25 10 32 30 15 14 20<br />
(a) Hur skall kontrollgränserna se ut om man förutsätter att enheter blir defekta oberoende av<br />
varandra med sannolikheten p<br />
(b) Förutsättningarna att enheterna blir defekta oberoende av varandra är inte alltid realistiska.<br />
Hur bör man göra istället<br />
71. [∗] En viss blåbärssoppstillverkare vill undersöka om vasaloppsåkare dricker mer soppa i år än<br />
normalt, på grund av det soliga vädret, genom att välja ut ett antal skidåkare slumpmässigt och<br />
mäta medelvärdet av deras soppkonsumtion. Antag att varje åkare dricker en slumpmässig, inte<br />
nödvändigtvis normalfördelad, mängd soppa med okänt väntevärdeÑdl och känd standardavvikelse<br />
×=20 dl. Normalt ärÑ=55 dl.<br />
(a) Sätt upp lämpliga hypoteser och konstruera ett test för att testa om medelkonsumtionen soppa<br />
är signifikant större i år än normalt, med approximativ signifikansnivå=0.05. Du får<br />
förutsätta att man kommer att behöva undersöka många åkare.<br />
(b) Hur många åkare måste man undersöka för att sannolikheten att upptäcka att medelkonsumtionen<br />
är större än normalt ska vara minst 80 % om medelkonsumtionen i verkligheten är 1 dl<br />
större än normalt<br />
(c) Medelkonsumtionen för dina undersökta skidåkare blev 60 dl. Kan man, med ditt test, påstå<br />
att medelkonsumtionen är större än normalt (Om du inte lyckats lösa uppgift (b) kan du själv<br />
välja något lämpligt antal åkare och räkna med det.)<br />
72. [∗] Filifjonkan oroar sig bl.a. för att mängden hallonsylt i hennes rulltårta skall vara för liten. För att<br />
vara helt perfekt skall mängden vara minst 1 tsk per skiva. Om den är mindre blir skivorna för torra<br />
och Filifjonkan får skämmas ögonen ur sig (anser hon).<br />
(a) Filifjonkan har skrapat ut hallonsylten ur tre oberoende rulltårtsskivor och fått att de innehöll<br />
0.96, 0.84 respektive 0.80 tsk hallonsylt. Vilka slutsatser ska hon dra om hon vill uttala sig<br />
med en signifikansnivå på 0.05 Använd ett lämpligt test och ange hypoteser och slutsatser.<br />
Man kan anta att mängden hallonsylt i en rulltårtsskiva är normalfördelad.<br />
(b) Gafsan påpekar det slösaktiga med att undersöka tre skivor och tycker det räcker med två.<br />
Filifjonkan oroar sig då för hur det kommer att påverka testets styrka. Hon antar, efter att noga<br />
ha studerat gamla mätningar, att standardavvikelsen för mängden hallonsylt i en rulltårtsskiva<br />
kan anses vara 0.04 tsk.<br />
Antag att Filifjonkan har som mål att med minst sannolikheten 0.90 upptäcka att hallonsyltmängden<br />
understiger 1 tsk då hon gör ett test på signifikansnivån 0.05. För vilka värden på<br />
den verkliga hallonsyltmängdenÑtsk är detta uppfyllt då man endast får undersöka två skivor<br />
19
3 SVAR<br />
3 Svar<br />
1. (a) (0,0,0), (0,0,1), (0,0,2), (0,2,0),<br />
(0,2,1), (0,2,2), (1,0,0), (1,0,1),<br />
(1,0,2), (1,2,0), (1,2,1), (1,2,2),<br />
(2,0,0), (2,0,1), (2,0,2), (2,2,0),<br />
(2,2,1), (2,2,2)<br />
(b) (0,0,2), (0,2,0), (0,2,1), (0,2,2),<br />
(1,0,2), (1,2,0), (2,0,0), (2,0,1),<br />
(2,0,2), (2,2,0)<br />
2. (a) (6,5), (6,6), (6,7), (7,5), (7,6), (7,7);<br />
(8,5), (8,6), (8,7).<br />
(b) 1/3<br />
3. (a) Nej<br />
(b) 0.12<br />
(c) 0.76<br />
4. (a) P(Gul) = 1/2<br />
(b) P(B) = 1/2<br />
(c) Sätt A = Påsklilja och B = Gul.<br />
(d) P(Påsklilja | Gul) = 2/3<br />
5. (a) –<br />
(b) –<br />
(c) –<br />
(d) D och E är ej oförenliga, A och C är ej<br />
oförenliga.<br />
6. 2/3. Ledning: det kan vara lämpligt att införa<br />
händelserna A: ”det valda myntet har krona<br />
på båda sidorna” samt B: ”krona kommer<br />
upp”.<br />
7. (a) 0.998<br />
(b) 0.9989<br />
(c) 0.2; 0.8<br />
8. (a) 4·10 −5<br />
(b) 3·10 −6<br />
(c) 4.30·10 −5<br />
9. (a) 0.783<br />
(b) 0.574<br />
(c) 2/3<br />
10. (a) 0.25<br />
(b) 0.375<br />
11. (a) 0.006<br />
(b) 0.986<br />
12. (a) 1/6<br />
(b) Det första alternativet<br />
(c) 0.952<br />
⎧<br />
0.08 för k = 0,<br />
⎪⎨<br />
0.42 för k = 1,<br />
13. (a) 0, 1, 2, 3; p X (k) =<br />
0.42 för k = 2, ⎪⎩<br />
0.08 för k = 3.<br />
(b) 0.92<br />
(c) 0.84<br />
14. 2/5 resp. 1/5<br />
15. (a) 1/4<br />
(b) 1/2<br />
(c) 2/3<br />
16. (a) e −Ðt<br />
(b) 1−e −Ðt<br />
(c) f T (t) =Ðe −Ðt . Ledning: P(T ≤ t) =<br />
P(minst en bil dyker upp i intervallet [0, t])<br />
(d) T är exponentialfördelad.<br />
17. x 0.05 = 10·(− ln 0.05) 1/5 ≈ 12.45<br />
18. (a) –<br />
(b) 0.75<br />
19. (a) 0.04<br />
(b) 0.424<br />
(c) 0.708<br />
20. (a) 0.08<br />
21. 0.306<br />
(b) 0.227<br />
(c) 0.845<br />
22. (a) a = 1/1152 resp. b = 1/8<br />
(b) E(T ) = 11.5 resp. ˜ÑT = 12<br />
(c) 0.9375<br />
23. (a) $570,000<br />
(b) $78,102<br />
24. (a) 0.7<br />
(b) 3.1<br />
(c) 12.9−3.1 2 = 3.29<br />
20
3 SVAR<br />
(d) √ 3.29 ≈ 1.814<br />
(e) 66.03<br />
25. E(Y ) = 1/6, V(Y ) = 7/180,<br />
f Y (y) = 1/ √ y− 1 för 0 ≤ y ≤ 1<br />
26. (a) E(X ) = 1.3; V(X ) = 0.81<br />
(b) P(X < Y ) =<br />
= 0.3·(0.1+ 0.6)+0.1·0.6 = 0.27<br />
(c) P(X = Y ) = 0.3 2 +0.1 2 +0.6 2 = 0.46<br />
(d) P(X + Y ≥ 2) =<br />
= 0.3·0.6+0.1·(0.1+0.6)+<br />
+ 0.6 = 0.85<br />
27. (a) 6.2, 0.05<br />
(b) 6.2, 0.5025<br />
(c) 0.501<br />
=Ð<br />
(d) Kalibreringsfelet, slumpmässiga variationen<br />
i surhet och det slumpmässiga<br />
mätfelet. Endast inverkan av det slumpmässiga<br />
mätfelet minskas i (c)<br />
28. (a) E(Y ) = E(Z)<br />
(b) V(Y ) = 31Ð/270; V(Z) =Ð/10.<br />
Varianten Z är bäst eftersom den varierar<br />
mindre.<br />
(c) (1.68, 3.72)<br />
29. (a) 10<br />
(b) 0.023<br />
(c) 0.159<br />
(d) 0.533<br />
(e) 0.383<br />
(f) 58.4<br />
30. (a) –<br />
(b) 0.906<br />
31. (a) 7.28·10 −3 , 8.88·10 −4<br />
(b) 8.16·10 −3<br />
(c) 2.275· 10 −2<br />
32. (a) 100, 300<br />
(b) 0.029<br />
33. (a) –<br />
(b) 0.011<br />
(c) 0.019<br />
34. (a) 6.68 m<br />
(b) 0.642<br />
(c) 0.204<br />
(d) 0.9988<br />
35. (a) 0.287, 0.358, 0.038<br />
(b) 1, 0.95, 0.95 n<br />
(c) 0.939<br />
36. (a) 0.15<br />
(b) 0.130<br />
(c) 0.386<br />
(d) 0.143<br />
37. (a) 0.010<br />
(b) 1.379 år<br />
(c) 0.960<br />
(d) 0.0006<br />
(e) 0.938<br />
(f) 0.541<br />
38. (a) 0.1429<br />
(b) $360<br />
39. (a) 2.418<br />
(b) 5.78 m<br />
40. E(p ∗ ) = p;<br />
d(p ∗ ) =<br />
41. 96 st<br />
42. 30.38<br />
√<br />
0.067(1−0.067)<br />
1000+2000<br />
43. 0.189. Ledning: detta är en ffg-fördelning.<br />
44. 2.01<br />
45. (a) –<br />
(b) E(a ∗ ) = a; V(a ∗ ) = 1/(4n x + n y )<br />
Enligt CGS:<br />
a ∗ ∈ ∼<br />
N(a, 1/ √ 4n x + n y )<br />
(c) (7.05, 7.20)<br />
46. (a) 50.70 tum, 59.40 tum 2<br />
(b) (47.787, 53.611)<br />
47. (a) 2.03 mg/l resp. 0.485 mg/l<br />
(b) (1.68, 2.38) mg/l<br />
(c) 1.74 mg/l<br />
48. (a) 76.5 resp. 14.27<br />
(b) (74.08, 78.92)<br />
21
3 SVAR<br />
49. (−0.019, 0.12)<br />
50. (a) 85.0 resp. 6.76<br />
(b) (80.34, 89.66)<br />
(c) (78.47, 91.53)<br />
51. (a) 15 st<br />
(b) 3 st<br />
52. (a) 100.0 m resp. 0.19 m 2<br />
(b) 0.195 m<br />
(c) (99.5, 100.5) m<br />
(d) 0.227 m<br />
(e) (149.4, 150.6) m<br />
53. (a) 364.0 mg/l resp. 7.79 mg/l/JTU<br />
(b) 59.0 mg/l<br />
54. (a) 0.03·10 4 liter 2<br />
(b) i.∗ = 1.01;∗ = 0.047<br />
ii.×∗ = 0.00735 (100 lit/dag)<br />
·×<br />
2<br />
55. (a) Lättbetong: Styrka ≈ 2487tid 0.175 ,<br />
Betong: Styrka ≈ 2250tid 0.162<br />
√<br />
(b) D(a·tid b ·) √=<br />
(a·tid b ) 2 · V() =<br />
= a·tid b · e×2 (e×2 − 1) ≈<br />
≈ [Gaussapprox.] ≈ a·tid b<br />
Lättbetong: 295tid 0.175 .<br />
Betong: 366tid 0.162<br />
56. (a) d(∗ 1 ) = √ 0.25 = 0.5;<br />
= (−3.62, −1.39)<br />
I1<br />
(b) IÑ0<br />
= (54.50, 63.97)<br />
57. (a) 10.82· 10 −3<br />
(b) 10.27·10 −3 tum/kN. Ledning: gör en<br />
MK-skattning avgenom att utnyttja<br />
att E(Y i ) =x i .<br />
58. (a) I pmars−p maj<br />
= (0.326, 0.468)<br />
(b) I 31(pmars−p maj ) = (10.1, 14.5)<br />
59. (a) I p = (0.19, 0.28)<br />
(b) I (1−p) 30 = (0.00, 0.0019)<br />
60. Förkasta H 0 på nivån 0.05<br />
61. (a) Ingen signifikant skillnad<br />
(b) (−5.6, 21.2) ◦ C<br />
62. Ingen signifikant skillnad<br />
63. Resultatet blir ännu mera osignifikant eftersom<br />
s nu också innehåller skillnaderna<br />
mellan plåtar av olika tjocklek.<br />
64. Det finns inget signifikant linjärt samband.<br />
Ledning: ansätt en enkel linjär regression och<br />
testa om= 0.<br />
65. (a) Sant<br />
(b) Falskt<br />
(c) Falskt<br />
(d) Falskt<br />
66. (a) 0.168<br />
(b) 0.410<br />
67. n = 35, r = 3<br />
68. n = 2, L = 0.85<br />
69. (a) nej<br />
(b) r = 5, n = 100<br />
70. (a) k = 27<br />
(b)<br />
71. (a) –<br />
(b) 270 st<br />
(c) Medelkonsumtionen är signifikant<br />
större än normalt<br />
72. (a) Mängden hallonsylt är inte signifikant<br />
för liten.<br />
(b)Ñ
4 FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
x 2<br />
θ x 1 = V cos<br />
x 2 = V sin<br />
4 Fullständiga lösningar till ∗-märkta uppgifter<br />
5. (a)<br />
x 1<br />
(b)<br />
A<br />
B<br />
C<br />
A*<br />
20<br />
12 30<br />
20<br />
(c)<br />
A ∩ C<br />
A ∪ B<br />
A ∩ B ∩ C<br />
20<br />
12<br />
20 30<br />
(d) D och E är ej oförenliga eftersom D∩E ≠ ∅, A och C är ej oförenliga.<br />
6. A: Det kastade myntet har krona på båda sidorna. B: Det kastade myntet har krona uppåt.<br />
Det är lätt att tro att svaret är en halv.<br />
Sökt: P(A | B) = P(AB)<br />
P(B)<br />
= [A är en delmängd av B] = P(A)<br />
P(B) = 1/2<br />
3/4 = 2 3 .<br />
Man kan även resonera med hjälp av möjliga och gynnsamma: Det finns tre möjliga kronor som<br />
kan hamna uppåt. Två av dessa kronor, nämligen de som finns på det tvåkronade myntet, ger de två<br />
gynnsamma fallen med krona även på andra sidan.<br />
7. (a) P(H) = 1/10, P(M) = 1/10, P(L) = 8/10. Inför händelsen A = ”Tunneln håller”. Vi här då<br />
följande kända sannolikheter<br />
P(A | L) = 0.999<br />
P(A | M) = 0.998<br />
P(A | H) = 0.99<br />
Vi använder satsen om total sannolikhet och får<br />
P(A) = P(A | L)P(L)+P(A | M)P(M)++P(A | H)P(H) =<br />
= 0.999·0.8+0.998·0.1+0.99·0.1 = 0.998<br />
(b) P(M) = 1/9, P(L) = 8/9.<br />
P(A) = P(A | L)P(L)+P(A | M)P(M) =<br />
= 0.999·(8/9)+0.998·(1/9) ≈ 0.998889<br />
23
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
(c)<br />
P(L | A ∗ ) = P(L∩A∗ )<br />
P(A ∗ )<br />
= (1−0.999) ·<br />
P(M | A ∗ ) = P(M∩A∗ )<br />
P(A ∗ )<br />
= (1−0.998) ·<br />
= P(A∗ | L)P(L)<br />
P(A ∗ )<br />
8/9<br />
1−0.998889 = 0.8<br />
= P(A∗ | M)P(M)<br />
P(A ∗ )<br />
1/9<br />
1−0.998889 = 0.2<br />
= P(A∗ | L)P(L)<br />
1−P(A)<br />
=<br />
= P(A∗ | M)P(M)<br />
1−P(A)<br />
=<br />
8. (a) Låt G i representera händelsen att det sker brott i tvärbalk i. Brott i någon (minst en) av<br />
tvärbalkarna representeras då av händelsen G 1 ∪ G 2 ∪ G 3 ∪ G 4 .<br />
P(G 1 ∪ G 2 ∪ G 3 ∪ G 4 ) =<br />
= 1−P((G 1 ∪ G 2 ∪ G 3 ∪ G 4 ) ∗ )<br />
= 1−P(G ∗ 1 ∩ G∗ 2 ∩ G∗ 3 ∩ G∗ 4 ) = [Oberoende]<br />
= 1−P(G ∗ 1 )P(G∗ 2 )P(G∗ 3 )P(G∗ 4 )<br />
= 1−(1−P(G 1 ))(1−P(G 2 ))(1−P(G 3 ))(1−P(G 4 ))<br />
= 1−(1−10 −5 ) 4 ≈ 3.99994 · 10 −5<br />
(b) Låt P i representera händelsen att det sker brott i pelare i. Brott i någon (minst en) av pelarna<br />
representeras då av händelsen P 1 ∪ P 2 ∪ P 3 .<br />
P(P 1 ∪ P 2 ∪ P 3 ) = 1−P((P 1 ∪ P 2 ∪ P 3 ) ∗ ) = 1−P(P ∗ 1 ∩ P ∗ 2 ∩ P ∗ 3 )<br />
= 1−P(P ∗ 1 )P(P∗ 2 )P(P∗ 3 ) = 1−(1−P(P 1))(1−P(P 2 ))(1−P(P 3 ))<br />
= 1−(1−10 −6 ) 3 ≈ 3·10 −6<br />
(c) Fel i bron uppstår om brott uppstår i någon pelare eller tvärbalk.<br />
P(G 1 ∪ G 2 ∪ G 3 ∪ G 4 ∪ P 1 ∪ P 2 ∪ P 3 ) =<br />
= P(G 1 ∪ G 2 ∪ G 3 ∪ G 4 )+P(P 1 ∪ P 2 ∪ P 3 )<br />
− P((G 1 ∪ G 2 ∪ G 3 ∪ G 4 )∩(P 1 ∪ P 2 ∪ P 3 ))<br />
= P(G 1 ∪ G 2 ∪ G 3 ∪ G 4 )+P(P 1 ∪ P 2 ∪ P 3 )<br />
− P(G 1 ∪ G 2 ∪ G 3 ∪ G 4 )·P(P 1 ∪ P 2 ∪ P 3 )<br />
= 3.99994·10 −5 + 3·10 −6 − 3.99994· 10 −5 · 3·10 −6 = 4.299928·10 −5<br />
9. Sannolikheten att man väljer att bygga en järnvägsförbindelse dvs P(R) = 1/(1+2+3) = 1/6.<br />
Sannolikheten att man väljer att bygga en motorvägsförbindelse dvs P(H) = 2/(1+2+ 3) = 1/3.<br />
Sannolikheten att man väljer att bygga en flygförbindelse dvs P(A) = 3/(1+2+3) = 1/2.<br />
Låt K = händelsen att förbindelsen är klar inom ett år.<br />
P(K|R) = 0.50, P(K|H) = 0.75, P(K|A) = 0.90<br />
(a) Satsen om total sannolikhet ger<br />
P(K ) = P(K|R)P(R)+P(K|H)P(H)+P(K|A)P(A) =<br />
= 0.50(1/6) + 0.75(1/3) + 0.90(1/2) = 4.7/6 = 0.78333<br />
(b) P(A|K ) = P(K|A)P(A)/P(K ) = 0.90·(1/2)/0.78333 = 0.57447<br />
(c) P(H|H ∪ R) = P(H ∩ (H ∪ R))/P(H ∪ R) = P(H)/P(H ∪ R) = (1/3)/(1/6+ 1/3) = 2/3<br />
10. Låt T beteckna den tid det tar att fylla en lastare. P(T = 2) = 0.5, P(T = 3) = 0.5.<br />
24
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
(a) Låt T 1 , T 2 ... beteckna lasttiden för lastare 1, 2,... i kön. +P(T 1 + T 2 < 5) = P(T 1 =<br />
2, T 2 = 2) = P(T 1 = 2)P(T 2 = 2) = 0.5·0.5 = 0.25.<br />
(b) Låt N beteckna antalet lastare i kön. Sannolikheten att N = 0, 1, 2 osv beskrivs av tabellen 2 .<br />
Vi söker P(T 1 + T 2 + ··· + T N < 5). Genom att betinga på antalet lastare i kö får vi med<br />
satsen om total sannolikhet<br />
N∑<br />
P( T i < 5) =<br />
i=1<br />
=<br />
∞∑ N∑<br />
P( T i < 5|N = k)P(N = k) =<br />
k=0<br />
i=1<br />
∞∑ k∑<br />
P( T i < 5)P(N = k)<br />
= 1·P(N = 0)+P(T 1 < 5)P(N = 1)+P(T 1 + T 2 < 5)P(N = 2)<br />
+ P(T 1 + T 2 + T 3 < 5)P(N = 3)+P(T 1 + T 2 + T 3 + T 4 < 5)P(N = 4)+...<br />
= 1·0.2+ 1·0.1+0.25·0.3+ 0·0.3+0·0.1+··· = 0.375<br />
11. Låt A resp B beteckna händelserna att kabel A resp B håller för belastningen och med A ∗ resp B ∗<br />
betecknar vi komplementen till dessa händelser. Ur uppgiften kan vi då identifiera sannolikheterna<br />
P(A ∗ ) = 0.02, P(A) = 0.98 och P(B ∗ |A ∗ ) = 0.30.<br />
(a) P(A ∗ B ∗ ) = P(B ∗ |A ∗ )P(A ∗ ) = 0.30·0.02 = 0.006.<br />
(b) Om lasten hänger kvar kan kabel A vara hel eller trasig, men B måste vara hel. Vi söker P(A|B)<br />
dvs sannolikheten att A är hel givet att lasten hänger kvar.<br />
P(A|B) = 1−P(A ∗ |B) = 1− P(A∗ B)<br />
= 1− P(B|A∗ )P(A ∗ )<br />
= [Total slh i nämnaren]<br />
P(B) P(B)<br />
P(B|A ∗ )P(A ∗ )<br />
= 1−<br />
P(B|A ∗ )P(A ∗ )+P(B|A)P(A) = 1− (1−0.30)0.02<br />
0.70·0.02+1·0.98 = 0.9859<br />
Ännu enklare blir räkningarna om man inser (rita ett Venn-diagram) att AB = A: P(A|B) =<br />
P(AB)/P(B) = P(A)/P(B) = 0.98/0.994 = 0.9859<br />
12. (a) Pos: Positivt utslag, S: Sjuk, S ∗ : Frisk.<br />
P(Pos|S)P(S)<br />
Sökt: P(S|Pos) =<br />
P(Pos|S)P(S)+P(Pos|S ∗ )P(S ∗ ) = 0.99·0.01<br />
0.99·0.01+0.05·0.99 = 1 6<br />
(b) Om man lyckas ändra 0.05 till 0 fås den sökta sannolikheten till 1. En ändring av 0.99 (obs.<br />
inte den som har med 99% av patienterna att göra) till 1 ger att den sökta sannolikheten<br />
ökar från ca 0.167 till ca 0.168. Dessvärre går det nog inte i verkligheten att minska antalet<br />
falsklarm utan att minska chansen till önskade larm.<br />
18. (a)<br />
(c) Den sökta sannolikheten blir då (samma resonemang som i (a) fast andra värden)<br />
0.99·0.50<br />
0.99·0.50+0.05·0.50 ≈ 0.952.<br />
f T (t) = dF T (t)<br />
dt<br />
⎧<br />
⎨<br />
=<br />
⎩<br />
2t − 2, 1 ≤ t ≤ 2<br />
0, t < 1<br />
0, t > 2<br />
(b) P(T > 1.5) = 1−P(T ≤ 1.5) = 1−F T (1.5) = 1−(1.5 2 − 2·1.5+1) = 0.75<br />
19. (a) 0.2·0.2 = 0.04<br />
2 Det relativt lilla antalet observationer (30 st) gör att denna observerade fördelning av antalet lastare i kö, är relativt osäker<br />
och kanske inte fullt återspeglar fördelningen för antalet lastare i kö i det långa loppet.<br />
k=0<br />
i=1<br />
25
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
(b) Låt X beteckna antalet sprickor som registreras. Satsen om total sannolikhet ger<br />
P(X = 0) = P(X = 0|N = 0)P(N = 0)+P(X = 0|N = 1)P(N = 1)+··· =<br />
2∑<br />
= P(X = 0|N = k)P(N = k) =<br />
k=0<br />
= 1·0.3+0.2·0.6+0.2 2 · 0.1 = 0.424<br />
(c) Med hjälp av Bayes sats fås<br />
P(N = 0|X = 0) =<br />
P(X = 0|N = 0)P(N = 0)<br />
P(X = 0)<br />
= 1·0.3<br />
0.424 ≈ 0.7075.<br />
20. (a) Eftersom ytan under täthetsfunktionen är 1 gäller att 5a+(20−5)a/2 = 1 dvs a = 1/12.5 =<br />
0.08. Tätheten kan således skrivas<br />
⎧<br />
⎨ 0.08, 0 < x < 5<br />
f X (x) = 0.08(20−x)/15, 5 < x < 20<br />
⎩<br />
0, för övrigt<br />
(b) Y anger vattennivån i damm B vid jordbävningstillfället. X anger höjningen av nivån i damm<br />
B orsakat av att vatten tillkommer från damm A. Vi söker P(Y + X > 40). Genom att betinga<br />
på de möjliga värden som Y kan anta får vi enligt satsen om total sannolikhet<br />
P(X + Y > 40) =<br />
= P(X + Y > 40|Y = 25)P(Y = 25)+P(X + Y > 40|Y = 35)P(Y = 35) =<br />
= P(X > 15|Y = 25)P(Y = 25)+P(X > 5|Y = 35)P(Y = 35) =<br />
= P(X > 15)P(Y = 25)+P(X > 5)P(Y = 35) = 0.0666· 0.7+0.6·0.3 = 0.2266<br />
Där P(X > 15 och P(X > 5) kan räknas ut genom triangelareor (se figuren):<br />
P(X > 15) =<br />
∫ ∞<br />
15<br />
f X (x) dx = (20−15)·(0.08(20−15)/15)/2 ≈ 0.066666<br />
P(X > 5) = (20−5)·(0.08(20−5)/15)/2 = 0.6<br />
(c)<br />
5 15 20 5 20<br />
P(Y = 25|X + Y < 40) =<br />
=<br />
P(Y = 25, X + Y < 40)<br />
=<br />
P(X + Y < 40)<br />
P(Y = 25)P(X < 15)<br />
P(X + Y < 40)<br />
P(Y = 25, X < 15)<br />
P(X + Y < 40)<br />
= 0.7·0.93333<br />
0.773333<br />
= 0.8448<br />
=<br />
21. P(X ≤ 7.5) = ∫ 7.5<br />
−∞ f X (x) dx = ∫ [ ]<br />
7.5<br />
7.5<br />
1<br />
6 2.7 (1 − x<br />
15 ) dx = 1 x2<br />
2.7<br />
(x −<br />
30 ) 6<br />
0.3056.<br />
27. (a) Z: mätvärdet, Y : mätfelet.<br />
E(Z) = E(5.8+Y ) = 5.8+E(Y ) = 5.8+=6.2<br />
D(Z) = D(5.8+Y ) = D(Y ) = 0.05, ty allm. gäller V(aX + b) = a 2 V(X ).<br />
(b) E(Z) = E(X + Y ) = E(X )+E(Y ) = 5.8+0.4 = 6.2<br />
D(Z) = D(X + Y ) = √ D(X ) 2 + D(Y ) 2 = √ 0.5 2 + 0.05 2 ≈ 0.502.<br />
26<br />
= 2.0833 − 1.7778 =
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
(c) D(¯Z) = D(Z 1 /3+Z 2 /3+Z 3 /3) = (alla tre proverna tas samma dag) = D(X/3+Y 1 /3+<br />
X/3 + Y 2 /3 + X/3 + Y 3 /3) = D(X + Y 1 /3 + Y 2 /3 + Y 3 /3) = √ 0.5 2 + 3·0.05 2 /9 =<br />
√<br />
0.5 2 + 0.05 2 /3 ≈ 0.501.<br />
(d) De tre källorna är den slumpmässiga variationen i surhet, det slumpmässiga mätfelet och det<br />
systematiska kalibreringsfelet. Av dessa är det endast inverkan från det slumpmässiga mätfelet<br />
som minskas i (c). Vill man bekämpa den stora källan till variation, variationen ivattnets surhet,<br />
måste<br />
2Ðman istället mäta över ett antal olika dagar.<br />
28. (a) E(Y ) = E( 1 (<br />
X2<br />
3 2 + X 3<br />
3 + X )<br />
5<br />
) = 1 ( E(X2 2Ð+3Ð+5Ð<br />
)<br />
+ E(X 3)<br />
+ E(X )<br />
5)<br />
=<br />
5 3 2 3 5<br />
= 1 ( )<br />
+ + =Ð.<br />
3 2<br />
3Ð3<br />
5Ð5<br />
E(Y ) = E(<br />
2Ð 3Ð<br />
X 2 + X 3 5Ð<br />
+ X 5<br />
2+3+5 ) = E(X 2)+E(X 3 )+E(X 5 )<br />
= =Ð.<br />
2+3+5 2+3+5<br />
(b) V(Y ) = V( 1 (<br />
X2<br />
3 2 + X 3<br />
3 + X )<br />
5<br />
) = 1 ( V(X2 2Ð+3Ð+5Ð<br />
)<br />
5 3 2 2 2 + V(X 3)<br />
3 2 + V(X )<br />
5)<br />
5 2 =<br />
= 1 ( )<br />
3 2 2 2 + 3 2 + 5 2 =<br />
270Ð.<br />
31<br />
V(Z) = V( X 2 + X 3 + X 5<br />
2+3+5 ) = V(X 2)+V(X 3 )+V(X 5 )<br />
(2+3+5) 2 =<br />
(2+3+5) 2 = 10Ð.<br />
1<br />
√Ð<br />
10 ) med<br />
Eftersom 1 10 < 31 så är Z bättre än Y eftersom den har mindre varians.<br />
270<br />
(c) EftersomÐ∗ = 8+5+14<br />
2+3+5 = 2.7 och X 2 + X 3 + X 5 ∈ Po(2Ð+3Ð+5Ð) = Po(10Ð) med<br />
10Ð≈10· 2.7 = 27 > 15 så kan vi normalapproximera X 2 + X 3 + X 5 ∈ ∼<br />
N(10Ð, √ 10Ð) och<br />
Ð∗ = X 2 + X 3 + X 5<br />
∈<br />
10 ∼<br />
N(Ð,<br />
√<br />
2.7<br />
IÐ= (Ð∗ ±Ð/2 · d(Ð∗ )) = (2.7±Ð0.025·<br />
) = (1.68, 3.72).<br />
10<br />
}{{}<br />
1.96<br />
31. Den månatliga maximala belastningen L är normalfördelad med väntevärde E(L) = 25 000 och<br />
standardavvikelse D(L) =×L = 0.30 · E(L) = 7 500, dvs L ∈ N(25 000, 7 500). 10-månaders<br />
maximala belastningen är en last så stor att sannolikheten för att få en så stor maximal last är 1/10,<br />
dvs om denna last betecknas l 10 så gäller att P(L > l 10 ) = 0.10. Eftersom L ∈ N(25 000, 7 500)<br />
gäller att<br />
)<br />
l10 − 25 000<br />
P(L > l 10 ) = 1−( =⇒<br />
7 500<br />
l 10 − 25 000<br />
= 1.28 dvs l 10 = 34 600<br />
7 500<br />
(a) Dimensioneringen har skett med säkerhetsfaktorer 1.25 respektive 1.40 dvs kabeln klarar 1.25·<br />
34 600 kg = 43 250 kg och balken klarar 1.40 · 34 600 kg = 48 440 kg. Sannolikheten att<br />
kabel resp. balk ej klarar den pålagda belastningen ges av<br />
)<br />
43 250−25 000<br />
P(L > 43 250) = 1−( = 1−(2.4333)<br />
7 500<br />
= 1−0.992724 = 0.007276<br />
resp.<br />
)<br />
48 440−25 000<br />
P(L > 48 440) = 1−( = 1−(3.12533)<br />
7 500<br />
= 1−0.999112 = 0.000888<br />
27
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
(b) ”Konstruktionen” fungerar ej om minst en av balk eller kabel brister. Sannolikheten för detta<br />
är 1−(1−0.007276)(1 − 0.000888) = 0.008157.<br />
(c) Låt C beteckna kabelns hållfasthet. C ∈ N(50 000, 10 000). Vi söker sannolikheten för att<br />
lasten överstiger kabelns kapacitet, dvs P(L > C) = P(L−C > 0). Det gäller att<br />
L−C ∈ N(25 000−50 000, √ 7 500 2 + 10 000 2 ) = N(−25 000, 12 500)<br />
och således<br />
)<br />
0−(−25 000)<br />
P(L−C > 0) = 1−( = 1−(2) = 0.02275.<br />
12 500<br />
32. (a) E(M a ) = E(50W + 10P) = 50E(W )+10E(P) = 50·1+10·5 = 100 och<br />
V(M a ) = V(50W + 10P) = 50 2 V(W )+10 2 V(P)+2·50·10C(W, P).<br />
Eftersom C(W, P) =ÖW,PD(W )D(P) = 0.5·0.2·1 = 0.1 gäller att<br />
V(M a ) = 50 2 · 0.2 2 + 10 2 · 1 2 + 2·50·10·0.1 = 300.<br />
(b) Om W och P hade varit oberoende så hade också M a varit normalfördelad eftersom M a är en<br />
linjär kombination av W och P. Om W och P följer en bivariat normalfördelning (förutom<br />
att de var och en är normalfördelade) så gäller att M a är normalfördelad även om W och P är<br />
beroende.<br />
M a ∈ N(100, √ 300)<br />
M r ∈ N(200, 50)<br />
Eftersom M r − M a ∈ N(200−100, √ 50 2 + ( √ 300) 2 ) så gäller att<br />
P(M r < M a )<br />
= P(M r − M a < 0) =( 0−100<br />
√<br />
2 800<br />
)<br />
=(−1.889822) =<br />
= 1−(1.889822) = 1−0.9706090 = 0.02939099<br />
33. Y = X·F ger ln Y = ln X+ln F. Eftersom X är lognormalfördelad gäller att ln X är normalfördelad<br />
och p.s.s. för ln F. Eftersom X och F är oberoende blir därför ln Y , summan av de två oberoende<br />
normalfördelade variabler, också normalfördelad och således blir Y lognormalfördelad.<br />
(a) Parametrarna i lognormalfördelningen för X (då ln X ∈ N(Ñlnx,×lnx)) kan relateras till dessa<br />
genom×lnx =<br />
√<br />
ln(1+2 x ) = √ ln(1+0.20 2 ) = 0.198<br />
Ñlnx = ln x 0.50 = ln 4 = 1.386<br />
Parametrarna i lognormalfördelningen för F kan relateras till dessa genom<br />
√<br />
×lnf = ln(1+2 F<br />
) = √ ln(1+0.10 2 ) = 0.09975<br />
Ñlnf = ln f 0.50 = ln 0.15 = −1.8971<br />
ParametrarnaÑlny och<br />
sigma lny i fördelningen för Y ges, eftersom F och X är oberoende, av<br />
Ñlny = E(ln Y ) = E(ln F)+E(ln X ) =Ñlnf +Ñlnx = −0.5108<br />
×2<br />
lny = V(ln Y ) = V(ln F)+V(ln X ) =×2 lnf +×2 lnx = 0.2217 2<br />
(b) Vi söker P(Y > 1).<br />
)<br />
0−(−0.5108)<br />
P(Y < 1) = P(ln Y < ln 1) = P(ln Y < 0) =( =(2.3040) =<br />
0.2217<br />
= 0.989276<br />
P(Y > 1) = 0.010724<br />
28
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
(c) Låt H beteckna händelsen att den slumpvis valda dagen är en heavy work day. Då gäller enligt<br />
satsen om total sannolikhet att<br />
P(Y ≤ 1) = P(Y ≤ 1 | H)P(H)+P(Y ≤ 1 | H ∗ )P(H ∗ ).<br />
Eftersom P(H) = 0.10 = 1−P(H ∗ ) och P(Y ≤ 1 | H ∗ ) = 0.989276 enligt (b) så återstår<br />
enbart att beräkna P(Y ≤ 1 | H).<br />
Under en dag med hög produktion gäller attÑlnx = ln 5 = 1.609437 och således<br />
Ñlny = −0.287682 medan parametern×lnx och därmed×lny är oförändrad.<br />
)<br />
0−(−0.287682)<br />
Vi få således P(Y ≤ 1 | H) = P(ln Y < 0 | H) =( =<br />
0.2217<br />
=(1.297618) = 0.9027883 och<br />
P(Y ≤ 1) = P(Y ≤ 1 | H)P(H)+P(Y ≤ 1 | H ∗ )P(H ∗ ) =<br />
= 0.1·0.9027883 + 0.9·0.989276 = 0.9806271<br />
P(Y > 1) = 0.0193729<br />
36. Med hjälp av resultat uppmätta under 20 år vill vi uppskatta sannolikheten för olika händelser.<br />
Naturligtvis kan denna relativt korta tid inte bjuda på hela spektrat av möjliga vindhastigheter, men<br />
vi kan dock ändå få en uppfattning om storleksordningen på vissa sannolikheter även om de kommer<br />
att bli relativt osäkra.<br />
(a) Under 3 år av de 20 överskrider vindhastigheten 80 km/h. Vi uppskattar sannolikheten för att<br />
vindhastigheten överstiger 80 km/h till p ∗ = 3/20 = 0.15.<br />
(b) Eftersom vi antar att vindhastigheten olika år är lika stor och oberoende av varandra blir, X ,<br />
antalet år av 10 som vindhastigheten överskrider 80 km/h Bin(20, p), där p ∗ = 3/20 enligt<br />
(a).<br />
Sannolikheten att det under de kommande 10 åren blir exakt 3 år med vindhastigheter över<br />
80 km/h = P(X = 3) =<br />
0.12983.<br />
( 10<br />
3<br />
)<br />
p 3 (1 − p) 10−3 som skattas med<br />
( 10<br />
3<br />
)<br />
0.15 3 0.85 7 =<br />
(c) Sannolikheten att det under en period på 3 år, det åtminstone ett år blir en<br />
(<br />
vindhastighet på<br />
3<br />
mer än 80 km/h = P(Y ≥ 1) = 1−P(Y < 1) = 1−P(Y = 0) = 1− p<br />
0)<br />
0 (1−p) 3−0<br />
som uppskattas till 1−(1−0.15) 3 = 0.38588 där Y ∈ Bin(3, p) enligt samma resonemang<br />
som i (a)<br />
(d) Under 1 år av de 20 överskrider vindhastigheten 85 km/h. Vi uppskattar sannolikheten för att<br />
vindhastigheten överstiger 85 km/h till p ∗ z = 1/20 = 0.05. Sannolikheten att det under en<br />
period på 3 år, det åtminstone ett år blir en vindhastighet på mer än 85 km/h = P(Z ≥ 1) =<br />
1−P(Z = 0) = (1−p z ) 3 som uppskattas till 1−(1−0.05) 3 = 0.14263 där Z ∈ Bin(3, p z )<br />
enligt samma resonemang som i (a).<br />
37. X är livslängden hos vägbeläggning av längden 1 mil. X är lognormalfördelad med median x 0.50 = 3<br />
år och variationskoefficientx = 0.5. ParametrarnaÑlnx och×lnx i lognormalfördelningen kan<br />
relateras till dessa genom<br />
Ñlnx = ln x 0.50 = ln 3 ≈ 1.09861<br />
√<br />
×lnx = ln(1+2 x ) = √ ln(1+0.5 2 ) ≈ 0.472381<br />
(a) Sannolikheten att en vägsträcka har en livslängd kortare än ett år<br />
) ln 1−Ñlnx<br />
P(X < 1) = P(ln X < ln 1) =(<br />
×lnx<br />
= 1−(2.322568) = 1−0.989899 = 0.010101 = p a<br />
=(−Ñlnx/×lnx) =(−2.322568))<br />
29
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
(b) 5 % percentilen x 0.05 fås ur<br />
)<br />
ln x0.05 −Ñlnx<br />
0.05 = P(X < x 0.05 ) =(<br />
×lnx<br />
⇐⇒<br />
ln x 0.05 −Ñlnx<br />
×lnx<br />
= −1.6449 =⇒<br />
x 0.05 = 1.37932<br />
(c) Sätt Y = antal vägsträckor som kommer att behöva repareras∈ Bin(4, p a ) så att P(Y = 0) =<br />
(1−p a ) 4 = 0.989899 4 = 0.960202<br />
(d) P(Y = 2) = ( 4<br />
2)<br />
p<br />
2<br />
a (1−p a ) 2 = 6·0.0001 = 0.0006<br />
(e) 1−P(X > 3) 4 = 1−(1−((ln 3−Ñlnx)/×lnx)) 4 = 1−(1−(0)) 4 = 1−0.5 4 = 0.9375.<br />
(f) Låt T vara livslängden hos vägbeläggning av längden 4 mil. Då gäller enligt (c) att P(T ><br />
1) = 0.96. Vi söker P(1 < T < 2). Det gäller att T = min(X 1 , X 2 , X 3 , X 4 ) där X i representera<br />
livslängden hos vägbeläggning av längden 1 mil och alla X i har samma fördelning som X och<br />
är oberoende. Det gäller således att<br />
P(T > x) = P(X i > x) 4 och<br />
P(1 < T < 2) = P(T > 1)−P(T > 2) = P(X i > 1) 4 − P(X i > 2) 4 .<br />
På samma sätt som i (a) får vi<br />
P(X i > 2) =((Ñlnx − ln 2)/×lnx) =(0.8583433) = 0.8046464 och således<br />
P(1 < T < 2) = 0.960202 − 0.4191991 = 0.5410028.<br />
38. X (t) ∈ Po(120t) med E(X (t)) = 120t.<br />
(a) X ( 1<br />
60<br />
) ∈ Po(120/60) = Po(2)<br />
P(X ( 1 60 ) > 3) =<br />
= 1−P(X ( 1<br />
60 ) = 0)−P(X ( 1<br />
60 ) = 1)−P(X ( 1<br />
60 ) = 2)−P(X ( 1<br />
60 ) = 3) =<br />
= 1−e −2 − e −2 2 1 /1!−e −2 2 2 /2!−e −2 2 3 /3! = 0.142873<br />
(b) E(X (3)) = 120 · 3 = 360. Det förväntade antalet personbilar är då 2 3 · 360 vilka var och en<br />
betalar $0.50, och det förväntade antalet lastbilar blir 1 3 · 360 vilka var och en betalar $2. Den<br />
förväntade tullavgiften blir då 2 3 · 360·$0.50+ 1 360·$2 = $360.<br />
3<br />
30
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
44. Rayleigh-fördelning med täthetsfunktionen<br />
f H (h) = h2 e− 1 2 (h/) 2 , h ≥ 0<br />
Observationer: 1.5, 2.8, 2.5, 3.2, 1.9, 4.1, 3.6, 2.6, 2.9, 2.3.<br />
ML-skattning avgenom maximering av Likelihood-funktionen<br />
L() =<br />
n∏<br />
i=1<br />
f H (x i ) = x 1<br />
2 e− 12 (x 1/) 2 x n<br />
·...·<br />
2 e− 12 (xn/) 2 =<br />
= 1<br />
1 ∑<br />
− · x<br />
2n 1 ·...·x n · e x 2<br />
22 i<br />
l() = ln L() = −2n ln+ ∑ ln x i − 1<br />
∂l ∑<br />
−<br />
2n+ ∂= 13 x<br />
2<br />
i = 0 ⇒<br />
2<br />
= 1 n∑<br />
xi 2 ⇒∗ = √ 1<br />
2n<br />
2n<br />
i=n<br />
22<br />
∑<br />
x<br />
2<br />
i<br />
n∑<br />
xi 2 ≈ 2.0052<br />
i=n<br />
∑n x<br />
∑<br />
45 (a) Eftersom Q(a) = (x i − 2a) 2 + (y j − a) 2 där<br />
(b)<br />
dQ(a)<br />
da<br />
i=1<br />
n x<br />
∑<br />
= −2·2 (x i − 2a)−2<br />
i=1<br />
a ∗ = 2∑ n x<br />
i=1 x i + ∑ n y<br />
j=1 y j<br />
4n x + n y<br />
.<br />
n y<br />
j=1<br />
∑<br />
n y<br />
j=1<br />
∑n x<br />
(y j − a) = 2 x i − 4n x a+<br />
i=1<br />
∑<br />
n y<br />
j=1<br />
y j − n y a = 0 så får vi<br />
E(a ∗ )<br />
V(a ∗ )<br />
= E( 2∑ n x<br />
i=1 X i + ∑ n y<br />
4n x + n y<br />
j=1 Y j<br />
) = 2∑ n x<br />
i=1 E(X i)+ ∑ n y<br />
j=1 E(Y j)<br />
4n x + n y<br />
= 2∑ n x<br />
i=1 2a+∑ n y<br />
j=1 a<br />
= 4n xa+n y a<br />
= a,<br />
4n x + n y 4n x + n y<br />
= V( 2∑ n x<br />
i=1 X i + ∑ n y<br />
j<br />
4n x + n y<br />
Y j<br />
) = 22∑ n x<br />
i=1 V(X i)+ ∑ n y<br />
j=1 V(Y j)<br />
(4n x + n y ) 2<br />
= 22∑ n x<br />
i=1 1+∑ n y<br />
j=1 1<br />
(4n x + n y ) 2 = 4n x + n y<br />
(4n x + n y ) 2 = 1<br />
4n x + n y<br />
∑n x<br />
Eftersom n x och n y är stora så gäller, enligt CGS, att X i ∈ ∼<br />
N(n x E(X i ), √ n x V(X i )) =<br />
N(n x 2a, √ n x ) och<br />
∑n x<br />
linjärkombination av X i och<br />
∑<br />
n y √<br />
Y j ∈ ∼<br />
N(n y E(Y j ), n y V(Y j )) = N(n y a, √ n y ) så att, eftersom a ∗ är en<br />
j=1<br />
i=1<br />
a ∗ ∈ ∼<br />
N(E(a ∗ ), √ V(a ∗ )) = N(a,<br />
∑<br />
n y<br />
Y j , det gäller att<br />
j=1<br />
1<br />
√ 4nx + n y<br />
).<br />
i=1<br />
(c) a ∗ =<br />
2·150·¯x + 100·ȳ<br />
4·150+100<br />
≈ 7.13.<br />
31
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
I a = (a ∗ 1<br />
1<br />
±Ð/2 · √ ) = (7.13±Ð0.025·<br />
√ ) = (7.05, 7.20).<br />
4nx + n y 4·150+100<br />
50. (a) n = 9,¯x = 85.00, s = 6.7639<br />
}{{}<br />
1.96<br />
(b)×=6,=0.02, EftersomÑ∗ = ¯X ∈ N(Ñ,×/ √ n) med×=6känd:<br />
IÑ=¯x ±Ð/2 ·×√ n<br />
= [Ð0.01 = 2.3263] =<br />
= 85.00±2.3263·<br />
6<br />
√<br />
9<br />
= [80.3474, 89.6526]<br />
(c) EftersomÑ∗ = ¯X ∈ N(Ñ,×/ √ n) där×är okänd och skattas med<br />
s = √ ∑ (xi −¯x) 2 /(n−1):<br />
·×<br />
s<br />
IÑ=¯x ± t/2(n−1)· √ = [t/2(n−1) = t 0.01 (8) = 2.90] =<br />
n<br />
= 85.00±2.90· 6.7639 = [78.4616, 91.5384]<br />
3<br />
51. Ett 90 % konfidensintervall förÑmed känt×, n 1 = 5 ges, eftersomÑ∗ = ¯X ∈ N(Ñ,×/ √ n 1 ), av<br />
IÑ= ¯x ±Ð/2 √ = 7.08±1.6449· 0.0816 √ = [7.02, 7.14]<br />
n1 5<br />
Man ser att bredden på intervallet bestäms avÐ/2 ·×√ n<br />
.<br />
(a) Med bibehållen konfidensgrad (Ð/2) kan man få ett smalare intervall genom att öka n.<br />
·×<br />
Ð/2<br />
·×<br />
Ð2/2<br />
·×<br />
√ = 1<br />
n2 2Ð/2<br />
·×<br />
√ ≈Ð1/2 n2<br />
1<br />
√<br />
n2<br />
=<br />
1<br />
√<br />
n1<br />
2 √ n 1<br />
n 2 = 4n 1 = 4·5 = 20<br />
dvs 20−5 = 15 fler mätningar.<br />
(b) Ett 95 % konfidensintervall med ungefär samma bredd.<br />
√<br />
n1<br />
Ð2/2<br />
√<br />
n2<br />
≈Ð1/2<br />
√<br />
n1<br />
n 2 ≈Ð2 0.025<br />
Ð2<br />
0.05<br />
n 1 = 1.962<br />
1.6449 2 · 5 ≈ 7.0991<br />
Nu är frågan om man ska avrunda uppåt eller nedåt. Om vi tittar på intervallen:<br />
n = 7 ¯x ± 1.96·×√<br />
7<br />
= [7.0196, 7.1404]<br />
n = 8 ¯x ± 1.96·×√<br />
8<br />
= [7.0235, 7.1365]<br />
Vi ser att för n = 7 blir intervallet något för brett och för n = 8 ganska mycket smalare.<br />
52. (a) LåtÑAB beteckna avståndet mellan A och B. En mätning X i =ÑAB +i störs av ett mätfeli,<br />
där E(i) = 0, V(i) =×2 X . De n (n = 5), mätningarna x 1 , x 2 ,...,x n ger ∑ n<br />
∑ 1 x i = 500.0,<br />
n<br />
1 x2 i = 50000.76, ¯x = 100.0, s = 0.43589, s 2 = 0.19.<br />
(b) Det gäller att V(¯X ) = V( ∑ X i )/n 2 = nV(X i )/n 2 = V(X i )/n =×2 X<br />
/n och D(¯X ) =×X/ √ n.<br />
×X skattas med s och vi får därför en skattning på D(¯X ) som d(¯X ) = s/ √ 5 = 0.19494<br />
32
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
(c) Om X i är normalfördelade kan ett konfidensintervall beräknas ur<br />
IÑAB = ¯x ± t 0.01(4)·s/ √ 5 = 100±3.75·0.19494 = (99.26958, 100.73042)<br />
Om vi ej vet något om X utan utnyttjar CGS för att normalapproximera ¯X , så kan vi använda<br />
IÑAB = ¯x ±Ð0.01 · s/ √ 5 = 100±2.33·0.19494 = (99.5, 100.5)<br />
som är ett konfidensintervall med approximativ konfidensgrad 0.98.<br />
(d) LåtÑBC beteckna avståndet mellan B och C. En mätning Y i =ÑBC +i störs av ett mätfeli,<br />
där E(i) = 0, V(i) =×2 Y<br />
. AvståndetÑAB +ÑBC uppskattas med¯x + ȳ. Då gäller att<br />
V(¯X + Ȳ ) = V(¯X )+V(Ȳ ) = V(X i )/5+V(Y i )/3 =×2 X /5+×2 Y /3<br />
Denna kan uppskattas med sx/5+s 2 y/3 2 = 0.43589 2 /5+0.20 2 /3 = 0.0513333. Således har<br />
√<br />
vi d(¯X + Ȳ ) = sx 2/5+s2 y /3 = √ 0.0513333 = 0.227.<br />
(e) Ett konfidensintervall ges av<br />
IÑAC = (¯x + ȳ±Ð0.01√ 0.051333) = (149.47, 150.53)<br />
Detta intervall har en approximativ konfidensgrad av 98 %.<br />
57.<br />
∑<br />
xi = 21, ∑ x 2 i = 91, ∑ y i = 213, ∑ y 2 i = 9619, ∑ x i y i = 935.<br />
(a)<br />
S xx = ∑ (x i −¯x) 2 = ∑ x 2 i − ( ∑ x i ) 2 /n = 91− 21 2 /6 = 17.5<br />
S yy = ∑ (y i − ȳ) 2 = ∑ y 2 i − ( ∑ y i ) 2 /n = 9619− 213 2 /6 = 2057.5<br />
S xy = ∑ (x i −¯x)(y i − ȳ) = ∑ x i y i − ( ∑ x i )( ∑ y i )/n = 935−21·213/6 = 189.5<br />
∗<br />
= S xy /S xx = 189.5/17.5 = 10.82<br />
(b) En regressionsmodell utan intercept står inte (direkt) i formelsamlingen men en härledning av<br />
minstakvadrat-skattningen är enkel. Minimera<br />
n∑<br />
Q() = (y i −x i ) 2<br />
i=1<br />
dQ<br />
d= −2<br />
∗<br />
=<br />
n∑<br />
x i (y i −x i ) = −2<br />
i=1<br />
∑<br />
xi y i<br />
∑ x<br />
2<br />
i<br />
= 935<br />
91 = 10.27<br />
n∑<br />
x i y i − 2n∑<br />
xi 2 = 0 =⇒<br />
i=1<br />
Man kan även använda matrisformuleringen som används vid multipel regression. X -matrisen<br />
innehåller då den enda dataserien och inte någon kolumn med ettor dvs den reduceras till en<br />
kolonn-vektor vilket ger enkla beräkningar och naturligtvis samma resultat.<br />
71. (a) Eftersom X i = ”mängd soppa för åkare i” medÑ∗ = ¯x där n är stort så kan vi, enligt Centrala<br />
20<br />
gränsvärdessatsen, normalapproximera och ¯X ∈ ∼<br />
N(Ñ, √ ). Då ges ett test av H 0 :Ñ=55<br />
n<br />
mot H 1 :Ñ>55 på signifikansnivån=0.05 av<br />
Alt 1. Konfidensintervall: ”Förkasta H 0 om 55 ∉ IÑ= (¯x −Ð0.05 · 20 √ n<br />
, ∞)”<br />
Alt 2. Teststorhet: ”Förkasta H 0 om<br />
¯x − 55<br />
20/ √ n >Ð0.05”<br />
33<br />
i=1
4<br />
FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
Alt 3. Direktmetoden: ”Förkasta H 0 om P(¯X ≥ ¯x omÑ=55) =<br />
Alt 4. Kritiskt område: ”Förkasta H 0 om¯x > 55+Ð0.05 · 20 √ n<br />
”.<br />
(b) Vi har att<br />
P(förkasta H 0 omÑ=55+1) = P(¯X > 55+Ð0.05 · 20 √ n<br />
om ¯X ∈ ∼<br />
N(56,<br />
≈( 55+Ð0.05 · √ 20<br />
n<br />
− 56<br />
20/ √ −1<br />
) =(<br />
n<br />
20/ √ n +Ð0.05) ≥ 0.80 ⇒<br />
−1<br />
20/ √ n +Ð0.05 ≥Ð0.20 ⇒ n ≥ 20 2 (Ð0.20−Ð0.05) }{{}<br />
2 = 268.07 dvs n ≈ 270.<br />
(c) Eftersom ¯x = 60 > 55 +Ð0.05 ·<br />
signifikant större än normalt i år.<br />
0.84<br />
}{{}<br />
1.64<br />
1−(¯x − 55<br />
20/ √ n ) < 0.05”<br />
20<br />
√ n<br />
)) ≈<br />
20<br />
√ 270<br />
= 57.0 kan H 0 förkastas. Medelkonsumtionen är<br />
72 (a) Låt X i vara hallonsyltmängd i för i = 1, 2, 3 där X i ∈ N(Ñ,×) är oberoende.<br />
Eftersom vi vill kunna påvisa om mängden hallonsylt är för liten vill vi testa H 0 :Ñ=1 mot<br />
H 1 :Ñ
−Ñ<br />
4 FULLSTÄNDIGA LÖSNINGAR TILL∗-MÄRKTA UPPGIFTER<br />
−Ñ<br />
−Ñ<br />
¯X − 1<br />
Eftersom P(<br />
0.04/ √ 2 < −Ð0.05) = P(¯X < 1−Ð0.05 · 0.04 √ ) = 2<br />
¯X<br />
= P(<br />
0.04/ √ 2 < 1−Ð0.05 · 0.04 [<br />
0.04/ √ ) = eftersom<br />
¯X ]<br />
2<br />
0.04/ √ 2 ∈ N(0, 1) =<br />
=( 1−Ð0.05 · 0.04 √<br />
2 1−Ñ<br />
0.04/ √ ) =(<br />
2 0.04/ √ 2 −Ð0.05) ≥ 0.90 får vi, med hjälp av 1−(Ð) =,<br />
1−Ñ<br />
att<br />
0.04/ √ 2 −Ð0.05 ≥Ð1−0.90 =Ð0.1 och därmed att<br />
Ñ≤1−(Ð0.1 +Ð0.05)·<br />
√<br />
2<br />
−Ñ<br />
0.04<br />
√<br />
2<br />
= 1−(1.28+1.64)· 0.04 √<br />
2<br />
= 0.9172.<br />
Villkoret är alltså uppfyllt för allaÑ≤0.9172 (tsk).<br />
35