Báo cáo bài tập lớn môn xác suất thống kê GVHD Nguyễn Đình Huy
LINK DOCS.GOOGLE:
https://drive.google.com/file/d/0B_NNtKpVZTUYVDc1SVRHTDROdTA/view?usp=sharing
LINK DOCS.GOOGLE:
https://drive.google.com/file/d/0B_NNtKpVZTUYVDc1SVRHTDROdTA/view?usp=sharing
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM --oOo-- BÁO CÁO BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG KÊ GVHD: Nguyễn Đình Huy SVTH: MSSV: Nhóm : 8 TP HỒ CHÍ MINH - 8/2012
- Page 2 and 3: BÀI SỐ 8 1. Trình bày lại v
- Page 4 and 5: Chọn ô B7 và nhập biểu th
- Page 6 and 7: Sử dụng chương trình “ Reg
- Page 8 and 9: thống kê. Do vậy phương trì
- Page 11 and 12: Phương trình hồi quy Yx 1, x2
- Page 13 and 14: Thực hiện bài toán bằng Exc
- Page 15 and 16: Thị trường A B C Công ty 55 3
- Page 17 and 18: • Áp dụng hàm số CHITEST t
- Page 19 and 20: Ta gỉa thiết: Mực nước sô
- Page 21 and 22: đây: Thành phố I II III Loại
- Page 23: e. Được kết quả như sau :
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH<br />
TRƯỜNG ĐẠI HỌC BÁCH KHOA TP.HCM<br />
--oOo--<br />
BÁO CÁO BÀI TẬP LỚN MÔN<br />
XÁC SUẤT THỐNG KÊ<br />
<strong>GVHD</strong>: <strong>Nguyễn</strong> <strong>Đình</strong> <strong>Huy</strong><br />
SVTH:<br />
MSSV:<br />
Nhóm : 8<br />
TP HỒ CHÍ MINH - 8/2012
BÀI SỐ 8<br />
1. Trình bày lại ví dụ 3.4 trang 207 và ví dụ 4.2 trang 216 Sách BT XSTK 2012<br />
(N.Đ.HUY).<br />
Ví dụ 3.4 trang 207 sách BT<br />
Hiệu <strong>suất</strong> phần trăm (%) của một phản ứng hoá học được nghiên cứu theo ba yếu tố pH<br />
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:<br />
Yếu tố<br />
A<br />
Yếu tố B<br />
B1 B2 B3 B4<br />
A1 C1 9 C2 14 C3 16 C4 12<br />
A2 C2 12 C3 15 C4 12 C1 10<br />
A3 C3 13 C4 14 C1 11 C2 14<br />
A4 C4 10 C1 11 C2 13 C3 13<br />
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu <strong>suất</strong> phản ứng?<br />
• Dạng toán:<br />
Phân tích phương sai ba yếu tố<br />
• Cơ sở lý thuyết:<br />
Giải<br />
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các giá trị<br />
quan sát G (i = 1, 2... r: yếu tố A; j = 1, 2... r: yếu tố B; k = 1, 2... r: yếu tố C)<br />
• Mô hình:<br />
Khi nghiên cứu ảnh hưởng của 2 yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô<br />
hình vuông latinh n*n. Ví dụ như mô hình vuông latinh 4*4:<br />
B C D A<br />
C D A B<br />
D A B C<br />
A B C D<br />
Mô hình vuông latinh 3 yếu tố được trình bày như sau:<br />
Yếu tố C (T..k. ví dụ: T...1 = Y111 + Y421 + Y331 + Y241)
Trắc nghiệm<br />
Giả thiết:<br />
H 0 : µ 1 = µ 2 = ….= µ k Các giá trị trung bình bằng nhau<br />
H 1 : µ j ≠ µ k Có ít nhất hai giá trị trung bình khác nhau<br />
Giá trị <strong>thống</strong> <strong>kê</strong>: và <br />
Biện luận:<br />
- Nếu nhận H 0 (yếu tố A)<br />
- Nếu (chấp nhận H 0 (yếu tố B))<br />
- Nếu (chấp nhận H 0 (yếu tố C))<br />
Áp dụng MS-EXCEL:<br />
Thiết lập bảng tính như sau:<br />
Tính các giá trị Ti..(tổng theo hàng từ B đến E)
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)<br />
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)<br />
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)<br />
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)<br />
Tính các giá trị T.j.(tổng theo cột từ hàng thứ 2 đến hàng thứ 5)<br />
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)<br />
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến ô E8<br />
Tính các giá trị T..k<br />
Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)<br />
Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)<br />
Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)<br />
Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)<br />
Tính giá trị T..(tổng các phẩn tử trong bảng)<br />
Chọn ô B10 và nhập biểu thức =SUM(B2:E5)<br />
Tính các giá trị và <br />
Các giá trị và <br />
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)<br />
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9<br />
Giá trị <br />
Chọn ô G10 và nhập biểu thức =POWER(B10,2)<br />
Giá trị <br />
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)<br />
Tính các giá trị SSR,SSC,SSF,SST và SSE<br />
Các giá trị SSR,SSC và SSF<br />
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)<br />
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9<br />
Giá trị SST<br />
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)<br />
Giá trị SSE<br />
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)<br />
Tính các giá trị MSR,MSC,MSF và MSE<br />
Các giá trị MSR,MSC và MSF<br />
Giá trị SST<br />
Chọn ô K7 và nhập biểu thức =I7/(4-1)<br />
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9<br />
Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))<br />
Tính các giá trị và F<br />
Chọn ô M7 và nhập biểu thức =K7/0.3958<br />
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9<br />
Kết luận và Biện luận:<br />
• F R =3.10 < F 0.05 (3.6)= 4.76 =>chấp nhận H 0 (pH)<br />
• F C =11.95> F 0.05 (3.6) = 4.76 =>bác bỏ H 0 (nhiệt độ)<br />
• F =30.05 > F 0.05 (3.6) = 4.76 => bác bỏ H 0 (chất xúc tác)<br />
Kết luận:<br />
Vậy chỉ có nhiệt độ và chất xúc tác ảnh hưởng đến hiệu <strong>suất</strong>.<br />
VÍ DỤ 4.2<br />
Người ta đã dùng 3 mức nhiệt độ gồm 105, 120, 135 o C kết hợp với 3 khoảng thời<br />
gian là 15,30 và 60 phút để thực hiện một phản ứng tổng hợp. các hiệu <strong>suất</strong> phản ứng(%)<br />
được trình bày trong bảng sau:<br />
Thời gian(ph)<br />
X1<br />
nhiệt độ( độ C)<br />
X2<br />
hiệu <strong>suất</strong> %<br />
15 105 1.87<br />
30 105 2.02<br />
60 105 3.28<br />
15 120 3.05<br />
30 120 4.07<br />
60 120 5.54<br />
15 135 5.03<br />
30 135 6.45<br />
60 135 7.26<br />
Y<br />
Hãy cho biết yếu tố nhiệt độ và thời gian / hoặc yếu tố thời gian có liên quan tuyến<br />
tính với hiệu <strong>suất</strong> của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 150 0 C trong vòng<br />
50 phút thì hiệu <strong>suất</strong> phản ứng là bao nhiêu?<br />
Áp dụng MS EXCEL<br />
Nhập dữ liệu vào bảng tính ta được như sau:<br />
Giải
Sử dụng chương trình “ Regression” trong thẻ Data => Data Analysis<br />
Chọn OK hộp thoại Regression xuất hiện<br />
Trong hộp Regression,lần lượt ấn định các chi tiết<br />
- Phạm vi của biến số Y (Input Y Range)<br />
- Phạm vi của biến số X (Input Y Range)<br />
- Nhãn dữ liệu (Labels)<br />
- Mức tin cậy (Confidence Level)<br />
- Tọa độ đầu ra (Output Range)<br />
- Và một số tùy chọn khác như đường hồi quy (Line Fit Plots), biểu thức<br />
sai số (Residuals Plots)…..<br />
1. Phương trình hồi quy tương ứng X 1<br />
Kiểm định giả thiết H o : thời gian không liên quan tuyến tính với hiệu <strong>suất</strong> của<br />
phản ứng tổng hợp
Phương trình hồi quy<br />
Yx 1 = f ( x1)<br />
Yx 1 = 2.73 + 0.04x1<br />
(R 2 =0.21 ; S=1.81) (1)<br />
Ta có t o = 2.12903 < t 0.05 = 2.365 (P v 2 = 0.0708 > a = 0.05)<br />
⇒ chấp nhận giả thiết H o<br />
t 1 = 1.3802 < t 0.05 = 2.365 (P v = 0.2099 > a = 0.05) (Tra bảng STUDENT)<br />
⇒ chấp nhận giả thiết H o<br />
F = 1.905 < F 0.05 (1,7) = 5.590 (hay F s = 0.209 > a = 0.05) (Tra bảng FISHER)<br />
⇒ chấp nhận giả thiết H o<br />
Vậy cả 2 hệ số 2.73(B 0 ) và 0.04(B 4 ) của phương trình hồi quy (1) đều không có ý nghĩa
<strong>thống</strong> <strong>kê</strong>. Do vậy phương trình hồi quy này không thích hợp.<br />
Kết luận: Vậy yếu tố thời gian không liên quan tuyến tính với hiệu <strong>suất</strong> của phản ứng<br />
tổng hợp.<br />
2. Phương trình hồi quy tương ứng X 2<br />
Kiểm định giả thiết H o : nhiệt độ không liên quan tuyến tính với hiệu <strong>suất</strong> của<br />
phản ứng tổng hợp.<br />
Ta có kết quả:
Phương trình hồi quy<br />
Yx 2 = f ( x2)<br />
Yx 2 = − 11.141+<br />
0.1286x2<br />
(R 2 = 0.76 : S = 0.99) (2)<br />
Ta có t o =3.418 > t 0.05 = 2.365 (P v 2 = 0.0111< a = 0.05)<br />
⇒ bác bỏ giả H o<br />
t 2 = 4.757> t 0.05 = 2.365 (P v = 0.0021< a = 0.05) (Tra bảng STUDENT)<br />
⇒ bác bỏ giả thiết H o<br />
F= 22.631>F 0.05 (1,7) = 5.59 (F s =0.0021< a = 0.05) (Tra bảng FISHER)<br />
⇒ bác bỏ giả thiết H 0<br />
Ta cũng kết luận: Hai hệ số -11.141(B 0 ) và 0.1286(B 2 ) của phương trình hồi quy(2)<br />
đều có ý nghã <strong>thống</strong> <strong>kê</strong>. Hay nói phương trình hồi quy này phù hợp<br />
Vậy yếu tố nhiệt độ liên quan tuyến tính với hiệu <strong>suất</strong> của phản ứng tổng hợp.<br />
3. Phương trình hồi quy tương ứng X 1 ,X 2<br />
Kiểm định giả thiết H o : thời gian và nhiệt độ không liên quan tuyến tính với hiệu <strong>suất</strong> của<br />
phản ứng tổng hợp
Phương trình hồi quy<br />
Yx 1, x2 = f ( x1, x2)<br />
(R 2 = 0.9776 ; S = 0.3297) (3)<br />
Yx 1, x2 = − 12.70 + 0.04x1 + 0.1286x2<br />
Ta có t o = 11.528 > t 0.05 = 2.365 ( P v = 2.56x10^-5 < a = 0.05)<br />
⇒ bác bỏ giả thiết H 0<br />
t 1 = 7.5827> t 0.05 = 2.365 (P v =0.00027 < a = 0.05)<br />
⇒ bác bỏ giả thiết Ho<br />
t 2 = 14.3278 > t 0.05 = 2.365 (P v = 7.234x10^-6< a = 0.05) (Tra bảng STUDENT)<br />
⇒ bác bỏ giả thiết H 0<br />
F= 131.392 >F 0.05 (2,6) = 5.140 ( hay F s =1.112x10^-5 < a = 0.05) (Tra bảng FISHER)<br />
⇒ bác bỏ giả thiết H 0<br />
Vậy các hệ số -12.7(B 0 ) , 0.04(B 1 ) và 0.1286(B 0 ) của phương trình hồi quy (3) đều có ý<br />
nghĩa <strong>thống</strong> <strong>kê</strong>. Vậy phương trình này là phù hợp.<br />
Kết luận: thời gian và nhiệt độ có liên quan tuyến tính với hiệu <strong>suất</strong> của phản ứng tổng<br />
hợp.<br />
Sự tuyến tính của phương trình Yx 1, x2 = − 12.70 + 0.04x1 + 0.1286x2<br />
Dự đoán hiệu <strong>suất</strong> phản ứng bằng phương trình hồi quy (3) ta làm như sau.<br />
Hiệu <strong>suất</strong> dự đoán = B 0 + B 1 *50 + B 2 *115<br />
Với B 0 , B 1, B 2 là hệ số phương trình hồi quy (3)
Kết quả thu được như sau:<br />
Coefficients<br />
Standard<br />
Error<br />
t Stat<br />
Intercept -12.7 1.101639 -11.5283<br />
X1 0.04454 0.005874 7.582718<br />
X2 0.128556 0.008972 14.32782<br />
Dự đoán 4.310873<br />
BÀI 2<br />
2. Đo đường kính X và chiều cao Y của 20 cây ta thu được số liệu sau:<br />
X 2,3 2,5 2,6 3,1 3,4 3,7 7,3<br />
Y 7 8 4 4 6 6 14<br />
X 3,9 4 4,1 4,1 4,2 4,4<br />
Y 12 8 5 7 8 7<br />
X 4,7 5,1 5,5 5,8 6,2 6,9 6,9<br />
Y 9 10 13 7 11 11 16<br />
a) Tìm đường hồi quy của Y đối với X.<br />
b) Tính sai số tiêu chuẩn của đường hồi quy.<br />
c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính giữa Y với X.<br />
tuyến tính<br />
Giả thiết :<br />
Nhận xét :Đây là <strong>bài</strong> toán phân tích hồi quy<br />
H 0 : βi = 0 “Phương trình hồi quy không thích hợp”<br />
H 0 : βi ≠ 0 “Phương trình hồi quy thích hợp”<br />
Giá trị <strong>thống</strong> <strong>kê</strong>:<br />
F =<br />
MSF<br />
MSE<br />
Phân bố Fisher v1 = 1, v2 = N-2<br />
Kết luận<br />
Nếu F < Fα (1,N-2) => Chấp nhận giả thiết H 0
Thực hiện <strong>bài</strong> toán bằng Excel<br />
Thiết lập bảng tính Regression:<br />
Nhập dữ liệu vào bảng tính :<br />
Sau đó vào Data /Data analysis, chọn Regression.<br />
Trong hộp thoại Regression lần lượt ấn định:<br />
• Phạm vi đầu vào: Input Y Range, quét vùng(B3:B23).<br />
Input X Range, quét vùng(A3:A23).<br />
• Chọn Labels (thêm nhãn dữ liệu).<br />
• Phạm vi đầura: Output Range, chọn ô D3.<br />
• Chọn Line Fit Plots trong Residuals để vẽ đường hồi quy.<br />
Sau đó nhấn OK ta có kết quả :
Kết luận :<br />
Đường hồi quy của Y đốivới X là : Y=1.67689X+1.045276<br />
X Line Fit Plot<br />
Y<br />
Y<br />
Predicted Y<br />
X<br />
Sai số tiêu chuẩn của đường hồi quy : 2,22<br />
Ta thấy: F = 24,3 > c = 4,41<br />
(tra bảng phân tố Fisher với bậc tự do (1,18) ở mức 0,05)<br />
Vậy: có hồi quy tuyến tính giữa Y với X.<br />
Có hồi quy tuyến tính giữa đường kính và chiều cao<br />
BÀI 3<br />
Một công ty muốn mở rộng việc bán sản phẩm sang 3 thị trường nước ngoài. Để<br />
đánh giá xem thị phần mà công ty có thể chiếm lĩnh được tại ba thị trường đó so với<br />
các đối thủ cạnh tranh có khác nhau hay không người ta đã thủ nghiệm thị trường<br />
bằng cách bán thử sản phẩm cho 150 khách hàng tiềm năng tại mỗi thị trường và thu<br />
được kết quả sau:
Thị trường<br />
A B C<br />
Công ty 55 38 24<br />
Đối thủ cạnh tranh 1 28 30 21<br />
Đối thủ cạnh tranh 2 20 18 31<br />
Các đối thủ khác 47 64 74<br />
Hãy tìm P-value để kiểm định xem cơ cấu của ba thị trường trên có khác nhau<br />
hay không.<br />
CƠ SỞ LÍ THUYẾT: Dạng <strong>bài</strong> so sánh tỷ số đơn giản.<br />
Giả thiết:<br />
H 0 : P 1 =P 1,0 ; P 2= P 2,0 ;….; P k,0 các cặp P i và P i,0 giống nhau.<br />
H 1 : có ít nhất một cặp P i và P i,0 khác nhau.<br />
Giá trị <strong>thống</strong> <strong>kê</strong><br />
2 <br />
=∑ <br />
<br />
O i : các tần số thực nghiệm.<br />
E i : các tần số lý thuyết.<br />
• Biện luận:<br />
χ 1 > χ 2 (a) bác bỏ giả thiết H o (DF=K-1)<br />
Trong Excel có hàm Chitest có thể tính giá trị χ 2 theo biểu thức:<br />
2 <br />
<br />
=∑ ∑<br />
ị ị <br />
ị<br />
O i j : các tần số thực nghiệm của ô thuộc hàng thứ I cột j.<br />
E i j<br />
<br />
: các tần số lý thuyết của ô thuộc hàng thứ I cột j; r là số hàng; c là số<br />
cột.<br />
• Xác <strong>suất</strong> P(X > 2 )<br />
với bậc tự do DF= (r-1) (c-1)<br />
Nếu P(X > )<br />
⇒ chấp nhận giả thiết H o và ngược lại.<br />
Nhập giá trị vào bảng tính:<br />
THỰC HIỆN BÀI TOÁN BẰNG EXCEL
Tính tổng các số:<br />
• Tổng hàng: Chọn F3, nhập =SUM(B3:D3), rồi Enter, dùng con trỏ kéo nút tự<br />
điều khiển từ điền từ F3 đến F6.<br />
• Tổng cột: Chọn B8, nhập =SUM(B3:B6), rồi Enter, dùng con trỏ kéo nút tự<br />
điều khiển từ B8 đến D8.<br />
• Tổng cộng: chọn F8 và nhập =SUM(F3:F6) hay nhập =SUM(B8:D8)<br />
Tính các tần số lý thuyết: (tổng hàng*tổng cột)/tổng cộng<br />
• A: Chọn B12: nhập =F3*$B$8/$F$8, rồi Enter, dùng con trỏ kéo nút tự điều<br />
khiển từ B12 đến B15.<br />
• B: Chọn C12: nhập =F3*$C$8/$F$8, rồi Enter, dùng con trỏ kéo nút tự điều<br />
khiển từ C12 đến C15.<br />
• C: Chọn D12: nhập =F3*$D$8/$F$8, rồi Enter, dùng con trỏ kéo nút tự điều<br />
khiển từ D12 đến D15<br />
.
• Áp dụng hàm số CHITEST tính giá trị <br />
Chọn B17, nhập =CHITEST(B3:D6,B12:D15), rồi Enter<br />
Hoặc chọn Formulas → Insert Function → chitest → OK<br />
Xuất hiện hộp thoại Function Agruments<br />
• Nhập các giá trị tần số quan sát vào mục Actual_range<br />
• Nhập các giá trị tần số lí thuyết vào mục Expected_range. Chọn OK<br />
Ta được P = 0.00044854 0.05 nên bác bỏ giả thuyết .<br />
Kết luận: Như vậy cơ cấu 3 thị trường trên là không giống nhau<br />
BÀI 4<br />
4.Người ta tiến hành đo mực nước sông tại một số địa điểm thuộc tỉnh X trong cùng<br />
một ngày (số lần đo không giống nhau) và thu được bảng số liệu sau đây:<br />
Thời điểm<br />
đo<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
Địa điểm đo<br />
F1 F2 F3 F4<br />
5,5 4,9 4,6 4,5<br />
5,6 5,1 4,8 6,2<br />
5,8 6,5 5,8 4,8<br />
5,9 5,4 5,1 4,8<br />
6,0 6,1 6,2 6,5<br />
6,7<br />
7,1 6,8<br />
7,2<br />
Với mức ý nghĩa α = 2%.Mực nước sông trung bình/ngày của các điểm nói trên có<br />
thực sự khác nhau không?
BÀI GIẢI<br />
I.Cở sở lý thuyết:<br />
a.Dạng <strong>bài</strong> toán : Phân tích phương sai 1 yếu tố<br />
b.Khái niệm <strong>thống</strong> <strong>kê</strong> và giả thuyết <strong>bài</strong> toán:<br />
Sự phân tích phương sai 1 yếu tố là đánh giá sự ảnh hưởng của một yếu tố (nhân tạo hay tự<br />
nhiên) nào đó trên các giá trị quan sát , Y i ,(i=1,2,…,k)<br />
Yếu tố thí nghiệm<br />
1 2 … K<br />
Y 11<br />
Y 12<br />
…<br />
Y 1N<br />
Y 21<br />
Y 22<br />
…<br />
Y 2N<br />
…<br />
…<br />
…<br />
…<br />
Y k1<br />
Y k2<br />
…<br />
Y kN<br />
Tổng cộng<br />
Trung bình<br />
T .1<br />
Y<br />
.1<br />
T .2<br />
Y<br />
.2<br />
…<br />
…<br />
T k<br />
Y .<br />
Y<br />
T ..<br />
c<br />
..<br />
Bảng ANOVA<br />
Nguồn sai<br />
số<br />
Yếu tố<br />
Sai số<br />
Bậc tự<br />
do<br />
(k-1)<br />
N-k<br />
Tổng số bình phương<br />
SSF<br />
=<br />
k<br />
∑<br />
i=<br />
1<br />
T<br />
N<br />
2<br />
i<br />
T..<br />
−<br />
N<br />
2<br />
Bình phương<br />
trung bình<br />
SSF<br />
MSF =<br />
( k −1)<br />
SSE<br />
MSE =<br />
SSE = SST – SSF ( N − k)<br />
Giá trị<br />
<strong>thống</strong> <strong>kê</strong><br />
MSF<br />
F =<br />
MSE<br />
F C<br />
=<br />
MSF<br />
MSE<br />
Tổng cộng (N-1)<br />
SST<br />
=<br />
k<br />
N<br />
∑∑<br />
i= 1 j=<br />
1<br />
Y<br />
2<br />
ij<br />
T..<br />
−<br />
N<br />
2<br />
Trắc nghiệm<br />
Giả thiết:<br />
H 0 : µ<br />
1<br />
= µ<br />
2<br />
= ... µ<br />
k<br />
⇔ “ Các giá trị trung bình bằng nhau”<br />
H 1 : µ ≠ ⇔ “ Ít nhất có hai giá trị trung bình khác nhau”<br />
i<br />
µ<br />
j<br />
Giá trị <strong>thống</strong> <strong>kê</strong>:<br />
MSF<br />
F =<br />
MSE<br />
Biện luận :<br />
Nếu F < Fa [ k −1,<br />
N − k]<br />
⇒ chấp nhận giả thiết H 0.
Ta gỉa thiết:<br />
Mực nước sông trung bình/ngày của các điểm đã đo là như nhau.<br />
Nhập bảng số liệu:<br />
THỰC HIỆN BÀI TOÁN BẰNG EXEL<br />
Nhấp vào lệnh Data va lệnh Data Analysis.<br />
Chọn chương trình Anova:Single Factor trong hộp thoại Data Analysis rồi nhấn OK.<br />
Trong hộp Anova:Single Factor lần lượt ấn định:<br />
Phạm vi đầu vào (Input Range):ta kéo từ B2 đến E9.<br />
Cách sắp xếp theo hàng hay cột (Group By):Chọn Columns.<br />
Nhấn dữ liệu (Labels in Fisrt row/column).<br />
Phạm vi đầu ra (Output Range):Chọn A12.
Được kết quả:<br />
Biện luận:<br />
F=0.598833 < F 0,02 =4.113404<br />
Chấp nhận giả thiết H 0 .<br />
Vậy mực nước sông trung bình của các điểm đã cho là như nhau<br />
BÀI 5<br />
5. Với mức ý nghĩa α = 5%. So sánh chi phí cho ba loại dịch vụ ở ba thành phố khác<br />
nhau bằng phương phương phân tích phương sai trên cơ sở bảng số liệu sau
đây:<br />
Thành phố<br />
I<br />
II<br />
III<br />
Loại dịch vụ<br />
I II III<br />
61<br />
58<br />
68<br />
52<br />
51<br />
64<br />
69<br />
61<br />
79<br />
Các con số trong ô là chi phí trung bình cho 1 lần dịch vụ (đơn vị: 1000đ)<br />
1. Cơ sở lý thuyết :<br />
a. Dạng <strong>bài</strong> toán : Phân tích phương sai 2 nhân tố không liên quan<br />
b. Khái niệm <strong>thống</strong> <strong>kê</strong> và giả thiết <strong>bài</strong> toán :<br />
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Y ij<br />
( i = 1.2…r : yếu tố A; j = 1.2…c : yếu tố B).<br />
Mô hình<br />
Yếu tố A<br />
1<br />
2<br />
…<br />
r<br />
Tổng cộng<br />
Trung bình<br />
1 2<br />
Yếu tố B<br />
… C Tổng cộng<br />
Y 11 Y 12 … Y 1c Y 1<br />
Y r1 … Y rc<br />
Y 21 Y 22 … Y 2c Y 2<br />
… … … … …<br />
T .1<br />
Y<br />
.1<br />
Y r2<br />
T .2<br />
Y<br />
.2<br />
…<br />
…<br />
T .c<br />
Y .<br />
Y<br />
T ..<br />
c<br />
Trung bình<br />
Y<br />
1<br />
Y<br />
2<br />
Y r<br />
..<br />
…<br />
Y<br />
r<br />
Bảng ANOVA<br />
Nguồn sai Bậc tự<br />
số do<br />
Yếu tố A (r-1)<br />
(hàng)<br />
Yếu tố B<br />
(cột)<br />
(c-1)<br />
Tổng số bình phương<br />
SSB =<br />
SSB =<br />
r<br />
∑<br />
i=<br />
1<br />
c<br />
∑<br />
j=<br />
1<br />
T<br />
T<br />
2<br />
i<br />
c<br />
2<br />
j<br />
r<br />
2<br />
T..<br />
−<br />
rc<br />
2<br />
T..<br />
−<br />
rc<br />
Bình phương<br />
trung bình<br />
SSB<br />
MSB =<br />
( r −1)<br />
MSF<br />
SSF<br />
=<br />
( c −1)<br />
Giá trị<br />
<strong>thống</strong> <strong>kê</strong><br />
MSB<br />
F R<br />
=<br />
MSE<br />
F C<br />
=<br />
MSF<br />
MSE<br />
Sai số (r-1)(c-1) SSE = SST – (SSF + SSB)<br />
Tổng cộng (rc-1)<br />
SST =<br />
r<br />
c<br />
∑∑<br />
i= 1 j=<br />
1<br />
Y<br />
2<br />
ij<br />
T..<br />
−<br />
r<br />
2<br />
SSB<br />
MSB =<br />
( r −1)
Trắc nghiệm<br />
• Giả thiết:<br />
H 0 : µ<br />
1<br />
= µ<br />
2<br />
= ... µ<br />
k<br />
⇔ “ Các giá trị trung bình bằng nhau”<br />
H 1 : µ ≠ ⇔ “ Ít nhất có hai giá trị trung bình khác nhau”<br />
i<br />
µ<br />
j<br />
• Giá trị <strong>thống</strong> <strong>kê</strong>:<br />
MSB<br />
F R<br />
= và F C<br />
=<br />
MSE<br />
MSF<br />
MSE<br />
• Biện luận :<br />
Nếu FR < Fa<br />
[ b −1,(<br />
k −1)(<br />
b −1)]<br />
⇒ chấp nhận H 0 (yếu tố A)<br />
Nếu FC < Fa<br />
[ k −1,(<br />
k −1)(<br />
b −1)]<br />
⇒ chấp nhận H 0 (yếu tố B)<br />
2. Áp dụng MS Excel :<br />
a.Nhập các số liệu vào bảng<br />
b. Nhấp lần lượt Data tab và Data Analysis tab.<br />
c. Chọn chương trình Anova : Two-Factor Without Replication trong hộp thoại Data<br />
Analysis rồinhấp nút OK.<br />
d. Trong hộp thoại Anova: Single Factor lần lượt <strong>xác</strong> định:<br />
- Phạm vi đầu vào (Input Range)<br />
- Cách sắp xếp theo hàng hay cột (Group by)<br />
- Nhãn dữ liệu (Label in First Row/Column).<br />
- Phạm vi đầu ra (Output Range)
e. Được kết quả như sau :<br />
Biện luận :<br />
F R = 24,91589 > F 0,05 = 6.944272 → Bác bỏ giả thuyết H 0 ( Thành phố)<br />
F C = 24,7477 > F 0,05 = 6.944272 → Bác bỏ giả thuyết H 0 ( Loại dịch vụ)<br />
Vậy chi phí cho 3 loại dich vụ ở 3 thành phố khác nhau không chịu ảnh hưởng của thành<br />
phố hay loại dịch vụ nên chúng giống nhau