ดาวน์โหลด All Proceeding - AS Nida
ดาวน์โหลด All Proceeding - AS Nida
ดาวน์โหลด All Proceeding - AS Nida
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
2. ตัวแบบและทฤษฏีที่เกี่ยวของ<br />
2.1 ตัวแบบการถดถอยโลจิสติกแบบ 2 ประเภท (Binary<br />
Logistic Regression Model)<br />
เปนตัวแบบที่ศึกษาถึงความสัมพันธของตัวแปร<br />
2 กลุม<br />
ไดแก<br />
กลุมตัวแปรอิสระ<br />
(X) และกลุมของตัวแปรตาม<br />
(Y) ซึ่งตัวแปรตามนี้เปน<br />
ตัวแปรเชิงคุณภาพมีคาไดเพียง 2 คา โดยพิจารณาในรูปของความสําเร็จ<br />
และความลมเหลว โดยที่<br />
Y=1 เมื่อพบความสําเร็จ<br />
และ Y=0 เมื่อพบความ<br />
ลมเหลว ซึ่งเมื่อไดตัวแบบความสัมพันธระหวางตัวแปรแลวจะสามารถ<br />
นําไปใชพยากรณโอกาสที่แตละหนวยจะอยูในกลุมใดกลุมหนึ่งได<br />
ตัวแบบการถดถอยโลจิสติกแบบ 2 ประเภท สําหรับการ<br />
พยากรณการจําแนกกลุม[2]<br />
เปนไปดังนี้<br />
จาก (1)<br />
เนื่องจากตัวแปรตาม<br />
Y มีคาไดเพียง 2 คา คือ 0 และ 1 ดังนั้น<br />
จึงมีการแจก<br />
แจงแบบเบอรนูลลี (Bernoulli Distribution)<br />
เมื่อเราทราบการแจกแจงของ<br />
Y เราสามารถสรางฟงกชัน<br />
ภาวะนาจะเปนได เนื่องจากการประมาณคาไมไดเปนไปตามรูปแบบ<br />
เรา<br />
จึงตองใชวิธีการประมาณเชิงตัวเลข(จําเปนตองทําซ้ําเพื่อใหไดซึ่งตัว<br />
ประมาณภาวะนาจะเปนสูงสุด(MLE) โดยทําการทําซ้ํา<br />
1 ครั้งจะไดตัว<br />
ประมาณภาวะนาจะเปนสูงสุด แลวทําการคํานวณ<br />
คาประมาณของ ดังนี้<br />
เมื่อประมาณคาพารามิเตอรดวยภาวะความนาจะเปนสูงสุดในตัว<br />
แบบถดถอยโลจิสติกแบบ 2 ประเภท แลวจะสามารถนําไปใชในการ<br />
พยากรณการจําแนกกลุมของตัวแบบ<br />
ดังนี้<br />
หนวยที่<br />
ถูกจัดใหอยูในกลุมที่เกิดสิ่งที่สนใจ<br />
ถา<br />
หนวยที่<br />
ถูกจัดใหอยูในกลุมที่ไมเกิดสิ่งที่สนใจ<br />
ถา<br />
เมื่อ<br />
c คือ จุดแบง หรือ ระดับของความนาจะเปนที่ใชในการ<br />
พิจารณาการจําแนกกลุมวาแตละหนวยจะอยูในกลุมใดระหวางกลุมการ<br />
เกิดเหตุการณที่สนใจ<br />
และกลุมที่ไมเกิดเหตุการณที่สนใจ<br />
(2)<br />
350<br />
2.2 ตัวแบบคอมพลีเมนทารีล็อก-ล็อก (Complementary loglog<br />
Model)<br />
ตัวแบบคอมพลีเมนทารีล็อก-ล็อก (Complementary log-log<br />
model) เปนสวนที่ขยายจากตัวแบบโลจิท<br />
(Logit model) และตัวแบบโพ<br />
รบิท (Probit model) เมื่อคา<br />
เพิ่มขึ้นจาก<br />
0 คอนขางชา แตคาของ<br />
จะมีคาเขาใกล 1 อยางรวดเร็ว และเหมาะกับขอมูลที่มีการกระจายแบบ<br />
ไมสมมาตร<br />
ตัวแบบคอมพลีเมนทารีล็อก-ล็อกในรูปความสัมพันธเชิงเสน<br />
(4)<br />
โดยที่<br />
และ<br />
คือ คาความนาจะเปนเมื่อเกิดเหตุการณที่สนใจในหนวยที่<br />
คือ ตัวแปรตามเชิงคุณภาพที่มีคาไดเพียง<br />
2 คา คือ 0 และ 1<br />
คือ ตัวแปรแฝง(Latent variable) ที่ไมสามารถสังเกตไดจึงไม<br />
ทราบคาที่แทจริงทราบเพียงแตผลที่เกิดขึ้น<br />
คือ เวกเตอรตัวแปรอิสระหนวยที่<br />
คือ เวกเตอรพารามิเตอรของตัวแบบ<br />
คือ ตัวแปรคาคลาดเคลือนที่เปนอิสระกัน<br />
หรือคาคาดหมาย<br />
อยางมีเงื่อนไข(Conditional<br />
expectation) หนวยที่<br />
ตัว แปรสุมปกติ<br />
มาตราฐาน โดย<br />
2.3 การประมาณคาพารามิเตอรดวยวิธีภาวะนาจะเปนสูงสุด<br />
(Maximum Likelihood Estimation)<br />
การหาคาตัวประมาณคาสัมประสิทธิ์การถดถอยดวยวิธีภาวะ<br />
นาจะเปนสูงสุด[3] คือตองทําให L มีคามากที่สุดโดยทําการหาอนุพันธ<br />
เทียบกับ ตางๆ เมื่อเราทราบการแจกแจงของ<br />
Y เราจะสามารถสราง<br />
ฟงกชันภาวะนาจะเปนได เนื่องจากการประมาณคาไมไดเปนไปตาม<br />
รูปแบบ เราจึงตองใชวิธีการประมาณเชิงตัวเลข (จําเปนตองทําซ้ําเพื่อให<br />
ไดมาซึ่งตัวประมาณภาวะนาจะเปนสูงสุด<br />
(MLE) โดยในการทําซ้ํา<br />
1 ครั้ง<br />
จะไดตัวประมาณภาวะนาจะเปนสูงสุด<br />
แลวทําการคํานวณคาประมาณของ โดยที่<br />
ดังนี้<br />
(3)<br />
; (5)<br />
เมื่อประมาณคาพารามิเตอรดวยวิธีภาวะนาจะเปนสูงสุดในตัว<br />
แบบการถดถอยโลจิสติกแบบ 2 ประเภทแลว จะสามารถนําไปใชในการ<br />
พยากรณการจําแนกกลุมของตัวแบบ<br />
ดังนี้