30.06.2013 Views

ดาวน์โหลด All Proceeding - AS Nida

ดาวน์โหลด All Proceeding - AS Nida

ดาวน์โหลด All Proceeding - AS Nida

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

2. ตัวแบบและทฤษฏีที่เกี่ยวของ<br />

2.1 ตัวแบบการถดถอยโลจิสติกแบบ 2 ประเภท (Binary<br />

Logistic Regression Model)<br />

เปนตัวแบบที่ศึกษาถึงความสัมพันธของตัวแปร<br />

2 กลุม<br />

ไดแก<br />

กลุมตัวแปรอิสระ<br />

(X) และกลุมของตัวแปรตาม<br />

(Y) ซึ่งตัวแปรตามนี้เปน<br />

ตัวแปรเชิงคุณภาพมีคาไดเพียง 2 คา โดยพิจารณาในรูปของความสําเร็จ<br />

และความลมเหลว โดยที่<br />

Y=1 เมื่อพบความสําเร็จ<br />

และ Y=0 เมื่อพบความ<br />

ลมเหลว ซึ่งเมื่อไดตัวแบบความสัมพันธระหวางตัวแปรแลวจะสามารถ<br />

นําไปใชพยากรณโอกาสที่แตละหนวยจะอยูในกลุมใดกลุมหนึ่งได<br />

ตัวแบบการถดถอยโลจิสติกแบบ 2 ประเภท สําหรับการ<br />

พยากรณการจําแนกกลุม[2]<br />

เปนไปดังนี้<br />

จาก (1)<br />

เนื่องจากตัวแปรตาม<br />

Y มีคาไดเพียง 2 คา คือ 0 และ 1 ดังนั้น<br />

จึงมีการแจก<br />

แจงแบบเบอรนูลลี (Bernoulli Distribution)<br />

เมื่อเราทราบการแจกแจงของ<br />

Y เราสามารถสรางฟงกชัน<br />

ภาวะนาจะเปนได เนื่องจากการประมาณคาไมไดเปนไปตามรูปแบบ<br />

เรา<br />

จึงตองใชวิธีการประมาณเชิงตัวเลข(จําเปนตองทําซ้ําเพื่อใหไดซึ่งตัว<br />

ประมาณภาวะนาจะเปนสูงสุด(MLE) โดยทําการทําซ้ํา<br />

1 ครั้งจะไดตัว<br />

ประมาณภาวะนาจะเปนสูงสุด แลวทําการคํานวณ<br />

คาประมาณของ ดังนี้<br />

เมื่อประมาณคาพารามิเตอรดวยภาวะความนาจะเปนสูงสุดในตัว<br />

แบบถดถอยโลจิสติกแบบ 2 ประเภท แลวจะสามารถนําไปใชในการ<br />

พยากรณการจําแนกกลุมของตัวแบบ<br />

ดังนี้<br />

หนวยที่<br />

ถูกจัดใหอยูในกลุมที่เกิดสิ่งที่สนใจ<br />

ถา<br />

หนวยที่<br />

ถูกจัดใหอยูในกลุมที่ไมเกิดสิ่งที่สนใจ<br />

ถา<br />

เมื่อ<br />

c คือ จุดแบง หรือ ระดับของความนาจะเปนที่ใชในการ<br />

พิจารณาการจําแนกกลุมวาแตละหนวยจะอยูในกลุมใดระหวางกลุมการ<br />

เกิดเหตุการณที่สนใจ<br />

และกลุมที่ไมเกิดเหตุการณที่สนใจ<br />

(2)<br />

350<br />

2.2 ตัวแบบคอมพลีเมนทารีล็อก-ล็อก (Complementary loglog<br />

Model)<br />

ตัวแบบคอมพลีเมนทารีล็อก-ล็อก (Complementary log-log<br />

model) เปนสวนที่ขยายจากตัวแบบโลจิท<br />

(Logit model) และตัวแบบโพ<br />

รบิท (Probit model) เมื่อคา<br />

เพิ่มขึ้นจาก<br />

0 คอนขางชา แตคาของ<br />

จะมีคาเขาใกล 1 อยางรวดเร็ว และเหมาะกับขอมูลที่มีการกระจายแบบ<br />

ไมสมมาตร<br />

ตัวแบบคอมพลีเมนทารีล็อก-ล็อกในรูปความสัมพันธเชิงเสน<br />

(4)<br />

โดยที่<br />

และ<br />

คือ คาความนาจะเปนเมื่อเกิดเหตุการณที่สนใจในหนวยที่<br />

คือ ตัวแปรตามเชิงคุณภาพที่มีคาไดเพียง<br />

2 คา คือ 0 และ 1<br />

คือ ตัวแปรแฝง(Latent variable) ที่ไมสามารถสังเกตไดจึงไม<br />

ทราบคาที่แทจริงทราบเพียงแตผลที่เกิดขึ้น<br />

คือ เวกเตอรตัวแปรอิสระหนวยที่<br />

คือ เวกเตอรพารามิเตอรของตัวแบบ<br />

คือ ตัวแปรคาคลาดเคลือนที่เปนอิสระกัน<br />

หรือคาคาดหมาย<br />

อยางมีเงื่อนไข(Conditional<br />

expectation) หนวยที่<br />

ตัว แปรสุมปกติ<br />

มาตราฐาน โดย<br />

2.3 การประมาณคาพารามิเตอรดวยวิธีภาวะนาจะเปนสูงสุด<br />

(Maximum Likelihood Estimation)<br />

การหาคาตัวประมาณคาสัมประสิทธิ์การถดถอยดวยวิธีภาวะ<br />

นาจะเปนสูงสุด[3] คือตองทําให L มีคามากที่สุดโดยทําการหาอนุพันธ<br />

เทียบกับ ตางๆ เมื่อเราทราบการแจกแจงของ<br />

Y เราจะสามารถสราง<br />

ฟงกชันภาวะนาจะเปนได เนื่องจากการประมาณคาไมไดเปนไปตาม<br />

รูปแบบ เราจึงตองใชวิธีการประมาณเชิงตัวเลข (จําเปนตองทําซ้ําเพื่อให<br />

ไดมาซึ่งตัวประมาณภาวะนาจะเปนสูงสุด<br />

(MLE) โดยในการทําซ้ํา<br />

1 ครั้ง<br />

จะไดตัวประมาณภาวะนาจะเปนสูงสุด<br />

แลวทําการคํานวณคาประมาณของ โดยที่<br />

ดังนี้<br />

(3)<br />

; (5)<br />

เมื่อประมาณคาพารามิเตอรดวยวิธีภาวะนาจะเปนสูงสุดในตัว<br />

แบบการถดถอยโลจิสติกแบบ 2 ประเภทแลว จะสามารถนําไปใชในการ<br />

พยากรณการจําแนกกลุมของตัวแบบ<br />

ดังนี้

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!