ดาวน์โหลด All Proceeding - AS Nida

ดาวน์โหลด All Proceeding - AS Nida ดาวน์โหลด All Proceeding - AS Nida

as.nida.ac.th
from as.nida.ac.th More from this publisher
30.06.2013 Views

เมื่อ มีการแจกแจงแบบเบอรนูลลีที่เปนอิสระกันมีคาเฉลี่ยและความ แปรปรวน ดังนี้ ดังนั้น ตัวแบบการถดถอยคือ เมื่อ ตัวแบบคอมพลีเมนทารีล็อก-ล็อก (Complementary log-log Model) ตัวแบบคอมพลีเมนทารีล็อก-ล็อก(Complementary log-log model) เปนสวนที่ขยายจากตัวแบบโลจิท(Logit model) และตัวแบบโพ รบิท(Probit model) เมื่อคา มีคาเขาใกล 1 อยางรวดเร็ว เพิ่มขึ้นจาก 0 คอนขางชา แตคาของ จะ สําหรับ ฟงกชันเชื่อมโยง(Link Function) ที่ใชในตัวแบบ โลจิทและโพรบิทนั้นจะมีคุณสมบัติสมมาตร(Symmetric) หรือ รอบคา 0.5 นั้นคือจากฟงกชันโลจิท ่ ่ จาก หมายถึงโคงของ สําหรับตัวแบบโลจิทและตัวแบบโพรบิทจะมีรูปแบบสมมาตรรอบจุด ที โดยเฉพาะเมื่อ จะมีคาเขาใกล 0 ดวยอัตราที่เทากันกับ เมื่อ จะมีคาเขาใกล 1 อยางรวดเร็ว แตถา เพิ่มขึ้นจาก 0 คอนขางชา แตมีคาเขาใกล 1 อยาง รวดเร็วดังรูปที 1ดวยตัวแบบโลจิทและตัวแบบโพรบิท จึงไมเหมาะสม กับขอมูล จึงควรใชตัวแบบอื่นคือตัวแบบคอมพลีเมนทารีล็อก-ล็อก และ ลักษณะของกราฟของ ดังรูปที่1 สําหรับตัวแบบคอมพลีเมนทารีล็อก-ล็อกแสดง รูปที่ 1 กราฟของ สําหรับตัวแบบคอมพลีเมนทารีล็อก-ล็อก 326 จากลักษณะของกราฟ ขางตน ควรใชเสนโคงฟงกชัน คือ ซึ่งมีรูปแบบไมสมมาตรคือ มีคาลดลงจาก 1รวดเร็วกวาาร เขาใกล 0 โดยสอดคลองกับรูปที่1ฟงกชัน (2) นําไปสูตัวแบบคอม พลีเมนทารีล็อก-ล็อกในสมการ (3) คือ (3) ตัวแบบคอมพลีเมนทารีล็อก-ล็อกในรูปความสัมพันธเชิงเสน โดย คือ คาความนาจะเปนเมื่อเกิดเหตุการณที่สนใจในหนวยที่ คือ ตัวแปรตามเชิงคุณภาพที่มีคาไดเพียง 2 คา คือ 0 และ 1 คือ ตัวแปรแฝง(Latent variable)ที่ไมสามารถสังเกตได จึงไมทราบ คาที่แทจริงทราบเพียงแตผลที่เกิดขึ้น คือ เวกเตอรตัวแปรอิสระหนวยที่ คือ เวกเตอรพารามิเตอรของตัวแบบ คือ ตัวแปรคาคลาดเคลือนที่เปนอิสระกัน หรือคาคาดหมายอยางมี เงื่อนไข(Conditional expectation) หนวยที่ ตัวแปรสุมปกติมาตราฐาน โดย เมื่อแตละคาสังเกต คือตัวแปรสุมแบบเบอรนูลลี ซึ่ง ซึ่งมีการแจกแจงความนาจะเปนคือ โดย ฟงกชั่นความนาจะเปนรวมคือ (2)

ลอการิทึมธรรมชาติของฟงกชั่นความนาจะเปนรวมคือ เมื่อ ดังนั้น ลอการิทึมธรรมชาติของฟงกชันภาวะนาจะเปน (Log-likelihood function) คือ เมื่อเราทราบการแจกแจงของ เราสามารถสรางฟงกชันภาวะ นาจะเปนได เนื่องจากการประมาณคาไมไดเปนไปตามรูปแบบ เราจึง ตองใชวิธีการประมาณเชิงตัวเลข(จําเปนตองทําซ้ําเพื่อใหไดซึ่งตัว ประมาณความนาจะเปนสูงสุด (Maximum Likelihood Estimator: MLE) โดยการทําซ้ํา 1 ครั้งจะไดตัวประมาณภาวะนาจะเปน สูงสุด แลวทําการคํานวนคาประมาณของ ดังนี้ เมื่อประมาณคาพารามิเตอรดวยวิธีภาวะความนาเปนสูงสุดใน ตัวแบบการถดถอยโลจิสติกทวินาม แลวจะสามารถนําไปใชในการ พยากรณการจําแนกกลุมของตัวแบบตอไป 2.2เสนโคง ROC (Receiver Operating Characteristic Curve) Receiver Operating Characteristic Curve หรือเรียกงายๆ วา “ROC Curve” ถูกนํามาใชในการประเมินความถูกตองของการพยากรณ เหตุการณในระบบจําแนกกลุมกรณีแบงเปน 2 กลุม ไดแก กลุมที่เกิด เหตุการณที่สนใจและกลุมที่ไมเกิดเหตุการณที่สนใจ โดยอยูในรูปของ กราฟที่พล็อตระหวางคา Sensitivity หรือ True-Positive Rate ซึ่งเปน อัตราสวนของการพยากรณถูกตองของการเกิดเหตุการณที่ สนใจ และคา 1-Specificity หรือ False-Positive Rate ซึ่งเปน อัตราสวนของการพยากรณผิดของการไมเกิดเหตุการณที่สนใจ โดยจะกําหนดให 1-Specificity อยูบนแกน และ Sensitivity อยูบน แกน และกราฟอยูในชวง ดังรูปที่ 2 327 รูปที่ 2 ตัวอยางเสนโคงและพื้นที่ใตโคง สําหรับการคํานวนคา Sensitivity และ 1-Specificity จะทํา โดยการกําหนดคาจุดตัด(Cut-off) ที่ระดับตางๆ ระหวาง 0 ถึง 1 เพื่อ เปรียบเทียบกับคาความนาจะเปนของการเกิดเหตุการณที่สนใจที่ไดจาก การพยากรณของแตละหนวยตัวอยางดวยตัวแบบประมาณที่ไดจากการ วิเคราะห แลวทําการจําแนกกลุมของตัวแปรตามซึ่งเปนตัวแปรที่ ตองการพยากรณ ออกเปน 2 กลุม โดยที่ ถา แลว ตัวอยางจะถูกพยากรณใหอยูในกลุมที่ไมเกิดเหตุการณ แลว ตัวอยางจะถูกพยากรณใหอยูในกลุมที่เกิดเหตุการณ จากนั้นจึงคํานวนหาสัดสวนของการพยากรณเหตุการณ เพื่อ นําคาที่ไดไปทําการพล็อตโคง ROC และคํานวนหาพื้นที่ใตโคง ซึ่งสูตร การคํานวน Sensitivity และ 1-Specificity เปนดังนี้ ตารางที่ 1 ตารางการจัดจําแนกการถดถอยโลจิสติกแบบทวินาม คาสังเกต คาพยากรณ จํานวนเหตุการณที่ สนใจ จํานวนเหตุการณที่ ไมสนใจ จํานวน เหตุการณที่ ใหผลบวก จํานวน เหตุการณที่ ใหผลลบ TP FN TP+FN FP TN FP+TN

ลอการิทึมธรรมชาติของฟงกชั่นความนาจะเปนรวมคือ<br />

เมื่อ<br />

ดังนั้น<br />

ลอการิทึมธรรมชาติของฟงกชันภาวะนาจะเปน (Log-likelihood<br />

function) คือ<br />

เมื่อเราทราบการแจกแจงของ<br />

เราสามารถสรางฟงกชันภาวะ<br />

นาจะเปนได เนื่องจากการประมาณคาไมไดเปนไปตามรูปแบบ<br />

เราจึง<br />

ตองใชวิธีการประมาณเชิงตัวเลข(จําเปนตองทําซ้ําเพื่อใหไดซึ่งตัว<br />

ประมาณความนาจะเปนสูงสุด (Maximum Likelihood Estimator: MLE)<br />

โดยการทําซ้ํา<br />

1 ครั้งจะไดตัวประมาณภาวะนาจะเปน<br />

สูงสุด แลวทําการคํานวนคาประมาณของ<br />

ดังนี้<br />

เมื่อประมาณคาพารามิเตอรดวยวิธีภาวะความนาเปนสูงสุดใน<br />

ตัวแบบการถดถอยโลจิสติกทวินาม แลวจะสามารถนําไปใชในการ<br />

พยากรณการจําแนกกลุมของตัวแบบตอไป<br />

2.2เสนโคง ROC (Receiver Operating Characteristic<br />

Curve)<br />

Receiver Operating Characteristic Curve หรือเรียกงายๆ วา<br />

“ROC Curve” ถูกนํามาใชในการประเมินความถูกตองของการพยากรณ<br />

เหตุการณในระบบจําแนกกลุมกรณีแบงเปน<br />

2 กลุม<br />

ไดแก กลุมที่เกิด<br />

เหตุการณที่สนใจและกลุมที่ไมเกิดเหตุการณที่สนใจ<br />

โดยอยูในรูปของ<br />

กราฟที่พล็อตระหวางคา<br />

Sensitivity หรือ True-Positive Rate ซึ่งเปน<br />

อัตราสวนของการพยากรณถูกตองของการเกิดเหตุการณที่<br />

สนใจ และคา 1-Specificity หรือ False-Positive Rate ซึ่งเปน<br />

อัตราสวนของการพยากรณผิดของการไมเกิดเหตุการณที่สนใจ<br />

โดยจะกําหนดให 1-Specificity อยูบนแกน<br />

และ Sensitivity อยูบน<br />

แกน และกราฟอยูในชวง<br />

ดังรูปที่<br />

2<br />

327<br />

รูปที่<br />

2 ตัวอยางเสนโคงและพื้นที่ใตโคง<br />

สําหรับการคํานวนคา Sensitivity และ 1-Specificity จะทํา<br />

โดยการกําหนดคาจุดตัด(Cut-off) ที่ระดับตางๆ<br />

ระหวาง 0 ถึง 1 เพื่อ<br />

เปรียบเทียบกับคาความนาจะเปนของการเกิดเหตุการณที่สนใจที่ไดจาก<br />

การพยากรณของแตละหนวยตัวอยางดวยตัวแบบประมาณที่ไดจากการ<br />

วิเคราะห แลวทําการจําแนกกลุมของตัวแปรตามซึ่งเปนตัวแปรที่<br />

ตองการพยากรณ ออกเปน 2 กลุม<br />

โดยที่<br />

ถา แลว<br />

ตัวอยางจะถูกพยากรณใหอยูในกลุมที่ไมเกิดเหตุการณ<br />

แลว<br />

ตัวอยางจะถูกพยากรณใหอยูในกลุมที่เกิดเหตุการณ<br />

จากนั้นจึงคํานวนหาสัดสวนของการพยากรณเหตุการณ<br />

เพื่อ<br />

นําคาที่ไดไปทําการพล็อตโคง<br />

ROC และคํานวนหาพื้นที่ใตโคง<br />

ซึ่งสูตร<br />

การคํานวน Sensitivity และ 1-Specificity เปนดังนี้<br />

ตารางที่<br />

1 ตารางการจัดจําแนกการถดถอยโลจิสติกแบบทวินาม<br />

คาสังเกต<br />

คาพยากรณ<br />

จํานวนเหตุการณที่<br />

สนใจ<br />

จํานวนเหตุการณที่<br />

ไมสนใจ<br />

จํานวน<br />

เหตุการณที่<br />

ใหผลบวก<br />

จํานวน<br />

เหตุการณที่<br />

ใหผลลบ<br />

TP FN TP+FN<br />

FP TN FP+TN

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!