30.06.2013 Views

ดาวน์โหลด All Proceeding - AS Nida

ดาวน์โหลด All Proceeding - AS Nida

ดาวน์โหลด All Proceeding - AS Nida

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Keyword: Binary logistic regression, Strictly non-nested, The<br />

Complementary log-log Function, ROC curve<br />

1.บทนํา<br />

ในงานวิจัยขององคกรหรือแขนงสาขาวิชาตางๆ วิธีการทาง<br />

สถิติเขามามีบทบาทมากขึ้นเรื่อยๆ<br />

จนกระทั้งกลายเปนวิธีการที่จําเปนที่<br />

จะชวยใหการวิเคราะหขอมูลที่ไดมานั้นเปนไปอยางมีประสิทธิภาพ<br />

โดย<br />

จุดประสงคของงานวิจัยโดยสวนใหญคือ เพื่อตองการทราบถึงปจจัย(ตัว<br />

อิสระ)ใดบางที่สงผลโอกาสที่จะเกิดเหตุการณ<br />

(ตัวแปรตาม)<br />

ความสัมพันธระหวางตัวแปรอิสระที่มีผลตอโอกาสที่จะเกิดเหตุการณ<br />

(ตัวแปรตาม) ตลอดจนเพื่อพยากรณโอกาสที่จะเกิดเหตุการณที่สนใจซึ่ง<br />

จะไดจากสมการที่เหมาะสม<br />

ปจจุบันพบวาลักษณะของขอมูลและ<br />

จุดประสงคของงานวิจัยมีหลากหลายมากขึ้น<br />

ทําใหเทคนิคการพยากรณมี<br />

เงื่อนไขที่หลากหลายมากขึ้นตาม<br />

ดังนั้นเพื่อใหการพยากรณที่มี<br />

ประสิทธิภาพการเลือกใชเทคนิคการพยากรณจึงขึ้นอยูกับลักษณะขอมูล<br />

ที่นํามาศึกษาและจุดประสงคของการพยากรณ<br />

เชน การพยากรณดวย<br />

วิธีการวิเคราะหความถดถอยโลจิสติค(Logistic Regression Analysis)<br />

เปนการหาความสัมพันธระหวางตัวแปรตามและตัวแปรอิสระโดยตัว<br />

แปรตามเปนตัวแปรเชิงกลุมที่แบงเปน<br />

2 กลุม(Binary<br />

Logistic<br />

Regression Model) หรือมากกวา 2 กลุม(Multinomial<br />

Logistic<br />

Regression Model) โดยทั่วไปแลวมักเปนการศึกษาขอมูลเกี่ยวกับ<br />

เหตุการณที่เราสนใจเราจะเกิดขึ้นหรือไม<br />

หรือเกิดขึ้นดวยความนาจะเปน<br />

เทาไหร เชน การเปนโรคหัวใจหรือไมเปนโรคหัวใจ มักเปนเหตุการณที่<br />

สาเหตุเกิดขึ้นไดตลอดเวลาและตัวแปรตามเปนตัวแปรคุณภาพที่มีการ<br />

แจกแจงแบบเบอรนูลี แบงขอมูลออกเปน 2 กลุม<br />

คือ มีคาเทากับ 1 เมื่อ<br />

เปนเหตุการณที่เราสนใจ<br />

และมีคาเทากับ 0 เมื่อเปนเหตุการณที่เราไม<br />

สนใจ สวนตัวแปรอิสระมีทั้งตัวแปรตอเนื่องและตัวแปรที่ไมตอเนื่องก็<br />

ได และสามารถเปนไดทั้งตัวแปรเชิงปริมาณหรือเปนตัวแปรเชิงคุณภาพ<br />

ไดอีกดวย ดังนั้นจึงไมสามารถใชการวิเคราะหความถดถอยแบบปกติได<br />

ดังนั้นจากสถานการณดังกลาวโดยสวนใหญจะใชเทคนิคการวิเคราะห<br />

ขอมูลดวยตัวแบบอื่น<br />

เชน ตัวแบบโลจิท(Logit Model),ตัวแบบโพรบิท<br />

(Probit Model) และตัวแบบคอมพลีเมนทารีล็อก-ล็อก(Complementary<br />

log-log Model) เปนตน<br />

ตัวแบบที่นํามาใชแสดงความสัมพันธระหวางตัวแปรตามและ<br />

ตัวแปรอิสระในการวิเคราะหของ ตัวแบบแบบโลจิท,ตัวแบบโพรบิท<br />

และตัวแบบคอมพลีเมนทารี ล็อก-ล็อก ซึ่งเปนตัวแบบเชิงเสนที่วางนัย<br />

ทั่วไป(Generalized<br />

Linear Model:GLM) เรียกวา ลิงคฟงคชัน(Link<br />

Function) โดยมี เปนตัวเชื่อมระหวางตัวแปรตาม<br />

และตัวแปรอิสระ<br />

ฉะนั้นการเลือกลิงคฟงคชันสามารถหาไดโดยใชฟงคชันเชื่อม<br />

โลจิท<br />

ฟงกชัน(Logit Function) , โพรบิทฟงกชัน(Probit<br />

Function) , คอมพลีเมนทารีล็อก-ล็อก<br />

(Complementary log-log Function)<br />

325<br />

ตามลําดับ สวนการเลือกใชฟงกชันเชื่อมโยงขึ้นอยูกับลักษณะของการ<br />

กระจายของขอมูล เชน ตัวแบบคอมพลีเมนทารี ล็อก-ล็อก<br />

(Complementary log-log Model) เปนฟงกชันเชื่อมโยง(Link<br />

Function)ที่<br />

มีลักษณะขอมูล คือ ตัวแปรตามแยกเปน 2 กลุม<br />

สวนตัวแปรอิสระเปนตัว<br />

แปรตอเนื่องหรือเชิงกลุมก็ได<br />

เปนตัวแบบที่มีเทอมหลักคลายกับตัว<br />

แบบโลจิท(Logit Model) เหมาะสมกับขอมูลที่มีลักษณะฟงกชันความ<br />

หนาแนนสะสมที่มีการลูเขาและลูออกไมสม่ําเสมอและไมสมมาตรที่<br />

ความนาจะเปน 0.5<br />

การคัดเลือกตัวแบบการถดถอยโลจิสติคแบบทวินาม (Binary<br />

logistic regression model) คือ วิธีการทางสถิติที่เกี่ยวของกับการเลือกเซต<br />

ของตัวแปรอิสระที่ดีที่สุดซึ่งใชเปนตัวพยากรณ(Predictor)<br />

แตละตัวแปร<br />

ตามใหอยูในกลุมเหตุการณที่เราสนใจหรือกลุมเหตุการณที่เราไมสนใจ<br />

โดยใชพื้นที่ใตโคง<br />

ROC (Receiver operating characteristic) สูงสุดเปน<br />

เกณฑหรือเรียกอีกอยางวา“พื้นที่ใตโคง”(Area<br />

Under the Curve: )<br />

เพื่อใหการคัดเลือกตัวแบบที่เหมาะสมที่สุดในการพยากรณ<br />

เปนการ<br />

เปรียบเทียบเซตของตัวแปรอิสระสองกลุมที่จะถูกเลือกเปนเซตของตัว<br />

พยากรณที่ดีที่สุด<br />

ควรอยูภายใตเงื่อนไขตัวแบบแบบไมติดกลุม(Non<br />

nested) และเปนตัวแบบแบบไมติดกลุมอยางสมบูรณ(Strictly<br />

Nonnested)<br />

นั้นคือ<br />

ตัวแบบทางสถิติแรกจะตองไมมีตัวแปรอิสระใดๆ ของตัว<br />

แบบที่สองอยูเลย<br />

ดังนั้น<br />

ผูวิจัยจึงสนใจที่จะศึกษาวาตัวแบบทางสถิติแบบไมติด<br />

กลุมอยางสมบูรณของตัวแบบถดถอยโลจิสติกทวินามที่มีฟงกชันคอมพลี<br />

เมนทารี ล็อก-ล็อกเปนฟงกชันเชื่อมโยงมีลักษณะของตัวแบบเปนแบบ<br />

ใดที่จะทําให<br />

คาพื้นที่ใตเสนโคง<br />

ROC สูงสุด โดยพิจารณาลักษณะของ<br />

ตัวแบบจากขนาดตัวอยาง , จํานวนตัวแปรอิสระ และระดับ<br />

ความสัมพันธในแตละคู<br />

(Degree of pair-wise correlations)ของตัวแปร<br />

อิสระ ที่จะสงผลใหการเลือกเซตของตัวแปรอิสระที่ดีที่สุด<br />

ซึ่งใช<br />

เปนตัวพยากรณ(Predictor) แตละตัวแปรตามใหอยูในกลุมเหตุการณที่เรา<br />

สนใจหรือกลุมเหตุการณที่เราไมสนใจไดอยางมีประสิทธิภาพ<br />

2.ทฤษฏีและตัวสถิติที่เกี่ยวของ<br />

2.1แบบจําลองที่ใชในการวิจัย<br />

ตัวแบบการถดถอยโลจิสติกทวินาม (Binary Logistic<br />

Regression Model)<br />

ตัวแบบการถดถอยโลจิสติกทวินามสําหรับการพยากรณใน<br />

การจัดประเภท ดังนี้<br />

เมื่อ<br />

(1)

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!