ดาวน์โหลด All Proceeding - AS Nida
ดาวน์โหลด All Proceeding - AS Nida
ดาวน์โหลด All Proceeding - AS Nida
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Keyword: Binary logistic regression, Strictly non-nested, The<br />
Complementary log-log Function, ROC curve<br />
1.บทนํา<br />
ในงานวิจัยขององคกรหรือแขนงสาขาวิชาตางๆ วิธีการทาง<br />
สถิติเขามามีบทบาทมากขึ้นเรื่อยๆ<br />
จนกระทั้งกลายเปนวิธีการที่จําเปนที่<br />
จะชวยใหการวิเคราะหขอมูลที่ไดมานั้นเปนไปอยางมีประสิทธิภาพ<br />
โดย<br />
จุดประสงคของงานวิจัยโดยสวนใหญคือ เพื่อตองการทราบถึงปจจัย(ตัว<br />
อิสระ)ใดบางที่สงผลโอกาสที่จะเกิดเหตุการณ<br />
(ตัวแปรตาม)<br />
ความสัมพันธระหวางตัวแปรอิสระที่มีผลตอโอกาสที่จะเกิดเหตุการณ<br />
(ตัวแปรตาม) ตลอดจนเพื่อพยากรณโอกาสที่จะเกิดเหตุการณที่สนใจซึ่ง<br />
จะไดจากสมการที่เหมาะสม<br />
ปจจุบันพบวาลักษณะของขอมูลและ<br />
จุดประสงคของงานวิจัยมีหลากหลายมากขึ้น<br />
ทําใหเทคนิคการพยากรณมี<br />
เงื่อนไขที่หลากหลายมากขึ้นตาม<br />
ดังนั้นเพื่อใหการพยากรณที่มี<br />
ประสิทธิภาพการเลือกใชเทคนิคการพยากรณจึงขึ้นอยูกับลักษณะขอมูล<br />
ที่นํามาศึกษาและจุดประสงคของการพยากรณ<br />
เชน การพยากรณดวย<br />
วิธีการวิเคราะหความถดถอยโลจิสติค(Logistic Regression Analysis)<br />
เปนการหาความสัมพันธระหวางตัวแปรตามและตัวแปรอิสระโดยตัว<br />
แปรตามเปนตัวแปรเชิงกลุมที่แบงเปน<br />
2 กลุม(Binary<br />
Logistic<br />
Regression Model) หรือมากกวา 2 กลุม(Multinomial<br />
Logistic<br />
Regression Model) โดยทั่วไปแลวมักเปนการศึกษาขอมูลเกี่ยวกับ<br />
เหตุการณที่เราสนใจเราจะเกิดขึ้นหรือไม<br />
หรือเกิดขึ้นดวยความนาจะเปน<br />
เทาไหร เชน การเปนโรคหัวใจหรือไมเปนโรคหัวใจ มักเปนเหตุการณที่<br />
สาเหตุเกิดขึ้นไดตลอดเวลาและตัวแปรตามเปนตัวแปรคุณภาพที่มีการ<br />
แจกแจงแบบเบอรนูลี แบงขอมูลออกเปน 2 กลุม<br />
คือ มีคาเทากับ 1 เมื่อ<br />
เปนเหตุการณที่เราสนใจ<br />
และมีคาเทากับ 0 เมื่อเปนเหตุการณที่เราไม<br />
สนใจ สวนตัวแปรอิสระมีทั้งตัวแปรตอเนื่องและตัวแปรที่ไมตอเนื่องก็<br />
ได และสามารถเปนไดทั้งตัวแปรเชิงปริมาณหรือเปนตัวแปรเชิงคุณภาพ<br />
ไดอีกดวย ดังนั้นจึงไมสามารถใชการวิเคราะหความถดถอยแบบปกติได<br />
ดังนั้นจากสถานการณดังกลาวโดยสวนใหญจะใชเทคนิคการวิเคราะห<br />
ขอมูลดวยตัวแบบอื่น<br />
เชน ตัวแบบโลจิท(Logit Model),ตัวแบบโพรบิท<br />
(Probit Model) และตัวแบบคอมพลีเมนทารีล็อก-ล็อก(Complementary<br />
log-log Model) เปนตน<br />
ตัวแบบที่นํามาใชแสดงความสัมพันธระหวางตัวแปรตามและ<br />
ตัวแปรอิสระในการวิเคราะหของ ตัวแบบแบบโลจิท,ตัวแบบโพรบิท<br />
และตัวแบบคอมพลีเมนทารี ล็อก-ล็อก ซึ่งเปนตัวแบบเชิงเสนที่วางนัย<br />
ทั่วไป(Generalized<br />
Linear Model:GLM) เรียกวา ลิงคฟงคชัน(Link<br />
Function) โดยมี เปนตัวเชื่อมระหวางตัวแปรตาม<br />
และตัวแปรอิสระ<br />
ฉะนั้นการเลือกลิงคฟงคชันสามารถหาไดโดยใชฟงคชันเชื่อม<br />
โลจิท<br />
ฟงกชัน(Logit Function) , โพรบิทฟงกชัน(Probit<br />
Function) , คอมพลีเมนทารีล็อก-ล็อก<br />
(Complementary log-log Function)<br />
325<br />
ตามลําดับ สวนการเลือกใชฟงกชันเชื่อมโยงขึ้นอยูกับลักษณะของการ<br />
กระจายของขอมูล เชน ตัวแบบคอมพลีเมนทารี ล็อก-ล็อก<br />
(Complementary log-log Model) เปนฟงกชันเชื่อมโยง(Link<br />
Function)ที่<br />
มีลักษณะขอมูล คือ ตัวแปรตามแยกเปน 2 กลุม<br />
สวนตัวแปรอิสระเปนตัว<br />
แปรตอเนื่องหรือเชิงกลุมก็ได<br />
เปนตัวแบบที่มีเทอมหลักคลายกับตัว<br />
แบบโลจิท(Logit Model) เหมาะสมกับขอมูลที่มีลักษณะฟงกชันความ<br />
หนาแนนสะสมที่มีการลูเขาและลูออกไมสม่ําเสมอและไมสมมาตรที่<br />
ความนาจะเปน 0.5<br />
การคัดเลือกตัวแบบการถดถอยโลจิสติคแบบทวินาม (Binary<br />
logistic regression model) คือ วิธีการทางสถิติที่เกี่ยวของกับการเลือกเซต<br />
ของตัวแปรอิสระที่ดีที่สุดซึ่งใชเปนตัวพยากรณ(Predictor)<br />
แตละตัวแปร<br />
ตามใหอยูในกลุมเหตุการณที่เราสนใจหรือกลุมเหตุการณที่เราไมสนใจ<br />
โดยใชพื้นที่ใตโคง<br />
ROC (Receiver operating characteristic) สูงสุดเปน<br />
เกณฑหรือเรียกอีกอยางวา“พื้นที่ใตโคง”(Area<br />
Under the Curve: )<br />
เพื่อใหการคัดเลือกตัวแบบที่เหมาะสมที่สุดในการพยากรณ<br />
เปนการ<br />
เปรียบเทียบเซตของตัวแปรอิสระสองกลุมที่จะถูกเลือกเปนเซตของตัว<br />
พยากรณที่ดีที่สุด<br />
ควรอยูภายใตเงื่อนไขตัวแบบแบบไมติดกลุม(Non<br />
nested) และเปนตัวแบบแบบไมติดกลุมอยางสมบูรณ(Strictly<br />
Nonnested)<br />
นั้นคือ<br />
ตัวแบบทางสถิติแรกจะตองไมมีตัวแปรอิสระใดๆ ของตัว<br />
แบบที่สองอยูเลย<br />
ดังนั้น<br />
ผูวิจัยจึงสนใจที่จะศึกษาวาตัวแบบทางสถิติแบบไมติด<br />
กลุมอยางสมบูรณของตัวแบบถดถอยโลจิสติกทวินามที่มีฟงกชันคอมพลี<br />
เมนทารี ล็อก-ล็อกเปนฟงกชันเชื่อมโยงมีลักษณะของตัวแบบเปนแบบ<br />
ใดที่จะทําให<br />
คาพื้นที่ใตเสนโคง<br />
ROC สูงสุด โดยพิจารณาลักษณะของ<br />
ตัวแบบจากขนาดตัวอยาง , จํานวนตัวแปรอิสระ และระดับ<br />
ความสัมพันธในแตละคู<br />
(Degree of pair-wise correlations)ของตัวแปร<br />
อิสระ ที่จะสงผลใหการเลือกเซตของตัวแปรอิสระที่ดีที่สุด<br />
ซึ่งใช<br />
เปนตัวพยากรณ(Predictor) แตละตัวแปรตามใหอยูในกลุมเหตุการณที่เรา<br />
สนใจหรือกลุมเหตุการณที่เราไมสนใจไดอยางมีประสิทธิภาพ<br />
2.ทฤษฏีและตัวสถิติที่เกี่ยวของ<br />
2.1แบบจําลองที่ใชในการวิจัย<br />
ตัวแบบการถดถอยโลจิสติกทวินาม (Binary Logistic<br />
Regression Model)<br />
ตัวแบบการถดถอยโลจิสติกทวินามสําหรับการพยากรณใน<br />
การจัดประเภท ดังนี้<br />
เมื่อ<br />
(1)