ดาวน์โหลด All Proceeding - AS Nida
ดาวน์โหลด All Proceeding - AS Nida
ดาวน์โหลด All Proceeding - AS Nida
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
349<br />
การประชุมวิชาการดานการวิจัยดําเนินงานแหงชาติ ประจําป 2554<br />
วันที่<br />
8-9 กันยายน 2554 ณ โรงแรม เอส ดี อเวนิว กรุงเทพฯ<br />
การหาจุดแบงของตัวแบบการถดถอยโลจิสติกแบบ 2 ประเภทสําหรับการพยากรณการจําแนกขอมูล<br />
โดยใชฟงกชันคอมพลีเมนทารี ล็อก ล็อก เปนฟงกชันเชื่อมโยง<br />
The Cut-Off Point Estimation Of Binary Logistic Regression Model For Predictive Classification<br />
Using Complementary Log-Log Function As A Link Function<br />
นิภาพรรณ ไพจินดา 1 และสุพล ดุรงควัฒนา 2<br />
1, 2<br />
ภาควิชาสถิติ คณะพาณิชยศาสตรและการบัญชี จุฬาลงกรณมหาวิทยาลัย<br />
254 ถ.พญาไท แขวงวังใหม เขตปทุมวัน กรุงเทพฯ 10330<br />
E-mail: 1, 2 toktakkab@hotmail.com<br />
บทคัดยอ<br />
การศึกษานี้มีวัตถุประสงคเพื่อหาจุดแบงของตัวแบบ<br />
ถดถอยโลจิสติกแบบ2ประเภทสําหรับการพยากรณการจําแนกขอมูล เมื่อ<br />
จํานวนของตัวแปรอิสระเพิ่มขึ้น,<br />
ขนาดตัวอยางใหญขึ้น,<br />
สัดสวนของ<br />
ความสําเร็จและความลมเหลวของลักษณะที่สนใจศึกษาเปลี่ยน<br />
และเมื่อ<br />
ระดับของความสัมพันธระหวางตัวแปรอิสระดวยกันมีคาเพิ่มมากขึ้น<br />
โดยใชฟงกชันคอมพลีเมนทารี ล็อก ล็อก เปนฟงกชันเชื่อมโยงในการหา<br />
จุดแบง<br />
คําสําคัญ : การจําแนกขอมูล, จุดแบง, การถดถอยแบบโลจิสติก, ฟงกชัน<br />
คอมพลีเมนทารี ล็อก ล็อก<br />
Abstract<br />
The purpose of this study is to find out the cut-off point<br />
estimation of binary logistic regression model for predictive<br />
classification. When the independent variables increases ,the sample<br />
size increases ,the proportion of success and failure in data set changes<br />
and degree of collinearity among independent variables becomes<br />
higher. This select cut-off point by using complementary log-log<br />
function as a link function<br />
Keywords: Classification Error rate, Cut-off points, Logistic regression,<br />
Complementary Log-Log function<br />
1.บทนํา<br />
ตัวแบบถดถอยโลจิสติกแบบ 2 กลุม<br />
ถูกนํามาใชในการ<br />
พยากรณ ตัวแปรตาม เชิงคุณภาพซึ่งมีลักษณะสิ่งที่สนใจเปนความสําเร็จ<br />
และความลมเหลว โดยใช ตัวแปรอิสระเปนตัวพยากรณ<br />
ในการทํานายวาสถานะของบริษัทใกลจะลมละลายหรือไม<br />
หรือ นักวิจัยทางการแพทยตองการพยากรณผูปวยของเขาวา<br />
เสี่ยงตอการ<br />
เปนโรคหรือไม โดยการใชตัวแปรเชิงปริมาณ บางตัว ตัวอยางเชน ความ<br />
ดันโลหิต ระดับคลอเรสเตอรอล ระดับน้ําตาลในเลือด<br />
เปนตน เปนตัว<br />
พยากรณทางการแพทยเชนกัน เกือบทั้งหมดของปญหาและงานวิจัยจะ<br />
ดําเนินการในการทํานายผลอยางใดอยางหนึ่งของตัวแปรตาม<br />
โดยใชกลุม<br />
ของตัวแปรอิสระ โดยปกติมักจะใช ระดับที่<br />
0.5 ในการหาจุดแบง ( cut of<br />
point ) ที่ไมสนใจการแจกแจงของขอมูลของตัวแปรอิสระ<br />
ขนาดตัวอยาง<br />
สัดสวนของขอมูลสองกลุม<br />
และ ความสัมพันธของตัวแปรอิสระ จุดแบง<br />
นี้ถูกใชมาเปนเวลานาน<br />
แตคําถามคือ จุดแบง( cut of point ) ที่เทาไหร<br />
จะ<br />
เหมาะสมที่สุดสําหรับ<br />
การจัดหมวดหมูสําหรับ<br />
ขอมุลหนึ่งในสองกลุม<br />
ซึ่งเปนสิ่งที่ทําใหสนใจศึกษางานวิจัยชิ้นนี้<br />
ซึ่งตัวแบบการถดถอยโลจิสติกมีลักษณะความสัมพันธที่<br />
ไมใชเสนตรง ดังนั้นจึงมีการใชฟงกชันเชื่อมโยง(Link<br />
function) เขามา<br />
ชวยในการพยากรณและตีความหมาย ตัวอยางฟงกชันเชื่อมโยง<br />
(Link<br />
function) เชน ฟงกชันโลจิท ฟงกชันโพรบิท และ ฟงกชันคอมพลีเมนทา<br />
รีล็อก-ล็อก เปนตน ซึ่งลักษณะการเลือกฟงกชันเชื่อมโยงแตละฟงกัชัน<br />
นั้นก็ขึ้นอยูกับลักษณะการกระจายของขอมูล<br />
ซึ่งการมาซึ่งขอมูลที่มี<br />
ลักษณะการกระจายที่สมมาตร<br />
เราจะใชฟงกชันเชื่อมโยงแบบโลจิท<br />
สําหรับขอมูลที่เราจะทําการศึกษาในครั้งนี้มีลักษณะของ<br />
ขอมูลที่มีการกระจายที่ไมสมมาตร<br />
เราจึงเลือกใชฟงกชันเชื่อมโยงแบบ<br />
คอมพลีเมนทารีล็อก-ล็อก เปนฟงกชันเชื่อมโยง<br />
ซึ่งเราจะนําฟงกชันนี้ไป<br />
ใชในการคํานวณจุดแบง (cut of point) แลวนําไปพยากรณหาจุดแบงที่ดี<br />
ที่สุด