30.06.2013 Views

ดาวน์โหลด All Proceeding - AS Nida

ดาวน์โหลด All Proceeding - AS Nida

ดาวน์โหลด All Proceeding - AS Nida

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

349<br />

การประชุมวิชาการดานการวิจัยดําเนินงานแหงชาติ ประจําป 2554<br />

วันที่<br />

8-9 กันยายน 2554 ณ โรงแรม เอส ดี อเวนิว กรุงเทพฯ<br />

การหาจุดแบงของตัวแบบการถดถอยโลจิสติกแบบ 2 ประเภทสําหรับการพยากรณการจําแนกขอมูล<br />

โดยใชฟงกชันคอมพลีเมนทารี ล็อก ล็อก เปนฟงกชันเชื่อมโยง<br />

The Cut-Off Point Estimation Of Binary Logistic Regression Model For Predictive Classification<br />

Using Complementary Log-Log Function As A Link Function<br />

นิภาพรรณ ไพจินดา 1 และสุพล ดุรงควัฒนา 2<br />

1, 2<br />

ภาควิชาสถิติ คณะพาณิชยศาสตรและการบัญชี จุฬาลงกรณมหาวิทยาลัย<br />

254 ถ.พญาไท แขวงวังใหม เขตปทุมวัน กรุงเทพฯ 10330<br />

E-mail: 1, 2 toktakkab@hotmail.com<br />

บทคัดยอ<br />

การศึกษานี้มีวัตถุประสงคเพื่อหาจุดแบงของตัวแบบ<br />

ถดถอยโลจิสติกแบบ2ประเภทสําหรับการพยากรณการจําแนกขอมูล เมื่อ<br />

จํานวนของตัวแปรอิสระเพิ่มขึ้น,<br />

ขนาดตัวอยางใหญขึ้น,<br />

สัดสวนของ<br />

ความสําเร็จและความลมเหลวของลักษณะที่สนใจศึกษาเปลี่ยน<br />

และเมื่อ<br />

ระดับของความสัมพันธระหวางตัวแปรอิสระดวยกันมีคาเพิ่มมากขึ้น<br />

โดยใชฟงกชันคอมพลีเมนทารี ล็อก ล็อก เปนฟงกชันเชื่อมโยงในการหา<br />

จุดแบง<br />

คําสําคัญ : การจําแนกขอมูล, จุดแบง, การถดถอยแบบโลจิสติก, ฟงกชัน<br />

คอมพลีเมนทารี ล็อก ล็อก<br />

Abstract<br />

The purpose of this study is to find out the cut-off point<br />

estimation of binary logistic regression model for predictive<br />

classification. When the independent variables increases ,the sample<br />

size increases ,the proportion of success and failure in data set changes<br />

and degree of collinearity among independent variables becomes<br />

higher. This select cut-off point by using complementary log-log<br />

function as a link function<br />

Keywords: Classification Error rate, Cut-off points, Logistic regression,<br />

Complementary Log-Log function<br />

1.บทนํา<br />

ตัวแบบถดถอยโลจิสติกแบบ 2 กลุม<br />

ถูกนํามาใชในการ<br />

พยากรณ ตัวแปรตาม เชิงคุณภาพซึ่งมีลักษณะสิ่งที่สนใจเปนความสําเร็จ<br />

และความลมเหลว โดยใช ตัวแปรอิสระเปนตัวพยากรณ<br />

ในการทํานายวาสถานะของบริษัทใกลจะลมละลายหรือไม<br />

หรือ นักวิจัยทางการแพทยตองการพยากรณผูปวยของเขาวา<br />

เสี่ยงตอการ<br />

เปนโรคหรือไม โดยการใชตัวแปรเชิงปริมาณ บางตัว ตัวอยางเชน ความ<br />

ดันโลหิต ระดับคลอเรสเตอรอล ระดับน้ําตาลในเลือด<br />

เปนตน เปนตัว<br />

พยากรณทางการแพทยเชนกัน เกือบทั้งหมดของปญหาและงานวิจัยจะ<br />

ดําเนินการในการทํานายผลอยางใดอยางหนึ่งของตัวแปรตาม<br />

โดยใชกลุม<br />

ของตัวแปรอิสระ โดยปกติมักจะใช ระดับที่<br />

0.5 ในการหาจุดแบง ( cut of<br />

point ) ที่ไมสนใจการแจกแจงของขอมูลของตัวแปรอิสระ<br />

ขนาดตัวอยาง<br />

สัดสวนของขอมูลสองกลุม<br />

และ ความสัมพันธของตัวแปรอิสระ จุดแบง<br />

นี้ถูกใชมาเปนเวลานาน<br />

แตคําถามคือ จุดแบง( cut of point ) ที่เทาไหร<br />

จะ<br />

เหมาะสมที่สุดสําหรับ<br />

การจัดหมวดหมูสําหรับ<br />

ขอมุลหนึ่งในสองกลุม<br />

ซึ่งเปนสิ่งที่ทําใหสนใจศึกษางานวิจัยชิ้นนี้<br />

ซึ่งตัวแบบการถดถอยโลจิสติกมีลักษณะความสัมพันธที่<br />

ไมใชเสนตรง ดังนั้นจึงมีการใชฟงกชันเชื่อมโยง(Link<br />

function) เขามา<br />

ชวยในการพยากรณและตีความหมาย ตัวอยางฟงกชันเชื่อมโยง<br />

(Link<br />

function) เชน ฟงกชันโลจิท ฟงกชันโพรบิท และ ฟงกชันคอมพลีเมนทา<br />

รีล็อก-ล็อก เปนตน ซึ่งลักษณะการเลือกฟงกชันเชื่อมโยงแตละฟงกัชัน<br />

นั้นก็ขึ้นอยูกับลักษณะการกระจายของขอมูล<br />

ซึ่งการมาซึ่งขอมูลที่มี<br />

ลักษณะการกระจายที่สมมาตร<br />

เราจะใชฟงกชันเชื่อมโยงแบบโลจิท<br />

สําหรับขอมูลที่เราจะทําการศึกษาในครั้งนี้มีลักษณะของ<br />

ขอมูลที่มีการกระจายที่ไมสมมาตร<br />

เราจึงเลือกใชฟงกชันเชื่อมโยงแบบ<br />

คอมพลีเมนทารีล็อก-ล็อก เปนฟงกชันเชื่อมโยง<br />

ซึ่งเราจะนําฟงกชันนี้ไป<br />

ใชในการคํานวณจุดแบง (cut of point) แลวนําไปพยากรณหาจุดแบงที่ดี<br />

ที่สุด

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!