10.07.2015 Views

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Metin İçerikli Türkçe Dokümanların SınıflandırılmasıRıfat Aşlıyan, Korhan Günel<strong>Akademik</strong> Bilişim’<strong>10</strong> - XII. <strong>Akademik</strong> Bilişim Konferansı Bildirileri<strong>10</strong> - <strong>12</strong> Şubat 20<strong>10</strong> Muğla ÜniversitesiTablo 5. K-En Yakın Komşu metoduyla(K=5) sözcük seçiminde 2. ve veritabanıoluşturulmasında 1. yaklaşım başarı yüzdeleriTablo 6. K-En Yakın Komşu metoduyla(K=7) sözcük seçiminde 2. ve veritabanıoluşturulmasında 1. yaklaşım başarı yüzdeleri4. Sonuç ve ÖnerilerBu çalışmada, En Yakın Komşu ve K-En YakınKomşu metotları kullanılarak dokümanların 5farklı kategoriye göre sınıflandırılmasını gerçekleştirensistem tasarlanmıştır ve gerçekleştirilmiştir.Hem öznitelik vektörlerinin oluşturulmasındakullanılacak sözcüklerin tespitindehem de öznitelik veritabanın oluşturulmasındaiki farklı yaklaşıma göre sistem gerçekleştirilmiştirve deneysel sonuçlar karşılaştırılmıştır.En yüksek başarı oranlarına ikinci yaklaşımlarlaulaşılmıştır. Yani her sınıfı temsil edenbir tane öznitelik vektörü oluşturulması ve birsınıfta olup diğer sınıfta az sayıda olan sözcüklerinalınması yaklaşımların seçilmesi başarıyıartırmıştır. En Yakın Komşu metodu, K-EnYakın Komşu metoduna göre daha başarılıolmuştur. Bütün sınıflar için %88.4 oranındabaşarı elde edilmiştir.Daha sonraki çalışmalarda sınıf ve dokümansayısı artırılacaktır. Daha farklı yöntemler (yapaysinir ağları, destek vektör makineleri) uygulanacakve birbirleriyle karşılaştırılacaktır.Hece bazında doküman sınıflandırma işlemi degerçekleştirilecektir.5. Kaynaklar[1] Kim, S.B., Rim, H.C., Yook, D., Lim, H.S.,“Effective methods for improving Naive Bayestext classifiers”, In: The 7th Pacific riminternational conference on artificial intelligence,pp 414–423 (2002).[4] Li, R., Wang, J., Chen, X., Tao, X., Hu, Y.,“Using maximum entropy model for Chinesetext categorization”, J Comput Res Dev,42(1):94–<strong>10</strong>1 (2005).[5] Kazama, J., Tsujii, J., “Maximum entropymodels with inequality constraints: A casestudy on text categorization”, Mach. Learn.,60(1–3):159–194 (2005).[6] Liu, W.Y., Song, N., “A fuzzy approach toclassification of text documents”, J. Comput.Sci. Technol., 18(5):640–647 (2003).[7] Joachims, T., “Text categorization withsupport vector machines: Learning with manyrelevant features”, In: Nedellec C, RouveirolC (eds) Proceedings of the <strong>10</strong>th Europeanconference on machine learning (ECML-98), Springer, Chemnitz, pp 137–142 (1998).[8] Yang, Y., Liu, X., “A re-examination oftext categorization methods”, Proceedings ofSIGIR’99, pp 42–49 (1999).[9] Ma, L., Shepherd, J., Zhang, Y., “Enhancingtext classification using synopses extraction”.In: Proceeding of the fourth internationalconference on web information systemsengineering, pp 115–<strong>12</strong>4 (2003).[<strong>10</strong>] Savio, L.Y. Lam, D.L.L., “Feature reductionfor neural network based text categorization”,6th international conference ondatabase systems for advanced applications(DASFAA ‘99). (1999).[11] Ng, H.T., Goh, W.B., Low, K.L., “Featureselection, perceptron learning, and a usabilitycase study for text categorization”, In: Proceedingsof the 20th annual internationalACM-SIGIR conference on research anddevelopment in information retrieval, pp67–73 (1997).[<strong>12</strong>] Nakayama, M., Shimizu, Y., “Subject categorizationfor web educational resources usingMLP”, In: Proceedings of 11th Europeansymposium on artificial neural networks, pp9–14 (2003).[13] Ruiz, M.E., Srinivasan, P., “Automatic textcategorization using neural network”, In: Proceedingsof the 8th ASIS SIG/CR workshopon classification research, pp 59–72 (1998).[14] Ma, S., Ji, C., “A unified approach on fasttraining of feedforward and recurrent networksusing EM algorithm”, IEEE Trans SignalProcess., 46(46):2270–2274 (1998).[2] Wu, M.C., Lin, S.Y., Lin, C.H., “An effectiveapplication of decision tree to stock trading”,Expert Syst Appl, 31(2):270–274 (2006).Tablo 7. En Yakın Komşu metoduyla (SabitÖBV değeri) sözcük seçiminde 2. ve veritabanıoluşturulmasında 2. yaklaşım başarı yüzdeleri.[3] Soucy, P., Mineau, G.W., “A simple K-NNalgorithm for text categorization”, In: Proceedingof the first IEEE international conferenceon data mining (ICDM_01), 28, pp647–648 (2001).542543

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!