10.07.2015 Views

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Uygurcada Biçimbilimsel BelirsizlikMurat Orhun, A. Cüneyd Tantuğ, Eşref AdalıYukarda gösterildiği gibi, Uygurca sözcüklerüzerinde biçimbilimsel çözümlemeler yaparken,bazı sözcükler için birden fazla çözüm üretmesisöz konusudur. Bu üretilen birden fazla çözümlerise, belirsizlik olarak kabul edilmiştir ve belirsizlikoranı alttaki formül ile hesaplanmıştır.Belirsizlik=ÇözümSayý ý öSözcükSayýsýBelirsizlik bir ise, demek tek çözüm üretmişoluyor.Bir sözcük için üretilen çözüm sayısı fazla oldukçabelirsizlik oranı yüksek olacaktır.Bu bildiride, Uygurcanın belirsizlik oranını hesaplamakiçin, rastgele 114 adet sözcük kullanıldıve Uygurcanın biçimbilimsel çözümleyicisi ileçözüldüğünde 161 adet çözüm oluşturulmuştur.Yanı belirsizlik oranı ise 1,4 civarında gerçekleşmiştir.Bu sayı büyüdükçe, belirsizlik oranıda yüksek oluyor. Mesela, her sözcüğün 3 adetfarklı çözüm verdiğin var sayarsak, belirsizlikdeğeri 3 olacaktır. Bu neden ile 1,4 ise, yüze30 civarında belirsizlik verdiğini kabaca kabuledebiliriz.4. SonuçBu bildiride, Uygurca sözcüklerin biçimbirimselçözümlemesinde oluşan belirsizlikleri oranıhesaplanmıştır. Bu hesaplamada, Uygurca içingeliştirilen biçimbirimsel çözümleyici kullanılmıştır[<strong>12</strong>–13]. Ayrıca Türkçeni biçimbirimselçözümleyicisi [9] , ile karşılaştırılmıştır vetemel farkları örnekler ile gösterilmiştir. TestKümesindeki sözcüklerin sayısı artınca, sözcüklerinbelirsizlik oranında artma görülmektedir.Özellikle, “eylem” türünde sözcüklereklendiğinde, belirsizlikte artma farkı büyükolmaktadır. Bunun temel nedeni ise, Tıpkı başkadillerde olduğu gibi, Uygurca eylerin yapısındakaynaklanmasındandır. Özellikle, eylemlerdentüretilmiş isimlerden oluşan belirsizlikçok fazla olmaktadır.548Uygurcanın biçimbirimsel belirsizlik giderilmesiile ilgili çalışmalar henüz devam etmektedir.Uygurca için geliştirilmiş herhangi birderlem bulunmadığından, kural tabanlı çözümlemeön görülmektedir. Bu çalışma bittiğinde,Türkçeden sonra, Türk dilleri gurubunda,biçimbilimsel belirsizlik üzerinde çalışılan dilunvanına sahip olacaktır.5. Kaynaklar[1] Kenneth R. Beesley, “ Arabic finite-statemorphological analysis and generation” InternationalConference On ComputationalLinguistics Proceedings of the 16th conferenceon Computational linguistics - 1. 89– 94,(1996).[2] Alam, Y. S.,” A Two-Level MorphologicalAnalysis of Japanese”. Texas Linguistics.Forum,22:229-252. (1983).[3] Karttunen, L., Wittenburg, K., “A Two-Level Morphological Analysis of English”. TexasLinguistics Forum, 22:217-228,(1983).[4] Lun, S., “A Two-Level MorphologicalAnalysis of French,” in Texas Linguistic Forum,Texas, USA, 271-278,( 1983)[5] R. Khan, R., 1983. “A Two-Level MorphologicalAnalysis of Rumanian,” in TexasLinguistic Forum, Texas, USA,. Texas, USA.253-270, (1983).[6] Koskenniemi, K., “Two-Level Morphology: A General Computational Model for WordForm Recognition and Production,” Departmentof General Linguistics, University ofHelsinki, (1983).[7] Antworth, E. L., “PC-KIMMO: A Two-Level Processor for Morphological Analysis,”Summer Institute of Linguistics, Dallas, Texas,USA, (1990).[8] Koskenniemi, K., “An Application of theTwo-Level Model to Finnish,” University ofHelsinki Department of General Linguistics,(1985).[9] Oflazer, K., “Two-level Descriptionof Turkish Morphology,”Literary and Linguistic Computing, vol. 9,137-148,(1995).[<strong>10</strong>] Altıntaş, K., ve Çiçekli, İ., “A MorphologicalAnalyser for Crimean Tatar,” Proceedingsof the <strong>10</strong>th Turkish Symposium on ArtificialIntelligence and Neural Networks, TAINNNorth Cyprus, pp. 180-189,(2001).[11] ] Tantuğ A.C., Adalı E., ve Oflazer K.,“Computer Analysis of The Turkmen LanguageMorphology”, Proceedings of the 5th InternationalConference on Natural LanguageProcessing, FinTAL 2006, Turku, Finland.[<strong>12</strong>] Orhun, M., Tantuğ, A.C. ve Adalı, E.,“Rule Based Analysis of the Uyghur Nouns”.Proceedings of the International Conferenceon Asian Language Processing (IALP). ChiangMai, Thailand,(2008).[13] Orhun, M., Tantuğ, A.C. ve Adalı,E.,“Rule Based Tagging of the Uyghur Verbs”. FourthInternational Conference on IntelligentComputing and Information Systems. Facultyof Computer &Information Science,AinShams University Cairo,Egypt, (2009).[14]http://www.ii.metu.edu.tr/tr/content/ agacyapili-derlem[15] Eryiğit, G, “Türkçenin Bağlılık Ayrıştırılması”,Doktora Tezi, İstanbul Teknik Üniversitesi,Bilgisayar Mühendisliği Bölümü.(2007).[16] Eryiğit.G ve Adalı,E.,” An Affıx StrıppıngMorphologıcal Analyzer For Turkısh”. Proceedingsof the IASTED International ConferenceArtificial Intelligence and applictions.Innsbruck, Austria,( 2004).<strong>Akademik</strong> Bilişim’<strong>10</strong> - XII. <strong>Akademik</strong> Bilişim Konferansı Bildirileri<strong>10</strong> - <strong>12</strong> Şubat 20<strong>10</strong> Muğla Üniversitesi549[17] Tömür, H.,.”Modern Uygur Grammar(Morphology).” Yildiz Teknik Üniversitesi,Fen-Ed Fak. T.D.E Bölümü. Istanbul .(İngilizcebaskı),( 1997).[18] Osmanof, M., “Hazirqi Zaman UyghurEdebiy Tilining İmla ve Teleppuz Lughiti”.Shin Jiang Xeliq Neshiryatı. (Uygurcabaskı),(1997).[19]Hakkani-Tur, Dilek. “Statistical Modellingof Agglutinative Languages”, PhD Thesis, Departmentof Computer Engineering, BilkentUniversity, (2000).[20] Kemal Oflazer and I. Kuruöz, “Taggingand Morphological Disambiguation of TurkishText”, Proceedings of the 4th ACL Conferenceon Applied Natural Language Processing,Stuttgart, Germany Oct. (1994).[21] Kemal Oflazer and Gökhan Tür, “CombiningHand-crafted Rules and UnsupervisedLearning in Constraint-based MorphologicalDisambiguation” Proceedings of the ACL-SIGDAT Conference on Empirical Methodsin Natural Language Processing, , Philadelphia,PA, USA. May (1996).[22] Deniz Yuret and Ferhan Türe,”LearningMorphological Disambiguation Rules forTurkish”,Proceedings of the Human LanguageTechnology Conference - North American Chapterof the Association for Computational LinguisticsAnnual Meeting (HLT-NAACL 2006)[23] Turhan Daybelge, Ilyas Cicekli, “A Rule-Based Morphological Disambiguator for Turkish”,Proceedings of Recent Advances inNatural Language Processing Borovets,Bulgaria, ,145-149,( 2007).[24] Tantuğ, A. C., “Akraba ve Bitişken DillerArasında Bilgisayarlı Çeviri İçin Karma BirModel”. . Bilgisayar Mühendisliği Bölümü.Doktora Tezi. İstanbul: İstanbul Teknik Üniversitesi.(2007).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!