11.07.2015 Views

Heceleme Yöntemiyle Kök Sözcük Üretme

Heceleme Yöntemiyle Kök Sözcük Üretme

Heceleme Yöntemiyle Kök Sözcük Üretme

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Heceleme</strong> Yöntemiyle Kök Sözcük Üretmeİ.Büyükkuşcubuyukkuscu@itu.edu.trE. Adalıadali@cs.itu.edu.trİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği BölümüÖzetçeKaynaklarda da değinildiği üzere türkçe eklemelibir dil olduğundan, Türkçe’nin doğuşunda köksözcüklerin tek hece olduğu düşünülmektedir.Zamanla bu tek heceli köklerin yapım ekleriylebirleştirilerek yeni sözcüklerin elde edildiği ve sıkkullanılan sözcüklerin kulaktan kulağadeğişimlerle birlikte yerleşerek yeni sözcüklerinüretilmiş olduğu söylenebilir. Diğer dillerdenalınmış sözcüklerin tek veya çift hecelik kökyapısına uymayacağı görüşü dil bilimcilerarasında kabul görmektedir. Bu düşüncedenfaydalanılarak, , heceleme yöntemiyle bir ve ikiheceden oluşan kök sözcük üretim yöntemi, bumakalede tanıtılmıştır.AbstractThis paper presents synthetic root synthesismethod.Turkish language is agglutinative, that is,grammatical functions are indicated by addingvarious suffixes to roots. There are two mainsuffix classes. In one class suffixes change themeaning of the root and make it a new stem viaderiving the root. New meaning calls the root’smeaning but stem points to totally new thing. Inthe other class suffixes adds some features to theroot, The thing that is pointed doesn’t changesbut it can marked plural, some case endingnominative, genitive, dative, accusative, locativeand ablative can be added. For example, “ev”means “home”. “Ev-de” means “in home”. “deand da” suffixes always give the “at thatlocation” meaning. Again verbs have the sameproperty. They have some time suffixes, wish andorder suffixes. There are nearly 200 suffixes inTurkish. And generally each suffix gives ameaning to the root.Lots of Turkish linguist says that when Turkishborn the names has only one syllable. And newnames are created by adding suffixes to them.When we are looking for root word we shouldlook to the word which has one or two syllable.In this paper different from the other syntheticword synthesis we used syllables.We applied all Turkish rules to those words. Theymay used as alternative root words for totallynew innovative things.1. GirişTürkçe sondan eklemeli ve kurallı bir dildir. Köksözcüklerin sonuna, bu köke farklı anlamlar katanyapım ekleri eklenerek bu sözcüğü çağrıştıranama tümüyle farklı bir şeyi anlatan gövdesözcükler elde edilir. Türkçe’de isim soylu kökveya gövdenin sonuna tekillik, çoğulluk,bulunma, yönelme gibi hal ekleri, iyelik ekleri,eşitlik ekleri eklenebilir. Eylem soylu kök vegövdenin sonuna zaman ekleri, kip ekleri (-ayım,-eyim, -se, -sa, -mek, -mak), şahıs ekleri, ilgiekleri çekim ekleri eklenir. Çekim eki denilen buekler kökün ya da gövdenin anlamınıdeğiştirmez, sadece ona işlerlik katar. Görüldüğüüzere Türkçe’de sözcükler eklerle genişleyen biryapı görünümündedir.Besim Atalay gibi pek çok dilbilimci Türkçe’ninbir hecelik köklerden doğduğunu düşünmektedir[1]. Zamanla bu kök sözcüklere ekler getirilerekyeni sözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.


Bu makalede bu görüşten yola çıkarak, sadece birve iki hecelik Türkçe sözcüklerin üretilmesi içingeliştirdiğimiz yöntem tanıtılacaktır.Geliştirdiğimiz yöntem, aslında, Türkçe’nindilbilgisi kurallarını uyarlamak olarak tadüşünülebilir.G. Eryiğit ve arkadaşlarının makalesindekullanılan yöntem, bir sözcüğü oluşturanharflerin Türkçe’nin dilbilgisi kurallarına uygunolarak dizilmesi olarak açıklanabilir [2]. Bumakalede tanıtılan yöntem, hece temelli olupayrıca tüm dilbilgisi kurallarına da dikkatetmektedir.Sözcük üretme sırasında, sadece harflerin dizilişiile ilgilenildiğinde, bazı durumlarındeğerlendirilmediği görülmektedir. Anılançalışmada yedi harfe kadar olan sözcüklerüretilmiştir. Doğal olarak bu sözcükler, bir iki yada üç heceden oluşmaktadır. Gözlenen eksikliklerşöyle açıklanabilir:Bir heceli sözcükler, olası tüm sözcüklerikapsamaktadır. İki Heceli sözcükler, iki heceliolası tüm sözcükleri kapsamamaktadır. Benzerşekilde üç heceli sözcükler de olası üç heceli tümsözcükleri kapsamamaktadır. Durum Tablo-1,Tablo-2…’de gösterilmiştir.Tablo-1Bu çalışmada hece yöntemini kullanılmıştır.Türkçe sözcüklerde, hece birleştirme kuralları davardır. Bu kurallar da çalışmamızda göz önünealınmıştır. Böylece geçerliliği daha yükseksonuçlar elde edilmiştir.2. KurallarKök kelimeler bulunurken aşağıdaki kurallardikkate alınmıştır:1- S harfin sesli, Z sessiz olduğunugöstermek üzere S, SZ, SZZ, ZS, ZSZ,ZSZZ hece türleri vardır.2- Üç sessiz sözcük başında ve sonundayana gelmez.3- İki sesli yanyana gelmez.4- Büyük ünlü uyumu gözetilmiştir.5- Küçük ünlü uyumu sağlanmıştır.6- Aynı hecede iki sessiz harf varsa busessiz harf çifti aşağıdakilerden biridir:“lç,lk,lp,lt,nç,nk,nt,rç,rk,rp,rs,rt,st,şt”7- “l” harfinden sonra “ç,k,p,t” gelebilir.8- “n” harfinden sonra “ç,k,t” gelebilir.9- “r” harfinden sonra “ç,k,p,s,t” gelebilir10- “s” harfinden sonra “t” gelebilir.11- “ş” harfinden sonra “t” gelebilir.12- 7- “j” türkçe bir harf değildir türkçekökenli kelimelerde bulunmaz; oyüzden sessizler içine alınmamıştır.13- 8- “ğ” ile başlayan kelime yoktur.14- Eğer sessiz ile biten bir heceye sessizile başlayan bir ek geliyorsa o zamanikinci hece de de “ğ” yoktur.15- 9- Sert sessizlerin benzeşmesi heceiçlerinde dikkate alınmıştır.16- 10- Kelimelerin “b,c,g,d” ile bitmemesidikkate alınmıştır.17- 11- “o” harfinin kelimenin ilk hecededışında başka bir yerinde olmamasıdikkate alınmıştır.3. <strong>Heceleme</strong> yöntemiyle KökSentezinin Algoritma AkışDiyagramıBesim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.4. Sentetik kelime türetmeMetodlarının KıyaslanmasıBesim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.


4.1 <strong>Heceleme</strong> Yönteminin izinverdiği Diğer Kuralların daKelime Sentezinde kullanılmasıBesim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.4.2 Elde edilen kelimelerinkullanım yüzdelriBesim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.4.2.1 Kelimelere Göre SözcükfrekanslarıBesim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.4.2.2 Hecelere Göre SözcükfrekanslarıBesim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.4.2.3 Kelimelere ve Hecelere GöreSözcük frekansının KıyaslanmasıBesim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.5. SonuçlarBesim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.Besim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.NB, MBL ve SVM KarşılaştırılmasıTablo–3: Yanlış Uyarı / Kaçırma Oranları6. Sonuçlar ve GelecekÇalışmalar


Besim Atalay gibi pek çok dilbilimci türkçeninbir hecelik köklerden doğduğunu süşünmektedir.Zamanla bu kök sözcüklere ekler getirilerek yenisözcükler türetilmiş bunların yerleşmesi vekökenlerinin unutulmasıyla sanki bu sözcüklerkendi başlarına kök sözcükmüş gibi varsayılmayabaşlanmıştır.Kaynaklar[1] Sahami, M., S. Dumais, D. Heckerman, E.Horvitz. 1998. “A Bayesian Approach toFiltering Junk E-Mail”. Learning for TextCategorization – Papers from the AAAIWorkshop, pages 55–62, Madison Wisconsin.AAAI Technical Report WS-98-05.[2] Androutsopoulos I., Koutsias J.,Chandrinos K.V., Paliouras G., SpyropoulosC.D., 2000. “An Evaluation of Naive BayesianAnti-Spam Filtering“. Proceedings of theworkshop on machine Learning in the NewInformation Age, 11th European Conference onMachine Learning (ECML 2000), Barcelona,Spain, pp. 9-17.[3] Sakkis G., Androutsopoulos I., PaliourasG., Karkaletsis V., Spyropoulos C.D.,Stamatopoulos P., 2003, “A Memory-BasedApproach to Anti-Spam Filtering for MailingLists”, Information Retrieval 6(1), 49-73, KluwerPublishing[4] Xavier Carreras, Lluís Marquez, BoostingTrees for Anti-Spam Email Filtering (2001),Proceedings of RANLP-01, 4th InternationalConference on Recent Advances in NaturalLanguage Processing[5] Drucker H., Wu D., Vapnik V.N., 1999.“Support Vector Machines for SpamCategorization”, IEEE Transactions On NeuralNetworks, pages 1048-1054.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!