10.07.2015 Views

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Türkçe Hayat Bilgisi Veri Tabanının OluşturulmasıM.Fatih Amasyalı, Bahar İnak, M.Zeki Ersen<strong>Akademik</strong> Bilişim’<strong>10</strong> - XII. <strong>Akademik</strong> Bilişim Konferansı Bildirileri<strong>10</strong> - <strong>12</strong> Şubat 20<strong>10</strong> Muğla Üniversitesi3.4 Veri Tabanına Ait İstatistiklerSistem 4 farklı kaynaktan alınan 475407 adetkavram ve bunlar arasında 40 farklı ilişki türüneait <strong>10</strong>89230 adet ilişki içermektedir. İlişkitürleri ve bu ilişkiye sahip kavram sayıları Tablo1’de verilmiştir.İlişki TürüConceptNetOrijinalWordnetTürkçeWordnetWebNe içinkullanılır?36864 0 0 0Bu neyapabilir?51549 0 0 0Neredebulunur?30778 0 0 0Ne arzu eder? 5989 0 0 0Bunun için negerekir?17822 0 0 0Bunun neözellikleri 1<strong>12</strong>14 0 0 0var?Neydenyapılmış?<strong>10</strong>00 0 0 0Neyin birparçası?8<strong>10</strong>5 0 0 0İçerdiğiolaylar 20330 0 294 0nelerdir?Bunun tanımınedir?2721 0 0 0Neye sebepolur?130<strong>10</strong> 907 237 0Neyi istetir? 7777 0 0 0Hangi hedefiçin bu 5297 0 0 0yapılır?Bunun içinilk önce ne 3147 0 0 0yaparsın?Bu netarafından <strong>10</strong>7 0 0 0oluşturulur?Buna neleryapılır/145 0 0 0uygulanır?Bu hangiolayla biter?2839 0 0 0Eşanlamlı 0 <strong>12</strong>4320 6999 0ÜstKavramıdır34566 282137 24141 0Benzer Fiiller 0 2807 758 0Alan adınedir?0 0 776 0YaklaşıkZıtanlamlı0 0 1678 0Durumundadır 0 0 1546 0BölümünBütünü0 27842 2385 0ÜyeninBütünü0 57717 2907 0Benzer Anlam 0 21999 504 0ParçanınBütünü0 0 230 0Zıtanlamlı 0 3463 0 0Sıfatın Eylemi 0 115 0 0Birliktegeçmek0 433 0 0Bu neyigerektirir?0 1990 0 0Bunun içeriğinedir?0 2349 0 0Sıfatın İsmi 0 1885 0 0İsim Hali 0 6087 0 0Fiil - Fiil 0 0 0 <strong>10</strong>255İsim - Fiil 0 0 0 200542İsimTamlaması0 0 0 3370Sıfat - Fiil 0 0 0 163<strong>12</strong>Sıfat - Sıfat 0 0 0 3735Sıfat -Tamlaması0 0 0 25250Toplam ilişkisayısı253260 534051 42455 259464Genel Toplam= <strong>10</strong>89230Tablo 1. Veri tabanının içerdiğiilişki türleri ve frekanslarıTablo 1 incelendiğinde, farklı kaynaklarda yeralan aynı ilişki türlerinin olmasına rağmentemelde ilişki türlerinin birbirlerinden ayrıkolduğu ve tasarladığımız veri tabanının buaçıdan bütünleştirici bir içeriğe sahip olduğusöylenebilir.4. Sistemin KullanımıSistemin içerdiği bilgilere erişim için kullanılanbir arayüzü bulunmaktadır. Kullanıcılarsisteme giriş yaptıktan sonra Şekil 2’de gösterilmişolan arayüze erişmektedirler.Şekil 2. Sistemin ArayüzüŞekil 2’deki arayüzde kullanıcının kavramlarladoldurabileceği iki alan, iki kavram arasındakiilişki türünü seçebileceği bir çoktan seçmeli listeve ilişkilerin getirileceği kaynakları seçeceğiseçme kutuları yer almaktadır. Bu alanlar kullanarak;şu kavramın hangi kavramlarla hangiya da şu tür ilişkide olduğu, hangi kavram ikililerininşu tür ilişkiye sahip olduğu gibi çeşitlisorgular yapılabilmektedir. Bununla birliktekullanıcının sistemin verdiği cevaplar hakkındapuan vermesi de sisteme entegre edilmiştir. Bununamacı kullanıcılardan gelen geri bildirimlerlebilgilerin güvenilirliklerini arttırmaktır.4.1 Cevapların Sıralanma ÖlçütleriKullanıcı sistemde bir sorgulama yaptığındabulunan cevaplar güvenilirlik derecelerinegöre sıralanarak kullanıcıya gösterilmektedir.Güvenilirlik değerlerinin hesaplanması sorgutürlerine göre farklılık göstermektedir. Eğerkullanıcı cevabı sadece kavramlardan oluşanbir sorgu (Ör: ağaç ile bütünün üyesi ilişkisinesahip kavramlar nelerdir?) gönderirse cevaplarkavramların frekanslarına göre, cevabı kavramve ilişki türlerini içeren bir sorgu (Ör: ağaç ilehangi kavramların hangi tür ilişkileri vardır?)gönderirse kavram ve ilişkinin frekansına göre,cevap sadece ilişki türlerini içeren bir sorgu(Ör: ağaç ile kağıt arasında hangi tür bir ilişkivardır?) içinse cevaplar ilişki türünün frekansınagöre hesaplanan güvenilirlik katsayılarınagöre sıralanarak kullanıcıya gösterilir.4.2 Sistemin İçerdiği Bilgilere ÖrneklerSistemin içerdiği çeşitli ilişki türlerinden 6’sınaait çeşitli bilgi ikilileri sistemin içeriği hakkındabilgi vermesi amacıyla Tablo 2’de verilmiştir.Neye sebepolur?öldürmek-cezaBundan neleryapılır?taş-köprüBunun için negerekir?yazmakaraştırmakdenemek-paradoğurmakhayatçelik-makineuyumak-yatmak sevmek-umut su-bulutseyahat etmekenerjisevmek-acı kağıt-gazeteöğrenmekokumakateş-acı yün-kumaşyaşam-yiyeceköldürmeküzüntükumaş-gömlekNe içinkullanılır?Bu neyapabilir?Neredebulunur?asker-savaş kuş-uçmak oda-binaçatal-yemek kişi-yürümek kişi-odatop-oynamakbilgisayardüşünmekelbise-mağazaördek-yemek çocuk-düşmek kemik-kişihastalıköldürmekbıçak-kesmek asker-savaşbaş-düşünmek gemi-batmak öğrenci-okulTablo 1. Veri tabanının içerdiği bilgilere6 ilişki türünden örneklerTablo 2’de yer alan bilgiler 4.1. bölümde anlatılansıralama ölçütlerine göre sıralandıklarındaher bir ilişki türü için en yüksek puanlı / engüvenilir bilgilerdir5. SonuçGündelik hayat bilgisi veri tabanlarının geleceğinbilgisayar sistemlerinin vazgeçilmez parçalarıolacağı yönünde birçok görüş bulunmaktadır.Bu nedenle literatürde birçok çalışma yeralmaktadır. Bu çalışma da ise Türkçe için ilkgündelik hayat bilgisi veritabanı oluşturulmuşve erişim için bir web arayüzü tasarlanmıştır.Sistemin içerdiği yenilikler olarak, Türkçe içinbir ilk olması, birçok kaynaktan beslenmesi vearama seçeneklerinin benzeri sistemlere göredaha gelişmiş olmasıdır.346347

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!