10.07.2015 Views

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Kural ve Sorgu Örüntülerinin Düzenlenmesi ile Rete Tabanlı Bir Çıkarsama Motorunun EniyilenmesiTuğba Özacar Öztürk, Övünç Öztürk, Murat Osman Ünalır3.2. Buluşsal 2: Ortak Değişkene SahipKoşulları Ardışık Olarak DizmekBu optimizasyon, Rete ağının orta kısımlarındaoluşan yükü hafifletmek için, ortak değişkenesahip koşulları ardışık olarak dizer. Eğerbir kuralın n. koşulu, n-1. koşul ile ortak birdeğişkene (x), sahip ise n-1. gerçeklemede, xüzerinde oluşmuş kısıtlar sonucu E(kn)’in boyutlarıazalır.3.3. Melez BuluşsalBu iki buluşsal, birbiri ile çelişmeden ve biraradakullanıldıklarında ayrı ayrı kullanılmalarınagöre daha iyi performans sağlayacaklarıgarantisini sağlayarak melezlenebilirler. r eniyilenecekkural, C(r), r’ye ait tüm koşullarınsıralı listesi, r1 eniyilemenin sonucu ve l, C(r1)listesinin en son elemanı olmak üzere, eniyilemeaşağıdaki sırada çalışır:Adım 1:• C (r1) ← null• C(r)’ye ait en kısıtlayıcı koşulu (x), bul vex’i C(r)’den silerek, C (r1)’ye ekleAdım 2:• eğer C (r) ≠∅ ise* x ∈ C (r) olmak üzere, l ile en fazlasayıda ortak değişkene sahip koşullariçinde en kısıtlayıcı olanını (x), belirleve x’i C(r)’den silerek, C (r1)’ye ekle* Adım 2• değilse* r’yi döndürEn kısıtlayıcı koşulun belirlenmesi, kurallar vesorgular için değişir. Yöntem 1, sorguları eniyilerkenminimum “alpha” belleğe sahip olgularıbulmayı garanti eder fakat kuralların eniyilenmesisırasında işe yaramaz hale gelir. Rete ağınınoluşumu henüz tam olarak bitmediği için,kuralların eniyilenmesi sırasında bir koşul ile eşleşenüçlülerin sayısı hesaplanamaz. Bu nedenle,kuralların eniyilenmesi sırasında yalnızca ikiyöntem, şu öncelik sırasında kullanılır: Yöntem2, Yöntem 3. Bu, minimum değişkene sahip koşullariçerisinde kompleks bir yükleme sahip ilk324koşul en kısıtlayıcı olandır, anlamına gelir. Yöntem2’nin, Yöntem 3’ten daha yüksek önceliğesahip olmasının nedeni, kurallar içerisinde üçdeğişkenli ve ontolojideki tüm üçlülerle eşleşençok fazla sayıda koşulun olmasıdır. Bu koşullaren büyük “alpha” belleğe sahiptirler ve Yöntem2 bunların en sona dizileceğini garanti eder.4. Performans AnaliziBu çalışmada, çıkarsama motorunun performansınıdeğerlendirmek ve gerçekleştirileneniyilemelerin performans üzerindeki etkisinigörmek için Lehigh Üniversitesi KarşılaştırmalıDeğerlendirmesi [8] kullanılmıştır. LehighÜniversitesi Karşılaştırmalı Değerlendirmesi,anlamsal web havuzlarının büyük veri setleriile sergiledikleri performansı değerlendirmekiçin geliştirilmiştir. Veri seti, “univ-bench”adındaki ontolojiye uygun olarak ve karşılaştırmalıdeğerlendirme ile birlikte sağlanansentetik veri üretme aracını kullanarak üretilir.Havuzların performansları, veri yükleme zamanını,havuz boyutunu, sorguya tepki süresinive sorgu yanıtlarının tamlığını ve geçerliliğiniiçeren bir dizi metriğe göre değerlendirilir.Karşılaştırmalı değerlendirme takımı, belirlisorgu tiplerine karşılık gelen 14 örnek sorguyukapsar. Testler, aşağıda özellikleri verilmişolan kişisel bilgisayarda gerçekleştirilmiştir:• AMD Athlon 64 3500 2200 Ghz CPU; 2GB RAM;320 GB sabit disk• Windows XP Professional İşletim Sistemi,.NET Framework 1.1Karşılaştırmalı değerlendirme içerisindeki ilkmetrik, veri setinin yüklenme süresidir. <strong>10</strong>3,074örnek içeren LUBM(1,0) veri setinin yüklenmesi6 dakika 41 saniye sürmektedir. Bu sürenin,diğer havuzlar ile karşılaştırıldığında, özellikleyükleme sürecinin Rete algoritmasının en çokzaman alan kısmı olduğu dikkate alınırsa başarılıbir sonuç olduğu görülmektedir.Karşılaştırmalı değerlendirme içerisindeki diğermetrikler, sorgularla ilgilidir. Daha kesinsonuçlar elde edebilmek için, sorgular on kezçalıştırılıp bütün sonuçların ortalaması alınmıştır.Sistemde, tüm sorgular yüzde yüz tam ve geçerliolarak yanıtlanmıştır. Sistemin çıkarsamadüzeyi, OWL Lite ve OWL DL arasındadır. Buçıkarsama düzeyi, OWL Entailment [9] testlerinegöre belirlenmiş 30 kural ile sağlanmaktadır.Test kapsamında, eniyileme işleminden sonratüm sorgular çalıştırılmıştır. Fakat eniyilemeolmaksızın tüm sorguların çalıştırılmamasınınnedeni, sorguların eniyileme yapılmadığındaaşırı derecede yavaş çalışmasıdır. Sistemdekiperformans artışının, kural örüntülerinin yenidendüzenlenmesi dışında bir nedeni daha olduğuunutulmamalıdır. Çıkarsamayı hızlandırmak için,Rete ağının “alpha” ve “beta” kısımlarında ek indekslememekanizmaları kullanılmıştır. Tablo 1,tüm sorguların çalışma sürelerini göstermektedir.Sorgu Metrik Sorgu Metrik<strong>12</strong>34567Süre(ms) 13Süre(ms) 521Yanıt sayısı 4 8 Yanıt sayısı 7790Tamlık <strong>10</strong>0 Tamlık <strong>10</strong>0Süre(ms) 60Süre(ms) 390Yanıt sayısı 0 9 Yanıt sayısı 208Tamlık <strong>10</strong>0 Tamlık <strong>10</strong>0Süre(ms) 23Süre(ms) <strong>10</strong>Yanıt sayısı 6 <strong>10</strong> Yanıt sayısı 4Tamlık <strong>10</strong>0 Tamlık <strong>10</strong>0Süre(ms) 70Süre(ms) 140Yanıt sayısı 34 11 Yanıt sayısı 224Tamlık <strong>10</strong>0 Tamlık <strong>10</strong>0Süre(ms) 532Süre(ms) 13Yanıt sayısı 719 <strong>12</strong> Yanıt sayısı 15Tamlık <strong>10</strong>0 Tamlık <strong>10</strong>0Süre(ms) 477Süre(ms) 11Yanıt sayısı 7790 13 Yanıt sayısı 1Tamlık <strong>10</strong>0 Tamlık <strong>10</strong>0Süre(ms) 76Süre(ms) 546Yanıt sayısı 67 14 Yanıt sayısı 5916Tamlık <strong>10</strong>0 Tamlık <strong>10</strong>0Tablo 1. Sorguların çalışma zamanları.<strong>Akademik</strong> Bilişim’<strong>10</strong> - XII. <strong>Akademik</strong> Bilişim Konferansı Bildirileri<strong>10</strong> - <strong>12</strong> Şubat 20<strong>10</strong> Muğla Üniversitesi325Çalışmada sunulan eniyileme buluşsallarınınana amacı kısmi gerçeklenmelerin boyutlarınıazaltmak, diğer bir deyişle sorgu çalıştırılmasısırasında oluşan “token” sayısını azaltmaktır.Sorgu içerisinde tek bir koşul olduğunda, yanıtlamasüreci oldukça basittir. Oluşturulantüm “token”lar, yanıt kümesinin bir elemanıdır.Koşul sayısı ikiye çıktığında, ikinci koşuldaki“token”lar, birinci koşuldaki “token”larla denetlenirve bu “token”ların yanıt kümesine eklenipeklenmeyeceğine karar verilir. İki koşula kadar,koşul diziliminin performans üzerinde bir etkisiyoktur. Fakat üç veya daha fazla koşul olduğunda,koşul dizilimi önem kazanmaktadır.Bu nedenle, üç ya da daha fazla koşula sahip,2, 4, 7, 8, 9 ve <strong>12</strong> numaralı sorguları test etmekanlamlı olmaktadır. Test sonucunda tüm sorgularınçalışma zamanlarında düşüş gözlemlenmiştir.Fakat, Şekil-2’de de görüldüğü gibi, 2,7, 9 ve 4 numaralı sorguların çalışma zamanlarındakidüşüş daha da belirgindir.Şekil-2. Sorgu performanslarındaki artış.Etiket Koşul Boyuta ?x rdf:type ub:GraduateStudent 1874b ?y rdf:type ub:University 979c ?z rdf:type ub:Department 15d ?x ub:memberOf ?z 8330e ?z ub:subOrganizationOf ?y 463f ?x ub:undergraduateDegreeFrom ?y 2414Tablo 2. İkinci sorguya ait koşulların ve bu koşullarakarşılık gelen “alpha” belleklerin boyutları.Bunun nedeni, bu sorgulardaki koşulların tipleridir.Bu sorguların ortak değişkenli koşullarıyoktur ve koşullara ait "alpha" bellekler büyük

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!