Akademik BiliÅim '10 10 - 12 Åubat 2010 MuÄla

More documents

Recommendations

Info

İş Zekası Çözümleri için Çok Boyutlu Birliktelik Kuralları AnaliziDerya Birant, Alp Kut, Medi Ventura, Hakan Altınok, Benal Altınok, Elvan Altınok, Murat Ihlamurveya düşey eksenlerde çakıştırarak görebilmektedirler.Örneğin; demografik veriler (yaş,cinsiyet, eğitim durumu vb.), sayısal veriler(adetler, işlem miktarları, bütçelenen değerlervb.), ürün özellikleri (renk, boyut vb.) ve zamangibi farklı açılardan bakılarak daha ayrıntılıanalizler yapabilmektedirler.Analizde göz önünde bulundurulacak veriboyutlarının, B={B 1,B 2,B 3,...,B t}, veritabanıtablosunun da VT={H 1, H 2, H 3,...,H t} olarakifade edildiğini düşünelim. Bu durumda veritabanıtablosunda yer alan bir hareket kaydıH i={b i1,b i2,b i3,...,b it} olacaktır. B iboyutununiçerdiği tanım kümeleri (domain) ile b ijϵ B iifadesi kullanılabilmektedir. Bu durumda VTveritabanı tablosu B 1X B 2X … X B tçaprazçarpımının alt kümesi olmaktadır.Çok boyutlu birliktelik kuralları genel olarakiki türe ayrılır. Karşılaştırma elemanları tekraretmeyen kurallar boyutlar arası birliktelik kuralları,tekrar eden kurallar ise hibrit birliktelikkuralları olarak adlandırılır.Boyutlar arası birliktelik kuralı örneği:Şube(“Cihan”) Λ Gün(“Salı”) SatınAlma("Aürünü")Hibrit birliktelik kuralı örneği:Şube(“Cihan”) Λ Gün(“Salı”) Λ SatınAlma(“Aürünü”) SatınAlma("B ürünü")4. AlgoritmaBirliktelik kuralları analizi konusunda geliştirilmişolan başlıca algoritmalar APRIORI[1], ECLAT [14], MAFIA [2] ve FP-Growth[5] algoritmalarıdır. Bu algoritmalar karşılaştırıldığındaFP-Growth algoritmasının yüksekperformans gösterdiği görülmüştür. [4] Bu algoritmabüyük veri-setlerinde hızlı çalışabilenve sistem kaynaklarını verimli kullanabilenbir algoritmadır. Bunun en büyük nedeni, tümveritabanını FP-Tree (Frequent Pattern Tree)218adı verilen sıkıştırılmış bir ağaç veri yapısındatutmasıdır. Ayrıca algoritma tüm veritabanı sadeceiki kez taramaktadır. Birinci tarama, tümnesnelerin destek değerlerinin hesaplanmasıiçin, ikincisi tarama ise ağaç veri yapısınınoluşturulması içindir.Şekil 2’de FP-Growth algoritmasının genelyapısı gösterilmektedir. Algoritmada öncelikleveritabanındaki her bir nesnenin destekdeğerleri hesaplanmaktadır. Destek değerleri,algoritmaya girdi olarak verilen destek eşikdeğerine büyük ve eşit olan nesneler büyüktenküçüğe sıralanarak bir liste içerisine konulmaktadır.Bu eleme sayesinde yaygın olmayannesnelerin hiçbir zaman ağaca eklenmemesisağlanmış olur. Veritabanındaki her bir hareketkaydı nesnelerin destek değerlerine göresıralanarak ağaca sıkıştırılmış biçimde eklenir.Sıralama işlemi sayesinde destek değeri dahabüyük olan nesneler köke daha yakın olmaktadır.Sıkıştırma işlemi çok tekrarlı nesnelerinilk-ekler olarak birleştirilmesi ile gerçekleştirilir.Bu metot arama maliyetini önemli ölçüdeazaltır. Hareket kaydı içerisinde yer alan birnesne ağaçta yoksa o nesne için yeni bir düğümoluşturulur ve destek değeri 1 olarak atanır.Eğer o nesne daha önce ağaçta oluşturulmuşise sadece o düğümün destek değeri 1 arttırılır.Nesnelerin ağaçtaki başlangıç noktaları başlıktablosu içerisinde tutulur. Aynı zamanda ağaçiçerisinde aynı nesneyi içeren düğümler birbirinebağlanır. Ağaç oluşturulduktan sonra üzerindeGrowth algoritması çalıştırılır.Şekil 3’de her bir nesne için çalıştırılan Growthalgoritmasının genel yapısı gösterilmektedir.Öncelikle içerisinde o nesnenin geçtiği yollarbelirlenir. Eğer tek bir dal varsa yaygın nesnelerkümesi, dalı oluşturan nesnelerin kombinasyonudur.Eğer birden fazla yol varsa, destekdeğer o yoldaki minimum destek değeri olarakbelirlenir. Daha sonra bu yollar o nesne içinkoşullu örüntü temelini (conditional patternbase) oluşturur. Her bir koşullu örüntü temelindenkoşullu örüntü ağacı (conditional patterntree) oluşturulur. Daha sonra bu şartlı örüntüağacı üzerinde algoritma özyinelemeli olarakyeniden çalıştırılır.Şekil 2. FP-Growth algoritmasının genel yapısıŞekil 3. Growth algoritmasının genel yapısıFp-Growth algoritması sonlandığında birliktesıklıkla görünen nesneler kümesi belirlenmişAkademik Bilişim’10 - XII. Akademik Bilişim Konferansı Bildirileri10 - 12 Şubat 2010 Muğla Üniversitesi219olur. Algoritma böl ve yönet yaklaşımına uygunolarak ana görevin kendi içinde daha küçükgörevlere ayrılmasına olanak vermektedir.Ayrıca oluşturulan FPtree veri yapısı asıl verikümesinden daha büyük olmamaktadır.5. Pazar Sepet Analizi UygulamasıBirliktelik kuralları analizi, en yaygın olarakpazar sepet analizi uygulamalarında kullanılmaktadır.Bu uygulamalarda temel amaçmarketlerde hangi ürünlerin birlikte satıldığınıbelirlemektir.Bu bildirideki uygulamada amaç, hangi şubedehangi gün hangi ürünlerin birlikte satıldığıbelirlemektir. Çok boyutlu veriler üzerindenhibrit birliktelik kuralları çıkarılmaktadır.Uygulama, önceki bölümlerde anlatılan modelive algoritmayı içerecek şekilde çalışma kapsamındageliştirilen “Analyzer” arayüzü kullanılarakgerçekleştirilmiştir. [9]5.1 Veri AmbarıUygulamada kullanılan veri ambarı, bir mağazanın9 şubesine ait 6300 müşterinin 6 aylık95000 alışveriş hareket verilerini içermektedir.Veri ambarı oluşturulurken veri indirgeme, temizleme,ön işleme ve dönüştürme işlemleriyapılmıştır. Örneğin, tarihler haftalık günleredönüştürülmüş, geçersiz veriler çıkartılmıştır.Şekil 4’de veri ambarının kar tanesi şeması(snowflake schema) gösterilmektedir. Alışverişhareketlerini içeren olgu tablosu (fact table)satış, şube ve zaman boyutlarını birleştirmektedir.Müşteri ve ürün tabloları alışveriş hareketlerinidestekleyici konumdaki tablolardır.Tablo1’de uygulamada kullanılan veri setininküçük bir örneği verilmektedir. Mağazanınsattığı ürünler A, B, C gibi harfler olarakkodlanmıştır.
İş Zekası Çözümleri için Çok Boyutlu Birliktelik Kuralları AnaliziDerya Birant, Alp Kut, Medi Ventura, Hakan Altınok, Benal Altınok, Elvan Altınok, Murat IhlamurAkademik Bilişim’10 - XII. Akademik Bilişim Konferansı Bildirileri10 - 12 Şubat 2010 Muğla Üniversitesi5.3 Veri Madenciliği SonuçlarıHangi şubede, hangi gün, hangi ürünlerin satıldığınıbelirlemeye yönelik yapılan uygulamasonuçlarının bir kısmı hem tabloda hemde grafiksel olarak Şekil 5’in 4. bölümündegösterilmektedir. Böylece müşterilerin satınalma alışkanlıkları çözümlenmiş olmaktadır vesatışları arttırmaya yönelik stratejiler geliştirilebilmektedir.Analiz sonuçlarının sağlayacağıbaşlıca yararlar şunlardır:Kısacası, farklı semtlerde bulunan birden fazlamağaza için farklı eğilimleri tespit edip, mağazabazında doğru satış ve stok politikalarıizlenebilmektedir.Şekil 4. Kar tanesi şemasıŞube Gün Ürünler01-Cihan Pazartesi A, B, C02-Bilkent Pazartesi A, D02-Bilkent Salı B, E, K02-Bilkent Salı C, K, Y, Z… … …09-Pazar A, C, EKeçiörenTablo 1. Örnek veriseti5.2 Veri MadenciliğiVerilerin hazırlanmasının ardından uygulamaüç aşamada gerçekleştirilmektedir:• Boyutların seçimi: OLAP küpünde bulunanboyutlardan, birliktelik analizine dahiledilmek istenen sahalar belirlenmelidir.(Şekil 5 – Bölüm 1)• Filtreleme: Çok büyük veri setlerinde filtrelemeyapılarak sadece belli bir kısım veriiçin birliktelik analizi çalıştırılabilmektedir.Örneğin; haftanın günlerinin hepsiyerine bir yada birkaçı seçilebilmektedir.(Şekil 5 – Bölüm 2)• Birliktelik analizi parametrelerinin tanımlanması:Verilen destek eşik değeri ile bellibir oranın üzerindeki birliktelikler bulunmaktadır.Ayrıca tüm birliktelik sonuçlarıyerine sadece istenilen sayıda nesne içeren– örneğin sadece üçlü – birliktelikler gösterilebilmektedir.(Şekil 5 – Bölüm 3)220• Belirlenen gün ve şubede, X ürününü alanlarınY ürününü de çok yüksek olasılıklaaldıkları biliniyorsa ve eğer bir müşteri Xürününü alıyor ama Y ürününü almıyorsa,o potansiyel bir Y müşterisidir denilebilir.• Her ürün için şube bazında bir sonrakiayın satış tahminleri çıkarılabilir.• Birlikte satın alınan ürünler için şubeve gün bazında promosyon uygulamasıyapılabilir.• Yeni bir ürün için potansiyel satış bölgesibelirlenebilir.• Analiz sonuçlarına göre stok eritmeyegidilebilir.• Ürün kataloglarında birlikte satılanürünler aynı sayfaya konularak çekici halegetirilebilir.• Web sitelerinde bir ürünle ilgilenen kişiye,bu ürünle birlikte en çok satılan ürününreklamı gösterilerek çapraz satış önerisigetirilebilinir.• Şube ve gün bazında reyon ve raf dizilişlerideğiştirilebilir. Bu konuda iki farklıstrateji geliştirmek mümkündür. Birincisistrateji, sıklıkla birlikte satın alınan ürünlerinbirbirine yakın iki farklı noktaya konulmasıve böylece müşterilerin iki ürünarasında bulunan reyonlardaki ürünleri dealma ihtimalini yükseltmektir. İkinci strateji,birlikte çok fazla satılan ürünlerin yanyana koyulması ile müşteri beklentilerinisağlanmak, ürünlerden birisini alan müşterinindiğerini almayı unutmasını engellemekve diğer ürünü de alma ihtimaliniarttırmaktır.6. Sonuçlar ve Gelecek ÇalışmalarÇalışmada, iş zekası çözümleri sunmaya yönelikolarak FP-Growth algoritmasını içeren biryazılım çerçevesi geliştirilmiştir. Çalışmanınamacı, toplanan çok boyutlu büyük veri yığınlarından,veri madenciliği yöntemleri ile öncedenbilinmeyen, yararlı ve kullanışlı olabilecekkuralların keşfedilmesidir. Veri madenciliği sonucundaelde edilecek bilgiler, mevcut durumudaha iyi görmeyi ve geleceğe yönelik akılcı vestratejik kararlar almayı sağlayacaktır.Gelecek çalışmalarda, Analyzer yazılımı ilediğer veri madenciliği yöntemlerini (kümeleme,sınıflandırma, sıralı örüntü analizi, aykırıdurum analizi) içeren uygulama çalışmalarınınyapılması ve elde edilecek sonuçlarının sunulmasıhedeflenmektedir.Şekil 5. “Open Analyzer” ekran görüntüsü2217. Kaynaklar[1] Agrawal, R., Imielinski, T., Swami, A.,“Mining Association Rules between Sets ofItems in Large Databases”, SIGMOD’93,ACM Press, 207-216 (1993).[2] Burdick, D., Calimlim, M., Gehrke, J.,“MAFIA: A Maximal Frequent Itemset Algorithmfor Transactional Databases”, Proceedingsof the 17th International Conferenceon Data Engineering, Heidelberg, Germany,443-452 (2001).[3] Dogan, B., Camurcu, Y., Association RuleMining from an Intelligent Tutor, Journal ofEducational Technology Systems, 36 (4): 433- 447 (2008)
Page 4 and 5:
Tıp Bilişiminde Mobilite Uygulama
Page 6 and 7:
İnternet ve Sanat, Yeni Medya ve n
Page 9 and 10:
Page 11 and 12:
Page 14 and 15:
Akademik Bilişim’10 - XII. Akade
Page 17 and 18:
Öğrenci ve Öğretim Elemanının
Page 19 and 20:
Lise Öğrencilerinin Mesleki Yönl
Page 21 and 22:
Lise Öğrencilerinin Mesleki Yönl
Page 23 and 24:
Telsiz Duyarga Ağları ile Bir Nes
Page 25 and 26:
Page 27 and 28:
Kablosuz Algılayıcı Ağlar ve G
Page 29 and 30:
Page 31 and 32:
Çizge Teorisi, Dağıtık Algoritm
Page 33 and 34:
Uzaktan Eğitimde Sistem Odası Tas
Page 35 and 36:
Hizmet İçi Eğitime Farklı Bir Y
Page 37 and 38:
Hizmet İçi Eğitime Farklı Bir Y
Page 39 and 40:
Orta Öğretimden Üniversiteye Gel
Page 41 and 42:
Orta Öğretimden Üniversiteye Gel
Page 43 and 44:
Uzaktan Eğitimde Yeni Bir Yaklaş
Page 45 and 46:
Page 47 and 48:
Erişim Ağlarında WIMAX’ın Opt
Page 49 and 50:
Page 51 and 52:
Türk ve Dünya Hukukunda Bilişim
Page 53 and 54:
Page 55 and 56:
Mekânsal Bilişime Ontolojik Bir Y
Page 57 and 58:
Mekânsal Bilişime Ontolojik Bir Y
Page 59 and 60: Mekânsal Bilişime Ontolojik Bir Y
Page 61 and 62: Temel Bilişim Eğitiminde Enformat
Page 63 and 64: Mobi̇ l Peer-To-Pee (P2P) Ağlarda
Page 65 and 66: Mobi̇ l Peer-To-Pee (P2P) Ağlarda
Page 67 and 68: Bulut Hesaplama Teknolojisi: Mimari
Page 69 and 70: Bulut Hesaplama Teknolojisi: Mimari
Page 71 and 72: Görevdeş (P2P) Ağlarda Sık Bulu
Page 73 and 74: Görevdeş (P2P) Ağlarda Sık Bulu
Page 75 and 76: Çevrimiçi Web Analiz Yazılımlar
Page 77 and 78: Web Sitelerinde Kullanılabilirlik
Page 79 and 80: Akademik Bilişim’10 - XII. Akade
Page 81 and 82: Akademik Profil Web SayfasıMehmet
Page 83 and 84: Mekansal Veritabanlarında Hızlı
Page 85 and 86: Mekansal Veritabanlarında Hızlı
Page 87 and 88: Öncül Parola Denetimi Yöntemiyle
Page 89 and 90: Öncül Parola Denetimi Yöntemiyle
Page 91 and 92: Yazılım Geliştirme Süreçleri v
Page 93 and 94: Yazılım Geliştirme Süreçleri v
Page 95 and 96: Web Tabanlı CMMI Süreç Yönetimi
Page 99 and 100: Geleneksel Yazılım Mühendisliği
Page 101 and 102: Geleneksel Yazılım Mühendisliği
Page 103 and 104: Veriambarı Yazılım Geliştirme S
Page 105 and 106: Veri Madenciliğinde Temel Bileşen
Page 107 and 108: Veri Madenciliğinde Temel Bileşen
Page 109: İş Zekası Çözümleri için Ço
Page 113 and 114: Görüntü İşlemede Yeni Bir Solu
Page 115 and 116: Görüntü İşlemede Yeni Bir Solu
Page 117 and 118: Bağlantısız Web Uygulamalarını
Page 119 and 120: Bağlantısız Web Uygulamalarını
Page 121 and 122: Web 2.0 Yeniliklerinin Eğitimde Ku
Page 123 and 124: Kurumsal Kimlik Yönetiminde Günce
Page 125 and 126: Kurumsal Kimlik Yönetiminde Günce
Page 127 and 128: Nesneye Dayalı Programlarla Nesne
Page 129 and 130: Normatif Çoklu Etmen Sistemlerinde
Page 131 and 132: Normatif Çoklu Etmen Sistemlerinde
Page 133 and 134: Birbirleriyle Etkileşim Halinde Bu
Page 135 and 136: Birbirleriyle Etkileşim Halinde Bu
Page 137 and 138: Gezgin Satıcı Probleminin İkili
Page 139 and 140: Gezgin Satıcı Probleminin İkili
Page 143 and 144: Web Tabanlı Sayısal Yarıgrup Hes
Page 145 and 146: Web 2.0 Uygulamalarının E-Öğren
Page 147 and 148: Web 2.0 Uygulamalarının E-Öğren
Page 149 and 150: İstatistiksel Yazılım Geliştirm
Page 151 and 152: Arama Motoru OptimizasyonuCoşkun A
Page 153 and 154: Arama Motoru OptimizasyonuCoşkun A
Page 155 and 156: Üst Seviye Ontolojileri Üzerine B
Page 157 and 158: Üst Seviye Ontolojileri Üzerine B
Page 159 and 160: Anlamsal Web Politika Dillerinin Ka
Page 161 and 162:
Anlamsal Web Politika Dillerinin Ka
Page 163 and 164:
Kural ve Sorgu Örüntülerinin Dü
Page 165 and 166:
Page 167 and 168:
Eğitimde bir Günlük Uygulaması:
Page 169 and 170:
Eğitimde bir Günlük Uygulaması:
Page 171 and 172:
Web 2.0 Teknolojilerinin Eğitim Ü
Page 173 and 174:
Türkçe Hayat Bilgisi Veri Tabanı
Page 175 and 176:
Türkçe Hayat Bilgisi Veri Tabanı
Page 177 and 178:
Türkiye’de İşe Alım Sürecini
Page 179 and 180:
Page 181 and 182:
Türkiye’de Bilim ve Teknoloji Po
Page 183 and 184:
Türkiye’de Bilim ve Teknoloji Po
Page 185 and 186:
Türkiye’de Planlı Kalkınma ve
Page 187 and 188:
Türkiye’de Planlı Kalkınma ve
Page 189 and 190:
Bilişim Şuraları, Teknoloji Poli
Page 191 and 192:
Bilişim Şuraları, Teknoloji Poli
Page 193 and 194:
Düşük Maliyetli Web Tabanlı Uza
Page 195 and 196:
Düşük Maliyetli Web Tabanlı Uza
Page 197 and 198:
Mobil Öğrenme Teknolojileri ve Ar
Page 199 and 200:
Page 201 and 202:
Öğretim Teknolojileri: Tanımı v
Page 203 and 204:
Page 205 and 206:
Braille Alfabesi ile Yazılmış Ka
Page 207 and 208:
Bilgi Güvenliğinde El YazısıBor
Page 209 and 210:
Güvenli İnternet Bankacılığı
Page 211 and 212:
Güvenli İnternet Bankacılığı
Page 213 and 214:
SMTP Protokolü ve Spam Mail Proble
Page 215 and 216:
SMTP Protokolü ve Spam Mail Proble
Page 217 and 218:
Sembolik Hesaplamalar için Mathema
Page 219 and 220:
Genişband Gezgin Haberleşmede Yen
Page 221 and 222:
Üç Boyutlu Çerçeve Yapıların
Page 223 and 224:
Üç Boyutlu Çerçeve Yapıların
Page 225 and 226:
Değişken Kalınlıklı İzotrop P
Page 227 and 228:
Değişken Kalınlıklı İzotrop P
Page 229 and 230:
Katsayıları Özellikli Bant Matri
Page 231 and 232:
Page 233 and 234:
Beykent Üniversitesi Yazılım Mü
Page 235 and 236:
Beykent Üniversitesi Yazılım Mü
Page 237 and 238:
Kampüs Ağlarında Etkin Bant Geni
Page 239 and 240:
Kampüs Ağlarında Etkin Bant Geni
Page 241 and 242:
Yabancı Dilde Lisans Öğrenimi i
Page 243 and 244:
Pardus’un 64 bit Mimarisine Port
Page 245 and 246:
Page 247 and 248:
İnternetteki Etkileşim Merkezi So
Page 249 and 250:
Page 251 and 252:
Desert Dune Dynamics And ProcessesL
Page 253 and 254:
Uydu Kentlerin Tasarımı için Bir
Page 255 and 256:
Uydu Kentlerin Tasarımı için Bir
Page 257 and 258:
Kent Kaynaklarının Etkin ve Verim
Page 259 and 260:
Kent Kaynaklarının Etkin ve Verim
Page 261 and 262:
Anadolu Liselerine Öğretmen Atama
Page 263 and 264:
Akıllı Trafik Denetimi ve Yöneti
Page 265 and 266:
Akıllı Trafik Denetimi ve Yöneti
Page 267 and 268:
3-Boyutlu Sanal Üniversite Oryanta
Page 269 and 270:
Page 271 and 272:
Metin İçerikli Türkçe Dokümanl
Page 273 and 274:
Page 275 and 276:
Uygurcada Biçimbilimsel Belirsizli
Page 277 and 278:
Sosyal Ağlar ve Profil Yönetimine
Page 279 and 280:
Sosyal Ağlar ve Profil Yönetimine
Page 281 and 282:
Mimarlıkta Yapı Bilgi Modelleme v
Page 283 and 284:
Mimarlıkta Yapı Bilgi Modelleme v
Page 285 and 286:
Kan Damarı Genişliği Değişimin
Page 287 and 288:
Diş Hekimliği Fakültesi Hastanel
Page 289 and 290:
Diş Hekimliği Fakültesi Hastanel
Page 291 and 292:
Ulusal Aşı Bilgi Sistemi: Bir Dur
Page 293 and 294:
Ulusal Aşı Bilgi Sistemi: Bir Dur
Page 295 and 296:
Dermatolojide Tanı Belirlemeye Yar
Page 297 and 298:
Türkiye’de B2B e-Ticaret’i Uyg
Page 299 and 300:
Türkiye’de B2B e-Ticaret’i Uyg
Page 301 and 302:
Bazı Kamu Kurumlarında Elektronik
Page 303 and 304:
Bazı Kamu Kurumlarında Elektronik
Page 305 and 306:
Page 307 and 308:
Açık Kaynak Kodlu Bilgisayar Enva
Page 309 and 310:
Dicle Üniversitesi Bilgi İşlem O
Page 311 and 312:
Aluminyum Kütle İçerisinde İler
Page 313 and 314:
Aluminyum Kütle İçerisinde İler
Page 315 and 316:
İş Akış Çizelgeleme Problemi
Page 317 and 318:
Meslek Liselerinde Mesleki Eğitimi
Page 319 and 320:
Meslek Liselerinde Mesleki Eğitimi
Page 321 and 322:
ActiveX ile Eğitsel Bir Web Sayfas
Page 323 and 324:
Eğitim Amaçlı Debian Web, FTP ve
Page 325 and 326:
Page 327 and 328:
Yeni Nesil Mobil Öğrenme Aracı:
Page 329 and 330:
Geoteknik Rapor Hazırlanmasında S
Page 331 and 332:
Geoteknik Rapor Hazırlanmasında S
Page 333 and 334:
Excel VBA ile Ankrajlı ve Ankrajs
Page 335 and 336:
Excel VBA ile Ankrajlı ve Ankrajs
Page 337 and 338:
Nüfus Tahmin Metotlarının ve Gel
Page 339 and 340:
Nüfus Tahmin Metotlarının ve Gel
show all

Akademik BiliÅim '10 10 - 12 Åubat 2010 MuÄla

Create successful ePaper yourself

Delete template?

Save as template?

Akademik BiliÅim '10 10 - 12 Åubat 2010 MuÄla