10.07.2015 Views

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

Akademik Bilişim '10 10 - 12 Şubat 2010 Muğla

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Öncül Parola Denetimi Yöntemiyle Parola Seçim Sistemi: Türkçe Parolalar için Bir Araştırmaİlker Korkmaz, Mehmet Emin Dalkılıç<strong>Akademik</strong> Bilişim’<strong>10</strong> - XII. <strong>Akademik</strong> Bilişim Konferansı Bildirileri<strong>10</strong> - <strong>12</strong> Şubat 20<strong>10</strong> Muğla Üniversitesigun olduğu değerin yönünde yapraklara doğruilerletilerek, terminal düğümdeki değer ile sınıflandırılmışolacaktır.Eğitim safhasında zayıf olarak tanıtılan bir parolanın,denetleme anında zayıf olmadığı kararınavarılırsa, bu sonuç “hatalı negatif” olarak,buna karşın eğer zayıf sözlükte yer almayanve eğitim esnasında tanıtılmayan veya güçlüolarak tanıtılan bir parola adayı, denetleme sırasındadeğerlendiriliyorken zayıf olarak nitelendirilirse,bu sonuç ise “hatalı pozitif” olaraktanımlanmaktadır.Eğitim safhasında ne kadar çok parola kullanılırsa,kullanılan tüm parolaların karar ağacındadoğru sınıflandırılabilmesi için ağaç yapısınınuzunluğu da artacaktır. Çünkü ağacın herhangibir yaprağında tek bir sınıf değeri kalana kadaryapı, kendini yinelemeli bir biçimde oluşturmayadevam edecektir. Eğitimde kullanılan tüm parolalariçin doğru sınıflandırmayı yapabilecek olanbir karar ağacı için gereken bir diğer ön şart daağaç yapısının düğümlerinde sorgulanacak olankriterlerin belirlenmesidir. Bu kriterler, kararağacı yapısındaki düğümlerde nitelik (attribute)olarak isimlendirilmektedir. Parolanın uzunluğuveya ilk karakterin sesli harf olması gibi çeşitlifonksiyonlar olarak gerçeklenen bu niteliklersonucunda, tüm parolalar, aldıkları değerleregöre ağaç yapısında bir alt seviyedeki düğümedoğru gönderilirler. Bu işlem eğitilen her parolanınsınıflandırılması yapılana dek sürer. İstenirse,belirli seviyelerden sonra ağaç budanarak(pruning) ilgili dalların altındaki tüm parolalarçoğunluğa göre sınıflandırılabilir. Önemli olan,boyut ve doğru sınıflama açısından en uygunolan karar ağacı yapısını oluşturmaktır [1].ProCheck [2] ve Hyppocrates [4] karar ağacınadayalı öncül parola denetleyici yazılımlarınaörnektir.3. DeneylerBizim çalışmamızda, Türkçe parolaların sınıflandırılabilmesiiçin karar ağacına dayalıyöntem kullanan “Hyppocrates” programı elealınıp programın eğitim safhasında farklı türparola sözlükleri kullanılarak değerlendirmesırasındaki performansı incelenmiştir. Bu deneylerde,Türk Dil Kurumu kelime sözlüğüyanı sıra Türk kullanıcıların çeşitli sistemlerdekullandıkları gerçek parolaları kullanılmıştır.Ayrıca, [1] çalışması içeriğinde yapılan parolakırma deneyleri sonucuna göre 2564 gerçekparoladan kırılan 777’si, bu programın eğitimsafhasında zayıf parola adayı olarak, kırılamayan1787’si de güçlü aday olarak tanıtılmıştır.Araç olarak “Hyppocrates” programının seçilmişolma sebebi, yazarlarından elde edilebilmişolması ve İngilizce parola adayları içinuygun performansla çalışabildiğinin belirtilmişolmasıdır [4]. Bu bildiride sunulan Türkçe parolalarile yapılan ilgili deneyler ve denenensözlükler, kriter olarak başka öncül parola denetleyiciprogramların Türkçe kelimeler ile testedilmesinde de kullanılabilir.Hyppocrates programının görsel kullanımınaburada değinilmeyip ilgili program aracılığıylayapılan deneyler aktarılmıştır. Programıneğitim ve test süreçlerinde kullanılmak üzerederlenen sözlükler ile ilgili açıklamalar Tablo1’de, ilgili deneylerin açıklamaları da Tablo2 ve Tablo 3 içinde sunulmuştur. Tablolardaki“MAP” ifadesi barındıran sözlükler, içeriğindekikelimelerdeki harflerde Türkçe karakterlerinilgili yakın İngilizce harfe dönüştürülmesi(“ç” yerine “c”, “ğ” yerine “g” kullanımı gibi)ile derlenmiştir. Böylece Türkçe kelimelerdekiher karakterin de 1 bayt ile kodlanmış durumdaolması sağlanmıştır.3. 1 İlk Deney ve Değerlendirmesiİlk deneyde, programın orjinal hali ve kendineait nitelikleri ile kullanımının ifadesi Tablo2’de “H” modunda belirtilmiş, programın nitelikdeğerleri içinde ilgili kriterlere göre Türkçeharfleri de kapsayacak biçimde yeniden derlenipiçeriğinde UTF-8 kodlanmış sözlükler kullanımınınifadesi ise “MH” (Modified Hyppocrates)modunda belirtilmiştir. Tablo 1’dekioranlar, sistemin ilgili eğitilen sözlükler vefarklı test sözlükleri ile denenmesi sonucundaortaya koyduğu hatalı negatif ve hatalı pozitifdeğerlerini sunmak adına, testlerin doğrulukoranlarını vermektedir. Örnek olarak, “words”ve “strong1” dosyaları ile eğitilen sistem, güçlüparola barındıran “strongMAP” dosyası iletest edildiğinde test parolalarının % 71’i içingüçlü kararının doğru verildiği Tablo 1’denanlaşılmaktadır. Tablo 1’de ilk iki satırdaki verilerdenanlaşıldığı üzere, eğitimde kullanılansözlük dilinin test edilen parolalar üzerinde belirginbir etkisi olmamıştır. Tablo 1’de üçüncüsatırdan çıkarsanabilen durum, MH modundaçalışıldığında, Türkçe karakterlerin sisteme aynenkatılmasında problem olabileceğidir. Tablo1’deki son satırdaki sonuçlar anlamlı görülebilirfakat yine de karar olarak sistemin MH modundakullanılmaması düşünülmüştür.3. 2 İkinci Deney ve Değerlendirmesiİkinci deneyde, sistem hiç MH modunda çalıştırılmamıştır.Sözlüklerdeki her karakter 1bayt ile ifade edilecek biçime dönüştürülmüştür.Eğitim safhasında, Türk Dil Kurumu kelimelerinibaz alarak derlenen sözlüğün harfdönüşümü yapılmış hali ile eğitim dili farkınıanlayabilmek adına İngilice kelimeler barındıransözlük ve test safhasında da eldeki gerçekTürk kullanıcı parolalarının kırılabilen ve kırılamayanlarıile bunların bazı karakterlerininrastgele değiştirilerek gürültülendirilmiş hallerikullanılmıştır.Tablo 3’teki verilere göre, güçlü parolalarıneğitim dilinden bağımsız olduğu teyid edilmiştir.Ayrıca, bu deneyde oluşan ağaç boyutununeğitimde kullanılan zayıf sözlük boyutuna oranı% 0,03’tür. Bu modelin, eğitimde kullanılanparolaları sınıflandırmadaki hata oranı %0’dır. Eğitim sözlüklerinde yer almayan paroladosyalarına karşı, dosyaların boyutları düşünülerekhesaplanan ortalama hata oranı, ~% 14olarak bulunmuştur.Tablo 3’teki verilerde, zayıf test sözlüklerindegürültü arttırıldığında daha az oranda zayıfparola kararı, güçlü test sözlüklerinde gürültüarttırıldığında daha fazla oranda güçlü parolakararı gözlenmesi tutarlıdır. Dolayısıyla, Türkçeparola denetiminde, eğitim safhasında zayıfsözlük adayı olarak, Türk Dil Kurumu sözlüğündegeçen kelimelerin, Türkçe alfabeye has“ç,ğ,ı,ö,ş,ü” harflerinin dönüştürülmüş hallerinibarındıran bir dosya kullanılması; güçlü sözlükadayı olarak, sistem tarafından rastgele karakterlerinseçilmesi ile üretilen parolaları barındıranbir dosya kullanılması uygun bulunmuştur.Sözlük İçeriği hakkında açıklama Kelime Sayısı Türüwords İngilizce sözlük 25486 Zayıfklm1utf.txt Türkçe UTF-8 olarak yazılmış sözlük 43804 Zayıfklm3map.txt Türkçe UTF-8 sözlükten ilgili karakterler dönüştürülerek43804 Zayıfoluşturulmuş sözlüktdkUTF.txt Türk Dil Kurumu sözcüklerinin UTF-8 olarak yazıldığı sözlük 61761 ZayıftdkMAP.txt Türkçe UTF-8 sözlükten ilgili karakterler dönüştürülerek 61761 Zayıfoluşturulmuş sözlükweakMAP Kırılabilmiş olan gerçek parolalar 777 ZayıfweakUTF8 weakMAP dosyası içeriğinin UTF-8 hali 777 ZayıfweakMAP.noise Kırılabilmiş parolaların 1 karakter açısından gürültülendirilmiş 777 Zayıfhalistrong1Program tarafından rastgele karakter seçimi ile üretilen parolaları 2334 Güçlüiçeren sözlükstrongMAP Kırılamamış olan gerçek parolalar 1787 GüçlüstrongMAP.noise Kırılamamış parolaların 1 karakter gürültülü hali 1787 GüçlüstrongMAP.2noise Kırılamamış parolaların 2 karakter gürültülü hali 1787 GüçlüstrongMAP.3noise Kırılamamış parolaların 3 karakter gürültülü hali 1787 GüçlüTablo 1. Deneylerde kullanılan sözlükler.174175

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!