13.07.2015 Views

türev tabanlı parametre kestirim yöntemleri - Harita Genel Komutanlığı

türev tabanlı parametre kestirim yöntemleri - Harita Genel Komutanlığı

türev tabanlı parametre kestirim yöntemleri - Harita Genel Komutanlığı

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

TÜREV TABANLI PARAMETRE KESTİRİM YÖNTEMLERİ(DERIVATIVE BASED PARAMETER ESTIMATION METHODS)Ahmet Tuğrul BAŞOKURAnkara Üniversitesi Mühendislik FakültesiJeofizik Müh. Bölümü, Tandoğan Kampusu, Ankarabasokur@eng.ankara.edu.trÖZETTers-çözüm kuramında çözüme karşılık gelen yanılgı enerjisi değeri, ön-<strong>kestirim</strong><strong>parametre</strong>lerinden çözüm civarında Taylor açılımı ile kestirilebilir. Böylece, yanılgıenerjisi Hessian dizeyi ve gradyen yöneyi ile temsil edilebilir. Kare ve simetrikHessian dizeyi yanılgı enerjisinin ön-<strong>kestirim</strong> <strong>parametre</strong>lerine göre ikinci, gradyenyöneyi ise birinci <strong>türev</strong>lerini kapsar. Hessian ve gradyen sırası ile eğrisellik ve eğimbilgilerini temsil ederler. Parametre <strong>kestirim</strong> problemlerinde, Hessian ve gradyenTmodel yanıtı cinsinden tanımlanmalıdır. Hessian AA ve Q dizeylerinin toplamları ileverilir. A dizeyinin sütunları ön-<strong>kestirim</strong> <strong>parametre</strong>lerine göre model yanıtın <strong>türev</strong>lerinikapsar ve Jacobian dizeyi olarak adlandırılır. Q dizeyi ise ön-<strong>kestirim</strong> <strong>parametre</strong>lerinegöre model yanıtın ikinci <strong>türev</strong>lerini kapsar ve doğrusal problemler için sıfırdır.Gradyen yöneyi ise Jacobian dizeyinin dönüğü ile veri farkları dizeyinin çarpımınaeşittir. Parametre düzeltme yöneyi ise Hessian dizeyinin tersi ile gradyen dizeyininçarpımından elde edilebilir. Bu işlem Newton ters-çözüm yöntemi olarak adlandırılırve birkaç yineleme ile çözüme ulaşmayı amaçlar. Ancak, ön-<strong>kestirim</strong> çözüme oldukçayakınsa ve problemi çözüm civarında doğrusallaştırmakta ise yakınsama elde etmekolanaklıdır. Diğer durumlarda, algoritmanın duraylılığını sağlamak amacı ile Hessianveya sadece Q için bir yaklaşımda bulunmak gerekebilir. Bu makale Hessian dizeyiiçin yapılan yaklaşımlar ışığında çeşitli <strong>türev</strong> <strong>tabanlı</strong> <strong>parametre</strong> <strong>kestirim</strong> <strong>yöntemleri</strong>nitartışmaktadır.Anahtar Kelime: Newton, En-dik iniş, Eşlenik Gradyen, Gauss-Newton ve SönümlüEn-küçük Kareler Ters-çözüm Yöntemleri, Tikhonov Düzgünleştiricisi.ABSTRACTIn the inversion theory, an estimate for the error energy that corresponds to thesolution of the problem can be made by a Taylor expansion for an initial parameterset in the neighbourhood of the solution. This provides the representation of the errorenergy in terms of Hessian matrix and the gradient vector. The square and symmetricHessian matrix contains the second derivatives while the gradient vector consists ofthe derivatives of the error energy with respect to initial guess parameters. TheHessian and gradient matrices represent the curvature and gradient information,respectively. In the parameter estimation problems the Hessian and gradientmatrices should be defined in terms of the theoretical model responses. The Hessiancan be given by the sum of AA T and Q matrices. A is a matrix whose columnscontains the derivative of model response with respect to initial guess parametersand is referred to as the Jacobian matrix. Q consists of the second derivatives of themodel responses with respect to the initial guess parameters and becomes equal to1


zero for the linear problems. The gradient vector equals to the multiplication oftranspose of the Jacobian by the data differences vector. Then the parametercorrection vector is calculated by the multiplication of the inverse of Hessian matrixwith the gradient vector. This process is referred as the Newton inversion method. Itrequires a few numbers of iterations to reach the minimum of the error energyfunction. However, this is only possible if the initial guess is close to the solution andprovides a linearized problem around the minimum of the error energy. For othercases, an approximation for the Hessian or only for Q is made to obtain stableinversion steps. This paper discusses a variety of derivative based parameterestimation methods in view of approximations made for the representation of Hessianmatrix.Key Words: Newton, Steepest-descent, Conjugate gradient, Gauss-Newton andDamped least-squares inversion methods, Tikhonov Stabilizer.1. TERS-ÇÖZÜM İŞLEMİNİN TANIMIGözlem veya deneylerin amacı bir sistem veya sürecin özelliklerini tanımlamaktır.Sistem veya sürecin özellikleri bir matematik model ile betimlenmeye çalışılır. Bumatematik modeli tanımlayan bağıntıda kullanılan ve sistemin yapısını belirleyensabitler ‘<strong>parametre</strong>’ ve bunların sınıflandırılması, anlamlandırılması ve sayılarınınsaptanması ‘<strong>parametre</strong>leştirme’ olarak adlandırılır. Parametreler doğrudan ölçülebilenbüyüklükler değildir. Ölçülebilen başka büyüklüklerden, hesap yolu ile saptanmayaçalışılır. Örneğin, bir depremin odak derinliği doğrudan ölçülebilir bir büyüklükdeğildir. Ancak, çeşitli kayıt istasyonlarında ölçülmüş deprem verisindenhesaplanabilir. Yerbilimlerinde <strong>parametre</strong>leştirme, yeraltının sonlu sayıda birimebölünmesi ile gerçekleştirilir. Bu birimlerin geometrisini ve fiziksel özelliklerinibetimleyen iki tür <strong>parametre</strong> vardır. Farklı her jeolojik birimin yeraltındaki konum vebiçimini tanımlayan kalınlık, genişlik gibi uzaysal değişkenler geometrik <strong>parametre</strong>lerioluşturur. Fiziksel <strong>parametre</strong>ler ise ölçülen alanın değişimine neden olan yoğunluk,özdirenç gibi özelliklerdir.Veri ve <strong>parametre</strong>leri birbirine bağlayan matematik bağıntı ‘düz çözüm (forwardsolution)’ olarak adlandırılır ve modelin belirli bir fiziksel durumu için deneyselgözlemleri betimleyerek, veri ve <strong>parametre</strong>ler arasındaki ilişkiyi verir. ‘Kuramsal veri’veya ‘model yanıtı (model response)’, <strong>parametre</strong>lere atanan bazı sayısal değerleryardımı ile çeşitli değişken değerleri için düz çözümden hesaplanan sayısal veridir ve<strong>parametre</strong>ler ile değişkenlerin bir fonksiyonudur.Veri ve <strong>parametre</strong>ler arasında dizey (matrix) denklemleri ile ifade edilebilen birilişki yok ise <strong>parametre</strong>ler doğrudan çözülemezler. Bu durumda, <strong>parametre</strong>lerinhesabı için dolaylı bir yol izlenir. Önceden belirlenen bir ölçüt çerçevesinde, ölçülenveri ile çakışma sağlayan bir kuramsal veri kümesi bulunmaya çalışılır. Çakışmasağlayan kuramsal verinin hesaplanmasında kullanılan <strong>parametre</strong>lerin problemin birçözümü olduğu düşünülür. Ölçülen veriye çakışan kuramsal veri kümesinin aranmasıişlemi ise ‘<strong>parametre</strong> <strong>kestirim</strong>i (parameter estimation)’ veya ‘ters-çözüm (inversion)’olarak adlandırılır.2


2. TERS-ÇÖZÜM İŞLEMİNİN YÜRÜTÜLMESİTers-çözüm işlemi, <strong>parametre</strong>lerinin sayısal değerleri için bir ön-<strong>kestirim</strong> değerininyorumcu tarafından sağlanması ile başlar. Bu ön-<strong>kestirim</strong>e karşılık gelen kuramsalveri hesaplanarak, ölçülen veri ile karşılaştırılır. Eğer yeterli çakışma elde edilememişise ölçülen ve kuramsal veri arasındaki farkları azaltmak için <strong>parametre</strong>ler yenilenirve işlem ‘durdurma ölçütlerinin’ sağlanmasına kadar devam eder (Şekil 1). Tersçözümişleminin amacı, ölçülen ve kuramsal veri kümelerinin çakışmalarınınsağlanmasıdır ve bu işlem ‘çakışmazlığın (misfit)’ enküçüklenmesi ile denetlenir.Çakışmazlık veya diğer adı ile ‘yanılgı enerjisi (error energy)’, değişkenin herdeğerinde veri farklarının mutlak değerinin herhangi bir dereceden kuvvetinihesaplamak ve bunları toplamak ile elde edilebilir:nnLLL=i−i=ii= 1 i=1∑ ∑ (1)E (p) (d f(x ;p) eBurada; n; veri sayısı, p; <strong>parametre</strong>ler, d i ; ölçü ve x i; değişken değerleri, f(x ; p)ikuramsal veridir. e i ; i inci yatay eksen değerindeki ölçülen ve kuramsal veriarasındaki fark e i =d i -f(x i ;p) ve L bir tam sayıdır ve bir problemin çözümüsırasında sabit olarak alınmalıdır. Çünkü sabit bir L değeri için çakışma ölçütü sadece<strong>parametre</strong> değerlerine bağımlı ve dolayısı ile sadece <strong>parametre</strong>lerin bir fonksiyonuolacaktır. En yaygın kullanılan L değeri ikidir ve bu durumda yöntem en-küçük kareleradını alır. Parametre değerleri, gerçeğe ne kadar yakın ise yanılgı enerjisi de o kadarküçük olacağından, ters-çözüm işlemi de yanılgı enerjisi fonksiyonunu enküçükleyen<strong>parametre</strong> kümesinin bulunmasına indirgenmiş olur (Başokur, 2002).ModelDüz ÇözümKuramsal Veri Ölçülen Verifiziksel vegeometrik<strong>parametre</strong>lermatematikbağıntıiki veri kümesinikarşılaştır<strong>parametre</strong> (ön-<strong>kestirim</strong>)ve değişkenin değerlerimodel <strong>parametre</strong>lerinideğiştirhayırdurdurma ölçütlerisağlandı mı?evetsonuçları yazŞekil 1. Ters-çözüm işleminin yalınlaştırılmış akış şeması.3


3. NEWTON TERS-ÇÖZÜM YÖNTEMİParametreler bilinmediğinden (1) bağıntısı ile verilen E(p) enerji yanılgısınındeğerinin de bilinmesi olanaklı değildir. Ancak, ön-<strong>kestirim</strong> <strong>parametre</strong>lerinden0hesaplanabilen E(p ) değerinden yararlanılarak, çözüm <strong>parametre</strong>lerine karşılıkgelen E(p) değerleri kestirilebilir. Şekil 2 de, iki <strong>parametre</strong>li bir problem için yatay vedüşey eksenler sırası ile birinci ve ikinci <strong>parametre</strong>yi göstermek üzere, herhangi bir<strong>parametre</strong> çiftine karşılık gelen yanılgı enerjisi değerlerinden eş enerji çizgileriçizilerek elde edilen harita görüntülenmiştir. Bu harita anlatım amacı ile hesaplanmışve görüntülenmiş olup, <strong>parametre</strong> <strong>kestirim</strong> probleminde önceden bilinemez. Çözüm<strong>parametre</strong>leri en küçük yanılgı enerjisi üreteceğinden, E(p) noktası yanılgı enerjisi0haritasının minimumundadır. Newton ters-çözüm yönteminin amacı, E(p )noktasından çözüm <strong>parametre</strong>lerine karşılık gelen E(p) minimumuna tek adımdaulaşmaktır. E(p) değeri, ön-<strong>kestirim</strong> <strong>parametre</strong>lerinin çözüm <strong>parametre</strong>lerine yakın0olduğu varsayımı ile E(p ) değerinden Taylor açılımı ile elde edilebilir. Bu varsayım,doğrusal olmayan problemlerin, çözüm civarında doğrusal davranış göstermesidurumunda geçerlidir. Üçüncü ve daha yüksek dereceli <strong>türev</strong>ler ihmal edilir iseizleyen açılım yazılabilir:( )m0 2 0∂E( pm m) ( ) ( j j )1 ∂ E p∑ 0 ∑∑ 0 0 ( j j )( k k ) (2)E(p) = E p + p - p + p - p p - p∂p 2 ∂p ∂p0 0 0 0j=1 j j=1 k=1 j kDizeyler ve yöneyler (vectors) kalın harfler ile gösterilmek üzere, m adet <strong>parametre</strong>için izleyen tanım ile0 0⎛∂E( p ) / ∂p⎞1⎜ 0 0 ⎟∂E( p ) / ∂p2∇ E = γ = ⎜⎟⎜ . ⎟⎜0 0E( p ) / p ⎟⎝∂∂m ⎠mX1(3)(2) bağıntısının sağ yanındaki ikinci toplam,⎡ ⎣⎤ =T( ∆p) 1xmγ mx1 ⎦ 1x1j=1 j0( ) (0pj- p0j )m ∂E p∑ (4)∂polarak yazılabilir ve sonuç bir adet sayısal değer üretir. Burada, γ , yanılgı enerjisinin<strong>parametre</strong>lere göre kısmi <strong>türev</strong>lerini ve dolayısı eğim bilgisini kapsar. ∆p , çözüm<strong>parametre</strong>leri ile ön-<strong>kestirim</strong> <strong>parametre</strong>leri arasındaki farkları kapsayan <strong>parametre</strong>düzeltme yöneyidir. T simgesi ise bir dizeyin dönüğünü (transpose) göstermektedir.4


0Şekil 2. Ön-<strong>kestirim</strong> ve çözüm <strong>parametre</strong>lerine karşılık gelen E(p ) (üçgen) ve E(p)(dolu kare) değerlerinin yanılgı enerjisi harita üzerinde gösterimi (ön-<strong>kestirim</strong><strong>parametre</strong>leri p =0.34, p =0.83 ve çözüm <strong>parametre</strong>leri p1=1, p2=1).0102Benzer olarak, mxm boyutundaki izleyen kare dizeyin tanımlanması ileH2 0 2 0 2 0⎛∂ E(p ) ∂ E(p ) ∂ E(p ) ⎞⎜.0 0 0 0 0 0 ⎟⎜∂p1∂p1 ∂p1∂p2 ∂p1∂pm⎟⎜ 2 0 2 0 2 0∂ E(p ) ∂ E(p ) ∂ E(p ) ⎟⎜.0 0 0 0 0 0⎟= ⎜ ∂p2∂p1 ∂p2∂p2 ∂p2∂pm⎟⎜ . . . . ⎟⎜⎟2 0 2 0 2 0⎜∂ E(p ) ∂ E(p ) ∂ E(p ) ⎟⎜.0 0 0 0 0 0pm p1 pm p2 pm p⎟⎝ ∂ ∂ ∂ ∂ ∂ ∂m ⎠(5)(2) bağıntısının sağ yanında ön-<strong>kestirim</strong> <strong>parametre</strong>lerine göre ikinci <strong>türev</strong>lerikapsayan terim, dizey denklemi olarak,T⎡⎣( ∆p ) ( ⎤1xmHmxm∆p)mx1 ⎦=1x1mm∑ ∑∂∂( ) (0)(0pj −pj pk −pk)E p2 0p∂p0 0j= 1 k=1 j k(6)şeklinde yazılabilir. Dizey çarpımları sonucunda bir adet sayısal değer elde edilir. Hdizeyi, Hessian dizeyi olarak adlandırılır ve ikinci <strong>türev</strong>leri kapsadığından yanılgıenerjisi haritasının eğrisellik bilgisini içermektedir. Bu dizeyin bireyleri arasındah( )E p= h = ∂ ∂ ∂2 0jk kj 0 0pjpkilişkisi bulunduğundan, köşegene göre bakışımlıdır. (4) ve (6) sonuçları kullanılarak,(2) bağıntısından, yanılgı enerjilerinin farkı için5


0 T 1 TE( p) = E( p ) + ∆p γ + ∆pH∆p20 T 1 TE( p) − E( p ) = ∆p γ + ∆pH∆ p(7)2elde edilir. Eğer, ön-<strong>kestirim</strong> <strong>parametre</strong>leri, gerçek <strong>parametre</strong> değerlerine yaklaşır ise∆p yöneyi de sıfıra yaklaşır. Bu nedenle, yanılgı enerjisi farklarının ∆p yöneyinegöre <strong>türev</strong>leri minimum yapılmalıdır. (7) bağıntısının <strong>türev</strong>inin sıfıra eşitlenmesi ileŞekil 3. Newton algoritması ile ters-çözüm adımlarının yörüngesi. (0) ön-<strong>kestirim</strong><strong>parametre</strong>leri ve diğer rakamlar yineleme numaralarıdır. Toplam 4 yinelemenin soniki yineleme adımı küçüktür. (ön-<strong>kestirim</strong> değerleri 0 0p1=0.4, p2=1.43 ve çözüm<strong>parametre</strong>leri p1=2, p2=2).∂⎡⎤⎣ 0E( p) −E( p ) ⎦ 1 1= + + Tγ H∆p ∆p H =∂∆p2 20bulunur. ∆p bir yöney olduğundan H dizeyi ile çarpımı da bir yöneydir. Satır ve sütunyöneyler birbirine eşit olduğundan,T( H∆p) mx1= ( ∆ p H)1xmyazılabilir. Buradan,( H∆p) =−γmx1mx1elde edilir. H, mxm boyutunda kare bir dizey olduğundan tersi (inverse) alınabilir.Yukarıdaki bağıntının her iki yanı soldan H dizeyinin tersi ile çarpılır ise∆p =− H . γ = ( H . γ )(8)-1 −1mx1 mxm mx1 mx1yazılabilir. Newton algoritmasının davranışı Şekil 3’ de gösterilmiştir.6


4. GRADYEN VE HESSIAN DİZEYLERİNİN HESAPLANMASI(8) bağıntısı ile verilen <strong>parametre</strong> düzeltme yöneyini hesaplayabilmek için gradyen0ve Hessian dizeylerinin elde edilmesi gerekir. f(xi;p ) değerleri, ön-<strong>kestirim</strong><strong>parametre</strong>lerinden hesaplanan kuramsal değerleri göstermek üzere (1) bağıntısı ileverilen yanılgı enerjisinin L=2 için sıra numarası k olan bir <strong>parametre</strong>ye göre kısmi<strong>türev</strong>i alınır ise∂ E( p )∂f(x ;p ) ∂e∂ p ∂p ∂p0 n 0 n0 i i=−2 (d0 i− fi) = 2 e0 i 0k i= 1 k i=1 k∑ ∑ (9)elde edilir. Bu bağıntının her <strong>parametre</strong> için yazılması ve bulunan denklem sisteminindizey çarpımları olarak düzenlenmesi ile gradyen yöneyi,Tγ = -2A ∆ d(10)olarak tanımlanabilir. Burada, ∆ d veri farkları yöneyi olarak adlandırılır ve nx1boyutundaki ölçülen veri yöneyi (d) ile ön-<strong>kestirim</strong> <strong>parametre</strong>lerinden hesaplanankuramsal veri yöneyinin (f) farklarını kapsar ( ∆ d =d-f) ve nx1 boyutunda biryöneydir. Jacobian dizeyi olarak adlandırılan nxm boyutundaki A dizeyinin bireyleriise xiyatay eksenindeki kuramsal verinin, j inci <strong>parametre</strong>ye göre <strong>türev</strong>inden oluşur:a0∂f(x i;p )ij=0∂pj(11a)Jacobian dizeyinin bir kolonu bütün ölçü noktalarında belirli bir <strong>parametre</strong>ye görekısmi <strong>türev</strong>leri kapsamaktadır:A0 0 0⎛ ∂f(x 1;p ) ∂f(x 1;p ) ∂f(x 1;p ) ⎞⎜. .0 0 0 ⎟⎜ ∂p1 ∂p2 ∂pm⎟⎜0 0 0∂f(x 2;p ) ∂f(x 2;p ) ∂f(x 2;p ) ⎟⎜. .⎟0 0 0⎜ ∂p1 ∂p2 ∂pm⎟⎜ . . . . . ⎟⎜⎟⎜ . . . . . ⎟= ⎜ ⎟⎜. . . . .⎟⎜ . . . . . ⎟⎜⎟⎜ . . . . . ⎟⎜ . . . . . ⎟⎜⎟⎜∂f(x ;p ) ∂f(x ;p ) ∂f(x ;p )⎜⎝ ∂ ∂ ∂0 0 0n n n ⎟. .0 0 0p1 p2 p ⎟m ⎠nxm(11b)Hessian dizeyini hesaplamak için yanılgı enerjisinin <strong>parametre</strong>lere göre ikinci<strong>türev</strong>lerinin hesaplanması gerekmektedir. Bu amaçla önce birinci <strong>türev</strong>leri kapsayan(9) bağıntısının q numaralı <strong>parametre</strong> için bir çarpımın <strong>türev</strong> özelliğinden7


yararlanılarak, yeniden <strong>türev</strong>i alınır ise Hessian dizeyinin h jqnumaralı elemanı eldeedilir ve iki ayrı toplama ayrılabilir:2 0 n2∂ E( p ) ⎛ ∂ei ∂ei ∂ e ⎞ihjk= = 20 0 ∑ + e0 0 i 0 0(12)∂pj∂p ⎜k i=1 ∂pj ∂pk ∂pj∂p⎟⎝k ⎠n ⎛ n2∂ei ∂e ⎞ ⎛i∂ e ⎞ihjk= 2 + 2 e⎜ 0 0 i 0 0i= 1 pj p ⎟ ⎜ k i=1 pj p ⎟⎝∂ ∂ ⎠ ⎝ ∂ ∂k ⎠∑ ∑ (13)(9) bağıntısından, farkların <strong>parametre</strong>lere göre <strong>türev</strong>lerinin kuramsal verinin<strong>parametre</strong>lere göre <strong>türev</strong>lerinin negatifine eşit olduğu görülebilir:∂e∂0 ∂f= ( di− f(xi;p ))= −∂p ∂p ∂pii0 0 0j j jBu bağıntının, q numaralı <strong>parametre</strong>ye göre bir kez daha <strong>türev</strong>i alınır ise∂ e ∂ f∂p ∂p ∂p ∂p2 2ii=−0 0 0 0j k j k(14)elde edilir. Bu sonuçlar, (12) bağıntısında yerine yazılır isen ⎛0 0 n2 0∂f(x i;p ) ∂f(x i;p ) ⎞ ⎛0 ∂ f(xi;p ) ⎞hjk = 2 + 2 −(d 0 0 i−f(x i;p ))⎜ 0 0i= 1 pj p ⎟ ⎜ k i=1pj p ⎟⎝ ∂ ∂ ⎠ ⎝ ∂ ∂k ⎠∑ ∑ (15)Hessian dizeyinin elemanlarının kuramsal verinin <strong>parametre</strong>lere göre <strong>türev</strong>lerindenhesaplanabileceği görülür. Bağıntının sağ yanındaki iki toplam,t⎛∂f(x ;p ) ∂f(x ;p ) ⎞= ∑ ⎜ (16a)⎟⎝⎠n0 0iijk⎜ 0 0i=1 ∂pj ∂pkn ⎛2 00 ∂ f(xi;p ) ⎞qjk= ∑ −(di −f(x i;p ))0 0(16b)⎜i=1 ∂pj∂p⎟⎝k ⎠elemanları tanımlanır isehjq = 2 tjq + 2 qjqyazılabilir. Toplamdaki sıra numaraları aynı olduğundan, bu bağıntı dizey toplamıolarak verilebilir (Lines and Tretiel, 1984):H = 2 T + 2 Q(17)8


T dizeyinin elemanları ile Jacobian dizeyinin elemanları benzerdir. Daha önce verilen(11a) bağıntısından izleyen toplam bulunabilir:t⎛ ⎞a a⎝ ⎠nn∂fi∂fijq = ∑ =⎜ij iki= 1pjp ⎟ ∑∂ ∂ k i=1Buradan T dizeyi,n n n⎛⎞⎜∑aa i1 i1 ∑aa i1 i2. ∑aai1 im ⎟⎜i= 1 i= 1 i=1⎟⎜n n n⎟⎜∑ai2ai1 ∑ai2a i2. ∑ai2aim⎟T = ⎜ i= 1 i= 1 i=1 ⎟⎜ . . . . ⎟⎜⎟n n naimai1 aima i 2. aima⎜∑ ∑ ∑ m2 ⎟⎝ = = = ⎠i 1 i 1 i 1 mxm(18)şeklinde gösterilebilir ve T dizeyininTT = A A (19)bağıntısı ile Jacobian dizeyinden hesaplanabileceği görülür. Q dizeyi ise (16)bağıntısından,Q= -⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝f(x ;p ) f(x ;p ) f(x ;p ) ⎞⎟⎟⎟f(x ;p ) f(x ;p ) f(x ;p ) ⎟⎟⎟. . . . ⎟⎟n 2 0 n 2 0 n 2 0∂ i ∂ i ∂ i∑ei 0 0 ∑e i .0 0 ∑ei0 0i= 1 ∂p1∂p1 i= 1 ∂p1∂p2 i=1 ∂p1∂pmn 2 0 n 2 0 n 2 0∂ i ∂ i ∂ i∑ei e0 0 ∑ i . e0 0 ∑ i 0 0i= 1 ∂p2∂p1 i= 1 ∂p2∂p2 i=1 ∂p2∂pmn 2 0 n 2 0 n 2 0∂ f(x i;p ) ∂ f(x i;p ) ∂ f(xeiei ;p ) ⎟∑ 0 0 ∑ i.0 0 ∑ei0 0 ⎟i=1 ∂pm∂p1 i= 1 ∂pm∂p2i=1 ∂pm∂pm ⎠mxm(20)olarak yazılabilir. Böylece, Hessian dizeyi, Jacobian ve Q dizeylerindenyararlanılarak,HT= 2 A A + 2Q(21)bağıntısından hesaplanabilir. Hessian dizeyinin tersi ise-1-1H = ( T + Q) / 2(22)9


verileceğinden, <strong>parametre</strong> düzeltme yöneyi, (10) ve (22) bağıntılarının (8)bağıntısında yerine yazılması ile−1T∆ p = ( T + Q ) A ( d-f )(23)= ( T + ) −1 T∆p AA Q A∆ d(24)şeklinde elde edilir. A ve Q dizeyleri herhangi bir yineleme adımındaki <strong>parametre</strong>değerlerine göre kuramsal verinin <strong>türev</strong>lerinden hesaplanabilir. Böylece <strong>parametre</strong><strong>kestirim</strong>i ön-<strong>kestirim</strong> değerlerine <strong>parametre</strong> düzeltme yöneyinin eklenmesineindirgenir:0p = p + ∆p(25)Ön-<strong>kestirim</strong> değerleri çözüm <strong>parametre</strong>lerine çok yakın değil ise (1) bağıntısı ileverilen Taylor açılımı E(p) değerine bir yaklaşımı verir. Bu nedenle, (25) bağıntısı dagerçek <strong>parametre</strong> değerleri yerine, onlara bir yaklaşımı verir. Yeni <strong>parametre</strong>değerleri ön-<strong>kestirim</strong> değerlerinden daha küçük yanılgı enerjisi üretir ise çözüme biradım daha yaklaşıldığı düşünülebilir. Bu durumda, hesaplanan <strong>parametre</strong> değerleriyeni bir adımın ön-<strong>kestirim</strong>i olarak kabul edilir ve yanılgı enerjisi önceden belirlenenbir değerden daha küçük olduğunda işlem durdurulur. Yeni bir yinelemedehesaplanacak <strong>parametre</strong> değerleri, bir önceki yinelemedeki <strong>parametre</strong> değerlerindenr+ 1 r r T r r −1r T rp = p + ((A ) A + Q ) (A ) .(d-f )(26)bağıntısı ile elde edilebilir. Yukarıdaki bağıntıda sağ taraftaki dizeylerin r inci adımiçin verildiği ve r+1 inci <strong>parametre</strong> değerlerinin hesaplanmaya çalışıldığı bilindiğinden,ters-çözüm probleminin çözümü olarak daha yalın olan (23) veya (24) bağıntılarınıkullanmak yeterlidir.Hessian dizeyi yanılgı enerjisi haritasının eğrisellik bilgisini, gradyen yöneyi iseeğim bilgisini içermektedir. Newton yöntemi bu bilgileri kullanarak, doğrudan yanılgıenerjisi haritasının minimumuna yönlenir (Şekil 3). Ancak, bu yönlenme Hessiandizeyinin terslenmesi sırasında çok büyük ∆ p değerlerinin hesaplanması ve<strong>parametre</strong> uzayında büyük bir adım atılarak, yanılgı enerjisi haritasınınminimumundan oldukça uzakta bir noktaya ulaşılmasına neden olabilir. Bu noktadaha büyük yanılgı enerjisi üreteceğinden, algoritma durdurulmak zorundadır.Newton yönteminin diğer zayıf yanı Q dizeyinin hesaplanmasındaki güçlüklerdir.Parametre sayısının yüzlerle ifade edilebildiği yerbilim problemlerinde Q dizeyininelde edilmesi, çok sayıda ikinci <strong>türev</strong>in hesabı ve bunların toplanmasınıgerektirdiğinden oldukça fazla bilgisayar zamanı alır. Ayrıca, sonlu-farklar yaklaşımıve benzeri sayısal yöntemlerle ikinci <strong>türev</strong> hesabında yeterli doğruluğun sağlanmasızordur. Bu nedenler ile Q dizeyin (20) bağıntısından doğrudan hesabından kaçınılır.Bunun yerine çeşitli yaklaşımlar kullanılır ve böylece çeşitli ters-çözüm <strong>yöntemleri</strong>türetilir.10


5. ÇEŞİTLİ TERS ÇÖZÜM YÖNTEMLERİa. En-dik iniş yöntemiBu yöntem sadece eğim bilgisinden yararlanır. Ön-<strong>kestirim</strong> değerlerine karşılık0gelen E(p ) konturu üzerindeki bir noktadan başlayarak, yanılgı enerjisi haritasındakontura dik yönde eğim aşağı gidilir ise yanılgı enerjisi daha küçük olan bir konturaerişilir. Böylelikle, çözüm yönünde bir adım atılmış olur. Bu adımın atılması ile0<strong>parametre</strong>lerde oluşan değişiklik, E(p ) değerinin <strong>parametre</strong>lere göre gradyeni ileorantılıdır. Eğrisellik bilgisini kapsayan Hessian dizeyini katkısını yok etmek için (8)bağıntısında yerine µ sabiti ile çarpılmış birim dizey yerleştirilirse en-dik inişyönteminin <strong>parametre</strong> düzeltme yöneyi elde edilir:∆ p = − µ . γ (27)Burada, γ yöneyi, yanılgı enerjisinin ön-<strong>kestirim</strong> <strong>parametre</strong>lerine göre kısmi<strong>türev</strong>lerini kapsamaktadır. Gradyen (10) bağıntısı ile verildiğinden yerine yazılarak,∆Tp µ A ∆d= (28)bulunur. Burada, yanılgı enerjisinin gradyeni yukarıda değinildiği gibi <strong>parametre</strong>uzayında atılan adımın yönünü belirler. Şekil 4’de, çeşitli ön-<strong>kestirim</strong> değerleri içinyanılgı enerjisi haritası konturlarına dik yönde ilerleyerek minimuma ulaşılmasıgörüntülenmiştir. Bu strateji minimuma erişilmesini garantilemekle birlikte, yönteminhızı adım büyüklüğüne bağlıdır. En uygun adım büyüklüğüne µ gerçel sabitinindeğerinin ayarlanması ile bir yaklaşım yapılabilir. Bu amaç için <strong>parametre</strong> düzeltmeyöneyinin doğrultusundaki en yakın minimum noktası saptanmaya çalışılır. Buminimum için bir yaklaşım Tarantola(1987) tarafından izleyen bağıntı ile verilmiştir:γ γµ =TTγ γ + (A. γ ) (A. γ )T(29)Şekil 4. Çeşitli ön-<strong>kestirim</strong> değerleri (üçgenler) için en-dik iniş yöntemi adımları.Herhangi bir adımın büyüklüğü iki nokta arasında kalan değer kadardır.11


Şekil 5’den de görülebileceği üzere başlangıçta büyük olan <strong>parametre</strong> düzeltmeyöneyinin değeri minimuma yaklaştıkça küçülmektedir. Çünkü ölçülen ve kuramsalveri arasındaki farklar ve çözüm civarında eğim değeri gittikçe küçülmektedir. Bunedenlerle yöntem minimuma erişmek için çok fazla sayıda yineleme gerektirir.Yöntemin diğer zayıf yanı ise yanılgı enerjisi haritasında dar bir vadi boyuncailerlemek gerektiğinde zig-zag çizerek ilerlemesi ve bunun da aşırı sayıda yinelemeyeyol açmasıdır.Şekil 5. Parametre düzeltme yöneyi yünündeki en yakın minimumu bularak ilerleme(1a-1b). Dar bir vadi boyunca zig-zag çizerek ilerleme (başlangıç 2 nolu ön-<strong>kestirim</strong>).b. Eşlenik Gradyen YöntemiBu yöntemde <strong>parametre</strong> düzeltme yöneyinin doğrultusu bir önceki yinelemedekidoğrultuya Hessian dizeyi uzayında dikgen (orthogonal) olacak şekilde seçilir.Yineleme işlemi izleyen bağıntı ile yürütülür:r 1 r rp + = p + µ Φ (30)Burada, Φ ; ardışık adımlar arasında dikgen olma koşulunu sağlayan aramadoğrultusu (search direction) yöneyidir. µ gerçel sayısı adım büyüklüğüdür ve en-dikiniş yönteminde olduğu gibi arama doğrultusundaki en yakın minimuma erişimisağlamayı amaçlar:Tγ γµ =(31)TTΦ Φ + ( A. Φ ) ( A. Φ )Ardışık iki yinelemeye ait arama doğrultusu yöneyinin H uzayında dikgen olmakoşulu,r T r 1( ) H− = 0Φ Φ (32)ile verilir. Gradyen yöneyi ve bu koşulun gerçekleşmesini sağlayan bir α katsayısıyardımı ile herhangi bir yinelemeye ait arama doğrultusu,12


Φ γr= +α.r−1Φ (33)1bağıntısı ile verilebilir. Başlangıç için bir Φ − yöneyi tanımlı olmadığından, yönteminilk adımı en-dik iniş yöntemi ile gerçekleştirilir. Bu durumda, ilk arama doğrultusu0 0yöneyi, gradyen yöneyine eşit alınır ( Φ = γ ). Diğer adımlar için (33) bağıntısıkullanılır. α katsayısı için bir yaklaşım veren çeşitli bağıntılar geliştirilmiştir.Bunlardan, Polak-Ribiere bağıntısı,α− ⎡⎣⎤⎦( γ ) γ ( γ ) γr T r r−1 T r r T r r−1( γ ) γ ( γ ) γ ( ) −= = γ γ γr−1 T r−1 r−1 T r−1(34)ve aşağıda verilen Fletcher-Reeves bağıntısı,α( γ ) γ=( γ ) γr T rr−1 T r−1(35)en yaygın kullanılan bağıntılardır. Polak-Ribiere bağıntısı hızlı bir şekildeyakınsamayı sağlar. Fletcher-Reeves bağıntısının hesaplanması biraz daha azzaman gerektirmekle birlikte, sadece çözüm civarında verilmiş ön-<strong>kestirim</strong> değerleriiçin yakınsama sağlayabilir.Şekil 6’da iki <strong>parametre</strong>li bir probleme ait yanılgı enerjisi haritasında eşlenikgradyen yöntemi ile minimuma erişilmesi gösterilmiştir. Her yineleme adımı, birönceki adıma göre dikgen olma koşulunu sağlamaktadır. Arama doğrultusunundikgen olma koşulu H uzayı için verildiğinden, yanılgı enerjisi haritasının konturlarıeliptik durumdan küresel duruma getirildiğinde birbirine dik olacaktır. Parametredüzeltme yöneyinin büyüklüğü eğim ile orantılı olduğundan eğimin büyük olduğudoğrultularda bu yöney de büyüktür. Eğimin çok küçük olduğu herhangi bir yönde çokküçük bir adım atılacağından, şekiller üzerinde bu yönlerdeki adımlar açık bir biçimdegörülemeyebilir.Şekil 6. Bir önceki <strong>parametre</strong> düzeltme yöneyine dikgen ilerleme. Başlangıç üçgen,bitiş noktası ise dolu kare ile gösterilmiştir. Noktalar arası bir adımı göstermektedir.13


Şekil 7’de ise en-dik iniş ve eşlenik gradyen <strong>yöntemleri</strong>nin karşılaştırılmıştır. (1) ileişaretlenen başlangıç noktasından ilk yineleme en-dik iniş yöntemi ilegerçekleştirilerek (2) ile gösterilen noktaya erişilmiştir. Bu noktadan sonra en-dik inişyöntemi ile yanılgı enerjisi konturuna dik yönde bir yineleme ile (edi) yazılan noktayagelinmiş ve algoritma zig-zag çizerek ilerlemeye başlamıştır. Eşlenik gradyen yöntemiise bir önceki doğrultu yöneyine H-dikgen yönde, (2) noktasından (egr) yazılannoktaya erişmiştir. Devam eden yineleme adımları aynı kuralın uygulanması ilegerçekleştirilmiştir. Eşlenik gradyen yönteminin en-dik iniş yöntemine göre daha hızlıçalıştığı görülmekte ise de sadece gradyen bilgisinin kullanılması nedeni ile çözümcivarında <strong>parametre</strong> düzeltme yöneyi küçülmekte ve yineleme sayısı Newtonyöntemine göre oldukça büyük kalmaktadır.Şekil 7. En-dik iniş ve eşlenik gradyen <strong>yöntemleri</strong>nin karşılaştırılması. Başlangıçnoktası üçgen (1), birinci yineleme adımı nokta (2) ve minimum ise dolu kare ilegösterilmiştir. (2) nolu noktadan sonra en-dik iniş algoritması (edi) ve eşlenik gradyenalgoritması (egr) yazılan noktalara erişerek farklı yol izlemektedir.c. Gauss- Newton YöntemiYukarıda değinildiği gibi Newton yöntemi hızlı olmakla birlikte ön-<strong>kestirim</strong><strong>parametre</strong>lerinin çözüm <strong>parametre</strong>lerine yakın olmadığı durumlarda Taylor serisiaçılımında ikinci dereceli <strong>türev</strong>lerin hesaplanmasında yeterli doğruluk sağlanamaz.Ayrıca veri fakları da büyük olduğundan Q dizeyinin elemanları da büyük olacak ve(24) bağıntısında Q dizeyi baskın hale gelecektir. Ancak bu durum <strong>parametre</strong>düzeltme yöneyinin çok büyük olmasına yol açarak, algoritmanın ıraksamasınaneden olabilir. Öte yandan, çözüme yakın bir ön-<strong>kestirim</strong> için hem ikinci <strong>türev</strong>ler hemde veri farkları küçük olacağından Q dizeyinin hesaplanmasındaki zorluklara oranlaçözüme katkısı çok önemli olmayacaktır. Bu nedenler ile (24) bağıntısında Q dizeyiihmal edilerek,= ( T ) −1 T∆p AA A∆ d(36)yazılabilir. Şekil 8’de, üçgen ile gösterilen ön-<strong>kestirim</strong> değerinden başlayarak dörtyineleme ile minimuma erişilmesi gösterilmiştir. Şekil 7’de aynı problem için verilen14


en-dik iniş ve eşlenik gradyen <strong>yöntemleri</strong> ile karşılaştırıldığında Gauss-Newtonyöntemini oldukça hızlı bir şekilde sonuca yakınsadığı görülmektedir.Şekil 8. Gauss-Newton yöntemi ile doğrudan minimuma yönlenmeye çalışarakilerleme. Şekil 7’de verilen en-dik iniş ve eşlenik gradyen <strong>yöntemleri</strong> ile karşılaştırınız.d. Sönümlü En-küçük Kareler (Levenberg-Marquardt) YöntemiGauss-Newton yöntemi hızlı yakınsayan bir yöntem olmakla birlikte ön-<strong>kestirim</strong>değerleri çözüm <strong>parametre</strong>lerine yakın değil ya da yanılgı enerjisi haritası karmaşıkTbir topografya oluşturmakta ise A A dizeyinin bazı özdeğerleri (eigenvalues) çokküçük olabilir ve dizeyin terslenmesi sırasında yeterli sayısal doğruluğunsağlanamaması nedeni ile <strong>parametre</strong> düzeltme yöneyinin bu özdeğerlere karşılıkgelen elemanları çok büyür. Başka bir olasılıkta eğrisellik bilgisinin yanılgı enerjisiharitasının minimumunun bulunduğu yönden farklı bir yöne adım atılması sonucunayol açan <strong>parametre</strong> düzeltme yöneyi üretmesidir. Her iki durumda da yineleme iledaha büyük yanılgı enerjisi üreten bir model elde edilir. Şekil 9 da aynı ön<strong>kestirim</strong>denbaşlamak üzere en-dik iniş, Gauss-Newton ve sönümlü en-küçük kareler<strong>yöntemleri</strong> karşılaştırılmıştır. Gauss-Newton yönteminde üçüncü yinelemeden sonraçözüme çok uzak bir noktada yineleme işlemi durdurulmaktadır. En-dik iniş yöntemiçözüme erişmekle birlikte dar bir vadi boyunca ilerlemek durumunda kaldığından çoksayıda yineleme yapmak zorunda kalmıştır. Sönümlü en-küçük kareler isegerektiğinde hem Gauss-Newton hem de en-dik iniş yöntemi gibi davranarak çözümedaha az sayıda yineleme ile erişebilmiştir. Bu davranış (36) bağıntısında AAT2dizeyinin köşegenlerine ε gibi bir gerçel sabitin eklenmesi ve bu sabitin değerininyineleme işlemi sırasında özdeğerlerin küçük değerler almasını engelleyecek şekildedeğiştirilmesi ile gerçekleştirilebilir. Bu durumda, I birim dizey olmak üzere <strong>parametre</strong>düzeltme yöneyi izleyen bağıntı ile verilir:T 2 −1T∆p = ( AA+ ε I ) A∆ d(37)15


Şekil 9. En-dik iniş (edi), Gauss-Newton ve sönümlü en-küçük kareler <strong>yöntemleri</strong>nin(LM) aynı ön-<strong>kestirim</strong> değeri için karşılaştırılması.Şekil 9’ dan görülebileceği gibi sönümlü en-küçük kareler algoritması, ilk yinelemeadımlarında en-dik iniş ve Gauss-Newton algoritmalarının arasında bir davranışgöstermiştir. Üçüncü yinelemede yanılgı enerjisinin az olduğu düz topografyalı birbölümde en-dik iniş yönteminin davranışına uygun olarak küçük düzeltme yöneyi ilezig-zag çizerek ilerleme sağlanılmıştır. Bu bölgeden sonra Gauss-Newtondavranışına geçiş sağlanarak birkaç adımda minimuma varılmıştır.e. Tikhonov DüzgünleştiricisiBazı jeofizik problemlerde <strong>parametre</strong>lerin değişiminin birbirlerine bağımlı olmasıistenilir. Örneğin iki- ve üç-boyutlu problemlerde komşu hücrelere ait fizikselözelliklerinde keskin değişimlere izin verilmek istenmeyebilir. Bu durumda biryuvarlatıcı işlemciye gereksinim duyulur. Bu amaç için (37) bağıntısındaki birim dizey,TLL şeklinde bir dizey ile yer değiştirilir:T 2 T −1T∆p = ( A A+ ε L L ) A ∆d(38)L dizeyin birinci veya ikinci <strong>türev</strong> işlemcisi olarak seçimi ile komşu <strong>parametre</strong>değerlerinin birbirlerine bağımlı olarak değişmeleri sağlanabilir. Bu yöntemalgoritmaların duraylılığını (stability) sağlamak amacı ile de kullanılmaktadır. Çeşitliduraylayıcı (stabilizer) dizeyler Zhadanov(2002) tarafından verilmiştir.6. AĞIRLIK ATAMAYorum için kullanılan yöntemin yanı sıra, ölçü yanılgıları ve gürültüler <strong>parametre</strong><strong>kestirim</strong>ine önemli ölçüde etki eder. Bu etkilerin uygun yöntemler ile azaltılması, tersçözüm<strong>yöntemleri</strong>nin hız ve yakınsamasını iyileştirir.Ölçme koşullarından kaynaklanan, iki tür gürültü kaynağı vardır. Bunlar, rasgele vesistematik gürültüler olarak adlandırılır (Bevington, 1969). Rasgele gürültüler,16


değişkenin bir değeri için yinelenen ölçümlerdeki kararsız değişmelerdir. Ölçümaygıtlarının duyarlılığının sınırlı olması, rasgele gürültülerin başlıca kaynağıdır.Ölçüler, değişkenin bir değeri için yinelenir ise, ölçü değerlerindeki görece belirsizlikistatistik analiz yardımı ile tanımlanabilir. Örneğin, bu amaç için ölçü değerlerininstandart sapmaları kullanılabilir. Her ölçüm değerine, standart sapması ile tersorantılı bir ağırlık katsayısı atanarak, gürültülü verinin duyarlı ölçülere göre tersçözümsonuçlarına daha az etki etmesi sağlanabilir. Eğer, arazi uygulamalarında,ölçüler yinelenmemiş ise standart sapmalar bilinemez ve bu durumda rasgelegürültüyü temsil etmek üzere bütün ölçülerin genel niteliğine bağlı bir ağırlık katsayısıbütün ölçü noktalarına atanır.Sistematik yanılgılar, ölçüm sisteminin ayarlarının yanlış yapılmasından, ölçümaygıtlarının yanlış konumlara yerleştirilmesinden, ölçü sistemi ile ona bağlı aygıtlarınbağlantılarının kötü veya yanlış yapılmasından ve gözlemcinin yaptığı gözlemyanılgılarından oluşur. Bu koşullarda, istatistik analize başvurmak, genellikle kullanışlıdeğildir. Ölçülerin tekrar edilmesi, ölçülerin duyarlılığını (precision) arttırmakla birliktedoğruluğunu (accuracy) arttırma konusunda yardımcı olmaz. Arazi çalışmasınınyapıldığı sırada, sistematik yanılgılar fark edilebilirse, bunlar hesapla veya başka birçare düşünülerek, ölçülerden giderilebilir ve ölçü doğruluğu arttırılabilir. Aksi takdirde,sistematik yanılgıların düzeltilme fırsatı ortadan kalkar. Sistematik yanılgılar birçokölçme işleminde bir bilinmeyen olarak kalabilir (Bevington, 1969). Hem rasgele hemde sistematik yanılgılar nedeni ile veride küçük saçılmalar gözlenir ise sistematikyanılgılar, rasgele yanılgılar ile birleştirilerek, ölçü belirsizlikleri istatistik yöntemler ileincelenebilir.Ölçü noktalarının gürültü içerikleri farklı olduğundan, ölçü değerlerine atanacakağırlık katsayıları ile gürültü içeriği fazla ölçü noktalarının <strong>parametre</strong> <strong>kestirim</strong>ini dahaaz etkilemesi istenir. Bu amaç için (1) bağıntısı ile verilen amaç fonksiyonu, en-küçükkareler için toplam ve dizey denklemleri olarak,n2 T∑ [ ] [ W d f ] [ W d f ](39)E (p) = w (d -f(x ;p)) = ( - ) ( - )2 i i ii=1şeklinde yazılabilir. Burada, w i ; ölçü noktalarına uygulanacak ağırlık katsayılarınıgöstermektedir. W; köşegen bireyleri ağırlık katsayıları ve diğer öğeleri sıfır olan nxnboyutunda bir kare dizeydir. (39) bağıntısı ile verilen yanılgı enerjisininenküçüklenmesi ile Gauss-Newton çözümü elde edilir:∆1(( T −Tp WA) ( WA) ) ( WA) ( W∆d)= (40)Bu bağıntı, (36) ile verilen Gauss-Newton çözümü ile karşılaştırılır ise A dizeyininyerine W.A dizeyinin ve ∆ddizeyinin yerine W.∆ddizeyinin kullanıldığıgörülmektedir. Diğer yöntemlerde enküçüklenecek amaç fonksiyonu farklı olmaklabirlikte, Jacobian ve veri farkları dizeylerinin ağırlık dizeyleri ile çarpılması ile belirli biryönteme ait ağırlıklı <strong>parametre</strong> <strong>kestirim</strong> bağıntıları elde edilir.17


Ağırlık katsayılarını saptamak amacı ile çeşitli yöntemler kullanılabilir. Örneğin,ölçülerin tekrarlanma olanağının bulunduğu durumlarda, bir ölçü noktasındakigürültünün, diğer ölçü noktalarındaki gürültülerden bağımsız ve standart sapmasınınσ olduğu düşünülür ve ağırlık dizeyi,iW⎛1/ σ10 0 0 0⎜⎜0 1/ σ20 0 0diag(1 / σ ) ⎜ 0 0 . 0 0=i=⎜ ⎟⎜⎜⎝0 0 0 1/ σ 0n−10 0 0 0 1/ σn⎞⎟⎟⎟⎟⎟⎠nxn(41)olarak tanımlanır. Ölçü tekrarlarının bulunmadığı koşullarda, Başokur(1999)tarafından önerilen ağırlık atama yöntemi uygulanabilir. Bu yöntemde ölçülen verinindavranışına göre seçilen bir fonksiyondan m adedi, yatay eksen boyunca yerleştirilirve bunların doğrusal bileşimi (linear combination) ile yuvarlatılmış bir veri elde edilir.Yuvarlatma işlemi için farklı bir yöntemlerden de yararlanılabilir. Bu durumda ağırlıkkatsayıları izleyen bağıntı ile verilebilir:2{ ( ) }* 2w = exp - d -d / 2α (42)i i i*Burada, d i ve d i sırası ile ölçülen ve yuvarlatılan veri noktalarını göstermektedir. αise biçim etmeni olup, izleyenαn= 1∑ *di-din(43)i=1bağıntısı ile hesaplanır ve bir veri noktasına ait ağırlık katsayısının hesaplanmasındatüm verinin gürültü içeriğinin göz önüne alınmasını sağlar. (41) bağıntısı sıfır ile birarasında ağırlık katsayıları üretir. Eğer, ölçülen ve yuvarlatılan veriler arasındaki farkküçük ise bu noktadaki ağırlık katsayısı birime yakın olur.7. DİZEY DENKLEMLERİNİN ÇÖZÜMÜEn-dik iniş ve eşlenik gradyen çözümlerinde Jacobian dizeyinin tümü ile bellektetutulmasına gerek bulunmamaktadır. Bir hesaplama adımında Jacobian dizeyinin birsütunu ile çarpma işlem gerçekleştirildiğinden, bellek kullanımının sorun olduğu çok<strong>parametre</strong>li problemlerde bir sütun ile işlem yapıldıktan sonra ardışık sütununhesaplanmasına geçilebilir.Kuramsal verilerin, <strong>parametre</strong> dizeyi ile Jacobian dizeyinin çarpımı,f= A.p(44)18


şeklinde tanımlanma olanağı var ise bunlar doğrusal problemler olarak adlandırılır.Bu tür problemlerde Jacobian dizeyi, veri çekirdek dizeyi adını alır ve <strong>parametre</strong>lerikapsamaz. Bu nedenle kuramsal verinin <strong>parametre</strong>lere göre birinci <strong>türev</strong>i, veriçekirdek dizeyine ve ikinci <strong>türev</strong>i ise sıfıra eşit olur :∂ f = A ,∂p2∂ f2∂p= 0(45)Newton yönteminde yineleme bağıntısı (26), birinci yineleme için yazılır ise ikinci<strong>türev</strong>ler sıfır olduğundan (Q=0),p − p = ( A A) A .(d-f ) = ( A A) A d − ( A A) A f1 0 T −1 T 0 T −1 T T −1T 0elde edilir. (44) bağıntısından,p − p = (AA) A.d − (AA) AAp1 0 T − 1 T T −1T 0T −1Tyazılabilir. Burada, ( AA ) AAişlemi birim dizeye eşit olduğundan denklemin her0iki yanındaki ön-<strong>kestirim</strong> <strong>parametre</strong>leri ( p ) sadeleşir. Böylece, doğrusalproblemlerde <strong>parametre</strong>lerin tek bir adımda çözülebileceği görülür:1( T − Tp AA ) Ad= (47)Newton (24), Gauss-Newton (36), sönümlü en-küçük kareler (37), Tikhonovdüzgünleştiricisi (38) <strong>yöntemleri</strong>nde, <strong>parametre</strong> düzeltme yöneyi ( ∆ p ), ilgilibağıntılardan çarpma, dönüğünü ve tersini alma gibi dizey işlemleri ile çözülebilir.Dizeylerin tersini alma için çok çeşitli yöntemler önerilmiştir. Gauss-Newton vesönümlü en-küçük kareler <strong>yöntemleri</strong> ile birlikte yaygın olarak kullanılan dizeyişlemlerinden biri ‘Tekil Değer Ayrışımı’ dır (Singular Value Decomposition, SVD). Buyöntemde ağırlık dizeyi ile çarpılmış Jacobian dizeyi A * = wA başka üç dizeyinçarpımı olarak ifade edilir:A* T= U S V(48)Burada, U ve V sırası ile veri ve <strong>parametre</strong> özyöneyleri (eigenvectos) olarakadlandırılır. U dizeyi nxm ve V dizeyi mxm boyutlarındadır. S ise mxm boyutunda ve<strong>parametre</strong> özdeğerlerini ( λ ) içeren bir köşegen dizeydir. Böylece, <strong>parametre</strong>düzeltme yöneyi izleyen toplamdan hesaplanabilir:mλj∆pk = ∑v kja2 2 jk=1,…,m (49)λ + εanj=1j ij i ii=1j= ∑u w ∆ dj=1,…,mBurada, vkj, uijvewisırasıyla U, V ve W dizeylerinin öğelerini göstermektedir.Parametre düzeltme yöneyinin hesaplanması için diğer bir yol doğrusal denklemsistemlerinin çözümünden yararlanmaktır. Bu amaç için ters-çözüm problemi,19


B . ∆ p = x(50)mxm mx1 mx1doğrusal denklem sistemi ile ifade edilir. Burada,x = ( A ) ∆dTmx1 mxn nx1TB = A A+ Q(Newton)BT= A A(Gauss-Newton)T 2B = A A+ ε I(sönümlü en-küçük kareler)T 2 TB=A A+ ε L L(Tikhonov)olarak tanımlanır. B; kare ve bakışımlı bir dizeydir. Böylece, doğrusal denklemsistemlerini çözebilen herhangi bir algoritma yardımı ile <strong>parametre</strong> düzeltme yöneyihesaplanabilir.8. YEREL MİNİMUMLAR SORUNUBirçok problemde yanılgı enerjisi haritasında birden fazla minimumlar bulunabilir.Bunlardan en küçük yanılgı enerjisi değeri olanı ‘global minimum’ diğerleri ise ‘yerelminimum’ olarak adlandırılır. Bir problemde birden fazla yerel minimum olması olasıiken bir adet global minimum vardır. Parametrelerin doğru çözümü, ters-çözümalgoritmasının global minimuma erişmesi ile olanaklıdır. Ancak, global minimumaerişim ön-<strong>kestirim</strong>e bağımlıdır. Şekil 10’da çeşitli ön-<strong>kestirim</strong> değerlerindenbaşlayarak sönümlü en-küçük kareler yöntemi ile problemin çözülmeye çalışılmasıgörüntülenmiştir. Yan yana duran iki ön-<strong>kestirim</strong> değerini temsil eden siyahüçgenlerden de anlaşılabileceği gibi birbirine yakın ön-<strong>kestirim</strong> değerleri kullanımı ilealgoritmanın farklı minimuma yönlenmesi olasıdır. Bu durum kullanılan yöntem ileilişkili olmayıp, tüm <strong>türev</strong> <strong>tabanlı</strong> algoritmaların ortak sorunudur. Ayrıca, bazıdurumlarda gürültü nedeni ile yerel minimumlardan birinin yanılgı enerjisi, globalminimumun yanılgı enerjisinden daha küçük hale gelebilir. Bu tür problemleriaşmanın en önemli aracı, ele alınan problemin doğasının iyi bilinmesi ve hesaplanan<strong>parametre</strong> değerlerinin fiziksel olarak olası olup, olmadığının denetlenmesidir.Şekil 10. Çözümü 1 p =2.25 ve 2 p =0.25 olan bir problemde global (mavi) ve yerel(sarı) minimumlar. Kırmızı üçgenler minimumları ve siyah üçgenler ön-<strong>kestirim</strong>değerlerini göstermektedir. Beyaz çizgiler sönümlü en-küçük kareler yöntemininizlediği çözüm yolunu göstermektedir. Noktalar arasında kalan doğrular, adımbüyüklüğünü göstermektedir (Başokur, Akça ve Siyam, 2007).20


9. SONUÇLARTürev <strong>tabanlı</strong> ters-çözüm algoritmaları yanılgı enerjisinin eğim ve/veya eğrisellikbilgisini kullanır. Sadece eğim bilgisini kullanan en-dik iniş yöntemi yanılgı enerjisiharitası üzerindeki en yakın minimuma erişir. Çoğu problemde yakınsama eldeedilmesine rağmen düzeltme yöneyinin küçük olması nedeni ile çok sayıda yinelemegerektirir. Eşlenik gradyen yöntemi, en-dik iniş yöntemine benzer şekilde hareketetmekle birlikte yakınsamayı hızlandırmak için yanılgı enerjisi haritasında bir öncekiyinelemeye dikgen olan düzeltme yöneyleri kullanır. Newton ve Gauss-Newtonalgoritmaları doğrudan minimuma erişmeyi hedefleyen hızlı yöntemler olmakla birliktekötü ön-<strong>kestirim</strong> veya karmaşık yanılgı enerjisi topografyasının bulunduğudurumlarda minimuma yakınsamayabilirler. Sönümlü en-küçük kareler ve Tikhonov<strong>yöntemleri</strong>nde Gauss-Newton algoritmasının karşılaştığı duraylılık sorunlarıgiderilmeye çalışılır. Uygulanacak duraylaştırıcılar probleme özgü olduğundan çeşitliuygulama örnekleri konu ile ilgili dergilerde bulunabilir. Türev <strong>tabanlı</strong> <strong>kestirim</strong><strong>yöntemleri</strong>nde, <strong>parametre</strong> ayrımlılığı standart sapma dizeyinin hesaplanması ileincelenebilir. Parametre ayrımlılığı ile ilgili konular çeşitli kaynaklardan incelenebilir(örneğin Başokur, 2002). Yazar tarafından geliştirilen FORTRAN ve PV-WAVEdillerinde yazılmış bilgisayar programlarının kaynak kodlarınahttp://jeofizik.ankara.edu.tr adresinden erişilebilinir.K A Y N A K L A RBaşokur, A. T., 1999, Automated 1-D interpretation of resistivity soundings bysimultaneous use of the direct method and iterative methods. GeophysicalProspecting 47, 149-177.Başokur, A. T., 2002, Doğrusal ve Doğrusal Olmayan Problemlerin Ters-Çözümü,TMMOB Jeofizik Mühendisleri Odası, 166 sayfa.Başokur, A. T., Akça, İ. and Siyam, W. A., 2007, Hybrid genetic algorithms in viewof the evolution theories with application for the electrical sounding method,Geophysical Prospecting 55, 393–406.Bevington, P. R. 1969, Data reduction and error analysis for the physical sciences,McGraw-Hill Book Co.Lines L.R. and Treitel S., 1984. Tutorial: A review of least-squares inversion and itsapplication to geophysical problems, Geophysical Prospecting 32, 159–186.Tarantola, A. 1987. Inverse Problem Theory, Elsevier, ISBN 0-444-42765-1.Zhadanov, M. S., 2002, Geophysical inverse theory and regularization problems,Elsevier.21

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!