Hausarbeit - Friedrich-Schiller-Universität Jena
Hausarbeit - Friedrich-Schiller-Universität Jena
Hausarbeit - Friedrich-Schiller-Universität Jena
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Friedrich</strong>-<strong>Schiller</strong>-<strong>Universität</strong> <strong>Jena</strong><br />
Institut für Geographie<br />
HptS: Analyse und Modellierung räumlicher Daten<br />
WS 2004/05<br />
Leitung: Dr. Martin Herold<br />
Die „Weights of Evidence“ Methode<br />
Theorie und konzeptionelle Grunglagen in GIS<br />
Stephan Sonntag<br />
Matr.Nr.: 58127<br />
Studiengang: Geographie (Diplom)<br />
Semester: 6
Inhalt<br />
1 Einleitung<br />
2 Vorhersage von Mineralvorkommen<br />
3 Umgang mit der Weights of Evidence Methode<br />
3.1 Binary evidential themes<br />
3.2 Berechnung der weights<br />
3.3 Binäre Reklassifizierung<br />
3.4 Bayes Theorem<br />
4 Abschließende Betrachtung<br />
Literatur
1 Einleitung<br />
Die „Weights of Evidence“ Methode ermöglicht Wahrscheinlichkeiten im Licht<br />
verschiedener Themen (evidences), die durch Analyse oder Beobachtung gewonnen<br />
werden, zu bemessen (weight). Die Methode wurde laut Arc-WofE User-Guide<br />
(1998:1) ursprünglich für eine nicht-räumliche Anwendung entwickelt. So wurden in<br />
der medizinischen Diagnose die Symptome einer bestimmten Krankheit als<br />
Informationen (evidences) verstanden und die zugehörige Hypothese lautete: „Dieser<br />
Patient hat die Krankheit X“. Für jedes Symptom wurde ein Paar von so genannten<br />
Gewichtungen (weights) festgelegt, ein für das Vorhandensein und eine für das Nicht-<br />
Vorhandensein des Symptoms. Somit konnte in einer großen Gruppe von Patienten eine<br />
Verbindung zwischen der Häufigkeit von Symptomen und einem bestimmte<br />
Erkrankungsmuster festgestellt werden. Die errechneten weights konnten dann dafür<br />
verwendet werden, um einzuschätzen ob ein neuer Patient diese Krankheit hat, basiert<br />
auf dem Vorhandensein oder Nicht-Vorhandensein von Symptomen.<br />
1980 wurde die „Weights of Evidence“ Methode für die Darstellung möglicher<br />
Mineralvorkommen mit Hilfe von GIS angepasst. Dabei bestehen die Themen<br />
„Evidences“ aus einer Reihe von untersuchten Datensätzen (Karten) und die Hypothese<br />
lautet: „Ist in diesem Gebiet das Vorkommen von Ablagerung X möglich“. Die weights<br />
werden durch die Zusammenhänge zwischen Bekannten Mineralvorkommen und den<br />
Werten in den Karten, die dabei als Vorhersagewerte dienen, abgeschätzt. Die<br />
Hypothese ist dann für alle möglichen Orte auf der Karte bewiesen, auf der die weights<br />
of evidence der verschiedenen Kartenlayer übereinstimmen.<br />
2 Vorhersage von Mineralvorkommen<br />
Die physikalischen und chemischen Grundlagen, die die Bildung von<br />
Mineralvorkommen bestimmen sind zu komplex um damit Vorhersagen in<br />
mathematischer Form zu treffen. Die Vorhersage von Mineralvorkommen muss daher<br />
laut BONHAM-CARTER (1994:252) in empirischer Form geschehen mit Hilfe von<br />
deskriptiven Ablagerungsmodellen. Die Beschreibung eines Ablagerungsmodells<br />
beinhaltet eine Bewertung der chemischen und physikalischen Prozesse die die<br />
Ablagerung bestimmen. Bei der Benutzung von GIS zur Berechnung von potentiellen<br />
Mineralvorkommen, spielen so genannte Ablagerungsmodelle (deposit models) eine<br />
Rolle. Diese werden dazu benötigt, um Karten zu selektieren und abzuleiten, die gute<br />
Vorhersagen über bestimmte Ablagerungstypen treffen können und die Gewichtungen<br />
(weights) in den Vorhersagekarten (predictor map) festlegen. Die Zuweisung von<br />
Gewichtungen kann entweder in Form von statistischen Kriterien geschehen oder durch<br />
die Einschätzung aufgrund der Meinung von Experten. Bei der statistischen Methode<br />
wird versucht ein räumlicher Zusammenhang zwischen der Vorhersagekarte und der<br />
Ergebniskarte (response map) aufgrund bekannter Mineralvorkommen zu bestimmen.
Diese beiden Typen werden in datenbasierte (data-driven) und wissensbasierte<br />
(knowledge-driven) Modelle unterschieden. In Abbildung 1 sind diese beiden Typen<br />
dargestellt. In datenbasierter Modellierung werden die verschiedenen Inputkarten mit<br />
Hilfe von Modellen, wie „logistic regression“, „weights of evidence“ oder „neural<br />
network analysis“ verbunden. Bei der wissensbasierten Modellierung wird mit „fuzzy<br />
logic“, Bayesian probability“ und „Dempster-Shafer belief theory“ gearbeitet.<br />
Abb. 1: Modelle zur Bestimmung möglicher Mineralvorkommen (Quelle: BONHAM-<br />
CARTER 1994:254)<br />
3 Umgang mit der Weights of Evidence Methode<br />
BONHAM-CARTER 1994:317) nennt folgende Schritte die beim Umgang mit der Weights<br />
of Evidence Methode durzuführen sind:<br />
1. Eine Anzahl von Karten muss ausgewählt werden, die brauchbare Themen<br />
(evidences) für die gegebene Fragestellung liefert (in diesem Fall die Suche<br />
nach mineralischen Ablagerungen)<br />
2. Jede Karte, deren Thema durch eine größere Zahl von Klassen gegeben ist<br />
muss eine optimale Reklassifizierung gewählt werden um sie in binäre Form<br />
umzuwandeln. Dabei muss ein starker räumlicher Zusammenhang zwischen der<br />
Karte und den Ablagerungen gegeben sein. Die binäre Reklassifizierung soll im<br />
weiteren Verlauf der Arbeit noch diskutiert werden.<br />
3. Untersuchung nach paarweiser Korrelation zwischen den binären Karten. Dabei<br />
müssen „problematische“ Karten gelöscht werden, die zu anderen Karten keine<br />
Korrelation aufweisen. Oder es werden verschiedene binäre Karten kombiniert<br />
um die Korrelation zu erhöhen.<br />
4. Die unter Punkt zwei entstandenen binären Karten müssen mit einer Gleichung,<br />
deren Herleitung in dieser Arbeit beschrieben wird, verrechnet werden.<br />
5. Eine Karte muss erstellt, die das Ergebnis der Berechnung darstellt.<br />
Die einzelnen hier angeführten Schritte erfordern sehr viel mehr computerisierte<br />
Berechnungen als die subjektive Festlegung der weights mit anderen Methoden. Der<br />
Vorteil der Methode besteht aber darin, dass objektive Einschätzungen der weights
gegeben werden, die räumliche Zusammenhänge zwischen Kartenmustern und<br />
bekannten Vorkommen berücksichtigen.<br />
3.1 Binary evidential themes<br />
Ein evidential theme ist laut Arc-WofE User-Guide (1998:1) ein Kartenlayer, der für die<br />
Vorhersage eines bestimmten punktuellen Objektes, zum Beispiel mineralogischen<br />
Vorkommen, dient. Die evidential themes bestehen jeweils aus zwei oder mehr Klassen.<br />
Die Weights of Evidence Methode ist nur für binarär Klassifikation geeignet, wodurch<br />
es erforderlich wird multi-class evidential themes in zwei Klassen zu generalisieren.<br />
In Abbildung 2 ist ein rechteckiger View mit einem evidential theme in zwei Klassen<br />
dargestellt. Dabei ist in der Attributtabelle der Wert 2 für Anwesenheit des Themas und<br />
für Nicht-Anwesenheit 1. Zusätzlich ist eine Anzahl von Trainingspunkten gegeben.<br />
Der Arc-WofE User-Guide (1998:1) beschreibt Trainingspunkte als Punkt-Layer, der<br />
aus Orten besteht, an deren Stelle die Objekte bekannt sind die dort vorkommen. Im<br />
Fall von geologischen Explorationsarbeiten sind die Trainingsunkte die Vorkommen<br />
bestimmter Stoffe, die bereits von Minengesellschaften und Prospektoren entdeckt<br />
worden sind. In anderen geologischen Fachgebieten könnten die Trainingspunkte Orte<br />
mit seismischer Aktivität, Störungen oder Klüfte darstellen. Die Serie von Punkten dient<br />
dazu, die Gewichtungen für jedes einzelne Thema zu berechnen. Dabei ist in der<br />
Attributtabelle der Punkte nur vermerkt, ob dort das Thema vorkommt oder nicht. Es<br />
wird nicht nach der Größe oder Ergiebigkeit der Vorkommen unterschieden. In Figur<br />
2A sind die Grenzen der Basiskarte (Boundary of base map) dargestellt und in Figur 2B<br />
ist nur noch die Basiskarte, in der ein Teil des Themas und einige Trainingspunkte<br />
fehlen, abgebildet.
Abb. 2: A: binary evidential theme mit Trainingspunkten. B: Ausschnitt aus A (Quelle:<br />
Arc-WofE User-Guide 1998:3)<br />
Das Gebiet eines unit cell´s ist mit u km 2 gegeben. Ein unit cell ist laut Arc-WofE User-<br />
Guide (1998:1) ein kleines Gebiet, dass einen zugehörigen Trainingspunkt umgibt. Die<br />
Größe dieses Gebiet muss festgelegt werden. Denn das Ergebnis der Weights of<br />
Evidence Methode ist eine Karte, in der die Wahrscheinlichkeit berechnet ist, dass ein<br />
Gebiet (unit area) einen bestimmten Trainingspunkt beinhaltet oder nicht. Folglich<br />
verändert sich die Wahrscheinlichkeit mit der gewählten unit cell Größe. Die Größe<br />
wird am Anfang des Computerprogramms gesetzt und ist für alle evidential themes und<br />
alle Trainingspunkte gleich groß.<br />
3.2 Berechnung der weights<br />
Die folgende Berechnung der weights geschieht auf Grundlage des Arc-WofE User-<br />
Guide (1998:3-5). Die Größe der base map aus Abbildung 2 ist A(T)/u = N(T) in unit<br />
cells, wobei T die base map ist, A() das Gebiet (area) und N() die Anzahl der unit cells.<br />
Die Anzahl der Trainingspunkte innerhalb der base map ist N(D). Angenommen das<br />
evidential theme ist B, dann ist A(B)/u = N(B) in unit cells das Gebiet in dem B (zum<br />
Beispiel ein bestimmtes Mineral) vorhanden ist. Der Wert für B kann zum Beispiel 2<br />
sein. Dementsprechend ist A( )/u = N( ) das Gebiet in dem B nicht vorhanden ist. Bei<br />
ist dann zum Beispiel der Wert 1 anzunehmen. Wenn keine unbekannten Bereiche<br />
vorhanden sind gilt folgendes:<br />
N(B) + N(<br />
) = N(T).
Sind Regionen in T, wo B wegen nicht-kompletter Erkundung unbekannt ist, entsteht<br />
eine dritte Klasse mit dem Wert 0. Die Gleichung lautet dann:<br />
N(B) + N(<br />
) + N(missing) = N(T).<br />
Wenn GIS verwendet wird, kann N(T), N(B) und N( ) leicht ermittelt werden. Auch<br />
die Anzahl der Trainingspunkte von B und , geschrieben als N(Bn B) und N( nD),<br />
kann leicht ermittelt werden.<br />
Die weights liefern ein Maß für den räumlichen Zusammenhang zwischen den<br />
Trainingspunkten und dem evidential theme. Ein weight muss für jede Klasse des<br />
evidential theme bestimmt werden. Ein positiver Wert bedeutet, dass mehr Punkte<br />
innerhalb der Klasse liegen als normal Wahrscheinlich sind. Umgekehrt bedeutet ein<br />
negativer Wert, dass weniger Punkte als erwartet in der Klasse vorkommen. Ein Wert<br />
von Null oder nahe Null bedeutet, dass die Trainingspunkte in der Klasse zufällig<br />
verteilt sind. Bei binären Karten, die ja aus zwei Klassen bestehen, wird W + für ein<br />
weight benutzt, bei dem das evidential theme anwesend ist (Wert 2). W - wird dann<br />
demenstsprechend für Abwesenheit des evidential themes verwendet.<br />
Die Differenz zwischen den weights ist der Kontrast C. Also gilt: C = W + - W - . Der<br />
Kontrast ist ein gesamtes Maß für den räumlichen Zusammenhang zwischen den<br />
Trainingspunkten und dem evidential theme, indem er die Effekte der beiden weights<br />
kombiniert.<br />
Werte für die weights zwischen 0 und 0,5 sind wenig vorhersagend, Werte zwischen 0,5<br />
und 1 sind mäßig vorhersagend, zwischen 1 und 2 stark vorhersagend und über 2 extrem<br />
stark.<br />
Die weights für binäre Themen sind durch den Zusammenhang folgenden bedingte<br />
Wahrscheinlichkeiten gegeben:<br />
P(B¦ D)<br />
W + = ln P(B¦ ) und<br />
P( ¦D)<br />
W - = ln P( ¦ )<br />
P() ist dabei das Zeichen für Wahrscheinlichkeit. Vorausgesetzt, es besteht eein<br />
einfaches Verhältnis zwischen den Gebieten, dann ist:<br />
N(Bn D)<br />
P(B¦ D) = N(D) ,<br />
N(Bn )<br />
P(B¦ ) = N( ) ,
N( n D)<br />
P( ¦ D) = N(D) und<br />
N( n )<br />
P( ¦ ) = N( ) .<br />
N(Bn D) ist dabei die Anzahl der Trainingspunkte in Thema B. Somit ergibt sich für o.<br />
g. Gleichung:<br />
N(Bn D) / N(D)<br />
W + = ln [N(B) - N(Bn D)] / [N(T) – N(D)]<br />
Für W - wird genauso verfahren. Die weights für die einzelnen evidential themes sind<br />
somit berechnet.<br />
3.3 Binäre Reklassifizierung<br />
Die Konvertierung von Karten mit mehreren Klassen zu einer binären Form kann nach<br />
BONHAM-CARTER (1994:319-320) auf zwei Arten geschehen. Zum einen subjektiv, in<br />
dem man geologische beurteilt oder aber statistisch. Bei letzterem wird die Schwelle des<br />
maximalen räumlichen Zusammenhangs zwischen der resultierenden binären Karte und<br />
dem Muster der Trainingspunkte bestimmte.<br />
Abb. 3: Karte mit Antiklinalen und Orten bekannten Goldvorkommens (Quelle:<br />
BONHAM-CARTER 1994:319)<br />
In Abbildung 3 ist eine Karte der Antiklinalen mit mehreren Klassen dargestellt, in der<br />
auch die Punkte mit bekannten Mineralvorkommen eingetragen sind. Auch ohne
statistisches Wissen ist zu erkennen, dass die Punkte dazu tendieren in der Nähe der<br />
Antiklinalen zu liegen. Wenn aus diesem Thema (evidence) eine binäre Karte entstehen<br />
soll, besteht die Frage darin, in welcher Entfernung von den Antklinalen die beste<br />
Distanz ist um einen Schnitt zu machen. Innerhalb dieser Grenze wird das Vorkommen<br />
als Wahrscheinlich angesehen, außerhalb nicht. Wenn die Distanz zu kurz gerät wird<br />
das Gebiet kleiner und die Gefahr besteht, dass einige der Punkte mit bekannten<br />
Vorkommen nicht darin liegen. Wird die Distanz jedoch zu lang gewählt geht der<br />
Effekt, die Suche in dem Gebiet einzuengen, fast vollständig verloren. Anders als in der<br />
Abbildung dargestellt, hat die Karte 24 Buffer die in einem Intervall von 250 Metern<br />
unterteilt sind.<br />
Abb. 4: Tabelle für die Karte der Antiklinalen (Quelle: BONHAM-CARTER 1994:322)<br />
In Abbildung 4 sind alle Klassen mit Entfernung, Größe und den dazugehörigen<br />
Trainingspunkten dargestellt. Der Kontrast in der letzten Spalte ist ein Maß für den<br />
räumlichen Zusammenhang zwischen den Punkten mit bekannten Goldvorkommen und<br />
den antiklinalen Faltenachsen. Aus der Distanz und dem Kontrast lässt sich ein<br />
Diagramm formieren, dass in Abbildung 5 dargestellt ist. In diesem Beispiel ist ein<br />
eindeutiger Zusammenhang zwischen der Karte mit den Antiklinalen und bekannten
Goldvorkommen festzustellen. Bei einer Entfernung von 1.25 km sind 51 der insgesamt<br />
68 Vorkommen vertreten. Die Grenze auf der Karte liegt also bei 1,25 km. An dieser<br />
Stelle ergibt sich das beste Ergebnis für die Vorhersage weiterer Vorkommen. Es<br />
besteht aber auch die Möglichkeit, dass kein so klares Ergebnis aus dem Diagramm<br />
hervorgeht, weil die Trainingspunkt vielleicht nicht so eindeutig verteilt sind. In solchen<br />
Fällen muss zusätzlich eine subjektive Beurteilung unter zu Hilfenahme von<br />
fachspezifischen Kenntnissen erfolgen.<br />
Abb. 5: Graph mit den Schwankungen<br />
des Kontrasts mit der Entfernung<br />
(Quelle: BONHAM-CARTER 1994:320)<br />
3.4 Bayes Theorem<br />
Diese Weights of Evidence Methode basiert auf der Wahrscheinlichkeitstheorie nach<br />
Bayes. Das Bayes Theorem erlaubt in gewissem Sinne das Umkehren von<br />
Schlussfolgerungen. Vereinfacht ausgedrückt können bei bekannten Ursachen mit Hilfe<br />
des Theorems die Wahrscheinlichkeit des Auftretens eines Ereignisses berechnet<br />
werden. Das Bayes Theorem gibt an, wie man mit bedingten Wahrscheinlichkeiten<br />
rechnet. Für zwei Ergebnisse B und D lautet es:<br />
P(D¦ B) =<br />
P(B¦ D) * P(D)<br />
P(B)<br />
Hierbei ist P(D) die A-Priori-Wahrscheinlichkeit für ein Ereignis A und<br />
P(B¦ D) die Wahrscheinlichkeit für ein Ereignis B unter der Bedingung, dass D auftritt.<br />
Die A-Priori-Wahrscheinlichkeit ist in den Naturwissenschaften ein<br />
Wahrscheinlichkeitswert, der aufgrund von Vorwissen (zum Beispiel symmetrische<br />
Eigenschaften eines Würfels) gewonnen wird.
BONHAM-CARTER ET AL (1998:173) transformiert dabei den Ausdruck der<br />
Wahrscheinlichkeit in die logarhitmische Form log e . Wenn nun L() für den Logarithmus<br />
geschrieben wird, ergibt sich für den A-Posteriori-Logarhitmus (das Ergebnis der<br />
Methode) für nur ein evidential theme folgende Gleichung:<br />
L(D¦ B) = L(D) + W +<br />
bei Vorhandensein des Themas oder:<br />
L(D¦ ) = L(D) + W -<br />
bei Nicht-Vorhandensein des Themas. Es wird nun davon gesprochen, dass der A-<br />
Priori-Logarhitmus durch die evidences zum A-Posteriori-Logarhitmus „aktualisiert“<br />
(„updated“) wird. Dies ist nun die logarithmische Form des Bayes Theorem. Wenn zwei<br />
binäre evidential themes (B 1 und B 2 ) gegeben sind, führt das zu vier möglichen<br />
Situationen, in die sie kombiniert sein können:<br />
L(D¦ B 1 n B 2 ) = L(D) + W + +<br />
1 + W 2<br />
L(D¦ 1 n B 2 ) = L(D) + W - +<br />
1 + W 2<br />
L(D¦ B 1 n 2) = L(D) + W + -<br />
1 + W 2<br />
L(D¦ 1 n 2) = L(D) + W - -<br />
1 + W 2<br />
,<br />
,<br />
und<br />
.<br />
Drei oder mehreren evedential themes werden ähnlich kombiniert, indem die<br />
angemessenen weights der Themen zusätzlich addiert werden. Die abschließende<br />
Gleichung, die das Ergebnis der weights of evidence Methode liefert lautet dann:<br />
L(D¦ B 1 n B 2 n B 3 …B n } = L(D) + S W + i .<br />
Wie bereits weiter oben beschrieben ist diese Gleichung in die Computertools integriert,<br />
die sich mit Weights of Evidence befassen.<br />
4 Abschließende Betrachtung<br />
An dieser Stelle werden einige Vor- und Nachteile der Weights of Evidence Methode<br />
angesprochen. Die prinzipiellen Vorteile sind:
1. Die Methode ist objektiv und vermeidet eine subjektive Auswahl der<br />
Gewichtungsfaktoren (weighting factors), wie es zum Beispiel in der „Index<br />
Overlay“ Methode der Fall ist.<br />
2. Verschiedene Kartenmuster können mit einem Modell kombiniert werden, dass<br />
relativ einfach als Computertool bedient werden kann.<br />
3. Inputkarten mit fehlenden Daten (lückenhafte Oberfläche) können in das Modell<br />
eingefügt werden.<br />
Zwei Nachteile der „Weights of Evidence“ Methode sind:<br />
1. Die Kombination der Inputkarten setzt voraus, dass die Karten in Bezug auf ihre<br />
einzelnen Themen unabhängig sind.<br />
2. „Weights of Evidence“ gemeinsam mit anderen datenbasierten Methoden ist nur<br />
in solchen Regionen zu gebrauchen, wo die Ausgangsvariable (in diesem Fall<br />
das Vorhandensein von bekannten Lagerstätten) einigermaßen gut bekannt ist.
Literatur<br />
Arc-WofE User-Guide (1998) http://ntserv.gis.nrcan.gc.ca/wofe/project.htm. Zugriff<br />
22.11.2004.<br />
BONHAM-CARTER, G.F. (1994): Geographic Information Systems for Geoscientists:<br />
Modeling with GIS. New York.<br />
BONHAM-CARTER, G.F., F.P. AGTERBERG & D.F. WRIGHT (1989): Weights of evidence<br />
modeling: a new approach to mapping mineral potential. In: Statistical<br />
Applications in the Earth Sciences. Geological Survey of Canada. Nr. 89-9,<br />
171-183.