Blatt 6
Blatt 6
Blatt 6
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Aufgabe 23: Netzwerke (8 Punkte)<br />
⎛<br />
1 1<br />
⎞<br />
⎛<br />
⎞<br />
0<br />
2 3<br />
1 1<br />
1 1 1 1 1<br />
1 1<br />
2<br />
0<br />
3<br />
0 0<br />
P =<br />
1<br />
⎜0 2<br />
0 0 0<br />
⎟ P ′ = (1 − d) P + d 1 1 1 1 1<br />
⎝ 1<br />
0 0<br />
3<br />
0 0⎠<br />
5 ⎜1 1 1 1 1<br />
⎟<br />
⎝1 1 1 1 1⎠<br />
1<br />
2<br />
0 0 0 0<br />
1 1 1 1 1<br />
Methoden aus der linearen Algebra finden in den verschiedensten Bereichen Anwendung. So auch in<br />
der Netzwerktheorie, einem interdisziplinären Gebiet zwischen Physik, Mathematik und Informatik.<br />
Betrachten Sie folgendes, aus fünf Knoten bestehendes, gerichtetes, Netzwerk.<br />
4<br />
3<br />
1<br />
5<br />
2<br />
Die Knoten beschreiben die Mikrozustände, in denen sich ein System befinden kann. Der Gesamtzustand<br />
des Netzwerks lässt sich zu jedem Zeitpunkt t durch einen Vektor ⃗p t angeben. Hierbei gibt p t,i<br />
die Wahrscheinlichkeit an, dass sich das System im Zustand i befindet.<br />
Die Pfeile geben an, welche Übergänge möglich sind. Der Einfachheit halber seien alle erlaubten<br />
Übergänge gleich wahrscheinlich. Die Matrixelemente P ij geben an, mit welcher Wahrscheinlichkeit<br />
ein Wechsel in den Zustand i stattfindet, falls sich das System im Zustand j befindet. Eine solche<br />
Matrix, in der die Spaltensummen 1 ergeben heißt (spalten-)stochastische Matrix.<br />
Hieraus ergibt sich folgende Gleichung für die Zeitentwicklung der Aufenthaltswahrscheinlichkeiten<br />
des Gesamtsystems in den möglichen Zuständen:<br />
⃗p t+1 = P ⃗p t<br />
a) Zeigen Sie: Jeder Vektor ⃗p 0 mit ∑ i p 0,i = 1 wird durch eine spaltenstochastische Matrix auf einen<br />
Vektor ⃗p 1 abgebildet, für den ebenfalls gilt ∑ i p 1,i = 1. (1 Punkt)<br />
b) Angenommen, das System befindet sich anfangs im Zustand 2. Mit welcher Wahrscheinlichkeit<br />
befindet es sich: (i) Nach einem Zeitschritt im Zustand 3? (ii) Nach zwei Zeitschritten im Zustand<br />
1? (iii) Wie sieht die Wahrscheinlichkeitsverteilung des Gesamtsystems nach drei Zeitschritten aus?<br />
(2 Punkte)<br />
c) Berechnen Sie die stationäre Wahrscheinlichkeitsverteilung, d.h. das ⃗p stat , das unter Anwendung<br />
von P invariant bleibt. Die Existenz eines solchen ⃗p stat kann vorausgesetzt werden! (2 Punkte)<br />
d) Nimmt man an, dass die Knoten Internetseiten beschreiben und die Pfeile Links zwischen diesen<br />
angeben, so beschreibt P das Verhalten eines Surfers, der zufällig den Verlinkungen folgt. Die Aufenthaltswahrscheinlichkeit<br />
eines solchen ’Random-Surfers’ kann als Maß für die Relevanz einer Seite<br />
aufgefasst werden. Probleme bereitet dabei die Tatsache, dass es Seiten geben kann, auf die zwar<br />
verlinkt wird, die aber selbst nicht auf andere Webpages verweisen. Um zu vermeiden, dass diesen<br />
eine zu hohe Relevanz zugeordnet wird, kann man einen zusätzlichen Term einführen. Mit einer Wahrscheinlichkeit<br />
d soll der Surfer, statt den Links weiter zu folgen, zufällig zu einer beliebigen Seite<br />
springen (formal realisiert durch die Matrix P ′ ). Das ist das Prinzip des PageRank-Algorithmus, der<br />
ursprünglich von der Suchmaschine Google verwendet wurde.<br />
Auf der Website zur Vorlesung finden Sie das Mathematica-File 1 PageRank.nb. Mit diesem soll nun<br />
ein etwas größeres Netzwerk untersucht werden. Ermitteln Sie für d = {0., 0.01, 0.1, 0.2, 0.9} die Aufenthaltswahrscheinlichkeit<br />
eines Random-Surfers für die Knoten 1, 12 und 17 des Netzwerks. Die<br />
Verteilung der Aufenthaltswahrscheinlichkeit ist durch den Eigenvektor zum größten Eigenwert gegeben,<br />
wobei die Summe der Einträge auf eins normiert wird! (3 Punkte)<br />
1 Mathematica ist z.B. verfügbar im CIP-Pool. Start über die Konsole mit dem Befehl ’mathematica’.