Effizient suchen leicht gemacht - Centre fri-tic
Effizient suchen leicht gemacht - Centre fri-tic
Effizient suchen leicht gemacht - Centre fri-tic
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Effizient</strong> <strong>suchen</strong> <strong>leicht</strong> <strong>gemacht</strong><br />
Ein Lehrmittel für den IKT-Unterricht<br />
von Giancarlo Gareiss
EFFIZIENT SUCHEN<br />
LEICHT GEMACHT<br />
2
Inhaltsverzeichnis<br />
Vorwort zum Gebrauch 4<br />
1. Bedeutung von Suchmaschinen 5<br />
2. Die Entwicklung des Internets 6<br />
3. Wie funktionieren Suchmaschinen 11<br />
4. <strong>Effizient</strong>es Suchen 18<br />
5. Gefahren im Umgang mit Google 25<br />
6. Anhang A 30<br />
a. Glossar 30<br />
b. Nützliche Links 34<br />
c. Quellenangabe 36<br />
7. Anhang B 43<br />
a. Lösungen 43<br />
3
Vorwort zum Gebrauch<br />
Was ist das Ziel des vorliegenden Lehrmittels?<br />
Das Lehrmittel „<strong>Effizient</strong> Suchen <strong>leicht</strong> <strong>gemacht</strong>“ soll dir einen<br />
Einblick in verschiedene Aspekte von Suchmaschinen und insbesondere<br />
Google verleihen. Es bringt dir einerseits die Funktionsweise<br />
von Suchmaschinen näher, andererseits lernst du Techniken<br />
für ein gezielteres Suchen im Internet und wirst auf die Gefahren<br />
im Umgang mit Google aufmerksam <strong>gemacht</strong>. Die Entstehungsgeschichte<br />
des Internets und die Bedeutung von Google und Co. runden<br />
das Lehrmittel ab und setzen Suchprogramme in einen grösseren<br />
Zusammenhang. Für die Bearbeitung brauchst du keinerlei<br />
Vorkenntnisse. Dein Wissen vom täglichen googeln reicht vollständig<br />
aus.<br />
Wie ist es aufgebaut?<br />
Das Lehrmittel ist in fünf Kapitel unterteilt, die jeweils verschiedene<br />
Aspekte von Suchmaschinen abhandeln. Zu Beginn jedes<br />
Kapitels steht eine Einführungsseite in grün, die einerseits dein<br />
Vorwissen aktivieren soll und andererseits eine Heranführung an<br />
die Thematik des Kapitels darstellt. Der blaugefärbte Hauptteil<br />
eines jeden Kapitels ist in eine linke und rechte Spalte unterteilt.<br />
Die linke soll dir Informationen zum Thema beschaffen und enthält<br />
auch Theorieteile, die rechte dient der Vertiefung mittels Aufgaben<br />
und der Auflockerung. Zum Schluss jedes Kapitels folgt<br />
eine rote Abschlussseite, die einerseits mit einer Zusammenfassung<br />
der wichtigsten Punkte, andererseits mit Repetitionsaufgaben<br />
dienen soll. Im Anhang finden sich die Lösungen sämtlicher Aufgaben,<br />
ein Glossar, welcher die unterstrichenen Begriffe erklärt<br />
und dazu noch einige nützliche Internetseiten für den Schulalltag.<br />
Tipps zur Bearbeitung<br />
� Bearbeite das Lehrmittel in der vorgegebenen Reihenfolge<br />
der Kapitel und Unterkapitel.<br />
� Lies vor den Aufgaben immer den Theorieteil genau<br />
durch.<br />
� Versuche die Aufgaben, sofern nicht anders vermerkt,<br />
selbständig zu lösen und notiere die Lösungen auf ein separates<br />
Blatt Papier.<br />
� Die Lösungen im Anhang müssen nicht immer mit deinen<br />
übereinstimmen.<br />
� Löse auch die Einstiegs- und Repetitionsaufgaben. Sie<br />
dienen der Aktivierung deines Vorwissens bzw. der Festigung<br />
des Erlernten.<br />
4
Die Entstehung des Internet<br />
1. Bedeutung von Suchmaschinen<br />
1958<br />
Als<br />
Menschen<br />
Reaktion<br />
stellten<br />
auf den<br />
schon<br />
russischen<br />
immer<br />
Satelliten<br />
Fragen. Es<br />
Sputnik<br />
liegt wohl<br />
(1957)<br />
einfach<br />
ruft das<br />
in<br />
Verteidigungsministerium<br />
der Natur des Menschen neugierig<br />
der USA<br />
zu<br />
die<br />
sein<br />
ARPA<br />
und alles<br />
(Advanced<br />
wissen<br />
Re-<br />
zu<br />
search<br />
wollen.<br />
Projects<br />
Denn wir<br />
Agency)<br />
<strong>suchen</strong><br />
ins<br />
für<br />
Leben.<br />
alles Gründe<br />
Das erklärte<br />
und wollen<br />
Ziel der<br />
nichts<br />
Behörde<br />
als<br />
ist,<br />
gegeben<br />
im Bereich<br />
hinnehmen.<br />
der Technik<br />
Früher vor<br />
nie<br />
mehr<br />
mehr<br />
als<br />
überraschend<br />
zweitausend<br />
geschlagen<br />
Jahren stell-<br />
zu<br />
werden.<br />
ten die Griechen ihre Fragen einem Orakel.<br />
1964<br />
Paul Baran entwickelt als erster die Idee zur Paketvermittlung in<br />
einem verteilten Netz. Sie stellt ein alternatives Verfahren zur<br />
Durchschaltevermittlung dar. [1]<br />
1969<br />
Die Rechner der Universität von Kalifornien, der Universität von<br />
Kalifornien in Santa Barbara, der Universität von Utah und des<br />
Stanford Research Institute werden miteinander verbunden und<br />
bilden zusammen das ARPANET. Finanziert und geleitet wird das<br />
Projekt von der ARPA. Das Ziel ist, eine Möglichkeit für die Zusammenarbeit<br />
und den Datenaustausch der Universitäten zu schaffen.<br />
[2]<br />
1970<br />
Das ARPANET wächst praktisch jeden Monat um einen Rechner.<br />
[3]<br />
1971<br />
Das Netzwerk umfasst mittlerweile 15 Knoten, [4] wird aber weiterhin<br />
nur von einigen Wenigen genutzt. Meistens Informatiker und<br />
Studenten an Universitäten und Forschungseinrichtungen. Die<br />
breite Öffentlichkeit weiss praktisch nichts von der Existenz des<br />
Netzwerks. [5]<br />
1973<br />
Vint Cerf und Robert Kahn legen den Grundstein für das Zusammenschliessen<br />
von verschiedenen Netzwerken:<br />
Sie entwickeln die Protokolle TCP/IP [6] und das Konzept der Gateways<br />
(Netzkoppler), mit deren Hilfe Netzwerke mit unterschiedlichen<br />
Protokollen und Geschwindigkeiten miteinander kommunizieren<br />
können. Jetzt konnte mit einem Router, der als Gateway<br />
fungierte, und dem TCP/IP-Protokoll jedes beliebige Netzwerk mit<br />
einem anderen in Verbindung treten. [7] Als erster nicht amerikanischer<br />
Rechner wird ein Rechner des NORSAR (Norwegian Seismic<br />
Array) mit dem ARPANET verbunden. [8]<br />
Aber in dem unaufhaltsamen Prozess der technischen Weiterentwicklung,<br />
in dem sich die Menschheit seit dem Anbeginn ihrer<br />
Existenz befindet, war es nur eine Frage der Zeit, bis auch das<br />
Beantworten von Fragen automatisiert und zu neuer Perfektion<br />
vorangetrieben werden sollte.<br />
Heutzutage sind sie in aller Munde. Die Rede ist von Suchmaschinen.<br />
Allen voran von einer. Von Google, dem Informationslieferanten<br />
schlechthin. Wenn man Leute fragt, einem eine Suchmaschine<br />
zu nennen, werden sie einem die Antwort in einem Wort<br />
geben: Google. Google ist omnipräsent. Keine andere Suchmaschine<br />
ist so oft in den Medien, wie der Suchgigant aus Kalifornien.<br />
Google stellt andere wie Yahoo! oder Microsofts Bing in den<br />
Schatten. Doch was steckt wirklich hinter dem Weltkonzern und<br />
welche Bedeutung kommt der Suchmaschine zu?<br />
Dank Google finden wir heute auf viele Fragen eine Antwort.<br />
Nicht nach fragen über den Sinn des Lebens oder der Zukunft<br />
(noch nicht), aber z.B. nach Zugverbindungen. Vor ein paar Jahren<br />
wäre das noch unmöglich gewesen. Suchmaschinen vollbringen<br />
rein technisch gesehen eine grossartige Leistung. Und wir müssen<br />
noch nicht einmal lange auf die Antworten warten. Denn das ganze<br />
passiert in Sekundenbruchteilen. Fast schon schneller als wir denken<br />
können, bekommen wir die Resultate. Menschen fragen Google<br />
für praktisch alles. Die Suchmaschine kontrolliert die Informationen,<br />
wie niemand jemals zuvor in der Geschichte der Menschheit.<br />
Google bestimmt was wir finden. Und somit auch was wir wissen.<br />
Was wir für ein Weltbild haben. Mehr als Zeitungen oder das<br />
Fernsehen dies tun.<br />
Deshalb ist es wichtig, dass wir uns bewusst werden, wie gross<br />
Googles Einfluss ist und wir andere Möglichkeiten kennen, an<br />
Informationen zu kommen. Denn was wir nicht finden – oder auf<br />
den Ergebnisseiten weit hinten steht –, existiert für viele auch<br />
nicht. Gerade auch deshalb ist es so wichtig, dass wir lernen im<br />
Internet gezielt nach den Informationen zu <strong>suchen</strong> und diese auch<br />
kritisch zu bewerten.<br />
5<br />
� Suchmaschinen vollbringen eine<br />
grossartige technische Leistung.<br />
� Wenn wir etwas mit einer Suchmaschine<br />
nicht finden, heisst das<br />
nicht, dass es die Sache nicht gibt.<br />
� Suchmaschinen beeinflussen unser<br />
Weltbild.
Wusstest du, dass…<br />
� Im Jahr 1972 das erste Mal gechattet<br />
wurde?<br />
� das Verb „googeln“ im Duden<br />
steht?<br />
� der Absender des ersten Spam-<br />
Mails Ärger mit dem amerikanischen<br />
Verteidigungsministerium<br />
bekam?<br />
2. Die Entwicklung des Internets<br />
Was weiss ich schon?<br />
Diskutiere mit deinen Kollegen, was ihr über folgende S<strong>tic</strong>hworte<br />
schon wisst? Haltet eure Gedanken schriftlich fest.<br />
� ARPANET<br />
� Internet<br />
� WWW<br />
� E-Mail<br />
� Google<br />
Nach diesem Kapitel weiss ich…<br />
� wie sich das Internet entwickelte.<br />
� was man unter Paketvermittlung versteht.<br />
� was ein verteiltes Netzwerk ist und welche Vorteile es besitzt.<br />
� dass das Internet und WWW nicht dasselbe sind.<br />
� was die Aufgaben der Protokolle TCP und IP sind.<br />
� wann es die ersten Suchmaschinen gab.<br />
� einige Fakten über Google.<br />
Eine Entwicklung, die unser Leben veränderte…<br />
Das Internet, wie wir es heute kennen (mit Suchergebnissen in<br />
Sekundenbruchteilen, mit sozialen Netzen und Plattformen für<br />
Musikdownloads) entwickelte sich nicht von heute auf morgen.<br />
Ebenso wenig wurde es von einem einzelnen entwickelt. Nicht<br />
einmal die ARPA (eine Forschungsbehörde), die als Begründer des<br />
Internets gilt, kann die Entdeckung des Internets als ihre alleinige<br />
Erfindung beanspruchen. Vielmehr waren es unzählige Erfindungen<br />
über Jahre hin weg, die immer wieder Teilprobleme lösten.<br />
Aufgabe:<br />
Studiere die Zeitlinie auf den nächsten Seiten und bearbeite anschliessend<br />
die Seite mit der Zusammenfassung. Die Bemerkungen<br />
in der rechten Spalte dienen dir, wie immer, mit zusätzlichen Informationen<br />
und witzigem Zusatzmaterial.<br />
6
Die Entstehung des Internet<br />
1958<br />
Als Reaktion auf den russischen Satelliten Sputnik (1957) ruft das<br />
Verteidigungsministerium der USA die ARPA (Advanced Research<br />
Projects Agency) ins Leben. Das erklärte Ziel der Behörde<br />
ist, im Bereich der Technik nie mehr überraschend geschlagen zu<br />
werden.<br />
1964<br />
Paul Baran entwickelt als erster die Idee zur Paketvermittlung in<br />
einem verteilten Netz. Sie stellt ein alternatives Verfahren zur<br />
Durchschaltevermittlung dar. [1]<br />
1969<br />
Die Rechner der Universität von Kalifornien, der Universität von<br />
Kalifornien in Santa Barbara, der Universität von Utah und des<br />
Stanford Research Institute werden miteinander verbunden und<br />
bilden zusammen das ARPANET. Finanziert und geleitet wird das<br />
Projekt von der ARPA. Das Ziel ist, eine Möglichkeit für die Zusammenarbeit<br />
und den Datenaustausch der Universitäten zu schaffen.<br />
[2]<br />
1970<br />
Das ARPANET wächst praktisch jeden Monat um einen Rechner.<br />
[3]<br />
1971<br />
Das Netzwerk umfasst mittlerweile 15 Knoten, [4] wird aber weiterhin<br />
nur von einigen Wenigen genutzt. Meistens Informatiker und<br />
Studenten an Universitäten und Forschungseinrichtungen. Die<br />
breite Öffentlichkeit weiss praktisch nichts von der Existenz des<br />
Netzwerks. [5]<br />
1973<br />
Vint Cerf und Robert Kahn legen den Grundstein für das Zusammenschliessen<br />
von verschiedenen Netzwerken:<br />
Sie entwickeln die Protokolle TCP/IP [6] und das Konzept der Gateways<br />
(Netzkoppler), mit deren Hilfe Netzwerke mit unterschiedlichen<br />
Protokollen und Geschwindigkeiten miteinander kommunizieren<br />
können. Jetzt konnte mit einem Router, der als Gateway<br />
fungierte, und dem TCP/IP-Protokoll jedes beliebige Netzwerk mit<br />
einem anderen in Verbindung treten. [7] Als erster nicht amerikanischer<br />
Rechner wird ein Rechner des NORSAR (Norwegian Seismic<br />
Array) mit dem ARPANET verbunden. [8]<br />
7<br />
Oft glauben die Leute, das<br />
ARPANET wurde erstellt, um nach<br />
einem atomaren Anschlag auf die<br />
USA die Kommunikation aufrecht zu<br />
erhalten. Dies war nicht das Ziel des<br />
Netzwerkes. Vielmehr wollte man<br />
eine Möglichkeit finden die knappen<br />
Rechnerkapazitäten der Universitäten<br />
miteinander zu verbinden und so den<br />
Datenaustausch untereinander zu<br />
fördern. Natürlich wurde das Netzwerk<br />
auch auf Ausfallsicherheit und<br />
Stabilität getestet, was aber eher auf<br />
die sowieso - auch ohne nukleare<br />
Angriffe - schon sensiblen Netzwerkverbindungen<br />
zurückzuführen ist. [9]<br />
NICE TO KNOW:<br />
Die ersten Daten, die über das ARPA-<br />
NET verschickt wurden, waren 1969<br />
ein „LOG“ – ein verunglücktes „LOG-<br />
IN“. Die Universität von Kalifornien<br />
versuchte sich in den Rechner der Universität<br />
Stanford einzuwählen. [10]<br />
Aufgabe 2.1<br />
Schau auf der folgenden Seite die<br />
verschiedenen Karten an und informiere<br />
dich darüber, wie sich das AR-<br />
PANET im Laufe der Zeit verändert<br />
hat:<br />
http://som.csudh.edu/fac/lpress/<br />
history/arpamaps/<br />
Löse mit Hilfe der Karten folgende<br />
Aufgaben:<br />
1. In welchem Jahr wurde das Pentagon<br />
an das ARPANET angeschlossen?<br />
2. Warum sind gerade in Boston und<br />
um Kalifornien herum so viele<br />
Rechner ans Netzwerk angeschlossen?
Wann wurde das erste Mal gechattet?<br />
1972 fand ein Chat zwischen zwei<br />
Kommunikationsprogrammen statt, das<br />
eine lief auf einem Rechner am SRI,<br />
das andere bei BBN. PARRY spielte<br />
einen Psychotiker mit Verfolgungswahn<br />
und „Der Doktor“ imitierte einen<br />
Psychiater. Die Programme gaben dabei<br />
vorgefertigte Antworten und wenn<br />
sie etwas nicht verstanden eine neutrale<br />
Aussage zum Besten. [22]<br />
NICE TO KNOW:<br />
1978 wurde von Gary Thuerk das erste<br />
Spam-Mail verschickt. Dieser wollte so<br />
für den Computerhersteller DEC werben,<br />
bekam aber prompt Ärger mit dem<br />
Verteidigungsministerium, dem Betreiber<br />
des ARPANET. [23]<br />
Für weitere Informationen: Google<br />
selbst!<br />
NICE TO KNOW:<br />
Vielfach wird „googeln“ synonym für<br />
die Internetrecherche verwendet. 2004<br />
wurde das Verb „googeln“ sogar in den<br />
Duden aufgenommen. [24]<br />
1982<br />
Mit EUnet entsteht eines der ersten Netzwerke in Europa. Es verbindet<br />
Rechner in Grossbritannien, Holland, Dänemark und<br />
Schweden. [11]<br />
1983<br />
Ein Anschluss an das ARPANET ist teuer. So bilden die vielen<br />
amerikanischen Informatikfakultäten, die sich das nicht leisten<br />
können, ihr eigenes Netzwerk. Dank den TCP/IP-Protokolle konnten<br />
diese völlig verschiedenen Netzwerke über das ARPANET<br />
vereint werden und wachsen so mit der Zeit zu einem grossen Netz<br />
zusammen. Langsam kommt der Begriff Internet auf. [12]<br />
1988<br />
Zwischen den USA, Frankreich und England wird das erste transatlantische<br />
Glasfaserkabel verlegt. [13]<br />
1989<br />
Das ARPANET wird stillgelegt. Die Netzwerke des ARPANET<br />
werden an das NSFNET angeschlossen, welches jetzt zum zentralen<br />
Backbone des Internet wird. [14]<br />
1990<br />
Archie, die erste eigentliche Suchmaschine, mit deren Hilfe Archive<br />
durchsucht werden können, geht online. [15] Folgende Länder<br />
haben ein eigenes Netz an das NSFNET angeschlossen und somit<br />
Zugang zum Internet: Argentinien, Belgien, Brasilien, Chile,<br />
Griechenland, Indien, Irland, Österreich, die Schweiz, Spanien und<br />
Südkorea. [16]<br />
1991<br />
Das von Tim Berners-Lee am CERN entwickelte World Wide<br />
Web wird für die Öffentlichkeit zugänglich <strong>gemacht</strong>. Mit dem<br />
WWW lassen sich verschiedene Webseiten zu einem sogenannten<br />
Hypertextsystem verlinken. [17]<br />
1994<br />
Erstmals in der Geschichte des Internets gibt es mehr kommerzielle<br />
als wissenschaftliche Seiten. [18] Mit der Gründung von Amazon<br />
erfolgt ein Meilenstein im Onlinehandel. Ein Jahr später wird Ebay<br />
gegründet. Das heute grösste Internetauktionshaus macht den Online-Einkauf<br />
günstig und bequem. [19]<br />
1995<br />
Die beiden bedeutendsten Suchmaschinen der 90er-Jahre werden<br />
gegründet: Altavista [20] und Yahoo [21] . Altavistas Babel Fish war<br />
der erste Internet-Übersetzungsdienst.<br />
8
1998<br />
Netscapes Internetbrowser Netscape Navigator verliert den Browserkrieg<br />
gegen Microsofts Internet Explorer und wird eingestellt.<br />
Der Internet Explorer ist somit lange Zeit ohne ernsthafte Konkurrenz.<br />
[25] Mit Napster entsteht die erste Musiktauschbörse im Internet<br />
und darüber hinaus eine unglaublich schnell wachsende Community.<br />
[26] Völlig neuartig ist das dabei verwendete Peer-to-Peer-<br />
Verfahren (P2P). [27]<br />
2001<br />
Jimmy Wales gründet Wikipedia, eine Enzyklopädie, bei der jeder<br />
und jede zum Autor werden kann. [28]<br />
2003<br />
Der Begriff Web 2.0 wird erstmals öffentlich verwendet. Inbegriff<br />
des neuen Internet Zeitalters sind Plattformen wie Facebook,<br />
MySpace, YouTube, Wikipedia oder auch Twitter. Der Nutzer<br />
erstellt und verteilt Inhalte selber. [29]<br />
2007<br />
Weltweit werden 97 Milliarden Mails verschickt - täglich. 40 Milliarden<br />
sind Spam-Mails. [30]<br />
2009<br />
Im Jahr 2009 werden ungefähr 176 Exabyte Daten über das Internet<br />
transportiert. Dies entspricht der 424‘000-fachen Datenmenge<br />
aller Bücher der Welt. [31]<br />
2010<br />
Die Spam-Quote bei E-Mails ist auf 97% angestiegen. [32]<br />
9<br />
Google: Der Weg zum Imperium [33]<br />
1996<br />
Larry Page und Sergey Brin arbeiten<br />
an der Universität Stanford gemeinsam<br />
an einer Suchmaschine.<br />
1998<br />
Google wird als Firma eingetragen<br />
und das Suchprogramm öffentlich<br />
zugänglich.<br />
Mai 2000<br />
AdWords startet mit 350 Kunden.<br />
Juni 2000<br />
Mit einer Milliarde indizierten Seiten<br />
ist Google die grösste Suchmaschine<br />
der Welt.<br />
2006<br />
Google übernimmt für 1.65 Milliarden<br />
Dollar YouTube.<br />
2007<br />
Google ist erstmals die am meisten<br />
aufgerufene Website des Internets.<br />
2008<br />
Google hat im Internet eine Billion<br />
Seiten gefunden.<br />
2009<br />
99% der gesamten Einnahmen generiert<br />
Google aus dem Anzeigensystem<br />
AdWords. [34]<br />
2010<br />
Google ist die wertvollste Marke und<br />
hat einen weltweiten Marktanteil von<br />
85%. [35]<br />
Google ist ein Wortspiel mit dem<br />
Begriff Googol. Dieser steht für eine<br />
1 gefolgt von 100 Nullen. Die grosse<br />
Zahl versinnbildlicht das Bestreben<br />
der Firma die schier unendlich grosse<br />
Menge aller vorhandenen Informationen<br />
zu ordnen. [36]
Aufgabe 2.2<br />
Diskutiert in Gruppen was die Vorteile<br />
eines verteilten Netzes (Bild unten,<br />
rechte Graphik) gegenüber einem<br />
zentralen Netz sind! Ihr könnt euch<br />
dabei auch am Beispiel mit „dem<br />
Zügeln“ orientieren. (Weshalb ist es<br />
bei einer Fahrt von A nach B besser,<br />
wenn nicht alle Autobahnen über<br />
einen Knoten laufen?)<br />
Abbildung 1:<br />
Zentrales, dezentrales und verteiltes<br />
Knotennetz (v.l.n.r.).<br />
Aufgabe 2.3<br />
Beschreibe das Verfahren der Direktvermittlung<br />
anhand des Beispiels<br />
links mit der Paketvermittlung.<br />
„Am Anfang schuf die ARPA das<br />
ARPANET.<br />
Und das ARPANET war wüst und leer.<br />
Und es war finster in der Tiefe.<br />
Und der Geist der ARPA schwebte über<br />
dem Netzwerk, und die ARPA sprach:<br />
„Es werde ein Protokoll.“ Und es ward<br />
ein Protokoll.<br />
Und die ARPA sah, dass es gut war.<br />
Und die ARPA sagte:“Es seien mehr<br />
Protokolle.“ Und es geschah so. Und<br />
die ARPA sah, dass es gut war. Und die<br />
ARPA sagte:“Es seien mehr Netzwerke.“<br />
Und so geschah es.“ [38]<br />
Zusammenfassung<br />
Paketvermittlung<br />
Um das Prinzip der Paketvermittlung und des verteilten Netzwerkes<br />
besser zu verstehen, soll hier ein Vergleich mit einem Umzug<br />
herangezogen werden:<br />
Bei einem Umzug finden unmöglich alle Möbel in einem Auto<br />
platz. Also verteilen du und deine Freunde, die dir beim Zügeln<br />
helfen, das Mobiliar auf mehrere Fahrzeuge. Um den Überblick<br />
nicht zu verlieren, schreibt ihr die Zügelkisten an. Genauso funktioniert<br />
das Verschicken von Informationen durch ein Netzwerk:<br />
Die Information wird in kleine Stücke (Pakete) aufgeteilt, welche<br />
alle beschriftet werden. Dann fahren sie los: Zuerst geht’s von der<br />
Einfahrt auf die Quartierstrasse, danach auf die Hauptstrasse, von<br />
dort auf die Schnellstrasse und schliesslich auf die Autobahn. In<br />
einem Netzwerk gehen die Nachrichten vom PC zuerst in ein lokales<br />
Netzwerk (LAN), dann in ein MAN, von dort in ein WAN und<br />
schliesslich laufen sie über ein Backbone. Es spielt jedoch keine<br />
Rolle, welches Auto welche Route wählt oder welches wann ankommt.<br />
Entscheidend ist einzig und allein, dass alle am Zielort<br />
eintreffen. Das Auto welches als erstes losgefahren ist, kann also<br />
durchaus auch als letztes ankommen (macht nichts: Die Zügelkisten<br />
sind ja angeschrieben und müssen nicht in der richtigen Reihenfolge<br />
ankommen.). Deine Freunde, welche die Autobahn nicht<br />
kennen, benutzen dafür ein GPS und werden so automatisch zum<br />
richtigen Ort geführt. Die Datenpakete werden durch das Internet<br />
Protocol zum Zielort geführt. Am Ziel wird kurz kontrolliert, ob<br />
alle eingetroffen sind, dann geht’s ans Auspacken. Die Kisten sind<br />
angeschrieben und können so effizient in die neuen Zimmer gebracht<br />
werden. Ein grosses Büchergestell, das wegen seiner Grösse<br />
in mehreren Kisten transportiert werden musste, kann nun wieder<br />
zusammengesetzt werden. Das TCP (Transmission Control Protocol)<br />
sorgt dafür, dass die Information am Zielort wieder in der<br />
richtigen Reihenfolge zusammengesetzt wird. Zusätzlich kontrolliert<br />
es, ob auch alle Pakete angekommen sind und fragt fehlende<br />
einzeln noch einmal an.<br />
Unterscheidung Internet – WWW<br />
Das Internet und das World Wide Web sind nicht dasselbe. Das<br />
Internet ist die Hardware (die Infrastruktur, welche die verschiedenen<br />
Rechner miteinander verbindet). Das WWW hingegen ist die<br />
Software (also das Programm, das verwendet wird um Seiten, die<br />
auf den Rechnern liegen, miteinander zu einem „weltweiten Netz<br />
an Webseiten“ zu verknüpfen). Die Seiten des WWW sind durch<br />
Links miteinander verknüpft. [37]<br />
10
3. Wie funktionieren Suchmaschinen?<br />
Was weiss ich schon?<br />
Diskutiere mit deinen Kollegen, was ihr über folgende S<strong>tic</strong>hworte<br />
schon wisst? Haltet eure Gedanken schriftlich fest.<br />
� Archiv<br />
� Web-Suchmaschinen<br />
� Meta-Suchmaschine<br />
� Index<br />
Nach diesem Kapitel weiss ich…<br />
� den Unterschied zwischen einem Verzeichnisdienst und<br />
einer Suchmaschine.<br />
� wie eine Suchmaschine den Index erstellt.<br />
� was bei einer Suchanfrage passiert.<br />
� einige Kriterien, mit denen die Relevanz der Suchergebnisse<br />
bewertet wird.<br />
� was der PageRank bedeutet und was nicht.<br />
Als alles unübersichtlich wurde…<br />
Vor noch gar nicht so langer Zeit gab es keine Suchmaschinen.<br />
Jetzt wirst du dich wahrscheinlich fragen warum? Ganz einfach:<br />
Man brauchte keine. Zu klein war die Zahl der existierenden Webseiten.<br />
Doch dann, als in den Neunzigerjahren die Anzahl an Seiten<br />
im Internet immer grösser und das gesamte Netz unübersichtlich<br />
wurde, [39] musste eine Lösung auf den Tisch um schneller an<br />
Informationen zu kommen. Irgendwie musste die unüberblickbare<br />
Flut an Informationen in vernünftiger Zeit durchsucht werden können.<br />
Aufgabe:<br />
� Überlege dir, wie du ausserhalb des Internets nach Informationen<br />
suchst. Versuche dabei vor allem auf die zwei<br />
folgenden Fragen einzugehen:<br />
- Wo suchst du?<br />
- Wie findest du dich in diesen Medien zurecht?<br />
11<br />
Wusstest du, dass…<br />
� die Google-Gründer am Anfang<br />
für ihre Suchmaschine einfache<br />
Computer verwendet haben?<br />
� heute hingegen ein Google Rechenzentrum<br />
eigene Kühltürme für<br />
die Rechner hat und den Strom einer<br />
Kleinstadt verbraucht?
Suchmaschinen für…<br />
- Websites: http://www.google.ch/<br />
- Dokumente: http://docmazy.com/<br />
- Bilder:<br />
http://www.google.ch/imghp<br />
- Musik: http://www.playlist.com/<br />
- Videos: http://www.youtube.com/<br />
Aufgabe 3.1<br />
Diskutiert die Vor- und Nachteile von<br />
Katalog-Diensten im Gegensatz zu<br />
Websuchmaschinen und erstellt davon<br />
eine Tabelle. Beachtet folgende<br />
Punkte:<br />
Effektivität, Subjektivität, Aktualität,<br />
Vollständigkeit, Kosten.<br />
- Kataloge:<br />
Excite, All One Search.<br />
- Websuchmaschinen:<br />
Google, Yahoo!, Bing, Alta Vista.<br />
- Metasuchmaschine:<br />
Ixquick, Meta Crawler.<br />
- Vertikale Suchmaschine:<br />
Tucows, Medivista.<br />
Definition einer Suchmaschine:<br />
Eine Suchmaschine ist in erster Linie ein Programm das nach Informationen<br />
sucht. Diese Suche kann einerseits auf nur einem<br />
Rechner stattfinden oder sich über ein ganzes Netzwerk, wie z.B.<br />
das Internet, erstrecken. Unter dem Begriff Informationen werden<br />
Webseiten, Dokumente, Bilder, Musik- und Filmdateien zusammengefasst.<br />
Mit Suchmaschinen sucht (und findet) man also Informationen<br />
in den unüberschaubaren Tiefen des Internets.<br />
Suchmaschine ist nicht gleich Suchmaschine…<br />
Wie du sicher schon erahnen wirst, gibt es für diese verschiedenen<br />
Anforderungen auch unterschiedliche Arten von Suchmaschinen.<br />
Und wie du auch schnell sehen wirst, verdient nicht einmal jede<br />
den Namen Suchmaschine.<br />
Es gibt verschiedene Arten von Suchmaschinen…<br />
Man kann Suchmaschinen anhand von verschiedenen Kriterien<br />
unterscheiden. Ein erstes bezieht sich auf die Daten, welche das<br />
Programm sucht (Websites, Dokumente, Bilder, Musik, Videos).<br />
[40] Beispiele dazu findest du rechts (oberes blaues Textfeld).<br />
Ein weiteres Kriterium untersucht den Ursprung der Information:<br />
[41] Beispiele zu den unterschiedlichen Arten von Suchmaschinen<br />
findest du wieder rechts (im unteren blauen Textfeld).<br />
� Bei Katalogen (auch Verzeichnis genannt) tragen Menschen<br />
von Hand eine Zusammenstellung von verschiedenen<br />
Seiten nach Themen sortiert zusammen. Meist nur zu<br />
einzelnen Themenbereichen, manchmal jedoch auch themenübergreifend.<br />
[42]<br />
� Websuchmaschinen durch<strong>suchen</strong> grosse Teile des WWW<br />
nach allen möglichen Themen. Im Vergleich zu Katalogen<br />
werden hier die Seiten jedoch nicht von Hand in den Index<br />
übertragen, sondern von Programmen. Diese Pragramme<br />
(Crawler) durch<strong>suchen</strong> das Web vollautomatisch nach<br />
neuen Seiten. [43]<br />
� Metasuchmaschinen durch<strong>suchen</strong> den Index von mehreren<br />
Suchmaschinen und können so deutlich grössere Bereiche<br />
des WWW abdecken. [44]<br />
� Vertikale Websuchmaschinen indexieren nur Seiten zu einem<br />
bestimmten Thema und erfassen daher nur einen<br />
Teilbereich des WWW. [45]<br />
12
Bevor wir mit Suchmaschinen irgendetwas <strong>suchen</strong> können, muss<br />
das Suchprogramm jedoch zuerst einmal einen Index erstellen, in<br />
welchem später gesucht werden kann. Denn Suchmaschinen<br />
durch<strong>suchen</strong> nicht bei jeder einzelnen Suchanfrage das gesamte<br />
Web, sondern nur ihren Index. [46] Der Index ist vergleichbar mit<br />
dem S<strong>tic</strong>hwortverzeichnis/Index am Ende eines Buches. [47] Hier<br />
steht auf welchen Seiten die Suchbegriffe vorkommen. Um zu<br />
unter<strong>suchen</strong>, wie ein Index einer Websuchmaschine erstellt wird,<br />
wollen wir unser Augenmerk jetzt auf das bekannteste und viel<strong>leicht</strong><br />
auch wichtigste Suchprogramm richten: Google.<br />
Wie funktioniert Google?<br />
Studiere folgende Abbildung und versuche dir die Funktionsweise<br />
einer Suchmaschine mit Hilfe des Textes auf der nächsten Seite<br />
klar zu machen.<br />
Abbildung 2:<br />
Abbildung 3:<br />
Crawler<br />
Dokumente<br />
Zwischenablage<br />
Lexikon<br />
Index Suchergebnisse<br />
13
Abbildung 4:<br />
Die Rechner der Google-Gründer an<br />
der Stanford University. Auf diesen<br />
einfachen Computern lief die Suchmaschine<br />
in den Anfangszeiten.<br />
Abbildung 5:<br />
Google Rechenzentrum in Oregon<br />
(USA) in der Grösse eines Footballfeldes.<br />
Aufgabe 3.2<br />
Auf dem Pausenhof geht ein neues<br />
Gerücht um. Diskutiert in Gruppen,<br />
was Kriterien sind diesem Glauben zu<br />
schenken?<br />
Wir betrachten nun den Aufbau einer typischen Websuchmaschine<br />
am Beispiel von Google (Siehe Graphik Seite 13):<br />
Mithilfe der Crawler durchsucht Google das Web. Ein Crawler ist<br />
ein Programm, das nichts anderes macht, als bei einer beliebigen<br />
Seite zu starten und dann von da aus den Links zu folgen. Die<br />
besuchten Seiten werden vollständig heruntergeladen und in der<br />
Zwischenablage gespeichert. Die heruntergeladenen Seiten werden<br />
sortiert und auf den Rechnern nach S<strong>tic</strong>hworten abgelegt. Welches<br />
Dokument wo abgelegt wurde, steht im Index. Zusätzlich werden<br />
alle neuen Begriffe in einem Lexikon gespeichert. [48]<br />
Der Ablauf einer Suchanfrage an Google:<br />
Eine Suchanfrage wird über eine Eingabe von Keywords in die<br />
Suchmaske der Seite von google.ch (Query) an den Google Web<br />
Server gestellt. Dieser leitet die Anfrage weiter an den Index<br />
Server, der Seiten sucht, welche die Keywords enthalten. Danach<br />
reicht der Index Server die Abfrage an die Doc Servers weiter.<br />
Diese enthalten die indexierten Seiten. Aus allen Seiten, welche zu<br />
den S<strong>tic</strong>hwörtern passen, werden mit Hilfe von Bewertungskriterien<br />
die Ergebnissseiten (Snippets) zusammengestellt. Die<br />
Snippets werden an den Rechner des Benutzers geschickt. Was<br />
zurückkommt ist die Ergebnisseite, mit den einzelnen Treffern.<br />
Der ganze Prozess dauert selten länger als eine halbe Sekunde. [49]<br />
Abbildung 3<br />
14
Zusammenfassung<br />
Bewertung der Relevanz<br />
Suchmaschinen<br />
Was ist Relevanz?<br />
Es gibt mehrere Arten von Suchmaschinen, nicht nur Websuchmaschinen.<br />
Aber selbst bei diesen gibt es unzählige und nicht nur<br />
Google. Eine Liste mit verschiedenen Suchmaschinen findest du<br />
im Anhang (unter Nützliche Links). Es lohnt sich auch hier einmal<br />
etwas anderes auszuprobieren.<br />
Suchmaschinen durchforsten nicht erst bei einer Suchanfrage das<br />
gesamte Web und finden dann die richtige Seite. Vielmehr wird<br />
vorher ein Index erstellt und laufend aktualisiert, welcher dann bei<br />
einer Suchanfrage nach den passenden Seiten durchsucht wird. [60]<br />
Zur Relevanzbewertung werden unterschiedliche Kriterien herangezogen.<br />
[61] Nicht nur der PageRank, sondern auch der Abstand<br />
zwischen zwei Suchbegriffen, die Position der Suchbegriffe innerhalb<br />
des Dokuments, der Standort, von wo aus die Suchanfrage<br />
gestellt wird, das Dateiformat, die Aktualität und bei Google neuerdings<br />
auch die Ladegeschwindigkeit einer Seite. [62]<br />
Im Zusammenhang mit Suchmaschinen taucht immer wieder der<br />
Begriff Relevanz auf. Vielfach wird von relevanten Seiten gesprochen.<br />
Aber was bedeutet das überhaupt? Um relevant zu sein, muss<br />
eine Seite oder ein Dokument denjenigen Teil einer Information<br />
enthalten, der zur Aufklärung der Fragestellung dient. Im Klartext<br />
heisst das, eine Seite ist dann relevant, wenn sie die Frage, die<br />
hinter deiner Suchanfrage steckt, beantworten kann.<br />
Wie bewerten Suchmaschinen die Relevanz einer Seite?<br />
Um aus den vielen Seiten, die zum gestellten Suchbegriff passen,<br />
die relevantesten zu finden, gibt es für Suchmaschinen verschiedene<br />
Möglichkeiten, welche meistens alle miteinander angewandt<br />
werden. So kann z.B. der Abstand von zwei Suchbegriffen in einem<br />
Dokument relativ mit dem Abstand in anderen Dokumenten<br />
verglichen werden.<br />
PageRank<br />
Das Wichtigste am PageRank ist nicht die Berechnung zu kennen,<br />
sondern seine Bedeutung:<br />
[50] Da sich dieses Kriterium auf den Text einer<br />
Seite bezieht, nennt man es auch textbezogenes Relevanzkriterium.<br />
Mehr dazu in Kapitel vier. Es gibt jedoch noch unzählige weitere<br />
Kriterien zur Berechnung der Relevanz. So benutzt Google insgesamt<br />
über 200 verschiedene (meistens geheime) Kriterien. [51] Das<br />
sicher bekannteste davon ist der PageRank.<br />
Er sagt nichts<br />
Löse<br />
über<br />
nun Aufgabe<br />
die Qualität<br />
3.3<br />
einer<br />
bevor<br />
Seite<br />
du weiterliest.<br />
aus, sondern einzig und<br />
allein etwas über ihre Wichtigkeit. Dies solltest du für das Kapitel<br />
fünf im Hinterkopf behalten. Beim Erstellen von Suchstrategien<br />
gilt PageRank es dies zu beachten.<br />
Beim PageRank Verfahren wird eine Seite aufgrund von den Seiten,<br />
die auf sie verweisen, bewertet. Je mehr sogenannte Links<br />
(oder Backlinks genannt) eine Seite bekommt, desto höher ist ihr<br />
Wert. Natürlich spielt es eine nicht unwesentliche Rolle was für<br />
Seiten auf sie verweisen: Je höher der Wert der verweisenden Seite,<br />
desto grösser der Anstieg bei der anderen Seite. Der PageRank<br />
wird also vererbt. [52]<br />
Der PageRank sagt jedoch rein gar nichts über die Qualität einer<br />
Seite aus, sondern nur etwas darüber wie beliebt oder bekannt eine<br />
Seite ist. [53] So gesehen sagt der PageRank auch etwas über die<br />
Wichtigkeit einer Seite aus. Aber Achtung: Dadurch werden unbekannte<br />
Seiten benachteiligt und somit eher nicht gefunden.<br />
15<br />
Aufgabe 3.3<br />
Vergleiche den PageRank von folgenden<br />
Seiten miteinander und ziehe<br />
daraus Schlüsse über den Zusammenhang<br />
zwischen Qualität und dem von<br />
Google erstellten Ranking:<br />
� www.ethz.ch<br />
� www.ksrychenberg.ch<br />
� www.sf.tv<br />
� www.blick.ch<br />
� www.nytimes.com<br />
� www.nzz.ch<br />
� www.google.com<br />
� www.google.ch<br />
� www.yahoo.com<br />
Den PageRank jeder Seite kannst du<br />
hier herausfinden:<br />
http://www.databasesearch.com/sys/pre-check.php<br />
Gib dazu im Feld „Prüfe URL“ die<br />
Internetadresse ein, gib den auf der<br />
Seite angezeigten Code ein und klicke<br />
anschliessend auf „Prüfung starten“.<br />
Die Bewertung wird mit einer Zahl<br />
zwischen 1 und 10 ausgedrückt. Dabei<br />
bedeutet 10 hervorragend und 1<br />
schlecht.<br />
� Der PageRank sagt nichts über die<br />
Qualität einer Seite aus.<br />
� Sondern nur über die Wichtigkeit.<br />
� Unbekanntere Seiten werden durch<br />
den PageRank benachteiligt.
Aufgabe 3.4 [58]<br />
Berechne den PageRank für die Seite<br />
A. Jeder Pfeil stellt einen Link dar.<br />
Die Seiten B, C und D haben einen<br />
PageRank von 1. Der Dämpfungsfaktor<br />
wird auf 0.85 gesetzt:<br />
D<br />
Abbildung 6<br />
A<br />
NICE TO KNOW:<br />
Der PageRank hat seinen Namen nicht<br />
etwa von den Seiten, die er bewertet,<br />
sondern von seinem Erfinder Larry<br />
Page. [59]<br />
B<br />
C<br />
Die folgende Seite ist freiwillig. Sie ist entweder für etwas<br />
schnellere oder für besonders interessierte Schüler gedacht.<br />
Wenn du sie nicht bearbeiten willst, kannst du sie überspringen<br />
und direkt zur Zusammenfassung auf Seite 15 übergehen.<br />
Berechnung des PageRanks<br />
Der PageRank drückt im Grunde nichts anderes aus, als die Wahrscheinlichkeit,<br />
dass eine Seite besucht wird.<br />
Angenommen jemand der im Internet „surft“ startet willkürlich auf<br />
irgendeiner Seite und folgt dann immer den Links, so drückt der<br />
PageRank der nächsten Seite aus, wie gross die Wahrscheinlichkeit<br />
war auf dieser und nicht auf einer anderen Seite zu landen. [54] Nur<br />
rechnet man diese Wahrscheinlichkeit nicht wie in unserem Beispiel<br />
von nur einer Seite (Startseite des „Surfers“) sondern von<br />
allen Seiten, die einen Link zu dieser Seite gesetzt haben.<br />
Angenommen wir haben zwei Seiten (Seiten B und C), welche<br />
auf eine dritte Seite (Seite A) verweisen. N steht für die Anzahl<br />
der gesamten Links, welche auf der jeweiligen Seite gesetzt<br />
sind. PR ist der PageRank der Seiten. Die Folgende vereinfachte<br />
Formel besagt zur Berechnung des PageRanks also:<br />
Der PRA ist definiert durch den PageRank der darauf verweisenden<br />
Seiten dividiert durch ihre gesamte Anzahl ausgehender<br />
Links (N).<br />
d = Dämpfungsfaktor, definiert zwischen 0 und 1.<br />
Gewöhnlich auf 0.85 gesetzt. [55]<br />
N = Anzahl der ausgehenden Links. [56]<br />
Diese Berechnung ist natürlich stark vereinfacht. In Wirklichkeit<br />
setzt sich die Formel zur Berechnung des PageRanks aus über 500<br />
Millionen Variablen und zwei Milliarden Ausdrücken zusammen.<br />
[57]<br />
16
Zusammenfassung<br />
Suchmaschinen<br />
Es gibt mehrere Arten von Suchmaschinen, nicht nur Websuchmaschinen.<br />
Aber selbst bei diesen gibt es unzählige und nicht nur<br />
Google. Eine Liste mit verschiedenen Suchmaschinen findest du<br />
im Anhang (unter Nützliche Links). Es lohnt sich auch hier einmal<br />
etwas anderes auszuprobieren.<br />
Suchmaschinen durchforsten nicht erst bei einer Suchanfrage das<br />
gesamte Web und finden dann die richtige Seite. Vielmehr wird<br />
vorher ein Index erstellt und laufend aktualisiert, welcher dann bei<br />
einer Suchanfrage nach den passenden Seiten durchsucht wird. [60]<br />
Zur Relevanzbewertung werden unterschiedliche Kriterien herangezogen.<br />
[61] Nicht nur der PageRank, sondern auch der Abstand<br />
zwischen zwei Suchbegriffen, die Position der Suchbegriffe innerhalb<br />
des Dokuments, der Standort, von wo aus die Suchanfrage<br />
gestellt wird, das Dateiformat, die Aktualität und bei Google neuerdings<br />
auch die Ladegeschwindigkeit einer Seite. [62]<br />
PageRank<br />
Das Wichtigste am PageRank ist nicht die Berechnung zu kennen,<br />
sondern seine Bedeutung:<br />
Er sagt nichts über die Qualität einer Seite aus, sondern einzig und<br />
allein etwas über ihre Wichtigkeit. Dies solltest du für das Kapitel<br />
fünf im Hinterkopf behalten. Beim Erstellen von Suchstrategien<br />
gilt es dies zu beachten.<br />
17<br />
Aufgabe 3.5<br />
Suche je ein Verzeichnisdienst, eine<br />
Schweizer Websuchmaschine, eine<br />
internationale Suchmaschine (nicht<br />
Google, Yahoo! oder Bing), eine Meta-Suchmaschine<br />
und eine vertikale<br />
Suchmaschine.<br />
Aufgabe 3.6<br />
Vergleiche die Grösse des Index von<br />
Google, Ixquick und Lycos mit den<br />
Suchanfragen „Taio Cruz“ und „the“.<br />
Aufgabe 3.7<br />
Suche in den Suchmaschinen Google,<br />
Yahoo! und Ixquick nach dem Begriff<br />
„facebook“ und stelle Unterschiede<br />
bei den Top Ten-Platzierungen fest.
Wusstest du, dass…<br />
� Googles Index mehr als 25 Milliarden<br />
Seiten umfasst?<br />
� die Seltenheit, dass man bei einer<br />
Suchanfrage nur ein einziges Resultat<br />
zurück bekommt, einen eigenen<br />
Namen trägt?<br />
4. <strong>Effizient</strong>es Suchen.<br />
Was weiss ich schon?<br />
Diskutiere mit deinen Kollegen, was ihr über folgende S<strong>tic</strong>hworte<br />
schon wisst? Haltet eure Gedanken schriftlich fest.<br />
� Rangierung<br />
� Katalog vs. Suchmaschine<br />
� Wie suche ich im Internet nach Informationen?<br />
� Suchstrategie<br />
Nach diesem Kapitel weiss ich…<br />
� wie sich die Relevanzkriterien konkret auf meine Suchresultate<br />
auswirken.<br />
� wann ich einen Katalog und wann ich eine Suchmaschine<br />
verwenden soll.<br />
� zwei Suchstrategien, die bei jeder Suchanfrage effizient<br />
zum Ziel führen.<br />
� wie man mit einfachen Operatoren umgeht.<br />
� wie man die erweiterte Suche einsetzt und wie ich in kurzer<br />
Zeit komplizierte Suchanfragen formulieren kann und<br />
so schneller zur gesuchten Information komme.<br />
� dass auch das Suchen etwas Übung braucht.<br />
Die Internetrecherche schneller und besser machen…<br />
Im Internet findet man alles! Ok, zugegeben, alles ist ein bisschen<br />
übertrieben. Aber sehr, sehr vieles lässt sich im Internet finden.<br />
Deutlich mehr als du dir vorstellen kannst. Das einzige Problem<br />
dabei? Viele Leute wissen nicht, wie sie <strong>suchen</strong> müssen, um an<br />
dieser Unmenge an Informationen teilzuhaben. Wenn man nämlich<br />
wüsste wie, würde man innert kürzester Zeit genau das finden, was<br />
man wissen will. Damit du diesem Ziel zumindest etwas näher<br />
kommst, werden wir im folgenden Kapitel zwei Suchstrategien<br />
anschauen, die gepaart mit dem Wissen, wie man Anfragen richtig<br />
formuliert, in vielen Fällen zum Ziel führen.<br />
Aufgabe:<br />
� Überlege dir wie lange du im Internet suchst, wenn du etwas<br />
wissen willst? Eine Suchanfrage lang? Zehn Minuten? Oder gar<br />
bis du es gefunden hast?<br />
� Hast du bei der Internetrecherche eine feste Strategie oder<br />
suchst du einfach mal drauf los?<br />
18
Rangierungsprinzipien<br />
Um zu wissen wie man effizient sucht, müssen wir zuerst die Rangierungsprinzipien<br />
von Suchmaschinen etwas genauer unter die<br />
Lupe nehmen. Im Unterkapitel Relevanz hast du schon einiges<br />
über die Relevanzbewertung, die ein Suchprogramm durchführt,<br />
erfahren.<br />
Ein weiteres wichtiges Kriterium ist das Vorkommen von sogenannten<br />
Schlüsselwörtern im Text einer Seite. [63] Doch nicht nur<br />
dort, sondern bereits auf der Ergebnisseite sieht man in den kurzen<br />
Ausschnitten der Websites, dass die Suchbegriffe fett markiert<br />
sind. Du wirst dir die sechs wichtigsten Rangierungsprinzipien in<br />
den Aufgaben 4.1 bis 4.6 selbständig erarbeiten. In den Lösungen<br />
findest du anschliessend die korrekten Kriterien. Im obersten Textfeld<br />
siehst du jeweils die gestellte Suchanfrage mit den S<strong>tic</strong>hworten.<br />
Danach folgen zwei weitere Textfelder, mit den S<strong>tic</strong>hworten<br />
fett markiert. Du must nun entscheiden, weshalb das obere Textfeld<br />
besser zur gestellten Suchanfrage passt. Daraus formulierst du<br />
dann ein Rangierungsprinzip. Jede Aufgabe behandelt ein Rangierungsprinzip.<br />
Halte deine Ergebnisse wie immer schriftlich fest.<br />
Löse nun die Aufgaben 4.1 bis 4.6 bevor du hier weiterliest.<br />
Neben diesen sechs Kriterien die den Inhalt betreffen, gibt es auch<br />
noch solche, die vom Inhalt unabhängig sind. Das können Ranking-Verfahren,<br />
wie etwa der PageRank sein. Aber auch solche<br />
wie die Anzahl der Zugriffe auf die Seite. Seiten, welche häufiger<br />
angeklickt werden, sind auf der Ergebnisseite sicher weiter oben<br />
zu finden als andere. Somit ergibt sich ein ewiger Kreislauf, denn<br />
Seiten die auf der Ergebnisseite weiter oben angezeigt werden,<br />
werden wiederum häufiger angeklickt.<br />
19<br />
Aufgabe 4.1 [64]<br />
Eingabe:<br />
Taio Cruz Break Your Heart Lyrics<br />
1. Treffer:<br />
Original Lyrics. Break Your Heart.<br />
2. Treffer:<br />
Download Taio Cruz Pop, R&B, Hip<br />
Hop music singles.<br />
Aufgabe 4.2<br />
Eingabe:<br />
Roger Federer<br />
1. Treffer:<br />
Roger Federer hat zum 5. Mal die ATP-<br />
Finals gewonnen. Mit diesem Sieg hat<br />
Roger Federer…<br />
2. Treffer:<br />
Roger Federer ist ein Schweizer Tennisspieler.<br />
Aufgabe 4.3<br />
Eingabe:<br />
Nati WM Vorbereitung Feusisberg<br />
1. Treffer:<br />
Die Schweizer Nati hat in Feusisberg mit<br />
der Vorbereitung auf das…<br />
2. Treffer:<br />
Die Schweizer Fussball-Nati testet im<br />
Rahmen der WM-Vorbereitung gegen<br />
Uruguay.
Aufgabe 4.4<br />
Eingabe:<br />
Champions League<br />
1. Treffer:<br />
Wetten zur UEFA Champions League.<br />
2. Treffer:<br />
Perhaps one of the oddest champions in<br />
the League of Legends is the yordle<br />
known as Amumu.<br />
Aufgabe 4.5<br />
Eingabe:<br />
Usain Bolt<br />
1. Treffer:<br />
Usain Bolt (* 21. August 1986 im Trelawny<br />
Parish) ist ein jamaikanischer<br />
Sprinter.<br />
2. Treffer:<br />
Usain Bolt wird in diesem Jahr keine<br />
Rennen mehr absolvieren. Der herausragende<br />
Leichtahlet bricht seine Saison<br />
wegen Rückenbeschwerden vorzeitig ab.<br />
Der Jamaicaner hätte noch an den Meetings<br />
in Zürich und Brüssel teilnehmen<br />
sollen.<br />
Aufgabe 4.6<br />
Eingabe:<br />
Xherdan Shaqiri<br />
1. Treffer:<br />
Xherdan Shaqiri (* 10. Oktober 1991 in<br />
Gjilan) ist ein Schweizer Fussballspieler<br />
kosovarischer Herkunft.<br />
2. Treffer:<br />
Er ist einer der grössten Talente im<br />
Schweizer Fussball: Der 18-jährige FCB-<br />
Spieler Xherdan Shaqiri.<br />
Alles eine Frage der richtigen Suchstrategie<br />
Die eben neu gelernten Rangierungsprinzipien, welche bei den<br />
meisten Suchmaschinen verwendet werden, helfen uns, sich in die<br />
Funktionsweise eines Suchprogramms einzudenken und so für jede<br />
Suchanfrage die optimale Strategie zu entwickeln.<br />
Jedoch gleich vorneweg: Es gibt nicht eine richtige Suchstrategie,<br />
vielmehr erfordert jede Recherche eine etwas anders ausgelegte<br />
Suche. Wir werden uns jetzt zusammen zwei verschiedene Strategien<br />
erarbeiten, die beide zum Ziel führen. Anschliessend wirst du<br />
die wichtigsten Operatoren kennen lernen, die von Google unterstützt<br />
werden, um die Suchstrategien auch umsetzen zu können.<br />
Zum Abschluss werde ich dir noch die Erweiterte Suche vorstellen.<br />
Versuche dich jedoch nicht gleich dort, sondern arbeite dich<br />
Schritt für Schritt durch, denn das Suchen erfordert vor allem eins<br />
– Übung. Du wirst später auch die „Anfänger-Tipps“ gebrauchen.<br />
Strategie 1: Synonyme<br />
1. Überlege dir als erstes, was du genau suchst. Mach dir Notizen,<br />
was du wissen willst. Mit etwas Übung wird dir dieser Teil<br />
<strong>leicht</strong>er fallen und du kannst ihn im Kopf erledigen. Schreibe<br />
dir zu Beginn diesen Schritt präzise auf. Eine Suchmaschine<br />
kann keine Gedanken lesen, du musst also ganz genau umschreiben<br />
was du suchst. Dafür musst du dir zuerst selbst darüber<br />
im Klaren sein.<br />
2. Denke dich in das Dokument, das du finden willst, ein. Was für<br />
S<strong>tic</strong>hwörter werden darin vorkommen? Wähle den Begriff der<br />
dir am wahrscheinlichsten erscheint. Versuche jetzt dein Vorwissen<br />
zu aktivieren. Suche Synonyme zu diesem Begriff. Du<br />
brauchst, wie schon gesagt, ein paar Wörter, die charakteristisch<br />
sind für das Dokument oder die Seite die du suchst,<br />
gleichzeitig aber auf möglichst wenigen anderen Seiten vorkommen.<br />
3. Jetzt kommen die Rangierungsprinzipien ins Spiel. Beachte vor<br />
allem die Kriterien eins bis drei. Versuche möglichst viele Wörter<br />
zu finden, welche im Zieldokument vorkommen könnten.<br />
Achte darauf, dass sie im Text häufig vertreten sind und versuche<br />
sehr spezifische, nicht allgemein verwendete zu finden, die<br />
auf anderen Seiten sehr wahrscheinlich nicht vorhanden sind.<br />
4. Jetzt erst gibst du deine Suchbegriffe in die Suchmaske von<br />
Google ein. Die Reihenfolge der Wörter ist egal.<br />
5. Überfliege die Suchresultate (Titel, Zusammenfassung, Internetadresse).<br />
20
6. Ist keines dabei, das dir die relevanten Informationen liefert, so<br />
gehe zurück zu Schritt 2.<br />
Suchstrategie 2: Verfeinern<br />
1. Als erstes machst du dir wieder darüber Gedanken, was du genau<br />
wissen willst. Notiere es wieder auf einem Blatt Papier.<br />
2. Überlege dir ein S<strong>tic</strong>hwort, welches möglichst charakteristisch<br />
ist für die Seite die du suchst.<br />
3. Dann geht’s schon ab ins Netz. Gib den Suchbegriff in die<br />
Suchmaske der Suchmaschine ein.<br />
4. Überfliege wieder die Suchresultate (Titel, Textausschnitt, Internetadresse).<br />
5. Wenn du mit dem Ergebnis nicht zu<strong>fri</strong>eden bist, was sehr wahrscheinlich<br />
ist, versuchst du ein S<strong>tic</strong>hwort hinzuzufügen. So dass<br />
deine Suche eingeschränkt wird. Das siehst du ja anhand der<br />
Anzahl der Treffer, die das Suchprogramm anzeigt. Wie genau<br />
man Suchbegriffe hinzufügt, wird im Abschnitt Einfache Operatoren<br />
erklärt.<br />
6. Verfeinere deine Anfrage solange, bis du zur gewünschten Information<br />
kommst.<br />
Du fragst dich wahrscheinlich, warum du bei dieser Methode nicht<br />
gleich von Anfang an mit mehreren Suchbegriffen arbeiten kannst.<br />
Das wirst du mit der Zeit können. Für den Beginn ist es jedoch<br />
ganz gut, wenn du siehst, wie die Suchmaschine auf veränderte<br />
Suchanfragen reagiert.<br />
Merke:<br />
Du siehst, man kann beide Suchtechniken verwenden, um ans Ziel<br />
zu kommen. Es ist auch etwas eine „Geschmackssache“, welche du<br />
lieber verwendest. Du kannst natürlich auch deine eigene Suchstrategie<br />
entwickeln.<br />
Im nächsten Unterkapitel werden wir die Operatoren behandeln.<br />
Mit der Hilfe von Operatoren können wir noch genauere Abfragen<br />
formulieren.<br />
21<br />
Aufgabe 4.7<br />
Im Jahresbericht der KS Rychenberg<br />
sind Klassenlisten aufgeführt. Suche<br />
die Liste deiner Klasse (über die<br />
Suchmaske in Google und nicht über<br />
die Homepage der Schule).<br />
TIPP:<br />
Wenn du in einem Themengebiet<br />
suchst, über welches du kein eigenes<br />
Vorwissen besitzt, so kann Wikipedia<br />
eine gute Hilfestellung leisten. Gib<br />
einfach das Haupts<strong>tic</strong>hwort (siehe<br />
Schritt 2) in Wikipedia ein und überfliege<br />
die Seite nach weiteren Schlüsselwörtern.<br />
Aufgabe 4.8:<br />
Suche mit Hilfe von Suchstrategie 2<br />
eine Seite die Kino- und Fernsehprogramme<br />
aus der Schweiz publiziert.<br />
TIPP:<br />
Es ist sehr wahrscheinlich – vor allem<br />
am Anfang, dass du mehrere Suchanfragen<br />
starten musst um zum Ziel zu<br />
kommen. Habe also etwas Geduld und<br />
nimm dir die nötige Zeit.<br />
Aufgabe 4.9<br />
Katalog oder Suchmaschine?<br />
1. Petrologie<br />
2. Schauspieler, der in der Fernsehserie<br />
„Two and a Half Men“ den<br />
Jungen „Jake“ spielt.<br />
3. Du möchtest dich über alle<br />
Schweizer Universitäten erkundigen.<br />
4. Liste aller Schweizer Olympiasieger
Aufgabe 4.10<br />
Suche mit Hilfe der Operatoren nach<br />
Ballsportarten, nicht aber nach Fussball.<br />
Klein schreiben<br />
Du kannst die S<strong>tic</strong>hwörter in der<br />
Google-Suche alle klein schreiben.<br />
Grossgeschriebene Wörter werden automatisch<br />
als klein interpretiert.<br />
Aufgabe 4.11<br />
Suche einen Preisvergleichsbericht<br />
über die Produkte aus der Migros und<br />
dem Coop.<br />
Aufgabe 4.12<br />
Welches der sechs Rangierungsprinzipien<br />
könnte man missbrauchen,<br />
so dass eine Suchmaschine eine Website<br />
als relevanter einstuft?<br />
Aufgabe 4.13<br />
Suche das weltberühmte Foto, auf<br />
dem Bauarbeiter auf einem Stahlträger<br />
des Rockefeller Centers Mittagspause<br />
machen.<br />
Abbildung 8:<br />
Bauarbeiter auf Stahlträger.<br />
Einfache Operatoren [65]<br />
Logische Operatoren sind eigentlich nichts anderes, als „mathematische<br />
Rechenarten“. Sie werden auch Boolsche Operatoren genannt,<br />
nach George Boole. [66] Sie verknüpfen die verschiedenen<br />
Suchbegriffe miteinander. Die gängigsten Google-Operatoren sind:<br />
� AND (kann in Google durch Leerschlag ersetzt werden.)<br />
Der Operator AND verbindet zwei Suchbegriffe miteinander.<br />
So wird ein Dokument gesucht, in welchem die beiden Begriffe<br />
vorkommen.<br />
� NOT<br />
Der Operator NOT (bei Google geht auch einfach ein Minuszeichen)<br />
schliesst einen Begriff aus. So wird nach dem ersten<br />
Begriff gesucht, nicht aber nach dem Begriff, der nach dem<br />
Operator steht.<br />
� OR<br />
Mit dem Operator OR wird entweder nach dem einen, oder<br />
nach dem anderen Begriff gesucht.<br />
Erweiterte Suche [67]<br />
Abbildung 7<br />
Mit der erweiterten Google-Suche können wir gezielter und<br />
schneller Suchen. Die erweiterte Suche findest du unter:<br />
http://www.google.ch/advanced_search?hl=de.<br />
Auf der nächsten Seite erfährst du im Detail was dir für verschiedene<br />
Möglichkeiten zur Verfügung stehen mit der erweiterten Suche.<br />
Wir wollen uns im Folgenden auf die nützlichsten Möglichkeiten<br />
beschränken: Die Suche nach Sprache, Region, Dateiformat,<br />
Datum, Position, Domains.<br />
22
All diese Optionen kannst du miteinander mischen. Du musst dafür<br />
im hellblau gefärbten Bereich der Googlesuche als erstes die<br />
Suchbegriffe eingeben. Diese funktionieren genau gleich wie die<br />
einfachen Operatoren:<br />
� mit allen Wörtern: Funktioniert genau gleich wie die Suche<br />
mit AND. Liefert Treffer mit allen S<strong>tic</strong>hwörtern. Bsp.: „Fussball,<br />
Ballsportarten“. So zeigt Google Seiten an, welche die<br />
S<strong>tic</strong>hworte Fussball und Ballsportarten enthalten.<br />
� mit der genauen Wortgruppe: Sucht nach den S<strong>tic</strong>hworten in<br />
der genauen Reihenfolge. Bsp.: „Übung macht den Meister“.<br />
Diese Anfrage liefert Treffer, welche diese Wörter in derselben<br />
Reihenfolge beinhalten. Alternativ kann die Wortgruppe auch<br />
in der normalen Suchmaske mit Anführungs- und Schlusszeichen<br />
gesetzt werden.<br />
� mit irgendeinem der Wörter: Liefert entweder den einen oder<br />
den anderen Suchbegriff. Bsp.: „Fussball, Ballsportarten“ liefert<br />
Seiten, welche entweder mit Fussball oder mit Ballsportarten<br />
zu tun haben. Funktioniert genau gleich wie „OR“.<br />
� ohne die Wörter: Liefert Suchergebnisse ohne die erwähnten<br />
Wörter. Bsp.: „Fussball“ liefert Seiten auf denen Fussball nicht<br />
vorkommt. Funktioniert genau wie „NOT“. Achtung: Geht nur<br />
wenn du in einem der oberen drei Felder etwas eingibst.<br />
Jetzt hast du die Suchbegriffe eingegeben, nach denen du <strong>suchen</strong><br />
möchtest. Nun kannst du deine Suchergebnisse mit den folgenden<br />
Möglichkeiten einschränken:<br />
� Sprache: Hier kannst du deine Treffer auf eine Sprache beschränken.<br />
Zum Beispiel auf Deutsch.<br />
� Region: Hier kannst du deine Suchergebnisse auf ein Land beschränken.<br />
Zum Beispiel nur Schweizer Treffer.<br />
� Dateiformat: Um nach einem gewissen Format zu <strong>suchen</strong>. Zum<br />
Beispiel nur nach Word-Dokumenten: Einfach „Microsoft<br />
Word (.doc)“ auswählen.<br />
� Datum: Wenn du nach Seiten suchst, die z.B. im letzten Monat<br />
in den Index aufgenommen wurden, einfach „im letzten Monat“<br />
auswählen.<br />
� Position: Mit dieser Funktion kannst du den Ort auf der Seite<br />
bestimmen, an dem dein Suchbegriff gefunden werden sollte.<br />
Z.B. in der Internetadresse. Dafür einfach „in der URL der Seite“<br />
wählen.<br />
� Domains: Hier kannst du z.B. nach Seiten <strong>suchen</strong>, welche die<br />
Domain „.com“ haben. Einfach „.com“ eingeben.<br />
23<br />
Googlewhack [68]<br />
Einen Googlewhack schafft man wohl<br />
sehr selten. Wenn nach der Eingabe<br />
eines oder zweier Wörter (ohne Anführungszeichen!)<br />
als Suchergebnis nur ein<br />
einziger Treffer zurück kommt, spricht<br />
man von einem Googlewhack. Jemanden,<br />
der nach solchen Google-whacks<br />
Ausschau hält, nennt man Googlewhacker.<br />
Eine Auflistung aktueller<br />
Googlwhacks findet man unter folgendem<br />
Link:<br />
http://www.googlewhack.com/tally.pl<br />
Aufgabe 4.14<br />
Wie findest du heraus wer beim 3:3<br />
zwischen dem FC Liverpool und der<br />
AC Milan im Champions League<br />
Final 2005 das 3:2 schoss?<br />
Google ignoriert dich<br />
Deine Google-Suchanfrage darf übrigens<br />
höchstens 32 S<strong>tic</strong>hwörter beinhalten.<br />
Alles was darüber geht wird von<br />
Google nicht beachtet.<br />
Aufgabe 4.15<br />
Suche alle PDF Dokumente, die<br />
Google in den letzten 24 Stunden<br />
indiziert hat.<br />
Indexgrösse<br />
Auch wenn Google zur tatsächlichen<br />
Grösse seines Indexes schweigt, so<br />
kann man doch erahnen in welchen<br />
Dimensionen sich dieser bewegt. Die<br />
Suche nach „the*“ liefert fast 25.5 Milliarden<br />
Treffer. Das Sternchen steht<br />
dabei für ein beliebiges anderes S<strong>tic</strong>hwort.
„Mancher suchet, um zu finden; und<br />
mancher findet, um nicht weiter <strong>suchen</strong><br />
zu müssen“ [69]<br />
Aufgabe 4.16<br />
Finde einen Plan mit den verschiedenen<br />
Buslinien von Winterthur.<br />
Aufgabe 4.17<br />
Wo suchst du um alle Verfilmungen<br />
von „Wall Street“ zu finden?<br />
Zusammenfassung<br />
Rangierungsprinzipien<br />
Es gibt unzählige Rangierungsprinzipien, die von Suchmaschinen<br />
verwendet werden. Teilweise sind diese auch von Suchmaschine<br />
zu Suchmaschine etwas anders. Vor allem die textunabhängigen<br />
Kriterien (z.B.: wie oft eine Seite angeklickt wird) sind für uns<br />
meist unsichtbar. Diejenigen, die jedoch vom Text abhängig sind,<br />
sind für uns direkt wahrnehmbar und auch umso wichtiger für<br />
unsere Suchstrategie. Deshalb beachten wir bei jeder Suchanfrage,<br />
die wir stellen die oben gelernten Rangierungsprinzipien.<br />
Suchstrategien<br />
Es gibt unzählige Suchstrategien und nicht falsche oder richtige.<br />
Wähle deine Strategie der Situation angepasst und nach deinen<br />
Vorlieben.<br />
Katalog versus Suchmaschine<br />
Suchmaschinen – allen voran Google – stellen mittlerweile ein<br />
sehr mächtiges und auch effizientes Suchinstrument dar. Deshalb<br />
ist es vernünftig, in den meisten Fällen auch auf sie zurückzugreifen.<br />
In einigen wenigen Fällen jedoch ist es besser, wenn man einen<br />
Katalog bemüht. Vor allem, wenn man einen Überblick über<br />
den Inhalt eines Gebietes gewinnen möchte.<br />
Einfache Operatoren<br />
Mit den einfachen Operatoren (-, +) können wir unsere Suchanfragen<br />
differenzierter gestalten.<br />
Erweiterte Suche<br />
Mit den erweiterten Suchoptionen eröffnen sich uns ganz neue<br />
Suchmöglichkeiten. Mit der Profisuche schöpfen wir das riesige<br />
Potential, das in Google steckt, noch einen Schritt besser aus, als<br />
mit den einfachen Operatoren. Die Suchmaske der erweiterten<br />
Suche ist ausserdem sehr einfach zu bedienen.<br />
24
5. Gefahren im Umgang mit Google.<br />
Was weiss ich schon?<br />
Diskutiere mit deinen Kollegen, was ihr über folgende S<strong>tic</strong>hworte<br />
schon wisst? Haltet eure Gedanken schriftlich fest.<br />
� Cookies, IP-Adresse<br />
� Umgang mit persönlichen Daten, Persönlichkeitsprofile<br />
� Google Street View<br />
� sichere Browser-Einstellungen<br />
� Meinungsfreiheit<br />
� Zensur im Internet<br />
� Was für verschiedene Suchmaschinen kennst du?<br />
Nach diesem Kapitel weiss ich…<br />
� wie und warum Google Daten über seine Benutzer sammelt.<br />
� wie ich mich davor schützen kann.<br />
� wie ein Cookie funktioniert.<br />
� welche Möglichkeiten es gibt im Web anonym zu bleiben.<br />
� wo und warum im Internet zensiert wird.<br />
� was die Gefahren der Monopolstellung von Google sind.<br />
Google kennt dich besser als du denkst…<br />
Google sammelt Daten – schon seit Jahren. Und erstellt damit Nutzerprofile<br />
um die Suchergebnisse zu verbessern. Gefährlich wird<br />
dies vor allem, wenn die Daten der verschiedenen Dienste verbunden<br />
würden. Denn dann hätte Google keine Nutzerprofile mehr,<br />
sondern Persönlichkeitsprofile von Millionen von Menschen. So<br />
oder so, Google hat so viele Informationen angehäuft wie niemand<br />
zuvor.<br />
Aufgabe:<br />
Überlege dir wie du dich schützt, wenn du im Internet unterwegs<br />
bist und bearbeite anschliessend das Kapitel.<br />
25<br />
Wusstest du, dass…<br />
� Google all deine Suchanfragen<br />
speichert?<br />
� Suchergebnisse auch in der<br />
Schweiz zensiert werden?
„Die perfekte Suchmaschine würde<br />
genau erkennen, was der Nutzer meint<br />
und genau die gewünschten Ergebnisse<br />
anzeigen.“ [70]<br />
Larry Page, Mitbegründer von Google.<br />
Unter dem folgenden Link kannst du<br />
deine Facebook-<br />
Sicherheitseinstellungen testen:<br />
http://www.reclaimprivacy.org/<br />
Abbildung 9: Ein „Choco-Cookie“<br />
Datenschutz<br />
Personalisierte Suche<br />
Wie du in Kapitel zwei gesehen hast, ist es Googles Vision einerseits<br />
alle verfügbaren Informationen dieser Welt zusammenzutragen<br />
und zu organisieren, andererseits haben die Google-Gründer<br />
den Anspruch ihre Suchmaschine so weit zu perfektionieren, dass<br />
sie alle Fragen beantworten kann. [71] Das Ziel, so Googles Vision,<br />
soll ein Instrument sein, das nicht nur für die Beantwortung einfacher<br />
Fragen wie die nach den aktuellen Zugverbindungen, sondern<br />
auch auf Fragen wie: „Welches Auto soll ich kaufen?“ irgendwann<br />
einmal eine Antwort bereit halten soll. Nicht nächstes Jahr, sehr<br />
wahrscheinlich auch nicht in nächster, aber viel<strong>leicht</strong> in ferner<br />
Zukunft. Was eine Suchmaschine für eine sogenannte personalisierte<br />
Suche benötigt, sind Informationen. Informationen über den<br />
Benutzer. Und zwar nicht einmal eine Menge davon. Um obige<br />
Suchanfrage zu beantworten, müsste eine Suchmaschine nur einige<br />
Vorlieben des Benutzers kennen: Sportwagen oder Geländewagen.<br />
Seine Lieblingsfarbe, Lieblingsmarke. Diese drei einfachen Informationen<br />
reichen vollständig aus, um dem Benutzer Werbung mit<br />
perfekt auf seine Wünsche zugeschnittenen Angeboten vorzuschlagen.<br />
Was ein Autohersteller, der den perfekten Wagen für den<br />
oben erwähnten Benutzer hat, für diese drei einfachen Informationen<br />
zahlen würde – unvorstellbar.<br />
Googles Datenerhebung<br />
Personalisierte Suche ist schon längst Realität. Nicht im grossen<br />
Stil, wie oben beschrieben, aber (bisher) im Kleinen. Was für<br />
Suchresultate angezeigt werden, ist schon jetzt von Person zu Person<br />
unterschiedlich. Ein spezielles Cookie (für Erklärung siehe S.<br />
27) mit einer Lebensdauer von 180 Tagen speichert alle Seiten die<br />
du anklickst, alle S<strong>tic</strong>hwörter die du in Google eingibst und wann<br />
du das tust. Darauf basierend sehen die Suchergebnisse bei jedem,<br />
ganz auf seine Vorlieben abgestützt, wieder etwas anders aus. [72]<br />
Aber nebst diesem Cookie sammelt Google noch viel mehr: Zusätzlich<br />
zu den gespeicherten Daten für die personalisierte Suche,<br />
speichert der Suchriese Suchanfragen für 18 Monate inklusive IP-<br />
Adresse, Google-Domain, Zeitpunkt der Suchabfrage, S<strong>tic</strong>hwörter<br />
der Suche und Informationen über den Browser. Da ist es auch ein<br />
schwacher Trost, dass die Lebensdauer der Cookies auf 18 Monate<br />
heruntergesetzt wurde. Zuvor setzte Google Cookies, die bis ins<br />
Jahr 2038 lebten. Denn bei jeder erneuten Suchanfrage beginnen<br />
die 18 Monate von neuem. Wer bei einem Google-Dienst<br />
26
angemeldet ist, der kann über Google Web History all seine Suchanfragen,<br />
die jemals gestellt worden waren, nachschlagen. Diese<br />
Daten hat somit auch Google. Wer ein GMail Konto besitzt liefert<br />
dem Unternehmen zu seinen Daten den Namen. Beim E-Mail<br />
Dienst werden alle Nachrichten mitgelesen. Google scannt die<br />
Nachrichten mit einer Analyse-Software auf S<strong>tic</strong>hwörter um in den<br />
Mails Werbung platzieren zu können. Passend zum Inhalt. Wenn<br />
du in einer Nachricht einem Freund von deinen geplanten Ferien<br />
erzählst, ist die Wahrscheinlichkeit hoch, dass darin Werbung von<br />
einem Reisebüro platziert wird. Besonders gefährlich werden diese<br />
Daten, wenn sie miteinander verbunden würden. So liessen sich<br />
ganze Persönlichkeitsprofile erstellen.<br />
Schutzmassnahmen<br />
Du bist der Sammelwut des kalifornischen Suchgiganten aber nicht<br />
schutzlos ausgeliefert. Es gibt durchaus ein paar Sicherheitsvorkehrungen,<br />
die du treffen kannst, um im Internet Fremden nicht<br />
alles preiszugeben und nicht auf Googles hervorragende Suchmaschine<br />
verzichten zu müssen.<br />
� Als erstes solltest du die Cookies in den Griff bekommen. Cookies<br />
sind nichts anderes als Informationen in Form von Textdateien,<br />
die von bestimmten Webseiten erstellt werden, um Informationen,<br />
wie persönliche Einstellungen auf der entsprechenden<br />
Webseite zu protokollieren. Diese werden dann auf<br />
dem Browser abgelegt. Das nächste Mal, wenn die Seite aufgerufen<br />
wird, kann das Cookies die Informationen an den Server<br />
des Webseitenbetreibers übergeben. Bei einem erneuten Abrufen<br />
der Webseite, kann das Cookie zudem den Besucher identifizieren.<br />
Dadurch kann man sich zum Beispiel automatisch auf<br />
einer Seite anmelden. Dies kann unter Umständen sehr nützlich<br />
sein. So kann man heutzutage eine Vielzahl an Webseiten nur<br />
noch be<strong>suchen</strong>, wenn man in den Browsereinstellungen Cookies<br />
akzeptiert. So praktisch sie auch sein können, teilweise<br />
stellen sie auch eine Gefahr dar. Vor allem mit langlebigen<br />
Cookies kann der Serverbetreiber der Webseite von den Benutzern<br />
ein Nutzerprofil erstellen, die ihm seine Surfgewohnheiten<br />
verraten. Denn beim auswerten der „Kekse“ sieht man was für<br />
Seiten abgefragt worden sind. Auch die E-Mail-Adresse ist, auf<br />
der Webseite einmal eingetragen, im Cookie gespeichert. Dies<br />
kann der Betreiber der Webseite zusammen mit seinem Wissen<br />
über die Vorlieben des Benutzers ausnutzen und gezielte Spam-<br />
Mails an ihn verschicken. [73]<br />
27<br />
Die Cookies, die von Webseiten gesetzt<br />
wurden, kannst du in der Regel<br />
auch wieder löschen. Dies kannst du<br />
in deinem Webbrowser tun. Und zwar<br />
unter Tools, Options, Privacy, Cookies.<br />
Klicke auf „Show Cookies“.<br />
Jetzt werden alle Cookies angezeigt,<br />
die auf deinen Browser angesetzt<br />
worden sind. Um sie zu löschen,<br />
kannst du einfach „Remove all Cookies“<br />
drücken. Wenn du nach einer<br />
Weile wieder nachschaust, siehst du,<br />
wie schnell welche gesetzt werden.<br />
Unter den Sicherheitseinstellungen<br />
deines Browsers kannst du einstellen,<br />
wie strikt du mit Cookies umgehen<br />
möchtest. Aber Achtung, wenn du sie<br />
ganz aussperrst, können gewisse<br />
Webseiten nicht angezeigt werden. Es<br />
gilt also einen Kompromiss zu finden<br />
zwischen Sicherheit und Bequemlichkeit.<br />
Aufgabe 5.1<br />
Versuche dich daran zu erinnern, was<br />
du gestern gegoogelt hast? In der<br />
letzten Woche? Im letzten Monat? Im<br />
letzten Jahr? Die letzten 18 Monate?<br />
Wenn du jetzt eine Liste machst mit<br />
all diesen S<strong>tic</strong>hwörtern, weisst du was<br />
Google über dich weiss!<br />
Natürlich kann Google damit keinen<br />
Namen, sondern nur eine Nummer in<br />
Verbindung bringen – sofern du kein<br />
GMail-Konto hast.
Schau auf der folgenden Seite mit und<br />
ohne Proxy nach, was für Informationen<br />
du im Web preisgibst:<br />
http://www.whatsmyip.de/<br />
Hier findest du eine Seite mit einigen<br />
Proxy-Servern:<br />
http://www.onionproxy.com/<br />
Auch in der Schweiz wurde und wird<br />
teilweise politisch motivierte Zensur<br />
betrieben. So wurde die Seite<br />
www.appel-au-peuple.org mit einem<br />
richterlichen Beschluss wegen ehrverletzenden<br />
Verschwörungstheorien<br />
über die Schweizer Justiz gesperrt.<br />
Mit einem ausländischen Proxy-<br />
Server kann jedoch weiterhin darauf<br />
zugegriffen werden. [78]<br />
Mit dem China Channel Firefox Addon<br />
kann man die chinesische Zensur<br />
nachempfinden.<br />
http://chinachannel.hk/<br />
Aufgabe 5.2:<br />
Erkundige dich nach Alternativen zu<br />
Google und probiere sie aus. Im Anhang<br />
steht eine Liste mit unzähligen<br />
anderen Suchprogrammen.<br />
� Google kriegt neben deinen Suchbegriffen auch noch deine IP-<br />
Adresse. Dadurch kann er deine Aktivitäten im Netz dir zuordnen.<br />
Aber auch dagegen kann etwas getan werden. Mit sogenannten<br />
Proxy-Servern. Wenn du mit einem Proxy-Server im<br />
Web unterwegs bist, bleibt deine eigene IP-Adresse geheim. Du<br />
„surfst“ dann sozusagen mit derjenigen des Proxy-Servers. [74]<br />
� Benutze, wenn du nicht anonym im Netz bist, Google (und<br />
auch andere Suchmaschinenanbieter) mit Bedacht. Suchmaschinen<br />
sind, auch wenn sie auf den ersten Blick anonym wirken,<br />
kein Ort an dem man vertrauenswürdige Sachen deponieren<br />
sollte. Gib nicht alles in eine Suchmaschine ein. Eigentlich<br />
solltest du nichts in Google eingeben, was du nicht auch einem<br />
Fremden erzählen würdest.<br />
Zensur<br />
Zensiert wird im Internet nicht nur in Staaten wie China, Burma,<br />
Iran, Saudi-Arabien, Syrien, Kuba, Ägypten, Nord Korea oder dem<br />
Vietnam. [75] Nein, auch in Europa wird zensiert. Zugegeben nicht<br />
in demselben Mass wie in diesen teilweise totalitären Staaten und<br />
auch nicht aus demselben Grund, aber es wird zensiert. Während<br />
in China oder anderswo aus politischen Gründen zensiert wird, so<br />
werden in der westlichen Welt Seiten mit pornographischem Inhalt,<br />
Seiten der Kinderpornographie oder rechtsradikale, neosozialistische<br />
Seiten zensiert. [76] Sogar die Schweizer Regierung stellt<br />
immer wieder Anfragen gewisse Inhalte entfernen zu lassen. Sie<br />
fordert aber auch immer wieder die Herausgabe von sensiblen<br />
personenbezogenen Daten. [77] In China wird alles zensiert, was der<br />
Regierung nicht genehm ist. Begriffe wie „Free Tibet“ oder „Tian’anmen<br />
Massacre“ werden in China von einer Firewall der Zensurbehörde<br />
systematisch geblockt. Du fragst dich jetzt sicher, was<br />
das ganze mit Suchmaschinen zu tun haben soll. Eine ganze Menge.<br />
Denn in einer Zeit, in der fast in allen Staaten dieser Welt die<br />
Suchergebnisse „geschönt“ werden, wird der Druck auf die Suchmaschinen,<br />
allen voran auf Google, immer grösser. Sie werden von<br />
den Regierungen teilweise gezwungen Seiten aus dem Index zu<br />
löschen oder Daten herauszugeben. Suchergebnisse sind also auch<br />
beeinflussbar.<br />
Monopolstellung?<br />
Benutze auch einmal eine andere Suchmaschine als Google. Es<br />
gibt unzählige Alternativen. So kannst du etwas vergleichen. Wenn<br />
du danach zum Schluss kommst, Google ist doch die Beste, kannst<br />
du ja immer noch zurückwechseln. Wie sagt man so schön: Abwechslung<br />
macht das Leben süss.<br />
28
Zusammenfassung<br />
Datenschutz<br />
Google sammelt Daten, Daten und nochmal Daten. Doch dagegen<br />
kann (und soll) man sich schützen.<br />
Dazu gibt es unterschiedliche Methoden, die natürlich auch kombiniert<br />
angewandt werden können:<br />
� Alte Cookies löschen und die Einstellungen des Internetbrowsers<br />
optimieren.<br />
� Sich anonym im Netz bewegen. Entweder durch ein Proxy-Server<br />
oder durch einen Anonymizer.<br />
� Sich überlegen, was man in die Google Suchmaske eintippt.<br />
Denn: Die Google Datenbanken vergessen niemals!<br />
Zensur<br />
In China und anderen totalitären Ländern wird Zensur betrieben.<br />
Gegen alle politischen Feinde. Aber auch in den USA und Europa<br />
wird zensiert. Vorrangig Kinderpornographie, andere pornographische<br />
Inhalte, rechtsradikale und andere „populistisch gefährliche“<br />
Seiten. Aber nicht nur. Auch hier werden manchmal Seiten aus den<br />
Suchergebnissen gelöscht, die politisch „nicht korrekt“ sind. Aber<br />
Zensur kann, sofern man von der Seite schon die Internet-Adresse<br />
kennt, umgangen werden. Mit einem Proxy-Server. Der muss<br />
jedoch (in den meisten Fällen) eine ausländische Domain haben,<br />
da Internetprovider – auf Druck von Regierungen – Seiten meistens<br />
für eine gewisse Domain sperren (z.B. für alle Computer mit<br />
einer Schweizer IP-Adresse).<br />
Monopolstellung Google<br />
Über Google laufen vier von fünf Suchanfragen – weltweit! [79] Das<br />
bedeutet, dass Google für jeden zweiten Menschen mit einem Internetanschluss<br />
die Informationen organisiert. [80] Vorderhand machen<br />
so viele Menschen Gebrauch von Google, weil die Suchmaschine<br />
den mit Abstand grössten Index hat, am schnellsten ist, die<br />
relevantesten Suchergebnisse liefert, die Startseite und das Layout<br />
allgemein schlicht und einfach ist und Google cool, hip und beliebt<br />
ist. Vielfach kennen die Benutzer jedoch auch gar keine andere<br />
Suchmaschine. Google wurde zum Inbegriff des Suchens. Zurück<br />
zum Thema: Wenn eine Firma den Informationsfluss von beinahe<br />
einer Milliarde Menschen regelt, ist Vorsicht geboten. Denn für die<br />
meisten ist Google die einzige Informationsquelle.<br />
29<br />
Abbildung 10: Googeln in China.<br />
Abbildung 11
Anhang A:<br />
a. Glossar:<br />
A:<br />
AdWords<br />
AdWords ist Googles Anzeigensystem mit dem es sein Geld verdient.<br />
Mit Adwords kann man zu gewissen S<strong>tic</strong>hwörtern Anzeigeplätze<br />
ersteigern, an denen dann die eigene Werbung steht. Die<br />
Werbung ist immer von den Suchergebnissen getrennt in der rechten<br />
Spalte platziert.<br />
Archiv<br />
Ein Archiv ist eine Art Katalogdienst, auf den online zugegriffen<br />
werden kann.<br />
B:<br />
Backbone<br />
Das Backbone ist die Autobahn des Internetverkehrs. Ein Backbone<br />
kann mit einem riesigen Kabel verglichen werden, durch das die<br />
ganzen Daten laufen.<br />
Bit<br />
Ein Bit ist eine Grösse aus der elektronischen Datenspeicherung.<br />
Daten speichert man durch zwei verschiedene Zustände. Entweder<br />
fliesst Strom oder es fliesst kein Strom durch die Schalter der<br />
Harddisk (Hauptspeicher). Diese beiden Zustände werden mathematisch<br />
durch eine 1 oder eine 0 dargestellt. Die Information ob<br />
Strom fliesst oder nicht nennt man ein Bit. Acht Bits ergeben ein<br />
Byte. Um bei grossen Datenmengen besser rechnen zu können, hat<br />
man Bytes weiter zusammengefasst: 1024 Bytes sind ein Kilobyte<br />
(KB), 1024 KB sind ein Megabyte (MB), 1024 MB sind ein Gigabyte<br />
(GB), 1024 GB sind ein Terabyte (TB), 1024 TB sind ein<br />
Petabyte (PB) und 1024 PB sind ein Exabyte (EB).<br />
Browser<br />
Ein Browser ist ein Programm für die Darstellung von Webseiten.<br />
Mit ihm navigiert man durch das Web. Beispiele sind: Internet<br />
Explorer, Firefox, Opera oder Safari.<br />
D:<br />
Domain<br />
Als Domain wird ein im Web zusammenhängender Teil bezeichnet.<br />
Anhand der Top-Level-Domain sieht man in welchem Land<br />
der Rechner steht.<br />
30
Durchschaltevermittlung<br />
Die Durchschaltevermittlung ist eine Möglichkeit, wie man die<br />
Daten über ein Netzwerk vermitteln kann. Bei der Durchschaltevermittlung<br />
wird immer eine Leitung für die Datenvermittlung<br />
oder ein Telefongespräch (die Durchschaltevermittlung kommt aus<br />
der Telekommunikation) freigeschaltet. Dabei kann die Leitung<br />
jeweils nur für einen Datentransfer auf einmal genutzt werden.<br />
Dies änderte sich mit der Paketvermittlung. Bei der die Nachrichten<br />
in kleine Pakete aufgeteilt werden und unabhängig zu welchem<br />
Gespräch sie gehören durch die Leitung gehen und am Zielort<br />
wieder zusammengesetzt werden. So kann eine Leitung für mehrere<br />
Datentransfers auf einmal genutzt werden.<br />
E:<br />
Exabyte<br />
siehe Bit.<br />
G:<br />
Gateways<br />
Unter einem Gateway versteht man ein Protokollübersetzer. So<br />
können Netzwerke mit unterschiedlichen Protokollen miteinander<br />
kommunizieren.<br />
Glasfaserkabel<br />
Kabel aus Glasfäden mit denen sehr hohe Datenraten übertragen<br />
werden können.<br />
H:<br />
History<br />
In der History sind alle Suchbegriffe gespeichert, die früher einmal<br />
eingegeben worden sind.<br />
Hypertextsystem<br />
Ein Hypertextsystem verbindet verschiedene Seiten durch Links.<br />
So kann man durch das Anklicken von Links auf eine andere Seite<br />
gelangen.<br />
I:<br />
Internetbrowser<br />
siehe Browser.<br />
K:<br />
Knoten<br />
Ein Rechner der über ein Netzwerk mit anderen Rechnern verbunden<br />
ist.<br />
31
L:<br />
LAN<br />
LAN steht für Local Area Network. Ein LAN ist ein lokales Netzwerk<br />
über das man mit Rechnern Daten austauschen kann. Dies<br />
kann entweder (wie heute üblich) über Wireless-LAN oder über<br />
ein normales LAN mit Netzwerkkabeln sein.<br />
M:<br />
MAN<br />
Ein MAN ist ein Netzwerk, das sich über eine ganze Region erstreckt<br />
(Metropolitan Area Network).<br />
P:<br />
Paketvermittlung<br />
siehe Durchschaltevermittlung.<br />
Peer-To-Peer<br />
Ein Peer-To-Peer-Netzwerk steht im Gegensatz zu einem traditionellen<br />
Client-Server basierten Netzwerk, bei dem der Server den<br />
Dienst anbietet und der Client ihn nutzt. In einem P2P-Netzwerk<br />
hingegen sind alle Rechner gleichberechtigt. Sie sind vor allem<br />
typisch für Dienste wie Musiktauschbörsen, bei denen alle die<br />
Musik über viele verschieden Rechner gleichzeitig heruntergeladen<br />
wird und nicht wie sonst von nur einem Server.<br />
Protokoll<br />
Protokolle sind für die Kommunikation zwischen den verschiedenen<br />
Rechnern im Web zuständig. Sie legen fest, wie und in welcher<br />
Reihenfolge der Datenaustausch erfolgt.<br />
S:<br />
Spam-Mail<br />
Eine Spam-Mail ist eine Werbemail, welche in der Regel ohne<br />
Zustimmung des Empfängers zugestellt wird.<br />
T:<br />
TCP/IP<br />
Die Protokolle „Transmission Control Protocol“ und „Internet<br />
Protocol“ sind für die Paketvermittlung in Netzwerken zuständig.<br />
Das Internet Protocol schaut, dass die Daten am richtigen Ort ankommen.<br />
Das Transmission Control Protocol unterteilt die Nachricht<br />
in kleine Pakete, setzt sie am Zielort wieder zusammen und<br />
kontrolliert ob alle Pakete angekommen sind.<br />
32
W:<br />
WAN<br />
Ein Wide Area Network erstreckt sich im Gegensatz zu einem<br />
LAN oder MAN über ein grosses Gebiet. Manchmal sogar über<br />
ganze Regionen oder Länder.<br />
WWW<br />
Unter dem World Wide Web (auch WWW oder einfach Netz genannt)<br />
versteht man die Software, welche verwendet wird um die<br />
einzelnen Webseiten miteinander zu verknüpfen. Somit wird das<br />
WWW auch als Hypertextsystem bezeichnet. Die einzelnen Seiten<br />
sind durch sogenannte Hyperlinks (Links) miteinander verbunden.<br />
Wichtig ist die Unterscheidung zwischen dem WWW und dem<br />
Internet. Das Internet ist lediglich die Hardware. Also die Infrastruktur,<br />
welche die verschiedenen Rechner, auf welchen die Seiten<br />
liegen, mit einander verbindet.<br />
33
. Nützliche Links<br />
Internationale Suchdienste<br />
Google http://www.google.com/<br />
Yahoo! http://www.yahoo.com/<br />
Bing (Microsoft) http://www.bing.com/<br />
All The Web http://www.alltheweb.com/<br />
AltaVista http://www.altavista.com/<br />
Northern Light Search http://www.nlsearch.com/<br />
Ask http://www.ask.com/<br />
EntireWeb http://www.entireweb.com/<br />
Schweizer Suchdienste<br />
The Swiss Search Engine http://www.swisspage.ch/<br />
Google Schweiz http://www.google.ch/<br />
Yahoo Schweiz http://ch.search.yahoo.com/<br />
AltaVista http://ch.altavista.com/<br />
Schweizer Homepage Directory http://www.swisspage.ch/<br />
Die Schweizer Suchmaschine http://www.yoodle.ch/<br />
Meta-Suchmaschinen<br />
Ixquick http://www.ixquick.com/<br />
Web Crawler http://www.webcrawler.com/<br />
Meta Crawler http://www.metacrawler.com/<br />
Apollo 7 http://www.apollo7.de/<br />
Highway 61 http://www.highway61.com/<br />
MetaGer http://www.metager.de/<br />
Internationale Verzeichnisdienste<br />
Yahoo! http://www.yahoo.com/<br />
Excite http://www.excite.com/<br />
All One Search http://www.allonesearch.com/<br />
Alles klar http://www.allesklar.de/<br />
Sharelook http://www.sharelook.co.uk/<br />
Schweizer Verzeichnisdienste<br />
Sharelook http://www.sharelook.ch/<br />
Vertikale Suchmaschinen International<br />
Software http://www.tucows.com/<br />
Filme http://www.imdb.com/<br />
Medizin und Gesundheit http://www.medivista.de/<br />
Zeitungsartikel http://www.paperball.de/<br />
34
Vertikale Suchmaschinen Schweiz<br />
Firmen, Produkte, Marken http://www.swissguide.ch/<br />
Schweizer Musikszene http://www.music.ch/<br />
Literapedia http://literapedia.wikispaces.com<br />
Internet-Archive<br />
Zeitungsartikel http://www.paperball.de/<br />
FAZ-Archiv http://fazarchiv.faz.net/FAZ.ein<br />
NZZ-Archiv http://nzz.gbi.de/NZZ.ein<br />
Die Zeit http://www.zeit.de/2010/index<br />
Der Spiegel http://www.spiegel.de/<br />
3Sat-Mediathek http://www.3sat.de/mediathek/<br />
GEO http://www.geo.de/<br />
Bibliothekskataloge<br />
Schweizer Vitueller Katalog http://www.chvk.ch/<br />
Deutsche-Internet-Bibliothek http://www.internetbibliothek.de/<br />
NEBIS http://opac.nebis.ch/<br />
ETH-Bibliothek http://www.library.ethz.ch/<br />
Schweizerisches Sozialarchiv http://www.sozialarchiv.ch/<br />
Zentralbibliothek Zürich http://www.zb.unizh.ch/<br />
Winterthurer Bibliotheken http://bibliotheken.winterthur.ch/<br />
Enzyklopädien/Lexika<br />
Wikipedia http://en.wikipedia.org/<br />
Encyclopedia Britannica http://www.britannica.com/<br />
Brockhaus Enzyklopädie http://www.brockhaus.de/<br />
Meyers Lexikon Online http://www.iicm.tugraz.at/<br />
One Look http://www.onelook.com/<br />
Wörterbücher<br />
LEO http://www.leo.org/<br />
CANOO http://www.canoo.net/<br />
Google Translate http://translate.google.com/<br />
Babelfish http://babelfish.yahoo.com/<br />
LENGUA http://www.lengua.com/<br />
Computer-Wörterbuch http://foldoc.org/<br />
35<br />
Abbildung 12:<br />
Titelseite der „Encyclopédie“ von<br />
Diderot und D’Alembert.
c. Quellenangabe:<br />
Abbildungen:<br />
Titelbild: Rechenzentrum: http://farm4.sta<strong>tic</strong>.flickr.com/3380/3419237278_d5da5f22bb_o.jpg<br />
Google-Logo aus Lebensmittelverpackungen: http://picasaweb.google.com/gblogphotos/ Googley<br />
ArtWalls?feat=flashalbum#5509770875559110002<br />
Abbildung 1: http://interaktiv.mlpd.de/rf0502/rfart15.htm<br />
Abbildung 2: Graphik zur Funktionsweise von Google. Aus der Doktorarbeit der Google-Gründer übernommen<br />
(stark vereinfacht): http://infolab.stanford.edu/~backrub/google.html<br />
Abbildung 3: http://www.google.ch/intl/de/corporate/tech.html<br />
Abbildung 4: http://geektechnique.org/media/google/googlehardware.html<br />
Abbildung 5: http://communication.howstuffworks.com/google-docs5.htm<br />
Abbildung 6: Graphik (<strong>leicht</strong> modifiziert) übernommen aus: Hübener, Markus: Suchmaschinenoptimierung kompakt.<br />
Heidelberg 2009. S. 18.<br />
Abbildung 7: http://www.suchfibel.de/2kunst/feldsuche.htm<br />
Abbildung 8: http://lequattrostagioni.wordpress.com/2009/11/06/1931-2001-bilder-die-bewegen/<br />
Abbildung 9: http://commons.wikimedia.org/wiki/File:Choco_chip_cookie.jpg<br />
Abbildung 10: http://bureau.comandantina.com/archivos/2006/02/<br />
Abbildung 11: http://marketgoodstocks.com/humor-news/google-china-changing-im-feeling-lucky-to-im-feelingcommunist/<br />
Abbildung 12: http://en.wikipedia.org/wiki/File:ENC_1-NA5_600px.jpeg<br />
Endnoten:<br />
[1] Viele glauben der Brite Donald Davies hätte das Paketvermittlungsverfahren als erster entdeckt. Fakt ist<br />
aber: Er war zwar der Namensgeber des neuartigen Verfahrens, der Amerikaner Paul Baran hatte dieses jedoch<br />
zuerst entwickelt. Er erfuhr jedoch nicht dieselbe Unterstützung der Telefongesellschaften wie sein<br />
englischer Konkurrent, da die amerikanische Telefongesellschaft AT&T vorerst kein Interesse an der<br />
Technik der Paketvermittlung hatte. Siehe dazu: Wikipedia, Die freie Enzyklopädie, „Packet switching“,<br />
Bearbeitungsstand: 14.10.2010, 18:13 UTC. http://en.wikipedia.org/wiki/Packet_switching (17.10.10).<br />
Oder auch in: Hafner, Katie und Lyon, Matthew: ARPA KADABRA oder die Anfänge des Internet. Heidelberg<br />
2008. S. 72-75.<br />
[2] H'obbes' Zakon, Robert: Hobbes‘ Internet Timeline 10. http://www.zakon.org/robert/internet/timeline/<br />
(17.10.10).<br />
[3] Hafner und Lyon S. 198.<br />
36
[4] H'obbes' Zakon, Robert: Hobbes‘ Internet Timeline 10. http://www.zakon.org/robert/internet/ timeline/<br />
(17.10.10). Oder folgende Seite: California State University Dominguez Hills: ARPANET maps.<br />
http://som.csudh.edu/fac/lpress/history/arpamaps/f8sep1971.jpg (17.10.10). Auf letzterer sind zwar 18<br />
Hosts zu sehen. Drei davon scheint jedoch eine Sonderfunktion zuzukommen und sind auf der Karte mit<br />
einem „T“ versehen. Gut möglich, dass auch die erste Seite vom selben Bericht (ARPANET Completion<br />
Report) ausgeht, die drei speziellen Hosts jedoch nicht mitzählt.<br />
[5] Hafner und Lyon S. 210.<br />
Die meisten Amerikaner erfuhren zum ersten Mal überhaupt von der Existenz des ARPANET im Jahre<br />
1975. Und zwar durch einen Skandal: Militärische Geheimdienste sammelten während der Zeit des Kalten<br />
Krieges Informationen wie selten zuvor. Sie hatten nicht nur Daten über den kommunistischen Osten, sondern<br />
auch innerhalb der USA wurden die örtlichen Geschehnisse vom Pentagon aus genau mit verfolgt. Als<br />
dies 1972 an die Öffentlichkeit kam, wurde die Löschung dieser Daten verlangt. 1975 gingen jedoch Behauptungen<br />
umher, wonach die Daten gar nicht gelöscht, sondern vom Geheimdienst an einen anderen Ort<br />
geschickt worden waren – per ARPANET. Siehe dazu Ebd. S. 274.<br />
[6] Weiterführende Lektüre zu den Internet-Protokollen TCP/IP: Universität Karlsruhe: TCP/IP.<br />
http://www.lehrer.uni-karlsruhe.de/~za151/netz/tcpip.html (17.10.10).<br />
[7] Hafner und Lyon S. 264–269.<br />
[8] Wikipedia, Die freie Enzyklopädie, „NORSAR“, Bearbeitungsstand: 14.05.2010, 12:49 UTC.<br />
http://en.wikipedia.org/wiki/NORSAR (17.10.10).<br />
[9] Hafner und Lyon S. 10. Entkräftet den weitverbreiteten Mythos über die Ziele des ARPANET.<br />
Oder auch: Internet Society: A Brief History oft he Internet.<br />
http://www.isoc.org/internet/history/brief.shtml (17.10.10)<br />
Auch ein ehemaliger Direktor der DARPA (ehemals ARPA) konnte den Mythos, das ARPANET sei nur<br />
als Kommunikationsmöglichkeit nach einem nuklearen Anschlag erbaut worden, als falsche Annahme erklären:<br />
About.com: Charles Herzfeld on ARPANET and Computers. http://inventors.about.com/library/<br />
inventors/bl_Charles_Herzfeld.htm (17.10.10).<br />
[10] Hafner und Lyon S. 176f.<br />
[11] Wikipedia, Die freie Enzyklopädie, „EUnet“, Bearbeitungsstand: 05.07.2010, 11:49 UTC.<br />
http://en.wikipedia.org/wiki/EUnet (17.10.10).<br />
[12] Wann genau der Begriff Internet aufkam, ist schwierig zu sagen, da das Aufkommen eines Begriffes selten<br />
dokumentiert wird und oftmals einen langsamen Prozess darstellt, der sich über Jahre hinweg ziehen kann.<br />
Es wird jedoch vermutet, dass er Mitte der 80er-Jahre populär wurde. Zudem hatte sich eine Unterscheidung<br />
zwischen Gross- und Kleinschreibung entwickelt: Ein „internet“ war ein privates, kleines Netzwerk,<br />
das TCP/IP benutzte. Das „Internet“ schafte es zum festen Begriff, wie die Grossschreibung in englischer<br />
Sprache verrät und ist definiert als das grosse, staatliche Netzwerk. Man könnte es auch Backbone nennen.<br />
Siehe dazu: Hafner und Lyon S. 289.<br />
[13] Wikipedia, Die freie Enzyklopädie, „TAT-8“, Bearbeitungsstand: 26.08.2010, 19:38 UTC.<br />
http://en.wikipedia.org/wiki/TAT-8 (28.11.10).<br />
[14] Hafner und Lyon S. 301–303.<br />
37
[15] Wikipedia, Die freie Enzyklopädie, „Archie“, Bearbeitungsstand: 18.05.2010, 11:29 UTC.<br />
http://de.wikipedia.org/wiki/Archie (17.10.10).<br />
[16] H'obbes' Zakon, Robert: Hobbes‘ Internet Timeline 10. http://www.zakon.org/robert/internet/ timeline/#1990s<br />
(17.10.10).<br />
[17] Wikipedia, Die freie Enzyklopädie, „WWW“, Bearbeitungsstand: 25.09.2010, 22:20 UTC.<br />
http://de.wikipedia.org/wiki/World_Wide_Web (17.10.10).<br />
Oder auch: Hafner und Lyon S. 305f.<br />
[18] Wikipedia, Die freie Enzyklopädie, „Chronologie des Internets“, Bearbeitungsstand: 14.09.2010, 20:55<br />
UTC. http://de.wikipedia.org/wiki/Chronologie_des_Internets (17.10.10).<br />
[19] Wikipedia, Die freie Enzyklopädie, „Chronologie des Internets“, Bearbeitungsstand: 14.09.2010, 20:55<br />
UTC. http://de.wikipedia.org/wiki/Chronologie_des_Internets (17.10.10).<br />
[20] Wikipedia, Die freie Enzyklopädie, „Alta Vista“, Bearbeitungsstand: 14.09.2010, 01:30 UTC.<br />
http://en.wikipedia.org/wiki/AltaVista (17.10.10).<br />
[21] Wikipedia, Die freie Enzyklopädie, „Yahoo“, Bearbeitungsstand: 14.10.2010, 22:21 UTC.<br />
http://de.wikipedia.org/wiki/Yahoo (17.10.10).<br />
[22] Den vollständigen Chat findet man in: Hafner und Lyon S. 218-220.<br />
[23] Wikipedia, Die freie Enzyklopädie, „Spam“, Bearbeitungsstand: 16.10.2010, 20:25 UTC.<br />
http://en.wikipedia.org/wiki/Spam_(electronic) (17.10.10).<br />
[24] Neue Zürcher Zeitung: Google lässt Duden-Eintrag „googeln“ ändern. http://www.nzz.ch/2006/08/16/<br />
vm/newzzEQXM1K6L-12.html (17.10.10).<br />
Auf Wunsch des Unternehmens wurde der Begriff in der nächsten Auflage des Dudens mittels „mit Google<br />
im Internet recherchieren“ genauer definiert, um eine Gattungsbegriffbildung zu verhindern, die schon<br />
längst Tatsache geworden ist.<br />
[25] Wikipedia, Die freie Enzyklopädie, „Browserkrieg“, Bearbeitungsstand: 09.10.2010, 19:11 UTC.<br />
http://de.wikipedia.org/wiki/Browserkrieg (17.10.10).<br />
[26] Wikipedia, Die freie Enzyklopädie, „Napster“, Bearbeitungsstand: 16.10.2010, 09:06 UTC.<br />
http://de.wikipedia.org/wiki/Napster (17.10.10).<br />
[27] Das Peer-To-Peer-Verfahren wird ausführlich erklärt auf: Wikipedia, Die freie Enzyklopädie, „Peer-to-<br />
Peer“, Bearbeitungsstand: 12.10.2010, 12:41 UTC. http://de.wikipedia.org/wiki/Peer-to-Peer (17.10.10).<br />
[28] Wikipedia, Die freie Enzyklopädie, „Jimbo Wales“, Bearbeitungsstand: 16.10.2010, 10:43 UTC.<br />
http://de.wikipedia.org/wiki/Jimbo_Wales (17.10.10).<br />
[29] Wikipedia, Die freie Enzyklopädie, „Web 2.0“, Bearbeitungsstand: 16.10.2010, 01:42 UTC.<br />
http://de.wikipedia.org/wiki/Web_2.0 (17.10.10).<br />
[30] Marketing Boerse: 2007 täglich 97 Milliarden E-Mails weltweit.<br />
http://www.marketing-boerse.de/News/details/2007-t%E4glich-97-Milliarden-E-Mails-weltweit/6555<br />
(17.10.10).<br />
38
[31] Im Jahr 2009 wurden durchschnittlich 11‘627 Petabyte Daten pro Monat über das (öffentlich zugängliche)<br />
Internet transportiert, was einem täglichen Datenaufkommen von mehr als 415 Petabyte entspricht (415 Petabyte<br />
entsprechen der tausendfachen Datenmenge aller Bücher, die jemals in jeder Sprache auf der Welt<br />
geschrieben wurden). Die Tendenz ist weiter steigend: Bis zum Jahr 2014 wird sich die weltweit verschickte<br />
Datenmenge um ungefähr den Faktor 3.5 auf 485 Exabyte erhöhen. Ein Grossteil dieser Daten wird<br />
durch Videos verursacht.<br />
Siehe dazu: Wikipedia, Die freie Enzyklopädie, „Internet“, Bearbeitungsstand: 16.10.2010, 07:28 UTC.<br />
http://de.wikipedia.org/wiki/Internet (17.10.10).<br />
Das Telekommunikationsunternehmen Cisco Systems, welches in der Branche von Routern und Internetverkehr<br />
eine feste Grösse ist, spricht im Jahr 2009 von 176 Exabyte Daten. Zudem erstaunlich: Um sich das<br />
gesamte Videomaterial, das im Jahr 2014 in einer Sekunde über das Web verschickt werden wird, anzusehen,<br />
bräuchte man mehr als zwei volle Jahre: Cisco Systems: Forecast and Methodology, 2009-2014.<br />
http://www.cisco.com/en/US/solutions/collateral/ ns341/ns525/ns537/ns705/ns827/white_paper_c11-<br />
481360_ns827_Networking_Solutions_White_ Paper. html (17.10.10).<br />
[32] Das Löschen von Spam-Mails raubt weltweit 100 Milliarden Stunden Arbeitszeit: Wikipedia, Die freie<br />
Enzyklopädie, „Spam“, Bearbeitungsstand: 14.10.2010, 18:48 UTC. http://de.wikipedia.org/wiki/ Spam<br />
(17.10.10). Spam-Mails sind jedoch nicht nur nervig und halten einem vom Wesentlichen ab, nein sie sind<br />
auch umweltschädlich: Laut einer Studie von McAfee könnten in den USA mit dem weltweiten Energieverbrauch,<br />
der beim versenden, sichten, lesen und bekämpfen von Spam-Mails entsteht 2,4 Millionen Häuser<br />
versorgt werden. Spam-Filter sind deshalb auch umwelttechnisch gesehen ein Vorteil: Alle Filter zusammen<br />
sparen die Energie von 13 Millionen Autos pro Jahr. Für weitere Informationen:<br />
McAfee: The Carbon Footprint of Email Spam Report.<br />
http://newsroom.mcafee.com/images/10039/carbonfootprint2009.pdf (17.10.10).<br />
[33] Die Fakten und Zahlen der „Google-Timeline“ stammen, sofern nicht anders vermerkt, aus: Kowalsky,<br />
Marc: Krieg der Welten. Der Kampf zwischen Apple und Google um die Vorherrschaft in der IT-Industrie<br />
ist voll entbrannt – mit Konzepten, die unterschiedlicher nicht sein könnten. In: BILANZ. Das Schweizer<br />
Wirtschaftsmagazin Nr. 14. Zürich 2010. S. 28-35. Hier S. 31-33.<br />
[34] Maass Christian et al.: Der Markt für Internet-Suchmaschinen. In: Lewandowski, Dirk (Hrsg.): Handbuch<br />
Internet-Suchmaschinen. Nutzerorientierung in Wissenschaft und Praxis. Heidelberg 2009. S. 3-17. Hier S.<br />
7.<br />
Google AdWords ist ein Auktionssystem, bei dem die Anzeigen versteigert werden. Wie bei allen Auktionssystemen<br />
wird auch hier der Markt voll ausgelastet. Denn der Preis kann niemals zu hoch oder zu tief<br />
sein. Sondern pendelt sich immer auf dem Niveau ein, das der Markt bereit ist zu zahlen. Für genauere Informationen<br />
siehe: Brandt, Richard: Googles kleines Weissbuch. Die Managementstrategien der wertvollsten<br />
Marke der Welt. München 2010. S. 86.<br />
[35] Becker, Hendrik und Arnold, Arne: Die Akte Google. In: PC WELT Nr. 8. München 2010. S. 72-82. Hier<br />
S. 75.<br />
[36] In ihrer Doktorarbeit äussern sich die Google-Gründer über die Hintergründe der Namensgebung: Brin,<br />
Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web Search Engine.<br />
http://infolab.stanford.edu/~backrub/google.html (16.11.10).<br />
Zudem findet man auf Wikipedia etwas zur Herkunft des Begriffs „Googol“: Wikipedia, Die freie Enzyklopädie,<br />
„Googol“, Bearbeitungsstand: 16.10.2010, 12:26 UTC.<br />
http://de.wikipedia.org/wiki/Googol (17.10.10).<br />
39
[37] Wikipedia, Die freie Enzyklopädie, „WWW“, Bearbeitungsstand: 14.11.2010, 02:15 UTC.<br />
http://de.wikipedia.org/wiki/World_Wide_Web (28.11.10).<br />
[38] Zitat aus Hafner und Lyon S. 304.<br />
1989 von Danny Cohen vorgetragen als Hommage an das ARPANET auf dem Act One Symposium an der<br />
UCLA (University of California Los Angeles) anlässlich des 20. Geburtstags des ARPANET, <strong>leicht</strong> angepasst<br />
und überarbeitet von den Autoren des Buches.<br />
[39] Wikipedia, Die freie Enzyklopädie, „Geschichte des Internets“, Bearbeitungsstand: 14.11.2010, 13:20<br />
UTC. http://de.wikipedia.org/wiki/Geschichte_des_Internets (28.11.10).<br />
[40] Wikipedia, Die freie Enzyklopädie, „Suchmaschine“, Bearbeitungsstand: 01.10.2010, 20:56 UTC.<br />
http://de.wikipedia.org/wiki/Suchmaschine (18.10.10).<br />
[41] Ebd.<br />
[42] Wikipedia, Die freie Enzyklopädie, „Webkatalog“, Bearbeitungsstand: 25.09.2010, 08:31 UTC.<br />
http://de.wikipedia.org/wiki/Webkatalog (18.10.10).<br />
[43] Wikipedia, Die freie Enzyklopädie, „Suchmaschine“, Bearbeitungsstand: 01.10.2010, 20:56 UTC.<br />
http://de.wikipedia.org/wiki/Suchmaschine (18.10.10).<br />
[44] Wikipedia, Die freie Enzyklopädie, „Metasuchmaschine“, Bearbeitungsstand: 25.09.2010, 08:31 UTC.<br />
http://de.wikipedia.org/wiki/Metasuchmaschine (18.10.10).<br />
[45] Wikipedia, Die freie Enzyklopädie, „Suchmaschine“, Bearbeitungsstand: 01.10.2010, 20:56 UTC.<br />
http://de.wikipedia.org/wiki/Suchmaschine (18.10.10).<br />
[46] SirValUse: Wer sucht, der findet! Google liefert nach wie vor die besten Suchergebnisse.<br />
http://www.sirvaluse.de/presse/nutzenforschung-report/09-<strong>suchen</strong>-im-internet/das-interview/index.html<br />
(28.11.10).<br />
[47] Google: Unternehmensbezogene Informationen. http://www.google.ch/intl/de/corporate/tech.html<br />
(28.11.10).<br />
[48] Brin, Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web Search Engine.<br />
http://infolab.stanford.edu/~backrub/google.html (16.11.10).<br />
[49] Google: Unternehmensbezogene Informationen. http://www.google. ch/intl/de/corporate/tech.html<br />
(28.10.10).<br />
[50] Search Engine Optimization: Relevanzkriterien – Basis für Onpage- und Offpage-Optimierung.<br />
http://www.seo-duesseldorf.de/suchmaschinenoptimierung/relevanzkriterien.html (18.10.10).<br />
[51] SEO für Google: Suchmaschinenoptimierung (SEO). http://www.jugendwettbewerb.de/ (18.10.10).<br />
[52] Brin, Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web Search Engine.<br />
http://infolab.stanford.edu/~backrub/google.html (16.11.10).<br />
[53] Reischl, Gerald: Die Google Falle. Die unkontrollierte Weltmacht im Internet. Wien 2008. S. 32.<br />
Kontrovers dazu: Brin, Sergey und Page, Lawrence: The Anatomy of a Large-Scale Hypertextual Web<br />
Search Engine. http://infolab.stanford.edu/~backrub/google.html (16.11.10).<br />
40
[54] Ebd.<br />
[55] Ebd.<br />
In ihrer Doktorarbeit argumentieren die beiden Google-Gründer, dass je mehr Links auf eine Seite verweisen,<br />
desto höher müsse automatisch auch ihre Wichtigkeit sein. Besonders, da bei Backlinks von Seiten mit<br />
einem hohen Ranking, sprich meistens renommierte Seiten, ein Teil deren Wert weitervererbt wird. Es gibt<br />
also Bonuspunkte für Links von gutbewerteten Seiten.<br />
[56] Das Beispiel wurde aus folgendem Buch, <strong>leicht</strong> modifiziert, übernommen: Hübener, Markus: Suchmaschinenoptimierung<br />
kompakt. Heidelberg 2009. S. 18.<br />
[57] Google: Unternehmensbezogene Informationen. http://www.google.ch/intl/de/corporate/tech.html<br />
(18.10.10).<br />
[58] Die Aufgabe wurde, <strong>leicht</strong> abgeändert, übernommen aus: Hübener S. 18.<br />
[59] Wikipedia, Die freie Enzyklopädie, „PageRank“, Bearbeitungsstand: 08.09.2010, 20:25 UTC.<br />
http://de.wikipedia.org/wiki/PageRank (18.10.10).<br />
[60] The Official Google Blog: Our new search index: Caffeine. http://googleblog.blogspot.com/2010/06/ournew-search-index-caffeine.html<br />
(18.10.10).<br />
Laut dieser Quelle, wurde früher der Google Index nur alle paar Wochen aktualisiert. Mit der Einführung<br />
des neuen Systems „Caffeine“ geschieht dies nun regelmässiger, in kleineren Portionen. So kommen jeden<br />
Tag einige Hunderttausend Gigabyte an neuen, aktualisierten Daten hinzu.<br />
[61] Official Google Webmaster Central Blog: Using site speed in web search ranking.<br />
http://googlewebmastercentral.blogspot.com/2010/04/using-site-speed-in-web-search-ranking.html<br />
(18.10.10).<br />
[62] Ebd.<br />
Laut dem offiziellen Google-Blog fliesst neuerdings, neben den übrigen Relevanzkriterien, auch die Ladegeschwindigkeit<br />
einer Seite in ihr Ranking mit ein. Dieser Faktor wird jedoch erst auf der englischsprachigen<br />
Seite Google.com angewandt und hat, laut Google, einen sehr geringen Einfluss. Was diese neue Methode<br />
jedoch tatsächlich für Auswirkungen mit sich bringt, ist noch nicht klar. Einige befürchten, dass Bilder<br />
und Videos grösstenteils aus dem Web verschwinden könnten, würde sich das „Speed-Ranking“ weltweit<br />
durchsetzten, da diese die Ladegeschwindigkeit enorm beeinträchtigen. Siehe dazu: tagSEOBlog:<br />
Neuer Rankingfaktor „page speed“ – Googles Bildersturm? http://www.tagseoblog.de/ neuerrankingfaktor-ladezeit-googles-bildersturm-im-internet<br />
(18.10.10).<br />
[63] Hartmann, Werner et al.: Informationsbeschaffung im Internet. Grundlegende Konzepte verstehen und<br />
umsetzen. Zürich 2000. S. 38.<br />
[64] Die Idee für die Aufgaben zum Herleiten der Relevanzkriterien stammt von mir. Die sechs Rangierungsprinzipien<br />
sind jedoch dem folgenden Buch entnommen: Ebd. S. 38-43. Die tatsächlichen Beispiele wurden<br />
von mir jedoch frei erfunden und der Text dazu der (entsprechenden) Abfrage bei Google entnommen.<br />
Teilweise musste auch auf <strong>leicht</strong> modifizierte Ergebnisseiten gewechselt werden, um explizitere Beispiele<br />
zu generieren.<br />
[65] Long, Johnny: Google Hacking. Bonn 2005. S. 28-30 und S. 88-91.<br />
41
[66] Wikipedia, Die freie Enzyklopädie, „Boolescher Operator“, Bearbeitungsstand: 01.05.2010, 09:00 UTC.<br />
http://de.wikipedia.org/wiki/Boolescher_Operator (19.10.10).<br />
[67] Übernommen von: Google: Erweiterte Suche. http://www.google.ch/advanced_search?hl=de (28.11.10).<br />
[68] Der Text über „Googlewhack“ wurde von der folgenden Seite übernommen und <strong>leicht</strong> abgeändert: Reischl,<br />
Gerald: Die Googlefalle. http://www.googlefalle.com/googlefalle/index.php/about/wussten-sie-dass/<br />
(20.10.10).<br />
[69] Weilenmann, Anne-Katharina: Fachspezifische Internetrecherche. München 2006. S. 9.<br />
[70] Google: Unternehmensbezogene Informationen. http://www.google.ch/intl/de/corporate/tech.html<br />
(20.10.10).<br />
[71] Ebd.<br />
[72] The Official Google Blog: Personalized Search for everyone. http://googleblog.blogspot.com/2009/12/<br />
personalized-search-for-everyone.html (20.10.10).<br />
[73] Glos, Michael: Sicher surfen, mailen, Daten tauschen. Poing 2004. S. 47.<br />
[74] Ebd. S. 205.<br />
[75] Reporters without Borders: Enemies of the Internet. http://en.rsf.org/IMG/pdf/Internet_enemies.pdf<br />
(21.10.10).<br />
[76] Wikipedia, Die freie Enzyklopädie, „Zensur im Internet“, Bearbeitungsstand: 07.10.2010, 08:36 UTC.<br />
http://de.wikipedia.org/wiki/Zensur_im_Internet (21.10.10).<br />
[77] Google: Transparency Report: Government Requests. http://www.google.com/transparencyreport/ governmentrequests/<br />
(21.10.10).<br />
[78] Wikipedia, Die freie Enzyklopädie, „Zensur im Internet“, Bearbeitungsstand: 07.10.2010, 08:36 UTC.<br />
http://de.wikipedia.org/wiki/Zensur_im_Internet (21.10.10).<br />
Mit einem ausländischen Proxy-Server kann weiterhin auf die Seite zugegriffen werden. Zum Beispiel: Auf<br />
http://youproxified.info/ einfach die Internet-Adresse: www.appel-au-peuple.org in das Feld „URL“ eingeben.<br />
[79] Becker, Hendrik und Arnold, Arne S. 75.<br />
[80] Weichert, Thilo: Datenschutz bei Suchmaschinen. In: Lewandowski, Dirk (Hrsg.): Handbuch Internet-<br />
Suchmaschinen. Nutzerorientierung in Wissenschaft und Praxis. Heidelberg 2009. S. 285-300. Hier S. 288.<br />
42
Anhang B:<br />
Lösungen:<br />
Lösungen zu 2.1<br />
1. 1976.<br />
2. In Kalifornien und Boston liegen besonders viele führende<br />
amerikanische Universitäten und Forschungseinrichtungen.<br />
Und das ursprüngliche Ziel des ARPANET war ja ein verbesserter<br />
Datenaustausch unter diesen.<br />
Lösungen zu 2.2<br />
Ein verteiltes (und in Ansätzen auch ein dezentralisiertes) Netz ist<br />
bei einem Ausfall eines Knotens oder auch mehrerer Knoten nicht<br />
einfach stillgelegt, sondern kann den Datenverkehr über die verbleibenden<br />
Knoten abwickeln.<br />
Lösungen zu 2.3<br />
Bei der Durchschaltevermittlung werden alle Möbel in einem Auto<br />
transportiert und nicht auf mehrere verteilt. Der Hauptunterschied<br />
besteht aber darin, dass bei dieser Methode die Autobahn für den<br />
Zügelwagen reserviert ist und zu dieser Zeit keine anderen Autos<br />
auf der Autobahn fahren dürfen.<br />
Lösungen zu 3.1<br />
� Kataloge sind zumindest in kleiner Grösse aktueller und zu<br />
einem kleinen Thema auch umfassender.<br />
� Suchmaschinen sind effizienter, objektiver, aktueller, vollständiger<br />
und auch vom Kosten-Nutzen-Aspekt her gesehen effektiver.<br />
Hier kann im Vergleich zu einem Katalog mit einem kleineren<br />
finanziellen Aufwand ein grosser Index erstellt und gepflegt<br />
werden.<br />
Lösungen zu 3.2<br />
Bei der Glaubwürdigkeit kommt es auf die Quelle an. Also wer das<br />
Gesagte verbreitet. Ist die Person auch sonst glaubhaft, wird dem<br />
Gerücht wohl eher Glauben geschenkt.<br />
Lösungen zu 3.3<br />
� www.ethz.ch (9)<br />
� www.ksrychenberg.ch (5)<br />
� www.sf.tv (7)<br />
� www.blick.ch (7)<br />
43
� www.nytimes.com (9)<br />
� www.nzz.ch (8)<br />
� www.google.com (10)<br />
� www.google.ch (7)<br />
� www.yahoo.com (9)<br />
Wie du sicher unschwer erkennen kannst, hat der PageRank also<br />
nicht direkt mit Qualität, sondern mit Popularität zu tun. Die Seite<br />
der ETH wird deutlich öfter zitiert, als die Seite der KSR, hat demzufolge<br />
also deutlich mehr Backlinks. Die Seiten des Schweizer<br />
Fernsehens und des Blicks sind was den PageRank betrifft gleichauf,<br />
was man vom Inhalt der Seiten sicher nicht behaupten kann.<br />
Die Website der New York Times hat ein <strong>leicht</strong> besseres Ranking<br />
als die NZZ, da die New York Times wahrscheinlich weltweit<br />
gesehen öfter zitiert wird, da sie über die Landesgrenzen hinaus<br />
bekannt ist. Dasselbe trifft auch auf den Vergleich zwischen den<br />
Google-Startseiten zu. Die Schweizer Seite wird im Vergleich zur<br />
internationalen Startseite deutlich weniger oft zitiert. Auch die<br />
Yahoo-Startseite kann „google.com“ nicht das Wasser reichen.<br />
Lösungen zu 3.4<br />
Bedenke jedoch, dass diese Rechnung stark vereinfacht ist. In<br />
Wirklichkeit setzt sich der PageRank aus einer riesigen Formel mit<br />
unzähligen Unbekannten zusammen. Diese Formel ist jedoch ein<br />
Firmengeheimnis.<br />
Lösungen zu 3.5<br />
Verzeichnisdienste: Open Directory Project, Sharelook, voodoo-it.<br />
Schweizer Suchmaschinen: search.ch<br />
Internationale Suchmaschinen: AltaVista, Entire Web, Ask,<br />
Gigablast, Lycos,<br />
Meta-Suchmaschine: Ixquick<br />
Vertikale Suchmaschinen: Google Code Search, ingenieur.de,<br />
Medisuch.<br />
Lösungen zu 3.6<br />
Mit einer Suchanfrage wie „Taio Cruz“ lässt sich gut die Aktualität<br />
der Indizes überprüfen. Während es Lycos nur auf schwache<br />
111‘000 Treffer bringt. Schafft Google gut 8 Millionen und<br />
Ixquick sogar gut 15 Millionen. Beide haben also einen sehr aktu-<br />
44
ellen Index. Bei der Grösse gilt es jedoch zu beachten, dass<br />
Ixquick Google nur schlägt, weil es eine Meta-Suchmaschine ist<br />
und die Indizes von Yahoo, Bing, AltaVista, Ask, EntireWeb,<br />
Gigablast, ODP, Semager, Sharelook, Suchclip, Voodoo-it und<br />
Wikipedia bemüht. Ein wahrlich unfairer Vergleich. Dennoch<br />
bringt es Ixquick auf nicht mehr als doppelt so viele Treffer. Der<br />
Index von Google ist also klar der Grösste. Bei der Eingabe von<br />
„the“ schafft Lycos gut 2 Milliarden, Google 12 Milliarden und<br />
Ixquick nicht mehr als gut 3,2 Milliarden Treffer.<br />
Lösungen zu 3.7<br />
Bei Google rangiert Wikipedia auf dem 5., bei Yahoo auf dem 7.<br />
und bei Ixquick auf dem 1. Platz. Dies liegt wahrscheinlich daran,<br />
dass Ixquick auch Wikipedia selbst durchsucht.<br />
Lösungen zu 4.1<br />
Das erste Ergebnis ist relevanter, da mehr Suchbegriffe darin vorkommen.<br />
Rangierungsprinzip 1<br />
Je mehr Suchbegriffe in einem Dokument vorkommen, desto<br />
wahrscheinlicher ist das Dokument relevant.<br />
Lösungen zu 4.2<br />
Der erste Treffer ist relevanter, da ein S<strong>tic</strong>hwort häufiger vorkommt<br />
als im ersten.<br />
Rangierungsprinzip 2<br />
Je häufiger ein Suchbegriff in einem Dokument vorkommt,<br />
desto wahrscheinlicher ist das Dokument relevant.<br />
Lösungen zu 4.3<br />
Das erste Suchergebnis ist relevanter als das zweite, da mit<br />
„Feusisberg“ ein seltener Begriff darin vorkommt.<br />
Rangierungsprinzip 3<br />
Dokumente, die seltene Suchbegriffe enthalten, sind mit einer<br />
höheren Wahrscheinlichkeit relevant, als Dokumente, die häufige<br />
Suchbegriffe enthalten.<br />
45
Lösungen zu 4.4<br />
Der erste Treffer ist relevanter, da die Suchbegriffe näher beieinander<br />
liegen.<br />
Rangierungsprinzip 4<br />
Je näher die Suchbegriffe beieinander liegen, desto wahrscheinlicher<br />
ist das Dokument relevant.<br />
Lösungen zu 4.5<br />
Der erste Treffer ist relevanter, da das Dokument kürzer ist, die<br />
Suchbegriffe aber gleich häufig enthält.<br />
Rangierungsprinzip 5<br />
Ein kurzes Dokument ist mit einer höheren Wahrscheinlichkeit<br />
relevant als ein langes Dokument, welches die gleichen Suchbegriffe<br />
gleich häufig enthält.<br />
Lösungen zu 4.6<br />
Hier ist das erste Dokument relevanter, da die gleichen Suchbegriffe<br />
früher vorkommen als im zweiten.<br />
Rangierungsprinzip 6<br />
Je früher die Suchbegriffe in einem Dokument vorkommen,<br />
desto höher seine Relevanz.<br />
Lösungen zu 4.7<br />
Dein Vorwissen, das du aktivieren kannst, sind die Namen. Gib ein<br />
paar Nachnamen deiner Klassenkammeraden bei Google ein. Fünf<br />
sollten genügen und du kannst die Treffer an einer Hand abzählen.<br />
Wenn du selbiges bei Yahoo und Bing versuchst, wirst du sehen,<br />
dass du keine brauchbaren Treffer bekommst…<br />
Lösungen zu 4.8<br />
Als erstes S<strong>tic</strong>hwort wäre wahrscheinlich „Fernsehprogramm“ eine<br />
gute Wahl. Da du jetzt keine Treffer mit integriertem Kinoprogramm<br />
dabei hast, ver<strong>suchen</strong> wir es mit „Fernsehprogramm Kino“.<br />
Mit dem geben wir uns aber nicht zu<strong>fri</strong>eden und geben „Fernsehprogramm<br />
Kino Schweiz“ ein. Einer der ersten Treffer scheint<br />
somit gleich brauchbar. „Cineman“ bietet sowohl das Kinoprogramm<br />
aus fast allen Schweizer Grossstädten, wie auch das Fernsehprogramm<br />
aller wesentlichen Sender an.<br />
46
Lösungen zu 4.9<br />
1. Hier empfiehlt sich eine Suchmaschine. Gleich der erste Treffer<br />
ist von Wikipedia. Wo du erfährst, dass Petrologie die Lehre<br />
von der Entstehung, den Eigenschaften und der Nutzung der<br />
Gesteine ist.<br />
2. Am besten suchst du hier über einen Katalog. Am geeignetsten<br />
ist wohl die „Internet Movie Database“. Gib hier einfach den<br />
Titel der Serie „Two and a Half Men“ in das Suchfeld ein. Der<br />
erste Treffer ist gleich der beste. Unter der Rubrik „Cast“ findest<br />
du jetzt die verschiedenen Schauspieler. So auch „Angus<br />
T. Jones“, der in der Fernsehserie „Jake Harper“ spielt.<br />
3. Am besten suchst du im Schweizer Katalog Sharelook.<br />
4. Wenn wir hier kein Vorwissen aktivieren können, versuche wir<br />
es erst einmal mit den simplen S<strong>tic</strong>hwörtern „Schweizer Olympiasieger“.<br />
Der Auszug der ersten Seite sieht gleich interessant<br />
aus. Denn auf der offiziellen Seite des Swissolympic Verbandes<br />
wird „Louis Zutter, der erste Olympiasieger der Neuzeit“ erwähnt.<br />
Sagt uns zwar nichts. Aber egal, wir klicken drauf. Hier<br />
finden wir eine Liste „Spotlights der Schweizer Sportgeschichte“.<br />
Die Seite liefert aber keine vernünftige Antwort auf unsere<br />
Frage. Eine übersichtliche Tabelle wäre nett. Aber viel<strong>leicht</strong><br />
finden wir ja etwas Vorwissen auf dieser Seite. Also <strong>suchen</strong> wir<br />
einmal die Passage, wo Louis Zutter erwähnt wurde. In Windows<br />
einfach den Namen eingeben und die Stelle wird grün<br />
markiert. Darunter finden wir eine nützliche Information: Dort<br />
steht nämlich, dass die erste Olympiasiegerin der Neuzeit „Helen<br />
de Pourtalès“ hiess. Gleich darunter finden wir in Verbindung<br />
mit einem Olympiasieg noch den Namen „Josef Imbach“.<br />
Wir geben also bei Google diese drei Namen ein: „Josef Imbach<br />
Louis Zutter Helen de Pourtalès“. Der erste Treffer ist logischerweise<br />
die gleiche Seite. Der zweite scheint jedoch sehr<br />
interessant zu sein: Olympians from switzerland – alphabe<strong>tic</strong>al<br />
listing. Wir klicken die Seite an und siehe da: Eine Liste mit allen<br />
Schweizer Olympiasiegern, erst noch alphabetisch geordnet.<br />
Was haben wir genau <strong>gemacht</strong>: Wir konnten zum Thema kein<br />
eigenes Vorwissen aktivieren. Also haben wir uns das Vorwissen<br />
durch das Eingeben von umschreibenden S<strong>tic</strong>hwörtern beschafft.<br />
47
Lösungen zu 4.10<br />
S<strong>tic</strong>hwörter: Ballsportart –Fussball<br />
Lösungen zu 4.11<br />
S<strong>tic</strong>hwörter: Preisvergleich Produkte Migros Coop. Auch hier<br />
scheinen schon unter den ersten Treffern einige vernünftige darunter<br />
zu sein.<br />
Lösungen zu 4.12<br />
Am häufigsten wird wohl das Rangierungsprinzip zwei missbraucht.<br />
So schreiben viele Webseiten-Betreiber gewisse S<strong>tic</strong>hwörter<br />
mehrere Tausend Mal auf ihre Website (Natürlich in der Farbe<br />
des Hintergrunds, sodass die Seite trotzdem noch lesbar bleibt).<br />
Denn das Rangierungsprinzip zwei besagt: Je häufiger ein S<strong>tic</strong>hwort<br />
vorkommt, desto wahrscheinlicher ist das Dokument relevant.<br />
Lösungen zu 4.13<br />
Die S<strong>tic</strong>hwörter „Rockefeller Center Bauarbeiter“ bei „Google<br />
Bilder“ eingeben genügt schon.<br />
Lösungen zu 4.14<br />
Hier überlegen wir uns als erstes wieder, wie eine Seite aussieht,<br />
die unsere Informationen bereithält. Am besten <strong>suchen</strong> wir nach<br />
einem Matchbericht. Dort sind alle Daten und Geschehnisse der<br />
ganzen Partei aufgelistet. Um den richtigen Matchbericht zu erwischen,<br />
müssen wir nur noch den Match eindeutig beschreiben. Wir<br />
ver<strong>suchen</strong> es also mit: „Matchbericht CL Final 2005 Milan Liverpool“.<br />
Und siehe da. Der erste Treffer ist bereits ein Volltreffer.<br />
Bei Wikipedia unter der Rubrik Details erfahren wir, dass der<br />
Tscheche Vladimír Šmicer Liverpool in der 56. Minute zurück ins<br />
Spiel gebracht hat.<br />
Lösungen zu 4.15<br />
Für diese Aufgabe verwenden wir die „Erweiterte Suche“. Im Feld<br />
„Dateiformat“ wählen wir „PDF“ und im Feld „Datum“ „in den<br />
letzten 24 Stunden“.<br />
48
Lösungen zu 4.16<br />
S<strong>tic</strong>hwörter: „stadtbus linie plan winterthur“.<br />
Der erste Treffer ist gleich der beste.<br />
Lösungen zu 4.17<br />
Internet Movie Database<br />
Lösungen zu 5.1<br />
Die Lösungen zu 5.1 können hier leider nicht angegeben werden:<br />
Weil ich erstens nicht Google bin und zweitens aus Platzgründen.<br />
Lösungen zu 5.2<br />
Auf den Seiten 34 und 35 findest du eine Liste mit einigen anderen<br />
Suchmaschinen.<br />
49