Wie kommt ein Ranking zustande?

Um die erfassten Seiten darstellen zu können, muss die Suchmaschine die Ergebnisse in eine Reihenfolge bringen. Dieses Ranking ist neben der Vollständigkeit und der Geschwindigkeit ein wichtiges Kriterium dafür, wie nützlich eine Suchmaschine für den Nutzer ist. Es wird von einer Vielzahl von Faktoren bestimmt, die im Einzelnen das Betriebsgeheimnis der Suchmaschinenbetreiber sind. Die wesentlichen Faktoren zur Bestimmung des Rankings werden in der Wissenschaft in vier Bereiche unterteilt:

1. Keywords im Text

Mit Hilfe textspezifischer Faktoren wird ermittelt, welche relevanten Wörter in den zu durchsuchenden Dokumenten vorkommen und deswegen in die Suchergebnisliste mitaufgenommen werden sollen. Ein solcher textspezifischer Faktor kann z.B. die Gewichtung von Worttypen sein; ein Wort wie „in“ ist weniger relevant als ein spezifisches Wort wie „Fußballweltmeisterschaft“.
Höher gewichtet werden auch Wörter, die an besonders bedeutenden Stellen stehen bzw. ausgezeichnet sind, wie z.B. in der Überschrift oder Fettschrift im Text.

2. Vorhandene Verlinkungen

Die „Wichtigkeit“ einer Seite anhand der Links von anderen Seiten wird algorithmisch gemessen, beispielsweise durch das PageRank-Verfahren (siehe Infokasten).

3. Aktualität

Abhängig von der Art der Suchanfrage gilt es, entweder besonders aktuelle Dokumente oder aber ältere Dokumente anzuzeigen, die besonders häufig abgerufen werden. Da Dokumente, die vor längerer Zeit ins Netz gestellt wurden, in der Tendenz bereits häufiger verlinkt wurden als Dokumente, die weniger lange im Netz standen, berücksichtigen Suchmaschinen heute die Aktualität von Dokumenten als Ausgleichsfaktor und lassen diese in das Ranking einfließen.

4. Lokalität

Lokalität bezieht sich auf den Standort und die Sprache des Nutzers. Beispielsweise werden Dokumente mit der Top-Level-Domain .de und solche in deutscher Sprache bevorzugt, wenn der Nutzer die deutsche Spracheinstellung gewählt hat oder sich durch eine deutsche IP-Adresse seines Computers als in Deutschland ansässig ausgewiesen hat.

Über diese vier Bereiche hinaus kann das Nutzerverhalten bzw. die Klickhäufigkeit der Nutzer eine Rolle spielen. Wird ein Suchergebnis z.B. häufig angeklickt, so kann dies ein Indiz für die Suchmaschine sein, dass die Inhalte der Seite für viele Suchende relevant sind. Bei einer neuen Suche kann dem Suchergebnis dadurch eine höhere Relevanz zugeschrieben werden, so dass das Suchergebnis möglicherweise ein höheres Ranking bekommt. Suchmaschinenanbieter versuchen laufend, das Ranking zu verbessern, um dem Nutzer die relevantesten Ergebnisse anzeigen zu können. Die Suchmaschine Google etwa hat in 2011/2012 über 500 Änderungen an ihrem Algorithmus durchgeführt. Der Algorithmus wurde durchschnittlich also fast zwei Mal täglich angepasst und verbessert.

Der PageRank

Der PageRank-Algorithmus wurde von Larry Page (daher der Name PageRank) und Sergey Brin, den beiden Gründern von Google, entwickelt. Mit diesem mathematischen Verfahren (Algorithmus) werden Dokumente bewertet und gewichtet. Es nimmt maßgeblich Einfluss auf die Reihenfolge, nach der die Suchergebnisse bei Google aufgelistet werden.

Der PageRank-Algorithmus wertet mehr als 200 Parameter aus. Einer der wichtigsten Parameter ist die Verlinkung; anstatt aber einfach die Anzahl der Links zu zählen, interpretiert der PageRank-Algorithmus den Wert eines Links. Jede Seite besitzt dabei ein Gewicht, das umso größer ist, je mehr Seiten (mit möglichst hohem Eigengewicht) auf diese Seite verlinken. Zur Ermittlung der Wichtigkeit einer Seite nutzt die Google-Technologie damit die kollektive Intelligenz des Internet und bewertet das als wichtig, was die Gesamtheit der Nutzer als wichtig ansieht. Google analysiert darüber hinaus auch den jeweiligen Inhalt der Seiten. Dabei wird nicht nur der Text einer Seite berücksichtigt, sondern auch Faktoren wie Schriftarten, Unterteilungen und die Position von Wörtern.