Es wurde bereits vielerorts diskutiert, ob für die PageRank-Berechnung
seit der Veröffentlichung der wissenschaftlichen Arbeiten durch Lawrence
Page und Sergey Brin weitere Kriterien als nur die einfache Link-Struktur des
Webs für die Berechnung des PageRanks hinzugezogen wurden. Lawrence Page
selbst skizziert in der Patentschrift zum PageRank-Verfahren die folgenden potentiellen
Einflussfaktoren:
* Die Stärke der Hervorhebung eines Links
* Die Position eines Links innerhalb des Dokuments
* Die Distanz zwischen Webseiten
* Die Bedeutung einer verweisenden Seite
* Die Aktualität einer verweisenden Seite
Die Implementierung dieser weiteren Einflussfaktoren würde zunächst auf bessere Annäherung des Random Surfer Modells an tatsächliches Nutzerverhalten abzielen. Mit der Einbeziehung von Hervorhebung und Position eines Links geht man davon aus, das ein Benutzer nicht völlig wahllos klickt, sondern unabhängig vom Ankertext eher die deutlich erkennbaren und unmittelbar sichtbaren Links verfolgt. Mit der Berücksichtigung der anderen Faktoren könnte Google darüber hinaus eine weit größere Flexibilität in der Bestimmung der Bedeutung eines eingehenden Links für eine Webseite erreichen, als durch die bereits erwähnten Methoden.
Ob einzelne dieser Faktoren tatsächlich in das PageRank-Verfahren implementiert
sind, ist empirisch kaum zu belegen, und soll deshalb an dieser Stelle auch
nicht ausführlich diskutiert werden. Es soll vielmehr erörtert werden,
auf welche Art und Weise weitere Einflussfaktoren in den PageRank-Algorithmus
implementiert werden könnten und welche Möglichkeiten zur Einflussnahme
auf den PageRank seitens Google sich hierdurch ergeben.
Modifizierung des PageRank-Algorithmus
Um weitere Faktoren in das PageRank-Verfahren einfliessen zu lassen, ist der
ursprüngliche PageRank-Algorithmus wiederum zu modifizieren. Da wir davon
ausgehen müssen, dass für die PageRank-Berechnung weiterhin zahlreiche
Iterationen durchgeführt werden, ist hierbei allerdings zu berücksichtigen,
dass im Sinne einer möglichst schnellen PageRank-Berechnung für die
Einbeziehung weiterer Faktoren zusätzliche Datenbank-Zugriffe im Laufe
der Iterationen weitestgehend vermieden werden sollten. Aus diesem Grunde bietet
sich der folgende, modifizierte PageRank-Algorithmus an:
PR(A) = (1-d) + d (PR(T1)×L(T1,A) + ... + PR(Tn)×L(Tn,A))
Hier bei stellt L(Ti,A) eine Bewertung des Links, der von der Seite Ti auf die Seite A zeigt, dar. L(Ti,A) tritt damit an die Stelle der Gewichtung des PageRanks von Seite Ti nach der Anzahl deren ausgehender Links durch den Faktor 1/C(Ti). Der Wert L(Ti,A) würde sich aus mehreren einzelnen Faktoren zusammensetzen, die jedoch nur einmal ermittelt werden müssten und dann vor der eigentlichen PageRank-Berechnung in einen einzigen Wert einfließen. Hierdurch vergrößert sich die Anzahl der Datenbankzugriffe nicht, wobei allerdings angemerkt werden muss, dass durch die hier vorgeschlagene Modifikation des PageRank-Algorithmus im Laufe jeder Iteration bei der Bestimmung jedes einzelnen PageRanks ein Zugriff auf eine wesentlich größere Datenbank zu erfolgen hat, als im Falle des ursprünglichen PageRank-Algorithmus, da nun nicht mehr nur die Bewertung von Seiten (anhand der Anzahl ihrer ausgehenden Links) sondern die Bewertung jedes einzelnen Links in die Berechnung einfließt.
Das Copyright dieser Erläuterung des Google PageRank unterliegt der eFactory GmbH & Co. KG
PageRank und Google sind geschützte Marken der Google Inc., Mountain View CA, USA. Das PageRank Verfahren unterliegt dem US Patent 6,285,999.
Suchmaschinenoptimierung mit osCommerce Shop-System auf Open Source Basis. Nutzen Sie unsere SEO-Module für den osCommerce-Shop, um mit ihrem Shop die Google Top-Positionen zu erreichen und ein dauerhaft stabiles Suchmaschinen-Ranking aufzubauen

