Eines der ersten Google Patente formulierte die These, dass stark verlinkte Webseiten relevanter sind, als weniger verlinkte Webseiten. Auf dieser These basierte der erste Google Algorithmus. Damit wurde 1998 eine Revolution im Internet losgestoßen und die Grundlage aller modernen Suchmaschinen gelegt.

Was zwischen unterschiedlichen Webseiten gilt, gilt aber auch innerhalb einer Seite. Online-Redakteure, Designer und Webmaster verlinken die Unterseiten der eigene Website unterschiedlich stark. Wieso welche Unterseite stärker verlinkt ist bleibt verborgen. Genauso wie die Frage, ob die stark verlinkten Seiten von besonderem Interesse für die Nutzer sind. Gleichzeitig senden die Designer und Redaktuere hierdurch ein bewusstes oder unbewusstes Signal an Google: „schau‘ her, diese Seite ist besonders relevant, denn viele andere Seiten verweisen hierauf. Bitte bewerte sie in den Suchergebnissen höher!“

Bislang blieb diese innere Wertung meist im Verborgenen – unsichtbar für Redakteure und User.

Data Beauty ermöglicht es, die Welt mit den Augen des Google Algorithmus zu betrachten

Indem die unsichtbare Struktur von Webseiten sichtbar gemacht wird, erfolgt ein Transfer der technischen Algorithmus-Welt hin zu einer für Menschen verständlichen, visuellen Darstellung. In dieser Translation der digitalen Welt werden die (unbewussten) Wertungen und Gewichtungen von verantwortlichen Webredakteuren, Designern und Webmastern sichtbar.

Projekt Datastädte

Im Rahmen des Projekts „Datastädte“ erfassen wir die digitale Struktur der Webseiten europäischer Hauptstädte und machen sie sichtbar. Kulturelle Unterschiede und landesspezifische politische Parameter treten selbst in der technischen Struktur zu Tage. Deutlich zeugen einzelne Webseiten von der spezifischen Ausgangslage der jeweiligen Stadt und den lokalen Schwerpunkten.

Methodik

In einem ersten Schritt werden die ausgesuchten Webseiten “gecrawlt”, das heißt jede einzelne Unterseite und jeder Link wird durch ein Programm aufgerufen und in einer Datenbank erfasst.

Die Datenbank wird anhand gewisser Parameter gefiltert – Artefakte werden entfernt und fehlerhafte Links gelöscht. Die so gewonnenen Daten werden anschließend maschinell organisiert und ein erstes Mal visualisiert – jede Seite wird als Punkt dargestellt, jede Verlinkung als Linie. Unterseiten, auf die viele Links zeigen, werden stärker gewichtet und als größere Kreise dargestellt, eingehende und ausgehende Links separat gewertet.

Anschließend laufen mathematische Algorithmen wie Fruchterman/Reingold oder ForceAtlas2 mehrere hundert bis tausend mal über die gewonnene “Punktewolke”, bis sich eine gewichtete, optimale Raumverteilung ergibt.

Hierbei bilden sich sogenannte “Cluster” heraus – Unterseiten gruppieren sich beieinander, die auf Grund der Linkstruktur eng miteinander verbunden sind (beispielsweise bestimmte Menüpunkte oder Themencluster). Andere Inhalte driften als Inseln heraus, wenn sie vom Zentrum der Website nur wenig verlinkt sind.

Zum Schluss erfolgt die Farbgebung anhand berechneter Parameter, beispielsweise des PageRanks oder des Clusterkoeffizienten, der die „Cliquenbildung“ innerhalb eines Netzwerks misst.

Ergebnis

Das Ergebnis ist visuell faszinierend. Es bilden sich Sternenwolken, Quallen, Spinnennetze, Kometen und andere Gebilde. Gemeinsam ist einzig der Netzwerkcharakter.

Data Beauty greift dabei nicht in die visuelle Form ein. Diese ergibt sich einzig aus der Website selbst. Bei sehr umfangreichen Seiten wird aber manchmal ein Teil der kleinsten Seiten herausgefiltert, um nicht nur eine einfarbige große Masse darzustellen.