Suchmaschinenmarketing

Googles Knowledge Vault: Das Weltwissen ist nicht genug

Der Knowledge Vault ist da – und zeigt: Google ist besser denn je in der Lage, Web-Content zu verstehen und zu vernetzen.

© Robert Kneschke / Rawpixel - Fotolia.com

© Robert Kneschke /
Rawpixel - Fotolia.com

Die neueste Entwicklung bei Google lässt Wissenschafts- und Marketing-Experten gleichermaßen aufhorchen. Der Knowledge Graph hat einen Nachfolger: den Knowledge Vault. Anstatt semantische Wissensnetze zu weben, gräbt Google sich nun deutlich tiefer in das vorhandene Weltwissen – und hebt die Analyse und Extraktion von Wissen aus Web-Content in komplett neue Sphären. Neben einem wissenschaftlichen Paper besiegelt ein neues Patent die Geburt des Knowledge Vault. Noch ist schwer abzuschätzen, welche Neuerungen auf das Suchmaschinenmarketing zukommen. Erste Einschätzungen lassen aber auf Großes hindeuten.

Knowledge Vault kommt ohne menschlichen Input aus

Die bisherige Wissensdatenbank von Google konnte nur so schnell wachsen wie das Wissen, das Menschen im Web teilen. Im Knowledge Graph wurde vor allem der Bestand an Informationen “aus der Crowd” dokumentiert. Das Magazin ClickThrough spricht in diesem Zusammenhang von einem “human-curated set of third-party sources for information”, aus dem der Knowledge Graph sich zusammensetzt.

Anzeige:

Für Google war dieses menschliche Weltwissen nicht genug – ein Algorithmus zur Automatisierung des Wissenswachstums musste her. “Google is building the largest store of knowledge in human history – and it’s doing so without any human help”, beschreibt NewScientist Tech die neue Generation von Content-Datenbanken. Das bedeutet der Knowledge Vault kommt komplett ohne menschlichen Input aus. “Knowledge Vault is being assembled from content across the internet without human editorial involvement”, stellt Greg Sterling von Search Engine Land fest. Dies eröffnet vielfältige neue Möglichkeiten für Online-Technologien und Services.

Der Knowledge Vault könnte damit die Grundlage sein für “future artificial intelligence applications, machine-to-machine communication, augmented reality, predictive models and virtual assistant use cases”, wie Sterling weiter erklärt. ScienceAlert geht noch etwas tiefer ins Detail über die neuen Fähigkeiten der intelligenten Riesen-Datenbank, die aktuell über 1,6 Milliarden Fakten enthält:

The Knowledge Vault will be the foundation for smartphone and robot intelligence. The algorithm is indiscriminate and will build information equally on places, people, history, science and popular culture. In the future, virtual assistants will be able to use the database to make decisions about what does and does not matter to us. […] Once the Knowledge Vault can interpret objects on sight, it will become integral to real-time information generation.

Valider Content währt am längsten

Die wichtigsten Bestandteile der Datensammlung für den Knowledge Vault hat SEO Südwest zusammengestellt:

Importer: Extrahieren die Daten und bestimmen die zugehörigen Entitäten
Türsteher: Datenbereinigung, Rechtschreibkorrektur, Normalisierungen wie die Entfernung bestimmter Sonderzeichen, Entfernung von Dopplungen, Entfernen unerwünschter Fakten
Build Engine: Baut den Index auf und verwaltet diesen
Fact Repository: Speichert Informationen über Entitäten in Form von Fakten.
Attribute und Werte: Fakten, die mit bestimmten Entitäten verknüpft sind, können besondere Formen haben. Für Helmut Schmidt kann das zum Beispiel das Geburtsdatum sein (23.12.1918)
Tupel: Die Datenstruktur von Fakten kann durch Informationstupel repräsentiert sein, die aus Fakten-ID, Attributen, Werten und einer Objekt-ID bestehen können. Zusätzliche Informationen wie die Quelle des Faktums sind möglich.

Der Knowledge Vault ist dank des Automatisierungs-“Boosts” in der Lage, Korrelationen beziehungsweise Zusammenhänge zwischen den einzelnen Daten oder auch Entitäten (Personen, Orte, Produkte et cetera) aufzuspüren und diese entsprechend zu vernetzen. Science Alert hierzu: “The Knowledge Vault is also going to be able to find correlations that humans would miss by sifting through enormous amounts of information”. Die Bereitstellung von validem Content, also möglichst korrekten Informationen, fördert die Arbeit der Google Bots und die Befütterung des Knowledge Vaults.

Damit beantwortet sich auch die Frage, was Seitenbetreiber in Sachen Suchmaschinenoptimierung tun können, um sich auf die neuen Technologien einzustellen. Brafton liefert ein paar Hinweise in einem Blog Post: “To get traffic and visibility in the first place, content has to offer original, useful information – and Google’s projects seem to indicate this means objectively true facts”. Das heißt, Unternehmen müssen weiterhin darauf setzen, sich mit ihrer Expertise hervorzutun – das geht am besten mit Unique Content.

Datenschutz-Bedenken: Google weiß über uns so viel wie über Elvis

Die oben beschriebene Eigenschaft des Algorithmus, sämtliche Arten von Informationen gleich zu behandeln und in die Datenbank zu integrieren, lässt Sorgen zur Privatsphäre aufkommen. Insbesondere fürchten viele Experten, dass Google nicht Halt macht vor privaten Daten. Ein anschauliches Beispiel dazu kommt von Fabian Suchanek, einem Data Scientist bei Télécom ParisTech:

Behind the scenes, Google doesn’t only have public data. It can also pull in information from Gmail, Google+ and Youtube. You and I are stored in the Knowledge Vault in the same way as Elvis Presley.

Google selbst hat sich nach der Veröffentlichung der ersten Artikel zum Knowledge Vault geäußert: “This system wouldn’t use any of your personal data. Secondly, Knowledge Vault is one of many efforts Google is working on to better understand text and what we’re searching for”, zititert Engadget eine unbekannte Quelle beim Konzern.

Den Knowledge Vault selbst bezeichnete Google gegenüber Search Engine Land nicht als aktiv neu entwickeltes Produkt, sondern als übergreifende Entwicklung im Bereich der Forschung: Google indicated that the “Knowledge Vault” […] is not an active Google product in development. Google also indicated that there are numerous models at the company and elsewhere about building a knowledge base with machines or extracting meaning from text”.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *