Dein wichtigster Touchpoint zur Digitalbranche.
Dein wichtigster Touchpoint zur Digitalbranche.
Social Media Marketing
Aufschlussreicher Blick ins bestgehütete Zuckerberg-Geheimnis: So funktioniert der Facebook Algorithmus

Aufschlussreicher Blick ins bestgehütete Zuckerberg-Geheimnis: So funktioniert der Facebook Algorithmus

Tina Bauer | 10.01.16

Ein Buch mit sieben Siegeln - dass hinter dem Newsfeed ein starker Algorithmus steht, ist bekannt. Was bisher nicht bekannt war, sind sein Aufbau und die Funktionsweise.

Das Geheimnis des Facebook-Algorithmus ist so gut beschützt wie Area 51. Die Nachrichten im Newsfeed werden vorselektiert und dem User aufgrund bestimmter Präferenzen ausgespielt. Doch wie der Algorithmus entwickelt, warum und wie er regelmäßig verbessert wird und wer das entscheidet, weiß außerhalb der blauen Mauern in Menlo Park keiner so genau. Will Oremus, Redakteur bei Slate, wollte dem Mysterium einmal auf den Grund gehen, weshalb er sich im Facebook Headquarter mit dem verantwortlichen Team des Newsfeeds getroffen und ihm auf den Zahn gefühlt hat.

Ein Blick hinter die Kulissen 

Facebook ist das einflussreichste soziale Netzwerk weltweit und hat sich für viele Internetnutzer zur Newsplattform und Anlaufstelle Nummer eins entwickelt. Doch mit steigender Popularität (Facebook hat täglich über eine Milliarde User) ist auch der Newsfeed immens gewachsen und der durchschnittliche User sähe sich wöchentlich mit mehr als 1.500 Statusupdates konfrontiert, die er selbst gar nicht selektieren könnte, würde der Algorithmus hier nicht Vorarbeit leisten. Er rankt die Beiträge nach den individuellen Interessen jedes Users und liegt damit oft schon ganz richtig. Beim Treffen mit dem Team, das den Algorithmus programmiert, bekam Oremus Einblicke in die Grenzen von Machine Learning, die Fallstricke datengetriebener Entscheidungen und die Schritte, die Facebook zunehmend unternimmt, um an Feedback von echten Menschen zu gelangen.

Blick in das Facebook Headquarter in Menlo Park © Flickr / Christopher Michel, CC BY 2.0
Blick in das Facebook Headquarter in Menlo Park © Flickr / Christopher Michel, CC BY 2.0

Viele Teile ergeben ein großes Ganzes

Für einige Leser sicherlich überraschend: DEN Facebook-Algorithmus gibt es nicht – oder wenigstens nicht in der Form. Denn für die Gestaltung des Newsfeed ist ein ganzes Set an Algorithmen – mehrere hundert an der Zahl – zuständig, das zusammengefasst ein riesen Masterpiece ergibt. Facebook arbeitet an einer perfekten Voraussage darüber, welche Inhalte jedem einzelnen User gefallen und auf welche er verzichten könnte, um den Content nach Relevanz auszuspielen. Für diese umfangreiche Aufgabe gibt es verschiedene Algorithmen, von denen jeder einen anderen Zuständigkeitsbereich hat.

Um die Posts im Newsfeed in einem ersten Schritt grundsätzlich zu sortieren, nutzt Facebook etwa einen Sortieralgorithmus. Das Team um Tom Alison, Director of Engineering, trägt dafür Sorge, ein System zu entwickeln, das dazu in der Lage ist, jeden Facebook Post mit einem numerischen Wert zu versehen, der sich an den Präferenzen der einzelnen Nutzer der Plattform orientiert. Das ist der schwierige Teil – die Relevanz jedes erdenklichen Posts für jeden User zu bestimmen und seinen Newsfeed auf diese Weise zu gestalten, so dass er keine Dinge zu sehen bekommt, die ihn nicht interessieren.

Interessen-Prognose: Wie kann der Algorithmus Vorhersagen über die Vorlieben eines Users treffen?

Woher weiß aber der Algorithmus, was der User sehen will und was nicht? Metal Fans wollen sicher keine Statusupdates von Helene Fischer Fans sehen und umgekehrt. Zur Lösung dieses Problems ist ein Prognosealgorithmus (Prediction Algorithm) zuständig. Je länger du dich auf Facebook aufhältst und mit Statusupdates und Accounts interagierst, über desto mehr Daten verfügt das Netzwerk, so dass der Algorithmus eine Grundlage hat, um Vorhersagen treffen zu können. Alison vergleicht dieses Vorgehen sehr aufschlussreich mit Sportwetten: Um Sportwetten im großen Stil gewinnen zu können, oder zumindest die Wahrscheinlichkeit zu erhöhen, sollte man etwa einen Blick in historische Daten über Gewinne und Verluste, einzelne Spieler,aktuelle  Verletzungen und das Verhältnis zwischen Heim- und Auswärtsgewinne werfen. Sogar Variablen wie die Länge der Anreise können in die Vorhersagen mit einfließen. Das Gleiche macht Facebook, wenn es voraussagen muss, ob du einen Post magst oder nicht. Bloß auf Grundlage mehrerer hundert Variablen.

Der Newsfeed-Algorithmus sagt allerdings nicht nur voraus, ob du einen Post likest, er trifft Voraussagen über dein gesamtes Verhalten: Ob du klickst, kommentierst, teilst, ihn ausblendest oder als Spam markierst. Er wird jede Möglichkeit mit einem Post zu interagieren vorhersagen und diese zu einem großen Ganzen zusammenfügen, um am Schluss einen Relevancy Score zu ermitteln. Sobald der Score feststeht, können die Beiträge in Reihenfolge gebracht werden. Diese Arbeit erledigt der Newsfeed-Algorithmus binnen Bruchteilen von Sekunden. Der Post also, der beim Öffnen von Facebook an erster Stelle steht, hat sich auf Grundlage deiner Vorlieben und den Voraussagen des Algorithmus gegen tausende andere an erster Stelle durchgesetzt und wird von Facebook als am relevantesten eingestuft.

Interaktion ≠ Interesse : Warum Interaktion keine passende Metrik ist

Dass die Einschätzungen auch häufig nicht stimmen, liegt an Faktoren, die nicht vorhersehbar sind, denn Menschen sind auf beiden Seiten für das Ergebnis verantwortlich. Früher, noch bevor es den Like-Button gab, hat der Prognosealgorithmus die Interaktionen ansich gemessen, denn es ist ja davon auszugehen, dass ein Post einen Nerv beim User getroffen hat, wenn er mit ihm interagiert. Allerdings hat sich dieses Vorgehen als falsch herausgestellt: Interaktionen spiegeln auch heute nicht zwangsläufig die wahren Interessen wider. Was, wenn du auf einen Link klickst, dich der Inhalt aber enttäuscht? Auch klicken User häufig auf den Like-Button, obwohl sie den Inhalt nicht wirklich gut finden und so fort. Würde es danach gehen, stünde in kurzer Zeit Viralität über Qualität und die Plattform wäre schnell langweilig.

© K.C. | fotolia.de
© K.C. | fotolia.de

Sie erkannten, dass das Ziel Relevanz heißen musste

Schon zu Beginn haben Facebook-Nutzer nicht einfach alle Inhalte in chronologischer Reihenfolge von all ihren Freunden gesehen. Damals siebte ein früher Algorithmus den Newsfeed danach aus, wie wahrscheinlich es war, dass der Post dein Interesse weckt. Maßgebliche Kriterien dafür waren etwa die Anzahl deiner Freunde, die im Post erwähnt wurden und wie aktuell das Statusupdate war. Dann führte Facebook den Like-Button ein, aber nicht aus altruistischen Gründen, sondern um besser messen zu können, was einem Nutzer gefällt. Die Engagement Metrik war geboren. Das war die Zeit, als auch Publisher und Advertiser die Plattform für sich entdeckten. Allmählich bekam man ein Gefühl für virale Posts und wusste nach kurzer Zeit, welche Worte oder CTAs man benutzen musste, um möglichst viele Likes zu kassieren – und damit in den Feeds oben zu bleiben. Auch zu dieser Zeit kamen die Entwickler auf die Idee, dass Klicks und Likes nicht ausreichten, um Relevanz zu determinieren. Hier zeigt sich sehr deutlich, dass Menschen für die Programmierung verantwortlich sind, während der Algorithmus nur macht, was ihm aufgetragen wurde. Wenn das Ergebnis ausbaufähig ist, liegt es eben an den Entwicklern. Und diese erkannten, dass das wirkliche Ziel des Newsfeed-Algorithmus sein muss, ausschließlich relevante Inhalte auszuspielen.

Feed Quality Panel: Der vermenschlichte Newsfeed

Um ausschließlich die relevanten Inhalte ausspielen zu können, müsste das Unternehmen jeden User zu seinen Interessen befragen, um mit diesem Datensatz arbeiten zu können. Da dies aber utopisch ist, wurde der Algorithmus auf subtilere Formen von Verhalten programmiert: Der einfache Klick auf ein Posting kann keine verlässliche Aussage treffen – wohl aber die Zeit, die der User mit dem Lesen nach dem Klick verbringt; auch gibt es sehr große Unterschiede zwischen dem Liken vor und nach dem Lesen eines Posts. Immer wieder ist das Newsfeed Ranking-Team überdies auf menschliche Hilfe angewiesen. So wurde das Newsfeed Quality Panel gegründet (2013) und mehrere hundert Nutzer aus Knoxville eingeladen, ihren Feed täglich zu beurteilen und dem Team Feedback zu geben. Mithilfe dieser tiefgehenden Befragungen wollte das Team fehlenden Puzzleteilen auf den Grund gehen. Denn es gibt durchaus viele Postings, die von hohem Interesse sind, eine Interaktion damit aber ausbleibt. Wie soll der Algorithmus solche Dinge messen? Nun, Facebook könnte die Zeit messen, die ein User mit dem Lesen eines Posts verbringt. Die Zeit also, in der er nicht scrollt. Dennoch kann dann immer noch keine Aussage darüber getroffen werden, ob der User innehält, weil ihm der Inhalt gefällt oder er beispielsweise schockiert ist über das, was er da sieht. Wieder kommen Menschen ins Spiel: Im vergangenen Sommer erweiterte Facebook daher das Knoxville-Team um weltweite Gruppen von Usern, die ihren Newsfeed regelmäßig beurteilen sollten. Seither ist das Feed Quality Panel zum unerlässlichen Werkzeug zur Optimierung des Algorithmus geworden und jeder weitere Optimierungsversuch wird von dem Panel auf Funktionalität getestet sowie mithilfe verschiedenster Metriken beurteilt.

Auf Grundlage der Ergebnisse des Panels führt das soziale Netzwerk andauernd neue Features ein, die dem Nutzer zu einer perfekten Journey verhelfen sollen. Eines dieser Features ist etwa der Ausblende-Button. Facebook betrachtet den Klick in die obere rechte Ecke eines Posts, um ihn auszublenden als extrem starkes Signal an, dass Inhalte nicht gefallen und versucht in Zukunft weniger solcher Statusupdates anzuzeigen. Solche Entwicklungen werden zu allererst in einer Offline-Simulation getestet, in einem zweiten Schritt unter einer kleinen Gruppe von Facebook-Mitarbeitern, dann an einer Usergruppe und erst danach für alle ausgerollt. Dennoch bleibt bei jeder Änderung eine kleine Gruppe an Usern übrig, die diese vorerst nicht zu sehen bekommt, um langfristige Negativ-Effekte der Neuerung besser vermeiden zu können. Vor diesem Hintergrund überrascht es kaum, dass zu jeder Zeit – auch jetzt gerade – dutzende des Einen, des Master-Algorithmus, im Umlauf sind. Facebook hat erkannt, dass der normale User der Schlüssel zur Lösung der Unsicherheiten des Algorithmus ist.

Fließender Übergang von Data Driven zu Data Informed – der Mensch im Mittelpunkt des Algorithmus

Und das Netzwerk breitet seine Tests weiter aus: In den vergangenen sechs Monaten hat Facebook bei ausgewählten Usern einen Test durchgeführt, bei dem sie zwei Postings bewerten sollten, die der Algorithmus im Vorwege für sie gerankt hat. Die Einbindung von Usern und die Grenzen von Machine Learning haben dazu geführt, dass Nutzer ihre Feeds inzwischen weitestgehend selbst feintunen können. Jeder kann jeden abbestellen oder direkt im Post einstellen, dass er weniger solcher Beiträge sehen möchte.

Facebook Newsfeed Optionen
Links: Die Abo-Optionen; Rechts: Ausblende-Optionen (Klick)

So hat das Zuckerberg-Netzwerk im Laufe der Zeit gelernt, dass das Buzzword „Data Driven“ nicht das Mittel der Wahl für die Optimierung des Newsfeed-Algorithmus sein kann und geht mit den Tests an echten Usern hinüber zu einer Data Informed-Betrachtungsweise, die sich für das Netzwerk in der Vergangenheit als Goldgrube erwiesen hat. Auch weiterhin wird Facebook den Newsfeed-Algorithmus optimieren und dabei künftig immer häufiger auf menschliches Feedback zurückgreifen.

Quelle: Slate

Kommentare aus der Community

Gerd Theobald am 14.01.2016 um 14:27 Uhr

M.E. gleicht der Versuch facebooks einem Menschen, der ein Meer mit einem Sieb ausschöpfen will. Die Algorithmen sind doch immer vergangenheitsbezogen. Ein analoges Adhoc Erlebnis kann meine eigenen Interessen spontan beeinflussen, so dass vergangenheitsbezogene Rechenresultate an der aktuellen Realitität vorbeischießen. Ein Individuum kann man nicht als ideelle Entität begreifen, sondern in der konkreten Auseinandersetzung. Daran haperts aber, weil ein soziales Medium immer ein Medium bleibt.

Antworten
Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*