BotMaker: Twitters neue Waffe gegen Spam

Anton Priebe | 21.08.14

Spammer nutzen die Transparenz von Twitter gnadenlos aus - wie es den Entwicklern des Social Networks trotzdem gelingt, dagegen vorzugehen.

Spam ist besonders Twitter ein Dorn im Auge. Gerade mit der Entdeckung, dass bis zu 23 Millionen Bots auf der Plattform unterwegs sind, ist das Thema umso brisanter. Der Kurznachrichtendienst veröffentlichte nun eine Auswertung seines Tools BotMaker, das bereits aktiv für weniger Spam sorgt.

Transparenz hat auch seine Nachteile

Die Programmierer bei Twitter haben es nicht leicht. Die APIs der Entwickler sind öffentlich einsehbar, also wissen die Spammer genau, wie sie vorgehen müssen. Das A und O der Plattform sind außerdem Inhalte in Real-Time. Somit bleibt nicht viel Raum und Zeit für Spam-Detektoren.

Die neu-entwickelte Waffe im Kampf gegen Spammer heißt BotMaker. Sie scannt Milliarden von Nachrichten täglich, erstellt Regeln (firmenintern Bots genannt) und sorgte bislang für einen 40-prozentigen Rückgang der Key Spam Metriken. Die drei Grundpfeiler des Tools sind das Verhindern der Veröffentlichung des Spams an sich, das Löschen der entsprechenden Tweets so schnell wie möglich und die effiziente Analyse von neuen Spam-Methoden.

Die Funktionsweise

Um das System der Plattform zu erhalten, haben die Entwickler eine Kombination aus verschiedenen Programmen geschaffen (siehe Grafik). Dazu gehören laut Raghav Jeyaraman, Tech Lead Anti-Spam Engineering bei Twitter:

Real time (Scarecrow): Scarecrow detects spam in real time and prevents spam content from getting into the system, and it must run with low latency. Being in the synchronous path of all actions enables Scarecrow to deny writes and to challenge suspicious actions with countermeasures like captchas.

Near real time (Sniper): For the spam that gets through Scarecrow’s real time checks, Sniper continuously classifies users and content off the write path. Some machine learning models cannot be evaluated in real time due to the nature of the features that they depend on. These models get evaluated in Sniper. Since Sniper is asynchronous, we can also afford to lookup features that have high latency.

Periodic jobs: Models that have to look at user behavior over extended periods of time and extract features from massive amounts of data can be run periodically in offline jobs since latency is not a constraint. While we do use offline jobs for models that need data over a large time window, doing all spam detection by periodically running offline jobs is neither scalable nor effective.

Damit kann einerseits die Geschwindigkeit von Twitter bewart werden, von der das soziale Netzwerk lebt. Andererseits schafft dies Raum für die Mitarbeiter, um schnell zu reagieren und neue Regeln sowie Modelle für die Anti-Spam Software zu realisieren. Vorher konnte es Stunden oder auch Tage dauern, bis eine effektive Lösung gefunden beziehungsweise übertragen wurde.

Die Analyse

Die Grafik zeigt die Reduzierung des Spams nach Launch von BotMaker. Innerhalb einer Zeitspanne von 30 Tagen ist die Anzahl von verdächtigen Tweets um 55 Prozent gefallen.

Ausführlichere Untersuchungsergebnisse und Code-Beispiele des BotMaker können auf dem Twitter Blog nachgelesen werden.

Quelle: Twitter Blog

Über Anton Priebe

Anton Priebe war von 2013 bis 2019 bei OnlineMarketing.de aktiv. Der studierte Germanist und Soziologe fokussierte sich als Redaktionsleiter auf Technologie, kreative Marketing-Strategien, Conversion-Optimierung und SEO.

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Kommentar

_* Hiermit willige ich in die Verarbeitung meiner angegebenen personenbezogenen Daten für das Kommentieren des Beitrags der Onlinemarketing.de GmbH ein. Mir ist bekannt, dass ich meine Einwilligung jederzeit durch eine formlose E-Mail an info@onlinemarketing.de widerrufen kann. Durch den Widerruf der Einwilligung wird die Rechtmäßigkeit der Verarbeitung, die aufgrund der Einwilligung bis zum Widerruf erfolgt ist, nicht berührt. Weitere Informationen über den Umgang mit Ihren Daten finden Sie in unserer Datenschutzerklärung.

BotMaker: Twitters neue Waffe gegen Spam

Transparenz hat auch seine Nachteile

Die Funktionsweise

Die Analyse

Über 30.000 Subscriber können nicht irren. Melde dich jetzt zu unserem NEWSLETTER an:

Kommentare aus der Community

Über 30.000 Subscriber können nicht irren. Melde dich jetzt zu unserem NEWSLETTER an:

Beliebte Kategorien

Nützlich

OnlineMarketing.de