Dein wichtigster Touchpoint zur Digitalbranche.
Dein wichtigster Touchpoint zur Digitalbranche.
E-Commerce
50 Prozent vorhersagbar: Online-Shops wissen schon im Voraus, was der Kunde kauft

50 Prozent vorhersagbar: Online-Shops wissen schon im Voraus, was der Kunde kauft

Ein Gastbeitrag von Michael Friedmann | 09.11.15

Michael Friedmann von Yoochoose erklärt, welche Technologie der E-Commerce braucht, um Kaufentscheidungen vorherzusagen und Personalisierung zu ermöglichen.

Das Kaufverhalten von Kunden vorhersagen zu können, gibt Online-Shops große Macht. Auf Basis von Analysetools sind sie heute in der Lage, jede zweite Kaufentscheidung zu prognostizieren. Mit diesem Wissen wird es möglich, das User-Verhalten zu beeinflussen und gezielte Empfehlungen vorzunehmen. Die Konversionsraten steigen damit um bis zu 25 Prozent. Das gelingt Shopbetreibern mit der richtigen Technologie und durch speziell entwickelte Algorithmen. Wie aber muss ein Personalisierungssystem beschaffen sein, um die korrekten Prognosen zu liefern, die mehr Verkäufe überhaupt erst ermöglichen?

Technologie für smarte Kaufempfehlungen

Nie war Personalisierung wichtiger als heute – und nie war sie für Online-Shops einfacher. Besonders bei regelmäßigen Einkäufen wie etwa im Bereich Lebensmittel, Drogerieartikel oder anderer Konsumgüter sind durch Analyse und Auswertung des User-Verhaltens klare Vorhersagen über den nächsten Kaufzeitpunkt möglich. Immer höher wird die Transparenz auch in anderen Kategorien wie Mode, Elektronik oder bei Reisen. Mit Big Data Analytics wird hier deutlich, ob und was die Kunden mögen und kaufen. Auf dieser Grundlage ist es zunehmend leichter, gezielte Angebote zu machen, dem User damit einen sanften Schubs zu geben und eine höhere Conversion Rate herbeizuführen.

Jede zweite Kaufentscheidung ist vorhersagbar

Dass heute bereits rund 50 Prozent aller Kaufentscheidungen im E-Commerce vorhergesagt werden können, hat die ACM Recsys Challenge 2015 gezeigt. Rund 500 Teams aus 49 Ländern hatten die Herausforderung angenommen, auf Basis des Datensatzes eines Online-Shops mit Informationen zu bisherigem Nutzerverhalten zu berechnen, ob ein Kunde bei diesem Besuch etwas kaufen wird und was er schlussendlich erwirbt. Aber wie ist so etwas möglich – und kann dies auch jeder Shopbetreiber für seinen Shop selbst durchführen? Der Weg zu personalisierten Inhalten und der daraus folgenden Produktempfehlung oder der Sortierung von Suchergebnissen ist in jedem Fall mehrstufig.

Trackingcode und Datenbanken

Zuerst gilt es, genügend Daten zu sammeln: Möglichst umfangreich werden alle Aktionen eines Besuchers mithilfe eines Trackingcodes erfasst. Daraus resultiert ein Klick-Stream, der jede Interaktion mit Produkten und Shopelementen festhält. Von welchem Standort und von welchem Gerät greift der Kunde auf die Plattform zu? Wann hat er die Produktdetailseite aufgerufen, wann hat er das Produkt in den Warenkorb gelegt oder wieder entfernt? Und welche Produkte hat er am Ende zu welchem Preis gekauft? Hat er sich ein Produktvideo oder die dazugehörigen Bewertungen angesehen? Solche Informationen werden  festgehalten – bei voller Wahrung der Privatsphäre. Persönlichen Daten müssen nicht erfasst werden – eine eindeutige Session-ID genügt.

Bei größeren Shops können auf diese Weise schnell Millionen von Datensätzen im Monat anfallen. . Bei der Speicherung haben sich NoSQL-Datenbanken immer mehr durchgesetzt. Diese helfen, auch riesige Datenmengen schnell und kostengünstig zu sammeln. Sie ermöglichen damit erst eine lange Speicherdauer, um später etwa Vergleichsdaten aus dem Vorjahr zur Analyse heranzuziehen zu können. Der Datenschatz aus der Vergangenheit ist der Treibstoff für das Machine Learning, um einen Blick in die Zukunft werfen zu können.

Zentraler Vorgang Feature Engineering

Um präzise Aussagen über Kaufentscheidungen treffen zu können, reichen klassische Monitoring-Tools nicht aus. Entscheidend ist vielmehr der Zwischenschritt des sogenannten Feature Engineering. Dabei werden auf Grundlage der erfassten Daten genau die Features definiert, die für genaue Prognosen relevant sind. Das können im ersten Schritt mehrere Hundert sein – zum Beispiel der Wochentag oder die Uhrzeit des Besuchs. Zeitabstände zwischen zwei Aktionen und die daraus zu entnehmende Information, wie lang sich der Besucher eine Produktdetailseite angesehen hat, können als ein Feature definiert werden. Auch Kombinationen verschiedener Aktionen sind oft sinnvoll. Dazu gehören Fragen, ob der User eine Produktdetailseite mehrmals während einer Session besucht, ob er diese am Anfang oder Ende angesehen hat oder ob er ein Produkt dem Warenkorb hinzugefügt, es anschließend aber wieder entfernt hat.

Zehn bis zwölf Features genügen

Die Herausforderung für Shopbetreiber liegt darin, die wirklich relevanten Features zu identifizieren. Dazu müssen diese aus den zahlreichen evaluierten Rohdaten herausgefiltert werden – liefern sie das gewünschte Ergebnis oder nicht? Prinzipiell sind mehrere Tausend Kombinationen aus Features möglich. Daher braucht es intelligente Verfahren, um aus den erfassten Nutzerdaten genaue Prognosen abzuleiten. Am Ende werden in der Regel nur rund ein Dutzend Features für die Prognose verwendet. Damit ließ sich zum Beispiel im Rahmen der Recsys Challenge die Kaufabsicht eines Users mit einer 50-prozentigen Trefferquote ablesen.

Technologische Herausforderungen und Lösungen

Die Überprüfung, welche Features die relevanten sind, muss nur einmal durchgeführt werden. Jede weitere Berechnung konkreter Produktempfehlungen oder Personalisierungsregeln erfolgt anschließend in Millisekunden. Dazu werden die Prognosemodelle in einer schnellen Datenbank abgespeichert – immer häufiger finden dabei die äußerst schnellen In-Memory Datenbanken Anwendung. Während ein Besucher im Shop unterwegs ist, werden seine Aktionen aus dem Tracking mit den Prognosen verglichen und damit dann passende Empfehlungen angezeigt, die Reihenfolge der Suchergebnisse beeinflusst oder sogar personalisierte Webseiten zusammengestellt. Filterfunktionen können beim Feintuning helfen und liefern somit noch genauere Ergebnisse. Immer empfiehlt es sich, die Features und Einstellungen individuell auf den eigenen Bedarf hin zuzuschneiden und so den Nutzen zu erhöhen.

Software as a Service als Lösung

Für effektive Personalisierung ist  der Betrieb von NoSQL- oder In-Memory-Datenbanken in Verbindung mit leistungsfähigen Servern nötig, die entsprechende Berechnungen durchführen. Hier setzen Cloud- basierte Software-as-a-Service-Lösungen (SaaS) an: Betreiber von Online-Shops erhalten damit die entsprechenden Ergebnisse, ohne dass sie sich um Datenbanken und Server kümmern müssen. Auch die Datenerfassung- und berechnung läuft weitgehend automatisiert ab. Shopbetreibern wird eine API zur Verfügung gestellt, mit der sie ein Tracking aufsetzen und so personalisierte Empfehlungen und Suchanfragen abrufen können. Damit ist es grundsätzlich für jeden Webshop möglich, von Personalisierung zu profitieren.

Kommentare aus der Community

Michael am 11.11.2015 um 19:15 Uhr

Hallo Christoph,

Danke, für das Feedback! Auch wir sehen hier ein Trend, mit ein Grund warum ich den Artikel geschrieben habe ;) !
Der Punkt ist hier, das man sich diese 10-12 Feature hart erarbeiten muss und dass nur genau dieses Set von Features das gewünschte – gute – Ergebnis liefert. Oft ist es notwendig hunderte von Features in verschiedenen Kombinationen zueinander auszuprobieren und auf Signifikanz zu testen bevor man das richtige Set findet. Wenn man zum Beispiel 10 weitere hinzunimmt – die für sich ganz gute Ergebnisse liefern – wird das Ergebnis meist wieder schlechter, weil man sich mit jedem weiteren Feature auch ein „Rauschen“ dazu holt. Wen das Thema interessiert, der findet auf der Seite der RecSys Challenge 2015 (im Artikel ist der Link) zahlreiche Papers welche das Vorgehen ausführlich erklären und auch anhand des Datensatzes eines Online-Händlers die Ergebnisse belegen.
Dort finden sich auch weitere Details, die in der Kürze des Artikels nicht zu erklären waren, wie z.B. dass die Wahrscheinlichkeit der Vorhersage natürlich auch mit zunehmender Session-Länge steigt und nach einem Klick noch keine 50% erreicht sind, sondern eben erst gegen Ende der Session. Nicht zu vergessen dass 50% genügend Spiel lässt um sich mit unorthodoxen Verhalten der Vorhersage zu entziehen. Aber – das zeigt auch unsere Erfahrung – der Mensch ist ein Herdentier und verhält sich unter ähnlichen Umständen meist ähnlich….
Viele Grüße
Michael (Autor)

Antworten
PrestaShop Agentur Browserwerk | Christoph am 10.11.2015 um 16:11 Uhr

Hallo Michael,
sehr interessant das Thema! Das scheint momentan ein richtiger Trend zu sein: KI und Machine-Learning in Kombination mit dem Dauerrenner Bigdata ;)

Was ich mich beim Lesen gefragt habe: reichen denn diese 10-12 Features aus, um eine definierte Submenge der Gesamtmenge it 50% Klassifizieren zu können? Das fände ich sehr interessant, wenn wir beim Shoppen alle ähnich vorgingen würden, weil ist ja zum Teil auch sehr mit subjektiven Empfindungen geprägt.

Abgesehen davon, dass ich zutiefst beeindruckt bin: erschreckend, dass sowas dann überhaupt möglich ist!

Viele Grüße
Christoph

Antworten
Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*