Cadence schlug den Empfehlungsalgorithmus dort, wo Warenkörbe sich auffüllen
Walmarts CASE-Studie zeigt, dass kalendarische Kaufrhythmen etwa vierzig Prozent der Vorhersageleistung beim nächsten Warenkorb ausmachen – eine stille Abrechnung mit den besuchsreihenfolgebasierten Empfehlungssystemen, auf denen die meisten Modehändler im Beauty-, Basics- und Nachfüllsegment noch immer laufen.
Sir John Crabstone
Die nützlichste Zahl in der Retail-Personalisierung dieses Monats lautet 0,2382. Es ist der Precision@5-Wert von Walmarts CASE-Modell auf Instacart ohne das temporale Faltungsnetz; das vollständige Modell erreicht 0,3989. Die einzige Komponente, die erfasst, wann ein Nutzer kauft, trägt etwa vierzig Prozent des diskriminativen Gewichts. Die meisten Empfehlungssysteme von Modehändlern enthalten diese Komponente überhaupt nicht.
CASE (Cadence-Aware Set Encoding) argumentiert, dass in Nachfüllkategorien die Kalenderzeit das dominante Signal ist – und dass die meisten Produktivempfehlungssysteme schlicht das Falsche kodieren. Die Formulierung im Paper ist präzise. Besuchsreihenfolge-Architekturen – die BERT-artigen Transformer, die zum Industriestandard geworden sind – behandeln Warenkörbe an den Tagen 1, 8 und 36 identisch wie Warenkörbe an den Tagen 1, 2 und 3. Sie kennen die Reihenfolge; den Abstand können sie nicht sehen. Dabei ist der Abstand entscheidend. Ein wöchentlicher Lebensmitteleinkauf und eine quartalsweise Parfümnachfüllung hinterlassen unter der Besuchsreihenfolge dasselbe Muster; nur der Kalender unterscheidet sie.
Walmart Global Tech hat CASE gegen den Produktionsstack getestet und Verbesserungen von 8,63 Prozent bei Precision@5, 9,90 Prozent bei Recall@5 und 10,46 Prozent bei NDCG@5 über eine Nutzerbasis in zweistelliger Millionenhöhe gemeldet. Diese Zahlen zeigen, was ein betreibender Händler für ein Modell bezahlt hat, das keinen Kalender lesen konnte; jeder Händler, der noch immer ein besuchsreihenfolgebasiertes Empfehlungssystem betreibt, zahlt diesen Preis gerade jetzt.
Die Studie untersucht den Lebensmittelhandel, doch die Arithmetik gilt für jedes Segment, in dem ein Artikel zur Neige geht. Das betrifft mehr des Kleiderschranks, als Einkäufer zugeben. Mascara, Reinigungsprodukte, Parfüm-Nachfüller, Feinstrumpfhosen, Basics, Socken in Multipack-Form – allesamt Nachfüllkategorien mit Kaufrhythmen, die genauso stabil sind wie Walmarts Milch und Waschmittel. Eine Kundin, die alle neun Wochen einen Charlotte Tilbury Mascara kauft, sendet das stärkste Signal für ihre nächste Bestellung. Das kollaborative Filtermodell empfiehlt ihr einen neuen Lippenstift, weil jemand mit ähnlichen Embeddings kürzlich einen gekauft hat.
Die Personalisierungsbranche hat ein Jahrzehnt damit verbracht, Modehändlern Cross-Selling- und Entdeckungsmodelle zu verkaufen. Cross-Selling ist der Teil des Warenkorbs, bei dem die Datenlage am dünnsten und die Margen am niedrigsten sind. Nachfüllkäufe verlaufen genau andersherum: dichte Kaufhistorie, klarer Rhythmus, Konversionen, die so gut wie nichts kosten. Die Nachfüllkundin ist zudem diejenige mit den niedrigsten Akquisekosten; sie kauft bereits, sie folgt bereits einem Takt. Walmarts Steigerungswerte zeigen, was diese Diskrepanz in den Kategorien kostet, die die meisten Händler als zu banal für tiefgehende Analysen betrachten.
Die Kritik im CASE-Paper ist präzise. Das dominante Element der Folgekorbvorhersage ist nicht das Item-Embedding, nicht die Cross-Item-Attention, nicht der User-Tower. Es ist der Kalender. Das Entfernen der temporalen Faltungen kostete mehr als das Entfernen jedes anderen Moduls. Der Warenkorb hat eine Uhr – und die meisten Händler betreiben Modelle, die keine Zeit lesen können.
Die Empfehlungssysteme der Modebranche wurden für eine Garderobe gebaut, die es so nicht gibt.
Die Kundin, die am häufigsten einkauft, ist diejenige, die das Entdeckungsmodell am wenigsten kennt. Die Marge in ihrem Warenkorb ist kein Forschungsproblem; sie steht seit Jahren auf den Kassenbons. Die Frage ist nur, welcher Händler sie als Erster liest.