Les Systèmes de Recommandation Retail ont Atteint leur Plafond de Données il y a des Années

Les recherches sur les lois d'échelle des modèles de recommandation montrent que l'accumulation de données atteint des rendements décroissants bien plus tôt que ne le supposent les retailers, déplaçant l'avantage concurrentiel du volume de données vers l'architecture des modèles.

Les systèmes de recommandation dans le retail atteignent leur plafond de données bien plus tôt que ne le supposent les opérateurs. L’analyse de Meta sur les modèles de taux de clics de type DLRM a révélé que la qualité évolue selon une « loi de puissance plus constante » en fonction de la taille des données, du nombre de paramètres et de la puissance de calcul. L’arithmétique est implacable : chaque multiplication par dix du volume de données d’entraînement produit un gain de précision inférieur au précédent, et la constante représente un plancher d’erreur qu’aucun volume de données ne peut franchir. La mise à l’échelle des paramètres a atteint sa limite en premier : pour l’architecture étudiée, les chercheurs ont conclu qu’elle était « à court de vapeur ». Les retailers de mode qui génèrent quotidiennement des millions d’événements navigation-clic-achat opèrent déjà sur la partie plate de cette courbe, qu’ils l’aient mesuré ou non.

Lorsque le plafond est architectural, la solution est architecturale. Meta l’a démontré directement avec HSTU, un transducteur séquentiel qui traite les actions des utilisateurs comme des tokens dans un cadre génératif. Ce modèle a franchi le plateau paramétrique là où DLRM s’était enlisé. Déployé à 1 500 milliards de paramètres, HSTU a livré une amélioration de 12,4 % lors des tests A/B en ligne. Sur les benchmarks publics, le gain de NDCG a atteint 65,8 %. Aucune augmentation plausible du volume de données d’entraînement n’aurait pu égaler ces gains sous l’ancienne architecture.

La recommandation mode aggrave le problème, car le signal se dégrade plus vite que dans les catégories aux cycles d’achat stables. Un client qui a acheté des chaussures de running il y a six mois en aura probablement de nouveau besoin ; une cliente qui a acheté une robe midi fleurie n’en voudra peut-être plus jamais. La rotation saisonnière, la vitesse des tendances et la nouveauté visuelle raccourcissent toutes la demi-vie des données d’interaction dans l’habillement. Climber, déployé dans le streaming musical où les signaux de consommation se dégradent à des rythmes comparables, s’attaque directement à ce problème : son extraction de séquences multi-échelles traite différents horizons temporels à différentes résolutions. Le gain de production global de 12,19 % qu’il a atteint constitue la première instance documentée d’une mise à l’échelle contrôlée du modèle générant une croissance continue des métriques en ligne sur sa plateforme de déploiement. Lorsque les données se dégradent aussi vite, en accumuler davantage ne peut pas se substituer à une architecture qui s’adapte à cette dégradation.

Le retailer disposant du jeu de données de préférences propriétaires le plus profond dans la mode a déjà expérimenté ce qui se passe lorsque l’architecture ne suit pas le rythme des données qu’elle ingère.

Stitch Fix a bâti toute son activité sur le principe que des données propriétaires de préférences stylistiques créent des rendements cumulatifs. L’entreprise a accumulé plus d’une décennie de retours explicites : notations de coupe, profils de style, raisons de rejet, annotations de stylistes. Selon toute théorie de l’avantage concurrentiel par les données, ce jeu de données aurait dû creuser l’écart concurrentiel avec le temps. Au lieu de cela, l’entreprise a fait état de sept trimestres consécutifs de baisse de chiffre d’affaires en glissement annuel avec une moyenne de 18 %, et une chute de 15 % des clients actifs pour l’exercice fiscal 2024. Plusieurs facteurs ont expliqué ce déclin, mais l’un d’eux s’est distingué par son absence : l’avantage des données n’a pas produit d’effets cumulatifs.

L’argument le plus solide contre cette thèse est que la préférence de mode est personnelle d’une manière qui résiste aux raccourcis architecturaux. Un système de recommandation en démarrage à froid peut faire remonter les meilleures ventes ; seul un jeu de données mature peut prédire qu’une cliente précise veut un pantalon à jambes larges en olive plutôt qu’en marine. C’est vrai dans le sens le plus étroit — le filtrage collaboratif surpasse encore les LLMs dans les contextes riches en données. Mais les travaux récents sur l’apprentissage de représentations dynamiques montrent que les nouveaux utilisateurs et articles peuvent être représentés sans fine-tuning, via une simple passe forward sur les embeddings existants, surpassant les méthodes comparables de 29,5 à 47,5 % dans les scénarios de démarrage à froid. Si l’écart du démarrage à froid se comble en semaines plutôt qu’en années, l’avantage des données constitue une longueur d’avance, non un fossé défensif.

La frontière d’investissement pour la recommandation retail a changé de nature. Le paradigme Foundation-Expert de Meta remplace les modèles de recommandation monolithiques par des experts légers et spécifiques à chaque surface, construits sur une fondation partagée, réduisant les coûts de calcul en centralisant les représentations générales plutôt qu’en réentraînant depuis zéro pour chaque surface de déploiement. Une ligne distincte de recherche sur la mise à l’échelle a atteint plus de cinq fois l’efficacité d’entraînement et vingt et une fois l’efficacité d’inférence grâce à une refonte architecturale seule, accompagnée de gains de 4 % à 8 % sur les métriques de consommation et d’engagement en production. Ce sont des gains qu’aucune augmentation plausible de la collecte de données ne peut égaler. Si ce schéma se confirme, les retailers qui maintiendront des avantages en matière de recommandation seront ceux qui adopteront les avancées architecturales le plus rapidement. La présentation au conseil d’administration qui met en avant le volume de données répond à une question que le domaine a dépassée depuis des années.