La couche mémoire est open source. Les retailers conservent les tickets de caisse.

Un système de mémoire augmenté par graphe pour les agents IA, publié sur arXiv en mars 2026, améliore le rappel conversationnel à long terme de 4,2 points par rapport à une base RAG optimisée sur le benchmark LoCoMo. La couche mémoire que les stacks de personnalisation retail attendaient est arrivée ; la base de données client qui les sous-tend est conçue pour stocker des transactions, pas des épisodes.

L’infrastructure de mémoire persistante pour les agents est arrivée avant même que la base de données client capable de l’alimenter n’existe. Un système augmenté par graphe appelé GAAMA, publié sur arXiv en mars 2026, améliore le rappel conversationnel à long terme sur le benchmark LoCoMo de 4,2 points par rapport à une base RAG optimisée, le comparateur le plus solide de l’évaluation. Cet écart se maintient sur les requêtes multisaut, temporelles et de bon sens — les catégories où les stacks à récupération augmentée ont historiquement échoué face aux clients posant des questions complexes ; pour les questions à saut unique, qui constituent la majorité du benchmark, l’avantage de GAAMA sur RAG est négligeable. Les stacks de personnalisation retail ont été conçus pour reconnaître un client via un identifiant fidélité et proposer une action prioritaire à partir d’un fichier transactionnel. Rien dans ce fichier ne ressemble à un épisode, une réflexion ou un nœud conceptuel.

La conception du système révèle ce qui manque dans la base de données du retailer. GAAMA conserve les tours de conversation bruts aux côtés d’assertions distillées par LLM et de réflexions inter-sessions, avec des nœuds conceptuels comme pottery_hobby ou camping_trip qui tracent des chemins de traversée entre les sujets. La récupération combine un PageRank personnalisé sensible aux arêtes avec une similarité cosinus. Une couche de réparation appelée GRAFT insère les faits manquants lorsque la suffisance de récupération passe sous un seuil. Le score de 79,1 % sur LoCoMo-10 est un chiffre de benchmark, pas un chiffre de déploiement ; la vraie affirmation est que les agents peuvent maintenir un état significatif entre les sessions sans gonfler en méga-hubs, ce que les graphes de connaissances accumulent lorsqu’ils se centrent sur des entités. Le code est librement disponible.

La base de données client d’un retailer stocke des lignes de grand livre, pas des épisodes. Les CDP unifient les transactions en point de vente, les interactions fidélité, les clics e-commerce et l’activité applicative en un profil à 360 degrés, et la résolution d’identité améliore les interactions clients reconnues de 30 à 50 % selon le rapport retail de CDP.com. Ce gain porte sur l’attribution, pas sur ce que l’agent peut se rappeler du client qu’il vient d’identifier. Les sessions anonymes démarrent toujours à froid. Même les clients connectés projettent une ombre transactionnelle sur laquelle aucun LLM ne peut réfléchir sans avoir d’abord été invité à convertir ces lignes en quelque chose de narrativement cohérent. Cette conversion n’est pas gratuite, et la plupart des retailers ne l’ont pas effectuée.

Le goulot d’étranglement a migré du modèle vers le schéma.

Un contre-argument raisonnable : la mémoire persistante des agents n’est pas pertinente pour le retail tant que la surface d’interaction n’est pas conversationnelle, et la majorité du retail se fait encore via une barre de recherche et un bouton de paiement. La version honnête de cette objection tient. GAAMA apprend à partir du dialogue, et un client qui ajoute silencieusement un article à son panier n’écrit aucun épisode digne d’être conservé. La thèse ne s’effondre que si le commerce agentique s’enlise — si les achats médiés par le chat restent une fraction du panier et que les interfaces vocales ne quittent jamais la cuisine. L’adhésion récente d’Amazon à l’Universal Commerce Protocol et la fermeture de TikTok Shop par fil de commentaires que nous avons documentée cette semaine indiquent l’inverse. Les retailers dont les schémas de fidélité ne stockent aucun épisode arriveront à la surface conversationnelle avec des agents qui ne se souviennent de rien.

L’industrie des CDP devra s’élargir de la résolution d’identité à la persistance des épisodes, car l’identification n’était que la moitié facile du problème. La moitié difficile consiste à préserver pourquoi la cliente a posé les questions qu’elle a posées la dernière fois qu’elle est venue. Convertir cela en quelque chose qu’un agent peut reprendre sans tout redemander, c’est là que le travail sur le schéma commence. Un épisode dans ce sens n’est ni un enregistrement de transaction ni un historique de clics, mais un enregistrement d’intention : une requête et le langage qui l’entoure, un brief stylistique offert par chat, un article retourné avec la raison exprimée. Vertex AI Memory Bank, désormais en préversion publique chez Google, est un indice productisé parmi d’autres ; mem0.ai et des prestataires similaires ont commencé à livrer une infrastructure comparable. Le fournisseur de mémoire qui obtiendra le droit de lire l’enregistrement client, et la quantité de contenu épisodique que cet enregistrement pourra livrer à l’agent qui le consulte, déterminera le prochain cycle d’achats CDP.

Le plus important achat technologique retail de 2026 ne sera pas un moteur de personnalisation. Les retailers qui liront 2026 comme une année de personnalisation achèteront des améliorations de moteur de classement quoi qu’il arrive. La lecture plus difficile est que 2026 est une année mémoire, où les dépenses qui comptent portent sur le stockage des épisodes et sur le schéma qui décide de ce qui en constitue un. Le prix de la confusion entre les deux sera payé la prochaine fois qu’un client reviendra via un agent — et que l’agent n’aura rien à lui répondre.