Applied AI

L'agent de shopping a rempli le panier. Il aurait dû poser la question.

De nouveaux travaux qui décomposent l'incertitude d'un agent LLM révèlent que le manque le plus coûteux dans une requête de shopping vient souvent du silence du client, et non d'une limite du modèle. Le prochain progrès des agents de shopping réside dans leur capacité à poser la bonne question plutôt qu'à construire avec assurance le mauvais panier.

Un robot assistant-acheteur marque une pause devant un panier de vêtements dépareillés, levant une carte avec un point d'interrogation plutôt que de valider l'achat.

Sir John Crabstone

La chose la plus utile qu’un agent de shopping puisse offrir, c’est une question. De nouveaux travaux décomposent l’incertitude d’un LLM en trois catégories : l’ambiguïté de la requête, les lacunes du modèle, et l’aléatoire de son propre processus d’échantillonnage. Seule la première appartient au client, et seule elle peut la résoudre. L’essentiel de l’ingénierie a porté sur la réponse. La frontière pour les agents de shopping, c’est le moment où ils cessent de répondre et posent une question.

La méthode qui sous-tend cette distinction est antérieure aux agents qui en ont besoin. Pour distinguer un modèle confus d’une requête confuse, des chercheurs reformulent l’entrée de plusieurs façons et observent si les réponses divergent. Lorsqu’elles s’éparpillent, c’est la requête qui est en cause, pas les connaissances du modèle. Un agent capable de lire cette dispersion dispose de quelque chose de plus précieux qu’un score de confiance : une raison de demander.

Pour les agents utilisant des outils, la distinction devient concrète. Un cadre récent sépare ce que l’utilisateur veut de ce que le modèle prédit, puis ne pose que la question dont la réponse modifierait le plus le panier. Sur des tâches ambiguës, il revendique une couverture de tâches 7 à 39 % plus élevée, tout en réduisant ses questions d’un facteur 1,5 à 2,7. Intégré dans un modèle de récompense, ce même signal a amélioré son jugement sur le moment d’agir, passant de 36,5 % à 65,2 % sur le modèle le plus petit testé. Savoir poser la bonne question est une compétence — et ces résultats montrent qu’elle peut s’apprendre.

Le domaine au sens large a conçu ses agents pour terminer la tâche et annoncer le succès. Un article de position de 2025 soutient que la division classique de l’incertitude — entre erreur du modèle et bruit des données — perd son sens dès lors qu’un agent peut prendre la parole. Le manque qui compte le plus est celui que le client n’a pas encore comblé. La calibration était le mauvais instrument ; ce qui manquait à l’agent, c’était la permission d’interrompre.

Les benchmarks récompensent ce qui ne devrait pas l’être. Les agents de shopping affichent des scores dans les soixante-dix face à des acheteurs simulés qui ne changent jamais d’avis et ne cachent aucune contrainte — le client qui n’existe pas que nous décrivions le mois dernier. Un score élevé face à une simulation accommodante ne dit rien de la capacité à servir un humain difficile.

Un agent qui ne pose jamais de question n’est pas décisif — il est simplement rapide à se tromper.

Cette habitude s’enseigne. Un agent de codage cherchant des clarifications testé ce printemps a résolu 69,4 % des tâches sous-spécifiées, comblant presque l’écart avec les agents disposant d’instructions complètes. Il a également appris à se taire au bon moment, réservant ses questions aux problèmes difficiles et laissant passer les cas simples. Un agent qui remplit le panier sans demander est un vendeur qui devine votre taille depuis l’autre bout du magasin.

Le commerce de détail offre le cas de test idéal. Une personne qui tape « quelque chose pour un mariage en été » a précisé l’occasion tout en omettant le budget, la taille et le code vestimentaire qui conditionnent tout le reste. Un agent e-commerce qui pose des questions avant de chercher affine ses propositions à chaque échange. L’agent qui procède quand même ne lui a pas épargné une décision. Il en a pris une mauvaise à sa place.

Une question coûte un instant à l’acheteur ; le mauvais panier coûte un retour et la confiance qui l’avait amené là. Un agent assez sûr de lui pour éviter la question est précisément celui en qui on ne peut pas se fier. La certitude est la seule chose que l’acheteur n’est pas venu acheter.