Comment les agents pensent et travaillent

Maintenant que vous avez créé votre premier agent, vous êtes probablement curieux de savoir ce qui se passe réellement quand un agent exécute une tâche. Comprendre comment les agents pensent et travaillent vous aidera à créer de meilleurs agents, à établir des attentes appropriées, et à dépanner des situations où les résultats ne correspondent pas tout à fait à ce que vous vouliez.

Quand vous regardez un agent travailler dans Ubby, vous verrez deux vues parallèles qui ensemble racontent l'histoire complète de ce qui se passe. Sur le côté gauche, vous avez le chat où l'agent explique sa réflexion et sa progression en langage naturel. Sur le côté droit, vous avez l'Agent's Computer, une fenêtre en temps réel sur chaque action que l'agent entreprend. Cette double vue est comme regarder à la fois le processus de pensée de quelqu'un et ses mains au travail simultanément.

Comprendre l'Agent's Computer

L'Agent's Computer est votre fenêtre sur le travail réel de l'agent. Pendant que le chat à gauche vous dit ce que l'agent pense faire, l'Agent's Computer à droite vous montre ce que l'agent fait réellement maintenant, en temps réel.

Quand un agent commence à travailler sur votre tâche, l'Agent's Computer s'ouvre automatiquement. Vous le verrez organiser son travail en une liste de tâches structurée. Chaque tâche représente un morceau distinct de travail qui doit être accompli, et vous pouvez regarder pendant que l'agent se déplace à travers cette liste systématiquement.

La beauté de l'Agent's Computer est la transparence. Vous n'attendez pas dans le noir en vous demandant si quelque chose se passe. Vous pouvez voir exactement quelle tâche l'agent exécute actuellement, quels outils il utilise, et quels résultats il obtient. Cette visibilité construit la confiance parce que vous comprenez ce qui se passe à chaque moment.

Pendant que l'agent travaille, tout ce qu'il produit est stocké dans les fichiers de tâches. Chaque document créé, chaque morceau de données extrait, chaque résultat intermédiaire est sauvegardé automatiquement. Cela signifie que vous pouvez accéder à n'importe quelle partie du travail de l'agent, pas juste au résultat final. Si l'agent crée un brouillon avant de produire la version finale, les deux sont disponibles pour vous. Si l'agent rassemble des données avant de les analyser, vous pouvez voir les données brutes aussi.

Comment les agents planifient leur travail

La toute première chose qu'un agent fait quand vous lui donnez une tâche est de créer un plan. Cette phase de planification est visible à la fois dans le chat et l'Agent's Computer, et c'est fascinant à regarder parce que vous pouvez voir l'intelligence de l'agent au travail.

Quand vous demandez à un agent de créer une présentation sur les agents IA autonomes, l'agent ne commence pas immédiatement à faire des slides. Au lieu de cela, il fait une pause pour réfléchir à ce que cette demande nécessite réellement. Vous verrez dans le chat que l'agent explique sa compréhension de votre demande, et puis dans l'Agent's Computer, vous regarderez pendant qu'il construit une liste de tâches structurée.

L'agent décompose votre demande de haut niveau en tâches concrètes et actionnables. Pour l'exemple de présentation, vous pourriez voir l'agent créer des tâches comme analyser le sujet pour déterminer les thèmes clés, structurer le plan de présentation, choisir un style visuel approprié, créer des slides individuelles pour chaque point majeur, et finalement réviser la présentation complète pour la cohérence.

Ce qui rend cette phase de planification puissante est que l'agent découvre ces étapes en comprenant votre objectif, pas en suivant un template. Si vous aviez demandé un type différent de présentation ou spécifié des exigences différentes, l'agent créerait une liste de tâches complètement différente. La planification s'adapte à ce dont vous avez réellement besoin.

Dans l'Agent's Computer, vous verrez cette liste de tâches prendre forme avec une structure claire. Les tâches sont souvent groupées en phases logiques comme planification, création, et finalisation. Chaque tâche montre son statut : en attente de démarrage, actuellement en cours, ou complétée. Pendant que l'agent travaille, vous pouvez suivre la progression à travers cette liste de tâches en temps réel.

La liste de tâches vous montre aussi combien de tâches l'agent a créées et combien il a complétées. Ce suivi de progression vous aide à comprendre à quel point le travail est avancé et combien il en reste. Pour une tâche complexe qui génère douze sous-tâches, vous pouvez regarder l'agent passer de zéro sur douze complétées à douze sur douze complétées, voyant exactement où l'effort est investi.

La différence entre agents généraux et agents custom

Comprendre comment les agents planifient révèle une distinction importante entre agents généraux et agents custom, et cette différence impacte significativement comment les tâches sont exécutées.

Quand vous utilisez un agent général, celui avec lequel vous interagissez directement sans configuration spéciale, cet agent a une autonomie complète sur la planification. Vous décrivez ce que vous voulez, et l'agent décide entièrement par lui-même comment décomposer le travail, quelles tâches créer, et dans quel ordre les exécuter. L'agent analyse votre demande et construit quelle que soit la structure de tâches qui a du sens pour accomplir votre objectif.

Cette autonomie est incroyablement puissante parce qu'elle signifie que l'agent peut gérer des demandes qu'il n'a jamais vues auparavant. Vous n'êtes pas limité à des workflows prédéfinis. L'agent réfléchit à chaque situation unique et crée un plan approprié. Cependant, cela signifie aussi une certaine variabilité. Demandez au même agent général de faire la même chose deux fois, et il pourrait créer des listes de tâches légèrement différentes à chaque fois, bien que les deux accomplissent l'objectif.

Les agents custom fonctionnent différemment. Quand vous créez un agent custom et définissez des workflows dans la configuration, vous prenez le contrôle de la phase de planification. Au lieu de laisser l'agent décider comment décomposer le travail, vous spécifiez exactement quelles tâches doivent se produire et dans quelle séquence. Le workflow que vous définissez devient la liste de tâches que l'agent suit.

Cette planification contrôlée est précieuse quand vous avez un processus spécifique qui doit être suivi de manière cohérente. Si votre résumé email hebdomadaire doit toujours se produire exactement dans la même séquence d'étapes, créer un workflow garantit cette cohérence. Chaque fois que l'agent s'exécute, il exécute précisément les tâches que vous avez définies dans précisément l'ordre que vous avez spécifié.

Le compromis est la flexibilité. Un agent custom avec un workflow défini ne peut pas adapter sa structure de tâches aux variations dans votre demande. Il suit le workflow que vous avez créé. C'est parfait pour les processus standardisés où la cohérence compte plus que la flexibilité, mais cela signifie que vous devez réfléchir soigneusement à quel workflow définir.

La plupart des utilisateurs commencent avec des agents généraux pour explorer ce qui est possible et comprendre comment les agents décomposent naturellement différents types de travail. Une fois qu'ils identifient une tâche qui doit se produire de manière répétée avec des étapes cohérentes, ils créent un agent custom avec un workflow défini pour garantir cette cohérence.

Regarder les agents exécuter des tâches

Une fois que la phase de planification est terminée, l'agent commence à exécuter les tâches une par une. Cette phase d'exécution est où vous voyez vraiment les capacités de l'agent en action, et l'Agent's Computer rend chaque étape visible.

Pendant que l'agent commence chaque tâche, vous verrez le statut de la tâche changer dans l'Agent's Computer. La tâche actuellement active est clairement mise en évidence pour que vous sachiez toujours où l'attention de l'agent est focalisée. Dans le chat, l'agent explique ce qu'il est sur le point de faire, et puis dans l'Agent's Computer, vous le regardez réellement se produire.

L'agent sélectionne les outils appropriés pour chaque tâche basé sur ce qui doit être accompli. Si la tâche nécessite de créer un document, l'agent utilise des outils de création de document. Si la tâche implique de rechercher des informations, l'agent utilise des outils de recherche web. Si la tâche a besoin de données d'un service connecté comme Gmail, l'agent utilise les outils d'intégration appropriés.

Ce qui est remarquable est que vous pouvez voir l'agent faire ces choix d'outils en temps réel. L'Agent's Computer vous montre quel outil l'agent invoque, quels paramètres il fournit à cet outil, et quels résultats reviennent. Cette visibilité vous aide à comprendre à la fois ce que l'agent fait et comment il utilise les capacités que vous lui avez accordées.

Chaque action que l'agent prend produit un résultat, et ces résultats sont stockés dans les fichiers de tâches auxquels vous pouvez accéder à tout moment. Quand l'agent recherche sur le web et trouve des informations, cette information est sauvegardée. Quand l'agent crée un slide, ce slide est sauvegardé. Quand l'agent traite des données, à la fois les données brutes et les résultats traités sont sauvegardés. Rien ne disparaît. La trace complète du travail de l'agent est préservée.

Ce stockage de fichiers complet sert plusieurs objectifs. Évidemment, vous avez besoin d'accès aux résultats finaux du travail de l'agent. Mais avoir accès aux résultats intermédiaires est tout aussi précieux. Si vous voulez comprendre pourquoi l'agent a fait certains choix, vous pouvez regarder les données avec lesquelles il travaillait. Si vous voulez réutiliser une partie du travail de l'agent dans un contexte différent, vous pouvez extraire juste ce morceau des fichiers de tâches.

Comment la sélection d'outils façonne les capacités de l'agent

La performance et les capacités de votre agent sont directement déterminées par quels outils vous lui donnez accès. Cette connexion entre outils et capacités est fondamentale pour comprendre ce que les agents peuvent et ne peuvent pas faire.

Pensez aux outils comme l'ensemble de compétences d'un agent. Un travailleur humain avec des compétences en menuiserie peut construire des meubles, mais ce même travailleur ne peut pas effectuer de chirurgie sans formation médicale. De même, un agent avec des outils de création de documents peut créer des présentations et des rapports, mais ce même agent ne peut pas envoyer d'emails sans accès aux outils email.

Quand vous créez un agent et sélectionnez quels outils activer, vous définissez les limites de ce que cet agent peut accomplir. Si vous activez l'ensemble complet d'outils par défaut plus l'intégration Gmail et l'intégration Google Drive, votre agent peut rechercher sur le web, créer des documents, envoyer des emails, et gérer des fichiers. C'est un ensemble de compétences large adapté à de nombreuses tâches de travail intellectuel.

Cependant, plus d'outils créent plus de complexité pour l'agent. Chaque outil additionnel auquel l'agent a accès est une autre option qu'il doit considérer lors de la planification et de l'exécution du travail. Un agent avec accès à cent outils différents doit analyser un espace de possibilités beaucoup plus grand qu'un agent avec accès à dix outils.

C'est pourquoi la sélection d'outils importe pour la performance. Un agent avec exactement les outils dont il a besoin pour son objectif spécifique peut travailler plus efficacement et prendre de meilleures décisions qu'un agent noyé dans des options non pertinentes. Quand vous créez un agent custom pour des résumés email hebdomadaires, vous n'avez pas besoin de lui donner accès aux outils d'édition d'images ou aux outils de tableur. Limiter l'agent à juste les outils Gmail et Google Drive le garde focalisé et efficace.

La qualité des décisions de l'agent est aussi corrélée avec le modèle de langage qui alimente l'agent. Des modèles de langage plus capables font de meilleurs choix sur quels outils utiliser et quand. Ils comprennent mieux les nuances de vos demandes et les différences subtiles entre des outils similaires. Quand vous sélectionnez quel modèle de langage utiliser pour un agent, vous choisissez le niveau d'intelligence qui pilote la sélection d'outils et l'exécution de tâches.

Votre propre clarté de demande compte aussi. Quand vous donnez à un agent une description de tâche claire et spécifique, l'agent peut faire des choix d'outils confiants. Quand votre demande est vague ou ambiguë, l'agent doit deviner vos intentions, et ces suppositions pourraient mener à une sélection d'outils sous-optimale. Plus vous êtes clair sur ce que vous voulez accomplir, mieux l'agent peut choisir les outils appropriés.

Avant de demander à un agent de faire quelque chose, il vaut la peine de vérifier que l'agent a accès aux outils nécessaires pour ce travail. Si vous voulez qu'un agent analyse un tableur mais ne lui avez pas donné d'outils de tableur, l'agent va lutter ou échouer. L'Agent's Computer vous montrera l'agent tentant la tâche avec des outils inadéquats, vous aidant à identifier ce qui manque.

Comprendre les fichiers de tâches et la préservation du travail

Chaque tâche sur laquelle un agent travaille génère des fichiers, et comprendre ce système de fichiers vous aide à faire plein usage du travail de l'agent. Les fichiers de tâches ne sont pas juste les résultats finaux. C'est un enregistrement complet de tout ce que l'agent a créé, analysé, ou traité pendant l'exécution.

Quand vous regardez les fichiers de tâches dans l'Agent's Computer, vous verrez un espace de travail organisé par la tâche. Si l'agent a créé une présentation, vous verrez tous les fichiers de slides, le fichier de plan, les métadonnées sur la présentation, et tous les matériaux de référence que l'agent a consultés. Tout vit dans un endroit accessible.

Cette préservation du travail intermédiaire est particulièrement précieuse quand vous voulez itérer sur les résultats. Supposons que l'agent crée une présentation et qu'un slide n'est pas tout à fait correct. Vous pouvez regarder les fichiers de tâches pour voir quelle information l'agent a utilisée pour créer ce slide. Vous pouvez voir le plan de l'agent pour comprendre son raisonnement. Vous pouvez même voir des brouillons antérieurs si l'agent a révisé son travail. Cette visibilité vous aide à donner à l'agent des retours spécifiques pour l'amélioration.

Les fichiers de tâches permettent aussi la collaboration entre plusieurs agents ou plusieurs exécutions du même agent. Si vous avez un agent qui rassemble de la recherche et un autre agent qui écrit des rapports, les fichiers de tâches du premier agent peuvent devenir input pour le second agent. Le travail coule naturellement d'un agent à l'autre à travers le système de fichiers.

Certains agents créent des outputs destinés à une présentation immédiate, comme un document fini ou un email préparé. D'autres agents créent des outputs qui sont des tremplins vers un travail ultérieur, comme une analyse de données qui informera une décision ou un plan de contenu qui guidera l'écriture. Les fichiers de tâches accommodent les deux types d'outputs également bien.

Vous pouvez télécharger n'importe quoi des fichiers de tâches. Si l'agent a créé exactement ce dont vous avez besoin, téléchargez-le et utilisez-le immédiatement. Si l'agent a créé quelque chose proche de ce dont vous avez besoin, téléchargez-le et raffinez-le vous-même. Les fichiers sont à vous pour les utiliser de la manière qui a du sens pour votre travail.

Comment les agents s'adaptent quand les choses ne se passent pas comme prévu

Même avec une planification parfaite et une sélection d'outils appropriée, les agents rencontrent parfois des situations où l'approche attendue ne fonctionne pas. Regarder comment les agents s'adaptent à ces situations révèle leur vraie autonomie.

Quand un agent tente une action et que quelque chose va mal, vous verrez cela se produire en temps réel dans l'Agent's Computer. L'agent essaie d'utiliser un outil, l'outil retourne une erreur ou un résultat inattendu, et l'agent doit décider quoi faire ensuite. C'est où vous voyez la capacité de raisonnement de l'agent en action.

L'agent essaie d'abord de comprendre ce qui s'est mal passé. Si un upload de fichier a échoué, est-ce parce que le fichier est trop grand ? Parce que le dossier cible n'existe pas ? Parce que la connexion a été interrompue ? L'agent examine le message d'erreur ou le résultat inattendu pour diagnostiquer le problème.

Basé sur ce diagnostic, l'agent ajuste son approche. Si le dossier n'existe pas, créer d'abord le dossier puis essayer à nouveau. Si le fichier est trop grand, essayer de le compresser ou de le diviser en morceaux plus petits. Si la connexion a été interrompue, attendre un moment et réessayer. L'agent n'abandonne pas au premier obstacle. Il résout les problèmes.

Vous verrez cette adaptation à la fois dans le chat et l'Agent's Computer. Dans le chat, l'agent pourrait expliquer que l'approche initiale n'a pas fonctionné et qu'il essaie une alternative. Dans l'Agent's Computer, vous verrez l'agent créer de nouvelles sous-tâches ou modifier son approche dans la tâche actuelle. La liste de tâches elle-même peut évoluer pendant que l'agent en apprend plus sur ce qui est nécessaire.

Cependant, l'adaptation a des limites. Un agent essaie typiquement plusieurs approches différentes avant de conclure qu'une tâche ne peut pas être complétée. Si l'agent tente trois ou quatre stratégies différentes et qu'aucune ne réussit, il reconnaît qu'il est bloqué et rapporte le problème plutôt que de continuer à échouer de manière répétée.

Quand un agent rapporte qu'il ne peut pas compléter une tâche, l'explication identifie généralement ce qui s'est mal passé et pourquoi l'agent n'a pas pu contourner. Cette information vous aide soit à corriger le problème sous-jacent soit à ajuster votre demande à quelque chose que l'agent peut accomplir avec ses outils disponibles.

Lire la progression et le statut de l'agent

Pendant que vous regardez un agent travailler, plusieurs indicateurs vous aident à comprendre comment les choses se passent et combien de temps le travail pourrait encore prendre. Apprendre à lire ces signaux vous aide à utiliser les agents efficacement.

Le compteur de tâches dans l'Agent's Computer vous montre l'indicateur de progression le plus direct. Quand vous voyez deux sur douze tâches complétées, vous savez que l'agent est environ un sixième du chemin à travers son travail. Quand vous voyez dix sur douze complétées, vous savez que l'agent est presque terminé. Ce compteur se met à jour en temps réel pendant que l'agent complète chaque tâche.

La tâche actuellement active vous montre ce que l'agent fait maintenant. Si la tâche est étiquetée "Créer slide sur perspectives futures" et que l'agent a travaillé dessus pendant plusieurs minutes, vous savez que l'agent met un effort significatif dans ce slide particulier. Les tâches complexes prennent naturellement plus de temps que les tâches simples.

Certains agents affichent du temps estimé ou des barres de progression pour les tâches qui durent plus longtemps. Si l'agent traite un fichier volumineux ou génère du contenu complexe, vous pourriez voir un indicateur de progression qui vous aide à jauger combien de cette tâche spécifique est complète.

Les indicateurs de statut vous disent l'état de chaque tâche : en attente, en cours, complétée, ou échouée. Une tâche échouée ne signifie pas nécessairement que l'agent a abandonné. L'agent pourrait avoir essayé une approche qui n'a pas fonctionné, marqué cette tentative comme échouée, et créé une nouvelle tâche représentant l'approche alternative. Lire la liste de tâches dans son ensemble vous raconte l'histoire de comment le travail s'est déroulé.

Dans le chat, l'agent fournit des mises à jour narratives sur ce qu'il fait et pourquoi. Ces mises à jour complètent l'information structurée de tâches dans l'Agent's Computer. Si vous êtes confus sur ce que l'agent essaie d'accomplir, les explications du chat clarifient la pensée de l'agent.

Ce qui rend l'exécution de l'agent fiable

Comprendre ce qui rend les agents fiables vous aide à créer de meilleures tâches et à choisir le travail approprié à déléguer aux agents. Plusieurs facteurs contribuent à la fiabilité d'exécution.

Les descriptions de tâches claires aident les agents à mieux planifier et à exécuter plus de manière fiable. Quand vous dites à un agent exactement ce que vous voulez, incluant toutes les contraintes ou préférences, l'agent peut construire un plan approprié. Les demandes vagues mènent les agents à faire des suppositions qui pourraient ne pas correspondre à vos intentions.

L'accès approprié aux outils garantit que les agents peuvent réellement faire ce que vous demandez. Avant de déléguer du travail à un agent, vérifiez que l'agent a les outils nécessaires pour ce travail. Un agent sans les outils nécessaires tentera la tâche quand même et échouera probablement, gaspillant du temps pour vous et l'agent.

Les modèles de langage bien choisis améliorent la qualité de décision tout au long de l'exécution. Si vous travaillez sur des tâches complexes qui nécessitent un raisonnement sophistiqué, utilisez les modèles de langage plus capables. Pour des tâches simples, les modèles moins capables fonctionnent bien et s'exécutent plus rapidement.

Les ensembles d'outils focalisés aident les agents à éviter la confusion. Plutôt que de donner à chaque agent accès à chaque outil possible, donnez à chaque agent seulement les outils dont il a besoin pour son objectif spécifique. Cette focalisation améliore à la fois la vitesse d'exécution et la qualité de décision.

La portée de tâche raisonnable garde le travail gérable. Les agents gèrent des tâches discrètes et bien définies plus de manière fiable que des assignations énormes et ouvertes. Si vous avez un très gros morceau de travail, considérez de le casser en plusieurs tâches d'agent plutôt que de demander à un agent de tout gérer dans une seule exécution.

Apprendre en regardant les agents travailler

Une des meilleures façons d'améliorer votre utilisation des agents est de les regarder travailler et d'apprendre de ce que vous observez. Chaque fois que vous voyez un agent exécuter une tâche, vous gagnez un aperçu sur comment les agents pensent et ce dont ils sont capables.

Faites attention à comment les agents décomposent vos demandes en listes de tâches. Au fil du temps, vous développerez une intuition pour ce qui constitue une bonne unité de travail pour un agent. Vous apprendrez à cadrer vos demandes de manières qui mènent à une décomposition de tâches efficace.

Remarquez quels outils les agents choisissent pour différents types de travail. Cette observation vous enseigne à quoi chaque outil est bon et quand il a du sens de l'utiliser. Vous commencerez à comprendre le paysage de capacités de vos outils disponibles.

Regardez comment les agents gèrent les erreurs et les obstacles. Voir l'agent s'adapter à des situations inattendues vous montre à la fois quels problèmes les agents peuvent résoudre eux-mêmes et quels problèmes nécessitent votre intervention. Cette compréhension vous aide à calibrer combien d'autonomie accorder à différents types d'agents.

Observez le temps que prennent différentes tâches. Certains travaux qui semblent simples aux humains prennent aux agents assez longtemps, et certains travaux qui semblent complexes aux humains sont faits rapidement. Cette intuition de timing vous aide à établir des attentes réalistes et à planifier quand utiliser des agents versus quand faire le travail vous-même.

Révisez les fichiers de tâches après que les agents complètent le travail. Regarder ce que l'agent a créé, quelle information il a rassemblée, et comment il a organisé son travail vous enseigne sur l'approche de l'agent aux problèmes. Cette connaissance vous aide à écrire de meilleures descriptions de tâches et à donner des retours plus efficaces.

Et maintenant ?

Maintenant que vous comprenez comment les agents pensent et travaillent, incluant le processus de planification, la sélection d'outils, l'exécution de tâches, et l'adaptation, vous êtes prêt à explorer quand et comment superviser le travail des agents. Le prochain article couvrira le mode supervisé versus autonome, vous aidant à comprendre quand regarder vos agents travailler de près et quand les laisser fonctionner indépendamment.

Cette fondation dans la pensée et l'exécution de l'agent vous servira bien pendant que vous créez des agents plus sophistiqués. Vous pouvez maintenant prédire comment les agents approcheront les tâches, anticiper quels outils ils auront besoin, et comprendre ce que vous voyez quand vous les regardez travailler dans l'Agent's Computer. Cette compréhension transforme les agents de boîtes noires mystérieuses en collaborateurs transparents dont vous pouvez suivre, évaluer, et améliorer le travail.