Commander des cupcakes, remplir un formulaire, générer un PowerPoint, ou encore interagir avec Google Drive sans toucher à la souris, c’est ce que propose désormais ChatGPT Agent. OpenAI a lancé aujourd’hui une nouvelle fonctionnalité qui pourrait bien changer la façon dont certains utilisateurs professionnels abordent les tâches numériques répétitives.
Le déploiement de ChatGPT Agent commence immédiatement pour les abonnés Pro, Plus et Team de ChatGPT. Les utilisateurs Pro ont droit à 400 requêtes mensuelles, tandis que ceux des plans Plus et Team sont limités à 40. À ce stade, aucune date n’a été annoncée pour les comptes gratuits ou les offres Entreprise et Éducation, bien que leur intégration soit envisagée d’ici la fin de l’été.
Mais que fait exactement ce nouvel agent ? Contrairement aux versions précédentes de l’outil, qui se contentaient de répondre à des questions ou de rédiger des textes, ChatGPT Agent agit dans un environnement virtuel. Il peut cliquer dans un navigateur visuel comme le faisait déjà Operator, mais aussi analyser massivement du contenu web via une interface textuelle issue du projet Deep Research. Ces deux approches ont été fusionnées pour donner naissance à une solution hybride, capable d’exécuter des instructions concrètes sur le web.
Yash Kumar, chef produit du projet, insiste sur l’orientation entreprise du développement. Le but est de séduire les professionnels en automatisant tout ce qui peut l’être, génération de fichiers Excel ou PowerPoint téléchargeables, remplissage automatique de formulaires en ligne, appels vers des API publiques comme celles de SharePoint ou Google Drive… Autrement dit, un outil pensé pour soulager les tâches numériques fastidieuses.
Isa Fulford, responsable recherche chez OpenAI et membre de l’équipe Deep Research initiale, a testé le système en lui confiant une commande très précise (et volumineuse) de cupcakes. Il aura fallu tout de même près d’une heure pour finaliser la tâche. C’est lent, très lent même, mais justifié par le gain d’énergie non négligeable pour l’utilisateur.
Cette lenteur illustre la complexité croissante des agents IA modernes. Car contrairement aux simples assistants conversationnels basés sur GPT-4 (ou bientôt GPT-5), ces systèmes doivent prendre des décisions dans des environnements ouverts et parfois imprévisibles, comme le web.
OpenAI a prévu un système d’alertes renforcé au lancement pour encadrer ces interactions automatisées avec prudence. Sam Altman a d’ailleurs conclu la présentation en évoquant les risques liés aux agents IA autonomes, tout en laissant entendre que ces garde-fous pourraient s’assouplir par la suite.
Reste maintenant à voir si ces agents tiendront leurs promesses face aux attentes élevées des utilisateurs professionnels… et au poids croissant que représente chaque clic virtuel exécuté par une intelligence artificielle.

