Depuis le lancement de ChatGPT par OpenAI en novembre 2022, le monde de l’intelligence artificielle n’a cessé d’évoluer. Ces mots : « intelligence artificielle » semblent être sur toutes les lèvres. Tout le monde veut en être, aucune entreprise ou État ne veut louper le virage de l’IA. Ses évolutions sont devenues des enjeux géopolitiques et économiques majeurs comme l’a démontré le sommet de l’IA tenu à Paris début février 2025. Parmi ses évolutions récentes, l’intelligence artificielle multi-agent semble très prometteuse. Mais le multi-agent est-il réellement si performant et va-t-il freiner la course aux plus gros modèles qui dure depuis quelques années ?

Les États et entreprises souhaitent tous monter dans le TGV IA, lancé à pleine vitesse et en constante évolution. Chaque jour une nouvelle technologie IA promet de révolutionner le secteur et d’offrir des performances toujours plus impressionnantes, comme l’une des évolutions les plus médiatisées dans les sphères IA : le « multi-agent » ou encore « l’Agentic AI ». Une technologie pleine de promesses et d’interrogations.
Pour répondre aux questions qu’elle soulève, commençons déjà par comprendre comment fonctionne un système IA « traditionnel ».
Architecture en chaîne
La plupart des systèmes d’intelligence artificielle sont construits avec une architecture en chaîne dans laquelle chaque maillon est exécuté successivement dans un ordre défini lors de l’implémentation du système et invariable.

Dans un système d’intelligence artificielle classique, une donnée d’entrée est saisie par l’utilisateur, nettoyée par une fonction de preprocessing, puis envoyée à l’agent IA qui produit un output pour l’utilisateur. Ce pipeline peut varier d’un système à l’autre mais au sein d’un même système, il sera toujours exactement le même quelle que soit la requête de l’utilisateur.
Ces systèmes, bien que performants pour réaliser des tâches simples et récurrentes, présentent de nombreux défauts. Ils sont extrêmement rigides et réagissent mal à l’évolution de leur environnement ou de la donnée qui leur est fournie.
De plus, face à des tâches plus complexes, nécessitant plusieurs étapes de raisonnement, les systèmes d’intelligence artificielle tels que nous les connaissons aujourd’hui peinent à produire des résultats satisfaisants sans être pris par la main et accompagnés tout au long du processus.
Systèmes d’intelligence artificielle mono-agents
On appelle « agent » une entité autonome qui perçoit son environnement, prend des décisions et agit en fonction de ses objectifs. Il peut s’agir d’un programme informatique, d’un modèle de machine learning, d’un robot physique, d’un LLM, ou encore d’un simple processus logiciel autonome.
De manière générale, dans les systèmes d’intelligence artificielle, les agents sont des briques expertes. Ils ne sont confrontés qu’à des sous-briques d’un problème général. Ce sont des spécialistes qui exécutent avec des hauts degrés de précision les tâches qui leur sont attribuées. Il existe une grande variété d’agents avec plus ou moins d’autonomie et de capacité de prise de décision. Commençons alors par étudier un système simple : le système mono-agent
Un système d’intelligence artificielle mono-agent ou système à agent unique est un système IA qui se différencie des systèmes en chaîne par le fait qu’il s’adapte aux changements de son environnement ainsi qu’à la donnée qui lui est fournie. Il est capable de prendre des décisions qui influencent le pipeline d’exécution du système. Il en existe des plus ou moins complexes avec des degrés d’autonomie variés, allant du simple routeur à un agent totalement autonome qui effectue des tâches diverses.
Pour simplifier :
Un agent routeur est un système qui analyse la donnée qu’on lui transmet puis décide, parmi une liste d’outils à sa disposition, lequel est le plus adapté à la tâche à réaliser.

Par exemple : dans une voiture autonome un agent routeur pourrait être une caméra qui lit les panneaux sur le bord de la route et transmet l’information à l’outil responsable de l’adaptation du comportement du véhicule (c’est-à-dire limitation de vitesse ou activation des feux obligatoires à l’entrée d’un tunnel).

Ici, les outils sont extrêmement concrets mais un système multi-agent peut en utiliser de toutes sortes, comme des API externes ou des systèmes plus complexes.
Les agents sont extrêmement prometteurs pour deux raisons :
- Premièrement, leur capacité de prise de décision donne un plus grand dynamisme au système qui s’adapte à son environnement et à la donnée qui lui est fournie. Ainsi, il n’est plus un simple exécutant d’une tâche donnée mais un véritable chef d’orchestre dans un processus de raisonnement plus complexe.
- Deuxièmement, la segmentation des tâches à réaliser par un système en actions plus simples permet d’utiliser des modèles plus petits et moins coûteux du point de vue de la puissance de calcul. Ils sont par conséquent plus sobres écologiquement.
Qu’est-ce qu’un système multi-agent ?
Logiquement un système multi-agent (SMA) met plusieurs agents en relation. Chacun est formé à une tâche précise et l’accomplit avec un taux de réussite plus important que si un unique agent était responsable de l’ensemble des tâches. Les agents ont la possibilité de communiquer entre eux, de faire appel l’un à l’autre, ou de mettre en commun et d’exploiter les résultats obtenus par les uns et les autres. Ainsi, le système tout entier est capable de résoudre des tâches de haut niveau tout en s’adaptant aux différentes situations auxquelles il est confronté.
L’enjeu est alors d’organiser le système pour que seuls les appels d’agent les plus judicieux soient réalisés et que le système s’adapte au mieux à l’environnement dans lequel il évolue. Chaque agent devra alors adapter son activité en fonction de celle des autres.
Exemple multi-agent
Les systèmes multi-agents sont déjà envisagés à grande échelle aujourd’hui dans des domaines autres que l’IA. Deux systèmes qui utiliseront sans doute le système multi-agent IA à grande échelle sont :
- Les villes intelligentes dans lesquelles les agents sont des feux de circulation, des capteurs, des lampadaires… ;
- Les voitures autonomes où les agents ne sont autres que les véhicules ayant à leur disposition des outils (capteurs, caméras, etc.).
Le dilemme autonomie – fiabilité pour les agents
Chaque agent dispose d’un degré plus ou moins important d’autonomie qui influencera ses performances. Rendre un agent plus autonome a ses avantages. Parmi lesquels : renforcer la flexibilité et la robustesse du système, faciliter l’émergence de comportements innovants…
Cependant, plus un agent devient autonome, moins le système sera prévisible et explicable. Utiliser les résultats dont on ne sait expliquer les sources peut s’avérer dangereux et entraîner une perte de contrôle du développeur et de l’utilisateur. De plus, augmenter l’autonomie d’un agent l’incite à halluciner et, par conséquent, entraîne une perte de fiabilité du système tout entier.
Lors de la phase de développement, il faut donc faire des choix quant à l’organisation du système ainsi que sur le degré d’autonomie transmis. À l’image des organisations humaines, il existe plusieurs architectures de systèmes multi-agents dans lesquelles chacun dispose d’un certain niveau d’autonomie et de capacité de prise de décision. Comme pour les organisations humaines, ces décisions influencent fortement les résultats et le flux de tâches du système.
Les différentes architectures multi-agents
Tout comme un gouvernement peut être unitaire selon le modèle français ou fédéral à l’image de l’Allemagne, un système multi-agent peut être centralisé ou décentralisé.
Ces différentes architectures déterminent les droits et les fonctions précises de chaque agent. L’organisation suivante illustre bien les systèmes multi-agents et les interactions qui peuvent exister entre tous les agents et avec leurs outils respectifs.

En pratique, quand le nombre d’agents augmente, cette architecture dense devient incontrôlable, non optimisée et trop coûteuse en raison de la puissance de calcul considérable nécessaire. C’est pourquoi des architectures plus subtiles et plus performantes ont été mises au point.
Architecture centralisée vs architecture décentralisée
Les systèmes multi-agents, comme définis dans la première partie de cet article, sont pleins de promesses. Cependant, pour en tirer le plein potentiel, il faut définir en amont l’architecture du système afin d’articuler de la manière la plus efficace possible les interactions entre les différents agents.
Il existe deux principaux types d’architectures :
- Les architectures centralisées ;
- Les architectures décentralisées.
Centralisation
Dans une architecture centralisée, toutes les communications et tous les transferts de données ou d’informations transitent, et sont interprétés par un unique agent.

Cet agent du système, faisant office de chef d’orchestre, connaît l’état du système complet tandis que tous les autres n’ont qu’une connaissance locale de l’environnement.
Cette architecture propose de nombreux avantages. La coordination des agents est rendue plus facile par la vision d’ensemble du superviseur lui permettant d’appeler le bon agent, et d’optimiser la prise de décision et les performances globales du système. De plus, dans une telle architecture, les agents n’ont ni besoin d’analyser l’environnement, ni de prendre de décisions, ce qui permet d’alléger leur implémentation.
Malgré tous ses bienfaits, l’architecture centralisée a ses limites et ses inconvénients. Le premier d’entre eux étant le passage à l’échelle. Quand un unique agent s’occupe de coordonner tous les autres, il perd grandement en efficacité quand le nombre d’agents augmente. Imaginez un PDG qui doit manager individuellement l’ensemble de ses collaborateurs ! L’agent superviseur devient un goulet d’étranglement pour le système, incapable d’analyser en continu un large environnement en des temps raisonnables.
Reprenons les deux exemples de systèmes multi-agents mentionnés plus haut, en supposant qu’ils soient construits au sein d’une organisation centralisée.
Dans une ville intelligente centralisée, les feux de circulation changent d’état selon les directives d’un centre de commandement, les capteurs ne font que récolter des informations, sans les analyser, avant de les transmettre au cerveau du système. Une fois toutes les données et informations recueillies, le centre de commandement pourra transmettre des directives à chacun des agents pour faire tendre le système vers l’état visé.
Le réseau de véhicules autonomes centralisé, en raison d’allers-retours trop nombreux entre les différents agents et le superviseur, relève plus de l’expérience de pensée que d’une éventualité concrète. Mais prêtons-nous quand même à l’exercice. Dans un système de voitures autonomes centralisé, un centre de commandement est responsable de l’ensemble des décisions prises par tous les agents. Si une caméra (c’est-à-dire un outil de l’agent voiture) repère un enfant sur le point de traverser, l’information sera transmise à la voiture, puis au centre de commandement qui imposera à l’agent voiture de freiner. Les échanges d’information et d’injonctions répétés dans cet exemple coûteront au système des fractions de secondes précieuses.
Certains systèmes, tels que les véhicules autonomes, nécessitent une prise de décision instantanée qui n’est pas permise par une architecture purement centralisée où toute décision est prise par un agent principal. On comprend aisément que cette architecture présente de fortes limitations et ne peut pas être adoptée dans tous les contextes.
Décentralisation
Les architectures décentralisées sont une alternative prometteuse pour pallier ces problèmes de passage à l’échelle. Le principe est simple : répartir l’autorité et la responsabilité entre les différents agents.
La blockchain est un exemple de système décentralisé (mais sans IA). Cette technologie de stockage sécurisé et transparent de l’information repose sur un réseau de machines détenant toutes une copie de la blockchain. Chaque modification de la chaîne doit donc se faire avec l’accord de toutes les machines, ce qui, moyennant un nombre important de machines, garantit l’intégrité de l’information.
La blockchain est un système totalement décentralisé mais l’organisation de chaque système est unique et peut nécessiter une structure fortement organisée ou au contraire bien plus souple. Dans la pratique, les systèmes d’envergure utilisent souvent des organisations hiérarchiques dans lesquelles, comme au sein d’une entreprise, chaque agent est responsable de certaines actions, et gère d’autres agents et outils.

Les systèmes multi-agents IA décentralisés reposent sur des agents communiquant entre eux, et chacun dispose de la liberté de prendre ses propres décisions en fonction de ses connaissances locales, de l’environnement et des interactions avec d’autres agents.
En plus de faciliter le passage à l’échelle en évitant de surcharger un agent central responsable de toutes les prises de décision, les systèmes multi-agents décentralisés sont moins vulnérables à la casse ou au mauvais fonctionnement d’un agent. Chacun étant plus autonome, il saura s’adapter aux modifications de l’environnement. Cependant, toutes ces améliorations sont rendues possibles par une implémentation plus complexe et par conséquent plus coûteuse.
Observons désormais ce qu’il advient de nos exemples s’ils sont construits dans un système décentralisé. La ville intelligente décentralisée parvient à prendre des décisions beaucoup plus locales et à réduire les flux d’informations inutiles. Un capteur de luminosité transmet directement aux lampadaires du quartier la donnée qui leur indique s’il est nécessaire qu’ils soient allumés, tandis qu’un capteur de mouvement adapte la luminosité à la circulation des passants et des voitures pour ne pas éclairer toute la nuit des rues vides. Les feux de circulation adaptent leur durée aux voitures présentes aux carrefours à un instant T.
Ainsi, dans une architecture décentralisée, on peut multiplier les informations collectées sans crainte de surcharger le centre de commandement qui ne prend que des décisions globales, celle d’allumer l’ensemble des capteurs de luminosité par exemple.
Dans un réseau de véhicules autonomes décentralisé, chaque voiture avertit celle de derrière qu’elle va ralentir, qu’un piéton s’apprête à traverser au mauvais endroit, que le feu est passé à l’orange… Ces transmissions d’information se font sans intermédiaire permettant d’alléger l’analyse et le stockage global, et d’accélérer la prise de décision par tous les agents.
Edge AI
Pour pousser la décentralisation encore plus loin, et réduire la latence et le temps de prise de décision, une autre solution est envisageable : l’« Edge AI » ou « IA en périphérie ». Cela consiste à placer des modèles de machine learning et d’intelligence artificielle directement sur des dispositifs IoT (Internet of Things), tels que des caméras ou des capteurs, plutôt que sur des serveurs distants ou dans le cloud. Les modèles sont alors directement appliqués sur la donnée collectée par leur hôte, sans aucun transfert.
Avec la multiplication des systèmes IA, les applications centralisées deviennent complexes et coûteuses en développement et en infrastructure. L’IA en périphérie permet de décentraliser davantage et de réduire le partage cloud de la donnée. En résultent une baisse des dépenses et de l’utilisation de la bande passante, mais surtout un gain considérable en sécurité puisque la donnée ne quitte jamais le hardware.
Grâce à la non-circulation de la donnée, les temps de latence du système sont réduits drastiquement. Dans le cas de la voiture autonome, comme dans beaucoup d’autres, la moindre milliseconde de latence peut avoir des effets considérables.
Apprentissage fédéré
Une autre perspective d’organisation, plus hiérarchique et moins centralisée, est « l’apprentissage fédéré ». Cela consiste à entraîner un modèle global à partir de ce que des modèles plus locaux ont appris mais en ne partageant que les poids et les biais des modèles, et non la donnée. Objectif : réduire la puissance de calcul nécessaire et la circulation de la donnée. Cela permet alors de respecter la confidentialité des données, notamment celles soumises au RGPD.
La procédure est la suivante :
- Le serveur global fournit aux serveurs locaux un modèle initial ;
- Chaque serveur entraîne ce modèle à partir des données qu’il a à sa disposition. Il crée une mise à jour locale du modèle ;
- Les serveurs locaux transmettent cette mise à jour au serveur global ;
- Le serveur agrège ces mises à jour pour améliorer le modèle global ;
- Le modèle global est renvoyé aux serveurs locaux et le cycle redémarre.
L’IA en périphérie et l’apprentissage fédéré permettent un plus grand contrôle de la circulation de l’information tout en maintenant les performances du système et en optimisant les temps de prise de décision. La démocratisation de ces approches de décentralisation est un pas de plus vers l’essor des systèmes multi-agents d’intelligence artificielle à grande échelle dans notre quotidien.
Conclusion
Quel sera l’impact du développement de tels systèmes ? Certes, la segmentation en sous-tâches plus simples et la recherche de spécialisation rendent compétitifs les plus petits modèles, moins coûteux et moins gourmands en énergie. Mais, comme démontré plus haut, ces systèmes favorisent aussi la prolifération des données. Nous dirigeons-nous alors vers une rationalisation de l’intelligence artificielle grâce à ces systèmes multi-agents ou vers des systèmes toujours plus complexes, coûteux et énergivores ?
Les tendances actuelles du marché de l’IA poussent à envisager plus sérieusement la seconde option pour les géants traditionnels du secteur pour qui le coût n’est pas un sujet et seule la performance compte. Ceux-là continueront certainement à utiliser et à produire des modèles toujours plus gros et toujours plus gourmands en puissance de calcul.
En janvier 2025, la société chinoise Deepseek est venue ébranler cette dynamique en proposant un modèle basé sur une architecture MoE (Mixture of Experts). Le modèle est basé sur plusieurs experts activés uniquement en cas de besoin. Ainsi, « seulement » 37 milliards de paramètres sont activés à la fois. Les acteurs les plus importants commencent à s’intéresser aux systèmes multi-agents. Cependant, ces architectures pourraient être une porte d’entrée pour des plus petits acteurs dans un secteur où seuls les géants semblent être en mesure de créer des produits de qualité opérationnelle. L’utilisation de modèles légers mais extrêmement performants au sein de la bonne architecture réduit drastiquement le ticket d’entrée pour des tâches précises et ouvre la voie aux plus petits acteurs.
Une jeune startup chinoise nommée Manus a récemment fait parler d’elle en dévoilant son « IA Générale » qui permet de réaliser des analyses approfondies des marchés financiers ou d’organiser intégralement des vacances au Japon et ce, en complète autonomie. Cela n’est qu’un exemple des applications de l’IA multi-agent qui voient le jour et repoussent toujours plus loin les frontières de l’imagination.
Au sein de la cellule Innovation de Meritis, nous avons récemment expérimenté un système multi-agent pour une tâche de détection d’incohérences. La donnée d’entrée du système est une base de connaissances d’entreprise. Nous avons développé plusieurs agents. Le premier pour extraire et reformuler les informations contenues dans les documents. Un second agent parcourt ensuite l’ensemble des informations extraites pour déterminer une liste de types d’information. Si leur nombre est trop important, un nouvel agent est appelé pour nettoyer cette liste et fusionner les types qui peuvent l’être. Ensuite, à chaque information est assigné un ou plusieurs types. Les informations de même type sont ensuite comparées deux à deux par un LLM afin de déceler d’éventuelles incohérences.
Nous avons testé notre système avec des modèles de tailles variables, de 8 à 123 milliards de paramètres. Tous testés sur les mêmes données, ils obtiennent des résultats très variés, et ce ne sont pas les plus gros les meilleurs ! Quoi qu’il en soit, les systèmes multi-agents ont le potentiel de devenir les David face à des Goliath déjà bien implantés. Affaire à suivre.
Vous avez aimé cet article ?
Abonnez-vous à notre newsletter pour ne rien rater de l’actualité Tech et Finance.

Pas encore de commentaires