Publié le 20/02/2025 Par Abdelkader HAMADI

L’intelligence artificielle connaît un nouveau bouleversement avec l’arrivée de DeepSeek, une startup chinoise qui vient boulevser l’ordre établi. Face aux géants américains comme OpenAI et Google, DeepSeek incarne une alternative crédible, accélérant le virage vers une IA plus accessible et efficiente. Mais cette montée en puissance soulève aussi des tensions économiques et géopolitiques. Assiste-t-on à un rééquilibrage des forces dans la course à l’IA ? Analyse.

Meritis Analyse DeepSeek

DeepSeek, l’étoile montante de l’IA chinoise qui ébranle la Silicon Valley

En 2023, le fonds spéculatif chinois High-Flyer, spécialisé dans le trading à haute fréquence assisté par IA, donne naissance à DeepSeek, une filiale dédiée à la recherche en intelligence artificielle générale (AGI). Dès la fin de l’année, l’entreprise frappe fort en lançant DeepSeek Coder et DeepSeek LLM, deux modèles open source qui posent les bases de son ambition.

Mais c’est en 2024, avec DeepSeek V3 et DeepSeek R1, que la startup se hisse sous le feu des projecteurs, proposant une alternative sérieuse aux géants OpenAI, Google et Meta. La suprématie américaine vacille : un nouvel acteur vient bouleverser le monde de l’IA et, en ce sens, repenser l’équilibre du marché.

Le secret de DeepSeek ? Une approche hybride et optimisée qui repose sur deux piliers : matériel et algorithmique. Face aux restrictions américaines sur les puces Nvidia H100, la startup adopte une stratégie astucieuse : elle exploite les GPU H800, certes moins puissantes, mais dont l’efficacité, combinée à des optimisations avancées, permet de rivaliser avec les modèles des mastodontes de la Silicon Valley. Un pari gagnant qui démontre que la puissance brute ne fait pas tout : c’est dans la finesse des optimisations logicielles et matérielles que se joue l’avenir de l’IA.

Mais DeepSeek ne s’arrête pas là. La startup mise sur l’inference-time computing, une avancée de rupture qui réduit drastiquement les coûts d’entraînement, la consommation énergétique et les besoins en puissance de calcul. Résultat : son modèle est jusqu’à 27 fois moins cher à exploiter que ChatGPT. Un avantage stratégique colossale qui change la donne sur le marché ultra-compétitif de l’intelligence artificielle.

DeepSeek VS OpenAi

Déjà des bouleversements sur les axes technologiques et économiques ?

Une menace pour les modèles économiques traditionnels

L’émergence de DeepSeek remet en question le modèle des géants américains qui investissent des milliards dans des infrastructures fermées. DeepSeek prouve qu’une IA performante peut être développée avec une approche plus légère et optimisée. Le coût de l’entraînement final de DeepSeek V3 n’étant que de 5,5 millions de dollars, comparé, par exemple, à plus de 70 millions de dollars pour Llama 3.1 de Meta.

Des coûts qui sont néanmoins à relativiser, étant donné qu’ils ne tiennent pas compte du coût de la recherche, du traitement et de la mise en place des données, des salaires… Résultat, impossible pour une entreprise de reproduire DeepSeek avec seulement 5,5 millions.

Cette dynamique favorise l’adoption croissante de solutions open source et attire une communauté grandissante de développeurs partout dans le monde. De plus en plus d’entreprises soucieuses de réduire leurs coûts et de s’émanciper des fournisseurs américains commencent alors à intégrer DeepSeek dans leurs systèmes.

Toutefois, certains experts restent prudents. Dan Ives, analyste chez Wedbush Securities, considère que les grandes entreprises américaines ne feront pas confiance à une startup chinoise pour leurs infrastructures stratégiques. Selon lui, Nvidia reste le leader incontesté des semi-conducteurs pour l’IA, la robotique et l’automatisation, malgré les avancées chinoises.

Envie de découvrir l’architecture qui se cache derrière tous les NLP modernes ?

👉 Découvrez notre article « Les Transformers, le modèle derrière la puissance de ChatGPT »

Transformers, le modèle derrière la puissance de ChatGPT

Un séisme sur les marchés financiers

DeepSeek - Baisse du cours de Nvidia

L’arrivée de DeepSeek a déclenché une onde de choc à Wall Street, provoquant une chute brutale des valeurs technologiques. Nvidia, pilier de l’industrie des semi-conducteurs, a vu son action plonger de 17 % en une seule journée, générant une perte de 589 milliards de dollars en capitalisation boursière. D’autres mastodontes du secteur, comme Microsoft, Meta et Alphabet, ont également subi des pertes conséquentes, les investisseurs redoutant une remise en question du modèle économique basé sur des infrastructures massives et onéreuses.

Ce krach boursier illustre une mutation profonde du secteur : l’optimisation algorithmique et l’open source pourraient bouleverser la rentabilité des géants de la Silicon Valley. Cette panique financière traduit également la crainte d’un basculement de la domination technologique vers la Chine, avec des implications majeures pour l’économie mondiale.

Accusations et tensions internationales

Face à cette percée, OpenAI et Microsoft accusent DeepSeek d’avoir enfreint les règles en utilisant des techniques interdites de distillation pour entraîner son modèle sur les réponses de ChatGPT. DeepSeek aurait ainsi accédé massivement aux données et connaissances de ChatGPT via leur API. Même si de forts soupçons subsistent, l’API d’OpenAI a reçu de très nombreuses requêtes cet automne. À ce jour, aucune preuve tangible n’a été présentée, mais ces accusations illustrent l’intensité de la rivalité technologique.

D’autres inquiétudes portent sur la confidentialité des données. Le stockage des informations sur des serveurs chinois alimente des craintes d’exploitation par Pékin, rappelant notamment les controverses autour d’une autre entreprise chinoise : TikTok. Ces préoccupations pourraient d’ailleurs inciter les régulateurs américains et européens à prendre des mesures restrictives contre DeepSeek. L’ouverture de ces marchés à la startup chinoise pourrait ainsi retarder le développement de DeepSeek.

Analyse du modèle DeepSeek 

Pourquoi tout le monde à peur de DeepSeek

Spécificités des modèles de DeepSeek 

Contrairement à ce que son nom pourrait laisser penser, DeepSeek n’est pas un modèle d’intelligence artificielle, mais bien une entreprise. C’est cette société qui développe DeepSeek Coder, DeepSeek LLM, DeepSeek V3 et DeepSeek R1, des modèles conçus pour repousser les limites de l’IA open source.

Le modèle DeepSeek-V3 repose sur une mixture d’experts, avec un total de 671 milliards de paramètres, dont seuls 37 milliards sont activés pour chaque requête, soit une puissance de calcul non négligeable. Cette approche permet d’optimiser l’utilisation des ressources en n’activant que les parties du modèle indispensables pour accomplir chaque tâche spécifique.

Le modèle a été entraîné sur un vaste corpus multilingue de 14,8 trillions de tokens, avec une forte présence de l’anglais et du chinois, mais aussi une proportion importante de contenus spécialisés en mathématiques et en programmation. Une fois cette phase de pré-entraînement terminée, la capacité de gestion du contexte a été étendue à 128 000 tokens, ce qui lui permet de mieux prendre en charge des documents longs et des raisonnements complexes.

DeepSeek-R1 ajoute des capacités de raisonnement au modèle DeepSeek V3, permettant de résoudre des problèmes plus complexes.

Vous cherchez une technique permettant d’améliorer la précision et l’actualité des réponses de votre Chatbot ?

👉 Découvrez le Multi-GraphRAG by Meritis !

Représentation du GraphRAg IA de Meritis

Différences par rapport aux géants de la scène internationale de l’IA ?

Par rapport à des modèles comme GPT-4, DeepSeek-V3 présente plusieurs avantages notables. Son architecture MoE lui permet d’être plus économe en calcul tout en maintenant un haut niveau de performance et sans nuire à la puissance de calcul. Sa fenêtre de contexte élargie lui donne un net avantage pour traiter des textes longs, un point souvent limité chez ses concurrents. Enfin, contrairement à OpenAI, qui garde ses modèles sous licence propriétaire, DeepSeek mise sur une approche open source, offrant plus de transparence et facilitant l’adoption par la communauté.

Cette percée technologique a été saluée par plusieurs experts du secteur, même aux États-Unis. Marc Andreessen, investisseur influent, a qualifié DeepSeek de « l’une des avancées les plus impressionnantes jamais réalisées », tandis que David Sacks, capital-risqueur et proche de Donald Trump, a estimé que cette innovation bouleversait la compétition mondiale en IA.

L’avantage de l’open source

L’intelligence artificielle évolue à une vitesse fulgurante. Parmi les acteurs qui bousculent l’ordre établi, DeepSeek se distingue par un choix stratégique audacieux : l’open source. Contrairement aux géants américains qui verrouillent leurs modèles derrière des murs opaques, DeepSeek mise sur l’ouverture, la transparence et la collaboration.

Ses modèles, DeepSeek Coder, DeepSeek LLM, DeepSeek V3 et DeepSeek R1, sont accessibles à tous. Chercheurs, startups, grandes entreprises ou simples passionnés peuvent les tester, les adapter et surtout en améliorer l’efficacité. Résultat ? Un écosystème dynamique où l’innovation ne dépend plus d’une poignée de mastodontes, mais de la créativité collective.

Et l’impact ne s’arrête pas là. En brisant les barrières des solutions propriétaires, DeepSeek accélère la vitesse des avancées technologiques. Plus besoin d’attendre des mises à jour contrôlées par une entreprise privée : l’évolution des modèles devient organique, portée par une communauté mondiale. Ce modèle collaboratif favorise la diversification rapide des usages, la découverte de nouvelles optimisations algorithmiques et une adoption industrielle bien plus rapide.

Autrement dit, l’open source ne se contente pas de rendre l’IA plus accessible. Il redéfinit la manière dont l’innovation se construit, rendant l’avenir de l’intelligence artificielle plus ouvert, plus rapide et surtout, moins dépendant d’une poignée d’acteurs dominants. DeepSeek ne cherche pas seulement à concurrencer OpenAI ou Google – il redessine le terrain de jeu.

Alibaba, l’autre acteur chinois de l’IA

QWEN Alibaba

Ce n’est pas fini. DeepSeek n’est pas la seule entreprise chinoise à faire des vagues. Il ne faut pas non plus oublier Alibaba qui monte en puissance avec son modèle Qwen ! Face à l’ascension fulgurante de DeepSeek, il ne faut pas perdre de vue la montée en puissance de Qwen, le modèle développé par Alibaba Cloud. La dernière version, Qwen 2.5-Max, lancée en janvier 2025, revendique des performances qui surpassent celles de DeepSeek V3, GPT-4o d’OpenAI, et Llama 3.1-405B de Meta.

En termes de différences, Qwen 2.5-Max se distingue par des performances qu’il présente comme supérieures à celles de DeepSeek V3, GPT-4o et Llama 3.1-405B. Toutefois, les informations techniques détaillées concernant les architectures et méthodologies d’entraînement de ces modèles restent floues, ce qui complique une comparaison directe et augmente le risque de non-conformité aux réglementations locales.

Vers un rééquilibrage des forces en IA ?

L’essor de DeepSeek marque une accélération de la compétition dans l’intelligence artificielle, notamment via la baisse des coûts d’entraînement. Pour maintenir leur position dominante, les entreprises américaines devront innover rapidement et explorer de nouvelles approches, notamment dans l’IA de raisonnement avancé.

Cette situation témoigne d’un déplacement du centre de gravité technologique : la Chine ne se contente plus de suivre les tendances, elle s’affirme comme un acteur capable de redéfinir les règles du jeu et de concurrencer les États-Unis dans le domaine de l’IA. Si DeepSeek maintient son avantage, l’industrie pourrait évoluer vers un modèle plus open source et moins dépendant des infrastructures colossales, affaiblissant ainsi l’hégémonie des géants américains.

En prouvant que l’optimisation et l’ingéniosité peuvent rivaliser avec la puissance brute, DeepSeek oblige les leaders actuels à repenser leur stratégie. La question étant désormais de savoir si OpenAI et ses concurrents sauront répondre efficacement à cette nouvelle donne technologique et économique.

Vous souhaitez savoir comment certaines images utilisés dans cet article ont été générées ?

👉Découvrez notre article « Génération d’image IA : comment ça marche ? »

Meritis - Comment les IA font-elles pour générer des images ?

Conclusion : une révolution à nuancer

Si l’approche open source de DeepSeek marque une avancée majeure dans le paysage de l’IA, il reste encore des zones d’ombre. L’enthousiasme autour de ces modèles doit être tempéré par une évaluation rigoureuse de leurs performances à long terme. Quelle sera leur réelle efficacité sur une large gamme de tâches complexes ? Leur optimisation suffira-t-elle à compenser le retard matériel face aux géants américains ? Autant de questions qui restent en suspens.

Un autre point crucial concerne la transparence sur l’entraînement des modèles. Si DeepSeek se démarque par son ouverture, la provenance et la qualité des données utilisées pour entraîner ses IA restent un sujet sensible, notamment concernant la conformité aux réglementations locales. L’accès aux poids du modèle ne garantit pas forcément une visibilité totale sur les biais potentiels ou les décisions prises en amont. Tout comme les possibles restrictions d’accès aux marchés américains et européens qui pourraient ralentir le développement du projet. 

Enfin, une autre révolution venant elle aussi de Chine pourrait bien rebattre les cartes : la percée de Qwen, le projet d’IA poussé par Alibaba. Pour l’instant, peu d’informations ont filtré, mais cette nouvelle technologie promet de repousser encore plus loin les limites de l’IA générative. Il faudra attendre plus de détails pour une comparaison objective et éclairée, afin de savoir si DeepSeek représente réellement une alternative crédible à long terme ou si un nouvel acteur viendra à son tour redistribuer les forces en présence. La réponse dans quelque temps.

[Livre Blanc] Intelligence artificielle : guide d’une IA décomplexée pour votre entreprise

Le saviez-vous ? 85 % des projets d’intelligence artificielle échouent, et ce alors que plus de 7 entreprises sur 10 sont engagées dans des projets IA 💡

🚀 Découvrez les clés du passage à l’échelle de votre projet d’Intelligence Artificielle

Téléchargez notre guide pour répondre à vos questions :

  • Comment implémenter son modèle ?
  • Par où commencer ?
  • Quels prérequis mettre en place pour passer en production ?
  • Quel algorithme utiliser ?

Vous avez aimé cet article ?

Abonnez-vous à notre newsletter pour ne rien rater de l’actualité Tech et Finance.

Call to Action newsletter

Pas encore de commentaires

Publier un commentaire

Abdelkader HAMADI

Auteur

Abdelkader HAMADI

Ingénieur en informatique en 2008, puis Docteur en Informatique de l'université de Grenoble depuis novembre 2014. J'ai enchaîné plusieurs postes d'enseignement et de recherche de 2013 à 2019. Je suis spécialisé dans les domaines de l'intelligence artificielle, la recherche d'information, la vision par ordinateur et de la data. J'ai rejoint Meritis à la fin de 2019 pour travailler en tant qu'ingénieur de conseil en Recherche et Développement. Je travaille actuellement sur une mission à SNCF Réseau en tant que chercheur sénior sur un projet innovant visant à développer des solutions de surveillance automatique du réseau ferroviaire par la fibre optique. Je suis responsable de la practice data-science chez Meritis et responsable de l'équipe data-science chez SNCF Réseau.