AI News

Une nouvelle ère de concurrence : les géants technologiques chinois dévoilent leurs modèles phares

Un an après que le « Choc DeepSeek » (DeepSeek Shock) a fondamentalement remodelé le paysage mondial de l'intelligence artificielle, les principaux laboratoires d'IA de Chine ont lancé une offensive coordonnée de publications de modèles majeurs. Alors que l'industrie marque l'anniversaire de l'entrée perturbatrice de DeepSeek sur le marché lors du Nouvel An chinois 2025, des géants tels que Zhipu AI, Moonshot AI et ByteDance ont simultanément dévoilé leurs modèles de fondation de nouvelle génération. La vague d'annonces de cette semaine — menée par le GLM-5 de Zhipu, le Kimi 2.5 de Moonshot et le Seedance 2.0 de ByteDance — signale un passage décisif des tactiques de rattrapage vers une véritable innovation architecturale dans l'écosystème chinois de l'IA.

Le timing est stratégique, imitant la fenêtre de lancement pendant les vacances qui a propulsé DeepSeek sur le devant de la scène mondiale l'année dernière. Cependant, contrairement aux guerres de prix de 2025, le champ de bataille de 2026 est défini par les capacités « agentiques » (agentic), la domination de la génération vidéo et, sans doute, le jalon le plus significatif à ce jour : l'indépendance matérielle totale.

GLM-5 de Zhipu AI : atteindre l'indépendance des infrastructures

En tête de file se trouve Zhipu AI, qui a officiellement publié le GLM-5, un grand modèle de langage qui représente un tournant décisif pour l'infrastructure informatique de la Chine. Avec un nombre total de paramètres de 745 milliards, le GLM-5 est construit sur une architecture de mélange d'experts (Mixture-of-Experts, MoE) qui active 44 milliards de paramètres par inférence.

Ce qui distingue GLM-5 n'est pas seulement son échelle, mais sa provenance. Zhipu AI a confirmé que le modèle a été entièrement entraîné sur des puces Huawei Ascend, marquant la première fois qu'un modèle de ce niveau de performance a été développé sans dépendre du matériel NVIDIA restreint par les États-Unis. Cette réussite répond à l'anxiété liée à la « fracture de calcul » qui a tourmenté le secteur, prouvant que les piles matérielles nationales peuvent supporter l'entraînement de modèles compétitifs face à GPT-5.2 et Claude Opus 4.5.

La réaction du marché a été immédiate. Suite à l'annonce, les actions de Zhipu AI à la Bourse de Hong Kong ont bondi de près de 30 %. L'entreprise, qui a finalisé son introduction en bourse en janvier 2026, a positionné le GLM-5 comme la pierre angulaire de « l'ingénierie agentique ». Contrairement aux itérations précédentes axées sur le chat, le GLM-5 est optimisé pour les opérations système complexes et le codage autonome, surpassant apparemment le Gemini 3 Pro de Google dans les tests de référence internes pour le raisonnement logique et la compréhension de contextes longs (jusqu'à 200 000 jetons).

Kimi 2.5 de Moonshot AI : l'ascension des essaims d'agents

Tandis que Zhipu s'est concentré sur l'infrastructure et l'échelle, Moonshot AI a misé sur le flux de travail agentique avec la sortie de Kimi 2.5. Le nouveau modèle introduit une technologie propriétaire baptisée « Agent Swarm » (Essaim d'agents), capable d'orchestrer jusqu'à 100 sous-agents parallèles pour exécuter des tâches complexes simultanément.

Kimi 2.5 utilise une nouvelle méthodologie d'entraînement connue sous le nom de Parallel-Agent Reinforcement Learning (PARL). Cela permet au modèle de décomposer une simple commande utilisateur — telle que « construire un tableau de bord e-commerce complet » — en des dizaines de fils distincts gérés par des sous-agents spécialisés (par exemple, conception front-end, schéma de base de données, intégration d'API) qui communiquent et fusionnent leurs résultats en temps réel.

Les résultats sont stupéfiants. Moonshot affirme que Kimi 2.5 réduit la latence des tâches complexes en plusieurs étapes de 4,5 fois par rapport aux modèles d'exécution séquentielle. Le modèle a également été intégré directement dans la plateforme Microsoft Foundry, une décision qui étend sa portée aux clients entreprises du monde entier. Lors des tests de référence, Kimi 2.5 a obtenu un score de 96,1 % sur AIME 2026, consolidant son statut de modèle de premier plan pour le raisonnement mathématique et l'ingénierie logicielle automatisée.

Seedance 2.0 de ByteDance : redéfinir la production vidéo par IA

Dans l'arène multimodale, ByteDance a dévoilé Seedance 2.0, un modèle de vidéo générative qui menace de bouleverser les industries du cinéma et de la publicité. Dépassant la phase « expérimentale » de la vidéo par IA précoce, Seedance 2.0 est commercialisé comme un outil prêt pour la production, capable de générer des clips de 4 à 15 secondes dans une résolution cinématographique 2K.

L'architecture sous-jacente, décrite comme un « Dual Branch Diffusion Transformer », permet la génération simultanée de vidéo et d'audio haute fidélité. Cela résout le problème du « film muet » qui a entravé des concurrents comme Sora et Kling. Seedance 2.0 introduit également un contrôle sans précédent sur le mouvement de la caméra et la cohérence des personnages. Lors des démonstrations bêta, les utilisateurs ont généré des récits complexes « multi-plans » où l'apparence d'un personnage restait parfaite au pixel près à travers différents environnements d'éclairage et angles de caméra.

Les analystes du secteur notent que Seedance 2.0 traite la vidéo 30 % plus rapidement que ses concurrents les plus proches, en exploitant l'énorme infrastructure interne de ByteDance. La sortie est déjà devenue virale sur les réseaux sociaux, les créateurs présentant des « films IA » pratiquement indiscernables du CGI traditionnel.

L'« effet DeepSeek » et la dynamique du marché

La publication coordonnée de ces modèles est inextricablement liée à l'« effet DeepSeek ». Début 2025, la sortie par DeepSeek d'un modèle haute performance et à bas coût a brisé le pouvoir de fixation des prix des entreprises établies et a forcé une accélération rapide de l'innovation. Un an plus tard, le marché a mûri. L'accent est passé de la simple réduction des coûts des jetons (tokens) à l'augmentation de la « densité d'intelligence » des modèles.

Les investisseurs ont récompensé ce pivot stratégique. L'indice Hang Seng Tech a progressé cette semaine, porté par les flux de capitaux vers les entreprises liées à l'IA. Cependant, une ombre plane sur ces célébrations : la sortie imminente de DeepSeek V4. Les rumeurs suggèrent que le nouveau modèle de DeepSeek, attendu plus tard ce mois-ci, pourrait une fois de plus redéfinir la base de référence des performances, particulièrement dans les tâches de raisonnement.

Le tableau ci-dessous fournit une comparaison technique des trois modèles majeurs publiés cette semaine, mettant en évidence les diverses approches adoptées par les entreprises chinoises pour capturer des parts de marché.

Analyse comparative des nouvelles sorties

Caractéristique/Métrique Zhipu AI GLM-5 Moonshot Kimi 2.5 ByteDance Seedance 2.0
Domaine principal Grand modèle de langage (Logique/Code) Orchestration agentique et multimodal Vidéo et audio génératifs
Architecture Mélange d'experts (MoE) Parallel-Agent Reinforcement Learning (PARL) Dual Branch Diffusion Transformer
Échelle/Spécifications 745 Md de paramètres (44 Md actifs) Supporte plus de 100 agents simultanés Résolution 2K, durée 15s
Innovation clé Entraîné à 100 % sur puces Huawei Ascend « Agent Swarm » pour exécution parallèle Synchronisation audio-vidéo native et cohérence des personnages
Disponibilité commerciale Poids ouverts (Open Weights) et API Microsoft Foundry et API Bêta fermée (Plateforme Jimeng)
Point fort du benchmark Rivalise avec GPT-5.2 en codage 96,1 % sur AIME 2026 Génération 30 % plus rapide que Kling

À quoi s'attendre : l'anticipation de DeepSeek V4

Aussi impressionnantes que soient ces sorties, l'industrie reste en état d'alerte maximale. Des sources de Creati.ai indiquent que DeepSeek se prépare à lancer son modèle V4 avant la fin du mois de février. Contrairement à ses concurrents qui se sont diversifiés dans la vidéo (ByteDance) ou les agents d'entreprise (Moonshot), DeepSeek devrait rester concentré sur les pures capacités de raisonnement, introduisant potentiellement un nouveau paradigme pour la pensée « Système 2 » dans l'IA.

Pour l'instant, cependant, les projecteurs sont braqués sur Zhipu, Moonshot et ByteDance. Ils ont démontré avec succès que l'écosystème chinois de l'IA n'est plus défini uniquement par un suivi rapide, mais par des philosophies technologiques distinctes — qu'il s'agisse de la souveraineté matérielle de Zhipu, des essaims agentiques de Moonshot ou de la maîtrise créative de ByteDance. Alors que l'année 2026 se déroule, la compétition ne porte plus seulement sur qui possède le plus grand modèle, mais sur qui peut intégrer le plus efficacement ces intelligences dans le tissu de l'économie numérique mondiale.

Vedettes