AI News

ByteDance accélère ses ambitions de silicium personnalisé lors de discussions stratégiques avec Samsung

Dans une démarche significative vers l'indépendance technologique, ByteDance, la société mère de TikTok et Douyin, serait en négociations avancées avec Samsung Electronics pour fabriquer ses propres puces d'IA personnalisées(custom AI chips). Ce pivot stratégique marque une évolution critique dans la planification de l'infrastructure du géant technologique chinois, alors qu'il cherche à garantir un approvisionnement stable en processeurs avancés dans un contexte de resserrement des chaînes d'approvisionnement mondiales et de restrictions géopolitiques.

Selon des rapports récents de l'industrie, ByteDance prévoit de produire jusqu'à 350 000 unités de ses puces d'inférence IA(AI inference chips) propriétaires, avec des échantillons d'ingénierie attendus dès mars 2026. En cas de succès, ce partenariat pourrait réduire considérablement la dépendance de ByteDance vis-à-vis de fournisseurs externes comme Nvidia et remodeler le paysage concurrentiel de l'adoption des semi-conducteurs d'IA parmi les colosses de l'internet en Chine.

Le pacte de fabrication : Samsung comme partenaire fonderie

La collaboration se concentre sur la production de puces conçues spécifiquement pour les charges de travail d'inférence IA(AI inference workloads)—le processus d'exécution de données réelles à travers des modèles d'IA entraînés pour générer des prédictions ou des recommandations. Bien que ByteDance se soit historiquement appuyé sur les GPU de Nvidia pour l'entraînement et l'inférence, l'ampleur même de ses algorithmes de recommandation pour des plateformes comme TikTok nécessite une puissance de calcul massive et spécialisée que les GPU à usage général traitent de manière moins efficace.

L'accord rapporté décrit un calendrier de production échelonné :

  • Phase initiale : ByteDance vise à obtenir des échantillons d'ingénierie d'ici la fin mars 2026.
  • Production de masse : L'entreprise cible une production initiale de 100 000 unités au cours de l'année en cours.
  • Échelle à long terme : La capacité de production devrait atteindre 350 000 unités au fil du temps, signalant un engagement majeur envers le matériel interne.

Crucialement, les négociations s'étendraient au-delà de la fabrication de puces logiques pour inclure la fourniture de mémoire à haute bande passante(High Bandwidth Memory, HBM). L'essor mondial de l'IA créant un goulot d'étranglement sévère dans la disponibilité de la mémoire, la sécurisation d'une ligne directe vers l'inventaire de mémoire de Samsung est probablement un facteur décisif dans le choix du partenaire par ByteDance. Samsung, positionné de manière unique à la fois comme une fonderie(foundry) de premier plan et un fabricant de mémoire de premier rang, offre une solution « clé en main » (turnkey) que d'autres fonderies ne peuvent pas facilement égaler.

Des algorithmes au silicium : le passage à l'inférence

Pour comprendre l'importance de ce développement, il est essentiel de distinguer les deux phases de base des charges de travail de l'IA : l'entraînement et l'inférence.

  • Entraînement(Training) : Consiste à alimenter un modèle avec des ensembles de données massifs pour lui « apprendre ». Cela nécessite une puissance de calcul brute immense (souvent des clusters Nvidia H100/A100).
  • Inférence(Inference) : Implique le modèle déployé prenant des décisions en temps réel (par exemple, « Quelle vidéo cet utilisateur devrait-il voir ensuite ? »). Cela nécessite une faible latence et une efficacité énergétique élevée.

Pour une plateforme grand public comme TikTok, les coûts d'inférence éclipsent souvent les coûts d'entraînement en raison des milliards d'utilisateurs actifs quotidiens nécessitant des recommandations instantanées. En concevant un silicium personnalisé optimisé uniquement pour ses architectures de recommandation spécifiques, ByteDance peut théoriquement atteindre une performance par watt plus élevée qu'en utilisant des GPU commerciaux standard.

Comparaison des exigences des charges de travail d'IA

Caractéristique Entraînement IA Inférence IA
Objectif principal Construire l'intelligence du modèle Exécuter le modèle en temps réel
Intensité de calcul Extrêmement élevée (Traitement par lots) Modérée (Faible latence requise)
Focus matériel FLOPS bruts, bande passante mémoire Efficacité, temps de réponse, coût
Contexte ByteDance Développer des LLM (Doubao) Servir les flux TikTok/Douyin

Naviguer sur la corde raide géopolitique

La poussée de ByteDance pour le silicium personnalisé(custom silicon) n'est pas seulement une optimisation technique ; c'est une nécessité stratégique née des frictions géopolitiques. Les États-Unis ont imposé une série de contrôles stricts à l'exportation limitant la vente d'accélérateurs d'IA de pointe (tels que le H100 de Nvidia et même le H20 déclassé) aux entités chinoises.

Bien que les puces d'inférence nécessitent généralement moins de puissance de traitement que les puces d'entraînement—ce qui permet potentiellement de les fabriquer sur des nœuds de processus légèrement plus anciens et non restreints (tels que 5 nm ou 7 nm)—la chaîne d'approvisionnement reste vulnérable. En concevant ses propres puces et en s'associant à Samsung (une entreprise sud-coréenne), ByteDance tente de diversifier ses risques liés à la chaîne d'approvisionnement. Samsung, bien qu'en conformité avec les réglementations américaines, offre une alternative vitale à TSMC, qui fonctionne actuellement à sa capacité maximale en raison de la demande d'Apple, Nvidia et AMD.

Le paysage plus large : les géants chinois de la tech optent pour la verticalité

ByteDance n'est pas seul dans cette entreprise. La tendance à l'« intégration verticale »—où les entreprises de logiciels conçoivent leur propre matériel—est devenue la norme pour les géants technologiques mondiaux. Amazon (AWS Inferentia), Google (TPU) et Microsoft (Maia) ont établi cette voie depuis longtemps. En Chine, l'urgence est accentuée par les sanctions.

État du développement de puces en interne chez les géants technologiques chinois

Entreprise Focus du projet de puce Objectif stratégique Défis clés
ByteDance Puces d'inférence IA Optimiser les moteurs de recommandation (TikTok/Douyin) Manque d'ADN matériel préalable ; taux de rendement de Samsung
Alibaba Yitian (CPU) & Hanguang (NPU) Efficacité de l'infrastructure cloud (AliCloud) Accès aux nœuds de fonderie avancés (TSMC/Arm)
Tencent Zixiao (Inférence IA) Traitement vidéo interne & services d'IA Intégration de la pile logicielle
Baidu Kunlun (IA généraliste) Soutien à Ernie Bot & conduite autonome Adoption de l'écosystème en dehors de Baidu

Défis et réponses officielles

Malgré des objectifs optimistes, la route vers le silicium personnalisé est parsemée de défis. La conception de semi-conducteurs est notoirement intensive en capital et impitoyable. Un défaut dans l'architecture ou un échec dans le processus de fabrication (taux de rendement) peut entraîner des retards se chiffrant en millions de dollars. De plus, la construction d'une pile logicielle permettant aux développeurs de ByteDance de porter de manière transparente leur code de la plateforme CUDA de Nvidia vers les nouvelles puces personnalisées sera une tâche d'ingénierie monumentale.

Interrogé sur ces rapports, ByteDance a déclaré que les informations concernant son projet de puce en interne étaient « inexactes », sans fournir de corrections spécifiques. Samsung Electronics a refusé de commenter. De tels démentis sont courants dans l'industrie des semi-conducteurs lors des phases de négociation active, souvent destinés à protéger des secrets commerciaux ou à gérer les attentes du marché boursier.

Conclusion : Un écosystème d'IA en maturation

Si ByteDance réussit à déployer 350 000 puces d'inférence personnalisées, cela marquera un tournant pour l'entreprise, la transformant d'un leader pur des algorithmes logiciels en une puissance d'IA verticalement intégrée. Cette initiative permettrait non seulement d'isoler l'entreprise de certains chocs géopolitiques, mais aussi de réduire considérablement les coûts opérationnels de l'application vidéo la plus populaire au monde. À l'approche de mars 2026, l'industrie observera de près si les premiers échantillons de silicium tiendront leurs promesses.

Vedettes