L’affaire non résolue de l’« acqui-hiring » à 20 milliards de dollars de Jensen Huang, et Groq, le cheval noir des puces IA, relance une tempête de financement de 49 milliards de dollars : en ligne de mire, l’hégémonie de l’inférence.

📅 2026-05-30 🤖 大模型智能生成

Le mystère des 20 milliards de dollars de « débauchage déguisé en acquisition » de Jensen Huang n'est pas résolu : Groq, le cheval noir des puces IA, déclenche une nouvelle tempête de financement de 49 milliards, visant directement l'hégémonie de l'inférence

Les soupçons autour d'une « embauche sans acquisition » d'une valeur de 20 milliards de dollars ne sont pas encore dissipés qu'un nouveau coup de tonnerre retentit sur le champ de bataille des puces d'IA. Alors que Nvidia est accusé d'avoir recours à des moyens financiers colossaux pour débaucher des équipes d'élite, Groq, la jeune pousse considérée comme un rival potentiel, est en train de mener une levée de fonds interne pouvant atteindre 650 millions de dollars (environ 49 milliards de yuans), selon Axios. Parallèlement, elle opère un virage stratégique vital : délaisser la vente de matériel pour miser entièrement sur les services d'inférence IA. Ce jeu de pouvoir dans la Silicon Valley s'avère bien plus déroutant que n'importe quelle série dramatique.

Le « not-acqui-hire » à 20 milliards : l'anxiété de Nvidia et l'obstination de Groq

Le terme « not-acqui-hire », ce nouveau mot-valise de la Silicon Valley, décrit avec précision l'offensive fulgurante de Nvidia — nul besoin d'acheter l'entreprise entière, il suffit d'attirer et d'intégrer les talents clés du concurrent avec des offres impossibles à refuser pour étouffer la compétition en silence. Le chiffre de 20 milliards de dollars qui circule dans l'industrie, bien que non confirmé officiellement, reflète la réalité sanglante du secteur des puces IA où « qui détient les talents détient le monde ». Cependant, Groq n'a visiblement pas cédé à cette frappe de destruction massive. Choisir ce moment pour lancer une levée de fonds de plusieurs centaines de millions de dollars, quitte à abandonner en partie son obsession pour le matériel, constitue la réponse la plus ferme au géant. Cette entreprise fondée par les vétérans des TPU de Google doit prouver qu'elle n'est pas un acteur de second rang bon seulement à vendre des cartes.

Abandonner l'obsession matérielle, le pari ultime de Groq sur l'inférence

Le LPU (Language Processing Unit) de Groq a ébloui l'industrie sur le papier, promettant des vitesses extrêmes de plusieurs centaines de tokens par seconde pour l'exécution de grands modèles de langage. Mais le secteur du matériel a toujours été impitoyable, et les remparts érigés par Dell, Supermicro et Nvidia elle-même sont profonds. L'annonce par Groq de recentrer ses efforts sur « l'inférence IA » (optimiser la manière dont les modèles répondent aux requêtes des utilisateurs) est bien plus qu'un simple ajustement technique ; c'est une transformation radicale de son modèle économique. L'entreprise ne rêve plus de vendre des puces physiques coûteuses à ses clients, mais vend directement, via des services cloud, cette « vitesse de réponse » vertigineuse. C'est une transition du « fabriquant de pioches » à l'« exploitation directe de la mine d'or », pariant sur la disposition des entreprises à payer pour une latence réduite à la milliseconde, bien plus que pour la possession d'un amas de transistors.

La bataille finale du marché de l'inférence derrière les 650 millions de dollars

À l'heure où l'IA générative progresse à pas de géant, les centaines de milliards de dollars investis annuellement à l'échelle mondiale dans l'entraînement doivent finalement être rentabilisés par l'inférence. Si Groq parvient à offrir avec son architecture LPU une solution d'inférence moins coûteuse, plus rapide et plus efficiente énergétiquement que les GPU, ces 650 millions de dollars seront le scalpel avec lequel elle percera le marché. Ce capital sera utilisé pour construire des clusters massifs de puissance de calcul dédiée à l'inférence, permettant aux développeurs d'exécuter des tâches d'agent en quelques millisecondes sans jamais toucher une puce physique. Ce n'est pas seulement un combat pour la survie de Groq, c'est le tournant où l'ensemble du marché de la puissance de calcul IA bascule du « règne de l'entraînement » à la « suprématie de l'inférence ». Alors que Nvidia consolide sa domination globale avec les H200 et B200, la percée verticale de Groq nous rappelle une chose : dans cette défection risquée de la puissance de calcul, il suffit de trouver le bon angle pour une « frappe asymétrique » pour donner des sueurs froides au géant.