NVIDIA vient de lancer ses nouveaux systèmes GB300 NVL72. Ils peuvent traiter 50 fois plus de travail par mégawatt d'électricité par rapport à l'ancienne plateforme Hopper. Cela signifie que les coûts chutent de 35 fois pour chaque élément d'information traité.
Signal65 a effectué des tests séparés sur le GB200 NVL72 et a constaté qu'il traite plus de 10 fois l'information par watt, réduisant les coûts à un dixième de ce qu'ils étaient.
Les améliorations continuent. Les mises à niveau de la bibliothèque TensorRT-LLM de NVIDIA seules ont donné au GB200 un gain de performance de cinq fois en seulement quatre mois pour les tâches nécessitant des réponses instantanées. Les équipes travaillant sur les outils Dynamo, Mooncake et SGLang poussent l'efficacité encore plus haut.
Ces outils d'IA tombent en panne s'il y a un temps de latence ou s'ils ne peuvent pas mémoriser suffisamment de contexte. Les entreprises ont besoin qu'ils fonctionnent réellement dans des situations commerciales réelles, pas seulement en démo.
Les outils d'intelligence artificielle qui écrivent du code et fonctionnent comme des assistants numériques représentent désormais près de la moitié de toutes les recherches liées à l'IA, contre seulement 11 % il y a un an.
Les chiffres proviennent du rapport State of Inference d'OpenRouter et montrent à quelle vitesse les choses évoluent dans ce domaine.
Cette augmentation soudaine pousse les entreprises à se précipiter pour construire du matériel capable de suivre. Ces assistants d'IA doivent répondre immédiatement et mémoriser le contexte de projets logiciels entiers, ce qui exerce des exigences sérieuses sur la puissance de calcul.
L'explosion du marché alimente la bataille des géants de la technologie pour la domination
L'argent en jeu est énorme. Le marché des agents d'IA valait 4,92 milliards de dollars en 2024. Les estimations le placent à 6,016 milliards de dollars pour 2025, puis explosent à 44,97 milliards de dollars d'ici 2035. C'est une croissance de 22,28 % chaque année pour la prochaine décennie. Les banques, les hôpitaux, les magasins et les usines sont les premiers adopteurs.
Les entreprises intègrent ces agents dans les systèmes de gestion client, les outils de planification et les configurations de sécurité pour économiser de l'argent et en faire plus. Ce qui a commencé comme une technologie facultative devient une infrastructure de base.
Comme le rapporte Cryptopolitan, Alibaba vient de lancer Qwen3.5 ciblant le marché chinois, affirmant des coûts de traitement inférieurs de 60 % par rapport à avant. Le modèle peut regarder les écrans et effectuer des tâches sur les téléphones et les ordinateurs. Il est en concurrence directe avec l'application Doubao de ByteDance, et une mise à jour DeepSeek arrive également.
OpenAI a embauché Peter Steinberger le 15. Il a construit OpenClaw, un agent d'IA open-source. Le PDG Sam Altman a déclaré que Steinberger dirigera les travaux sur les agents personnels de nouvelle génération et l'a qualifié de génie avec d'excellentes idées sur les assistants intelligents capables de faire des choses utiles.
La crise des talents que personne ne peut résoudre
94 % des dirigeants d'entreprise disent qu'ils manquent de compétences en IA. D'ici 2028, 44 % s'attendent à avoir encore des pénuries de 20 à 40 %. Workera dit que ces lacunes pourraient coûter à l'économie mondiale 5,5 billions de dollars en 2026 en raison de produits retardés, de problèmes de qualité et de ventes perdues.
À l'heure actuelle, la demande de talents en IA dépasse l'offre de 3,2 pour un dans le monde entier. Les emplois en IA paient 67 % de plus que les postes logiciels ordinaires. Pourtant, 85 % des employés de bureau apprennent ces choses sur leur temps libre, et 83 % disent qu'ils s'enseignent principalement eux-mêmes au lieu de recevoir une formation formelle.
Lorsque les entreprises achètent des outils d'IA auprès de fournisseurs spécialisés, elles réussissent 67 % du temps. Les développements internes ne fonctionnent qu'environ un tiers aussi souvent.
Salesforce a connu une croissance de 119 % des agents au début de 2025 et a dépassé 500 millions de dollars de revenus récurrents pour ces produits. Ils ont ajouté 6 000 clients d'entreprise en trois mois.
Les entreprises achèteront probablement des solutions au lieu de les construire. Cela indique que le marché se concentre autour de quelques grands acteurs capables de fournir ce qui fonctionne réellement.
Source : https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


