Pénurie de puces: la crise de la mémoire est-elle grave?

EXPERT INVITÉ. Depuis deux ans, l’intelligence artificielle (IA) est souvent présentée comme une révolution logicielle, dominée par les algorithmes et la puissance de calcul. Pourtant, derrière cette révolution visible se cache une réalité beaucoup plus industrielle: sans mémoire, l’IA ne fonctionne tout simplement pas. Et aujourd’hui, ce n’est plus la capacité de calcul qui pose le plus de problèmes, mais la capacité à fournir la mémoire nécessaire pour alimenter cette nouvelle infrastructure mondiale. Synthèse, analyse et opportunité d’investissement.

Depuis le début de 2026, un message revient comme un boomerang chez les grands patrons de la tech: la mémoire devient le nouveau goulet d’étranglement.

Si l’agence Bloomberg ou encore le Wall Street Journal en ont parlé récemment, Tim Cook explique que cette tension peut comprimer les marges de l’iPhone, non pas parce que la demande faiblit, mais parce que certains composants deviennent tout simplement plus chers et plus difficiles à sécuriser.

Elon Musk, lui, résume le dilemme avec une brutalité très «industrielle»: soit on «tape le mur», soit on construit une usine, ce qui en dit long sur la gravité perçue du sujet.

Derrière ces déclarations, le moteur est clair: la construction frénétique de centres de données IA absorbe une part croissante des capacités, et surtout des puces mémoire associées aux accélérateurs.

Le résultat, c’est une inflation visible sur certains types de DRAM (mémoire dynamique à accès aléatoire), avec des hausses très rapides et une retarification quasi quotidienne chez certains intermédiaires.

Ce choc arrive «trop tôt», car il se manifeste alors même que les plans de capex IA ne font que monter en puissance.

On reparle donc de pénurie, non pas comme un accident logistique, mais comme un déséquilibre structurel entre une demande IA explosive et une offre qui ne peut pas se réajuster en quelques trimestres.

Et quand la mémoire se tend, tout l’écosystème tremble: téléphones intelligents, PC, consoles, auto, télécoms, et même certains industriels.

Moralité: ce n’est pas «une» crise des puces, c’est «la» crise de la mémoire, et elle redistribue déjà les cartes.

Une puce, c’est quoi?

Quand on dit «puce», on met souvent dans le même sac des réalités totalement différentes: processeurs, capteurs, puces de communication, contrôleurs, et bien sûr mémoire.

Une puce, au fond, c’est un petit circuit gravé sur du silicium qui exécute une fonction précise, et l’ensemble forme un «système» où chaque pièce dépend des autres.

Le cerveau, ce sont les puces de calcul ; la mémoire, c’est à la fois la réserve et l’autoroute qui permet au cerveau de travailler sans s’étouffer.

Dans l’IA, cette notion explose, car les modèles exigent un accès ultra-rapide à des quantités massives de données, et c’est la bande passante mémoire qui devient la contrainte numéro un.

Voilà pourquoi on parle autant de DRAM, et encore plus de mémoire haut débit (HBM): ce n’est pas seulement «plus de mémoire», c’est «de la mémoire beaucoup plus rapide», plus complexe à fabriquer, et plus difficile à produire en volume.

Le point clé, c’est que la mémoire HBM n’est pas un produit interchangeable: elle demande des procédés avancés, du packaging sophistiqué, des rendements délicats, et une chaîne d’équipement très spécifique.

Résultat: vous pouvez avoir des capacités de fabrication qui semblent importantes sur le papier, mais qui ne se traduisent pas en disponibilité réelle sur les composants les plus demandés.

C’est comparable à un embouteillage: l’infrastructure est en place, mais c’est un point de passage critique qui crée la contrainte. Lorsque ce point devient saturé, l’ensemble du système ralentit, même si, en apparence, l’offre globale de puces reste disponible.

Que s’est-il passé en........

© Les Affaires