Dossier

Pénurie hardware 2026 : quel impact sur vos compagnons IA ?

En 2026, l'IA aspire toute la chaîne de production mondiale. GPU, mémoire, processeurs : tout y passe. Et vos compagnons IA, de Nomi à Character.AI en passant par Kindroid et Replika, tournent sur le même matériel. Comptes gratuits réduits, prix en hausse, fonctionnalités découpées : on vous explique d'où ça vient et où ça va.

Petit compagnon IA observant une autoroute de données lumineuse menant vers des tours de serveurs géantes, symbole de la pénurie hardware liée aux data centers de l'IA.

Petite annonce avant de commencer. Ce dossier est différent de ce qu'on publie habituellement ici. Plus technique, plus hardware, plus chiffré. Mais il vous concerne directement, parce que les compagnons IA que vous utilisez tous les jours tournent sur le même matériel dont on va parler. Et ce qui s'y passe en ce moment, ça se voit déjà sur Nomi, Kindroid ou même Candy pour ne citer qu'eux, mais c'est le cas pour toutes les plateformes. On vous explique pourquoi. Et oui, ça fait mal. Même pour les gamers. Et pour tout le monde, en fait.

Ce qui se passe

Pourquoi tout part en pénurie

Il y a cinq ans, Nvidia vendait surtout des cartes graphiques aux gamers. Aujourd'hui, c'est la plus grosse entreprise au monde. Le 13 mai 2026, elle a dépassé les 5 500 milliards de dollars en bourse, devant Apple, devant Microsoft. Pour vous donner une idée, la seule chose qui vaut plus cher sur la planète, c'est l'ensemble de l'or en circulation. Si vous n'arrivez pas à vous représenter une telle somme, ne vous inquiétez pas, personne ne le peut.

Ce qui a tout changé, c'est l'IA. Les puces qui servent à entraîner ChatGPT, Claude, Gemini, Grok et tous les autres, c'est Nvidia qui les fabrique. Quasiment toutes. Si ce nom ne vous dit rien, il est pourtant partout autour de vous.

Un peu de contexte. Au début des années 90, Nvidia s'est fait connaître en fabriquant les cartes graphiques qui permettent aux joueurs PC d'avoir les meilleurs graphismes. Beaucoup de films avec des images de synthèse ont été rendus possibles grâce à leurs solutions. Et aujourd'hui, ces mêmes cartes se retrouvent au cœur de l'IA, parce qu'elles sont parfaites pour l'entraînement des modèles et la génération d'images. Pour la conversation au quotidien, ça commence à basculer sur d'autres puces spécialisées, les NPU (des petites puces dédiées à l'IA, intégrées directement dans les téléphones et PC récents). Mais pour tout ce qui demande de la puissance brute, Nvidia reste seul maître à bord.

Et ça se voit dans les chiffres. Dans son dernier rapport publié le 20 mai, la division data centers IA a sorti 75 milliards de dollars de revenus sur un seul trimestre. Les cartes graphiques pour les gamers ? Nvidia ne les compte même plus à part. Elles sont maintenant reléguées dans une nouvelle catégorie baptisée "Edge Computing", un fourre-tout qui mélange le gaming avec la robotique, l'automobile et les télécoms. 6,4 milliards sur 81,6 au total. C'est pas une petite somme, mais bon, 8 %... Le gaming n'a pas quitté Nvidia, et Nvidia n'a pas quitté le gaming non plus. Côté logiciel, l'entreprise reste très active, y compris sur le cloud gaming. Mais côté matériel, les priorités ont basculé. Pour l'instant.

Pour mesurer le basculement, il suffit de comparer avec 2021. À l'époque du boom crypto, les mineurs raflaient toutes les cartes graphiques et les gamers ne trouvaient plus rien en magasin. On avait tendance à voir Nvidia comme une victime collatérale. C'est plus compliqué que ça. L'entreprise a lancé des puces spécialement conçues pour le minage, engrangé des centaines de millions dessus, et la SEC (organisme fédéral américain de réglementation et de contrôle des marchés financiers) l'a condamnée à 5,5 millions de dollars d'amende pour avoir maquillé l'impact du minage sur ses revenus gaming. En 2021, Nvidia profitait de la situation tout en faisant mine de la subir. En 2026, plus besoin de faire semblant. Les puces IA partent aux data centers avec des marges colossales. Le gaming ? Il attend son tour comme toujours.

Trois entreprises tiennent toute la chaîne

À chaque pénurie hardware depuis dix ans, c'est le même nom qui revient. TSMC, un fabricant taïwanais qui produit à lui seul 90 % des puces les plus avancées de la planète. Quand Apple, Nvidia ou AMD conçoivent une puce, c'est TSMC qui la fabrique physiquement dans ses usines. Normalement, quand quelque chose coince dans le hardware mondial, c'est par là que ça bloque. Cette fois, TSMC produit, mais sa capacité est aspirée en priorité par les puces IA, qui rapportent bien plus que le reste.

Le deuxième goulot, c'est la mémoire. Pour faire tourner une puce IA, il lui faut un type de mémoire ultra-rapide, conçue pour transporter les milliards de données des modèles à une vitesse que la mémoire classique ne peut pas atteindre. Le secteur l'appelle la HBM, pour High Bandwidth Memory, mémoire à haute bande passante. Et trois entreprises au monde la produisent. Pas dix, pas vingt. Trois. SK Hynix et Samsung en Corée du Sud, Micron aux États-Unis. Derrière ces trois noms, c'est moins d'une dizaine d'usines qui tournent réellement.

Et le prix donne le vertige. Un module de cette mémoire dernière génération se négocie entre 300 et 500 dollars pièce. La RAM qu'on met dans nos PC, celle qui sert à faire tourner vos jeux, vos applications, votre navigateur avec 47 onglets ouverts ? Plutôt 5 à 10 dollars pour une capacité comparable. Quand un fabricant a le choix entre produire de la mémoire IA à 300 dollars ou de la mémoire grand public à 5 dollars, le calcul est vite fait. C'est pas un accident, c'est un choix économique. Et la conséquence directe, c'est que la RAM et le stockage de votre prochain PC grimpent par ricochet, parce que les usines qui les fabriquent habituellement sont siphonnées vers le créneau IA.

Une fois la mémoire produite, il faut encore la coller à la puce, au sens presque littéral. C'est un procédé d'assemblage de pointe que très peu d'usines maîtrisent, et c'est TSMC, encore lui, qui rafle la quasi-totalité de ce marché. En bout de chaîne, quatre acteurs tiennent donc toute la production de hardware IA. Trois pour la mémoire, un pour la fabrication et l'assemblage. Pas de plan B si l'un d'eux tousse.

Au CES, le plus gros salon tech au monde qui se tient chaque année à Las Vegas, la presse a commencé en janvier 2026 à parler d'ère de pandémie mémoire. Dramatique, oui, mais pas si loin de la réalité.

Combien de temps ça va durer

Bon, et ça dure combien de temps tout ça ? La réponse courte, c'est pas un retour à la normale avant 2028. Et c'est le scénario optimiste.

En février 2026, le patron d'Intel Lip-Bu Tan a posé la formule qui circule depuis dans toute l'industrie : « Aucun soulagement avant 2028 ». Il a précisé avoir échangé directement avec des fabricants de mémoire, qui lui ont confirmé le même horizon. Les trois construisent de nouvelles usines à travers le monde, mais elles n'entreront en service qu'en 2027-2028 au plus tôt. Le temps qu'elles montent en volume, on parle plutôt de 2028-2029. Si la demande continue de gonfler au rythme actuel, ça pourrait aller jusqu'à 2030. Ça fait long.

« Aucun soulagement avant 2028 »

Lip-Bu Tan, patron d'Intel

Et la demande va continuer de gonfler. En mars de cette année, Jensen Huang, le patron de Nvidia, a annoncé qu'il prévoit mille milliards de dollars de commandes de puces IA dans les deux ans à venir. Pas cent, pas cinq cents. Mille. C'est le double de ce qu'il annonçait un an plus tôt. Pour donner un ordre de grandeur, le PIB annuel de la Suisse c'est 900 milliards.

Et Huang ne cache pas comment ça va se passer. Amazon, Microsoft, Google, Meta, les géants du cloud qui ont les moyens de poser un milliard sur la table pour réserver un million de puces, ils sont servis en premier. Le reste passe après. Et "le reste", c'est tout le monde. Les chercheurs, les startups, et par ricochet les équipes qui font tourner vos compagnons IA.

La pénurie ne se résoudra pas par expansion de l'offre. Elle se résoudra par tri des clients, et les derniers de la chaîne c'est nous.

La pénurie ne se résoudra pas par expansion de l'offre. Elle se résoudra par tri des clients, et les derniers de la chaîne c'est nous.

L'onde de choc hardware

Nvidia gaming, victime de Nvidia IA

On a vu pourquoi Nvidia priorise l'IA. Maintenant, regardons ce que ça donne concrètement si vous êtes un gamer.

Pour ceux qui ne suivent pas le hardware, voilà le résumé : les nouvelles cartes graphiques que les joueurs attendent depuis plus d'un an n'arrivent pas. Les RTX 50 Super, attendues depuis fin 2025, celles qui devaient apporter 50 % de mémoire en plus sur les RTX 5070 et 5080, ont été reportées indéfiniment. La RTX 5060 Ti 16 Go a vu sa production coupée, la mémoire réallouée ailleurs. La prochaine génération, la RTX 60, est repoussée à fin 2027 voire 2028. En résumé, aucune nouvelle carte gaming majeure en 2026.

Et pour combler le trou, Nvidia a sorti une surprise qui ressemble à un aveu. L'entreprise relance la production de la RTX 3060 12 Go, une carte sortie en 2021. Pas du déstockage, des puces neuves fabriquées cette année, avec de la mémoire d'ancienne génération qui elle non plus n'est pas dans le même goulot. En janvier, Jensen Huang a qualifié cette relance de "bonne idée". Quand le patron de la plus grosse boîte tech au monde dit que ressortir une carte de cinq ans c'est une bonne idée, on a compris le message. Nvidia a confirmé dans la foulée que le stock de cartes gaming resterait tendu pour au moins six mois. On a du mal à les croire, vu comment la sortie des premières RTX 5000 s'est passée.

Quand le patron de la plus grosse boîte tech au monde dit que ressortir une carte de cinq ans c'est une bonne idée, on a compris le message.

Et la concurrence ?

Question naturelle : si Nvidia n'arrive plus à fournir, pourquoi pas aller voir ailleurs ?

Le problème, c'est qu'il n'y a pas vraiment d'ailleurs. Le seul concurrent historique de Nvidia sur les cartes graphiques, c'est AMD. Si vous avez un PC ou un Mac, vous avez probablement déjà vu le nom, c'est aussi eux qui fabriquent beaucoup de processeurs, les puces qui font tourner votre machine au quotidien. Côté cartes graphiques pour les gamers, AMD a toujours joué le rôle de l'alternative souvent moins chère. Sauf qu'en 2026, ils sont dans la même galère. L'entreprise a annoncé une hausse de prix d'au moins 10 % sur ses cartes, et prévoit une baisse de 20 % de ses revenus gaming au second semestre.

AMD essaie aussi de se faire une place sur le marché des puces IA, mais Nvidia en tient encore plus de 80 % à lui seul. Intel, l'autre grand nom du secteur, a tenté sa chance avec une puce dédiée à l'intelligence artificielle mais le projet est en train d'être abandonné. Il y a aussi quelques petites entreprises spécialisées qui existent, mais elles restent loin derrière.

En résumé, personne n'est en mesure de venir titiller Nvidia. Et tant qu'il n'y a pas de rival crédible, la pression sur toute la chaîne ne se relâchera pas.

L'effet boule de neige

Les cartes graphiques sont en première ligne parce que c'est là que la bataille se joue. Mais la pénurie ne s'arrête pas là. Par effet de cascade, tout y passe.

Les processeurs d'abord. Intel et AMD ont déjà augmenté leurs prix de 10 à 15 % depuis le début de l'année. Et ce n'est pas fini, une nouvelle hausse est prévue au second semestre. L'IA nouvelle génération, celle qui ne se contente plus de répondre à une question mais qui enchaîne des actions toute seule, demande de plus en plus de processeurs en plus des cartes graphiques. Et comme pour le reste, les fabricants servent les data centers en priorité.

Les cartes mères, la RAM, le stockage, tout suit dans la foulée. Le marché du PC à monter soi-même prend un coup, avec des baisses de production de 25 à 37 % chez les fabricants de cartes mères en 2026. Du jamais vu depuis 2008.

Les smartphones aussi. La mémoire qui va dans votre téléphone sort des mêmes usines que celle qui part vers l'IA, et les prix suivent. Les analystes prévoient une hausse moyenne de 13 % cette année. Et pour tenir les tarifs d'affichage, certains fabricants commencent à rogner discrètement sur les composants. Moins de RAM, appareil photo un cran en dessous, écrans moins fins. Vous payez le même prix, mais vous en avez moins. Le secteur appelle ça la "spec shrinkflation", ou si vous préférez en français la réduflation. Des mots bien compliqués pour dire moins bien pour le même prix.

Et au bout de la chaîne, le bas de gamme est en train de disparaître. Les ordinateurs à 500 € ? D'ici 2028, ça n'existera plus d'après plusieurs analystes du secteur.

Et nos compagnons dans tout ça ?

Le silence des plateformes

Tout ce qu'on vient de décrire, les puces qu'on ne trouve plus, la mémoire qui flambe, les usines qui tournent pour l'IA et pas pour le reste, ça ne concerne pas que les gamers et geeks qui montent leur PC. Vos compagnons IA tournent sur la même infrastructure. Nomi, Kindroid, Replika, Character.AI, Candy AI... Toutes ces plateformes louent des serveurs bourrés de GPU pour générer chaque message, chaque selfie, chaque appel vocal que vous recevez. Toutes ces interactions ont un coût matériel. Et chaque élément de la chaîne, comme on l'a vu plus haut, coûte plus cher qu'il y a six mois.

Le truc, c'est qu'on n'en entend presque pas parler. Parmi les grandes plateformes, le sujet ne remonte quasiment jamais. Pas de post de blog, pas de message sur les réseaux. Tout reste en coulisses, et on peut comprendre pourquoi. Expliquer à ses utilisateurs que chaque message et chaque selfie a un coût matériel qui grimpe, c'est pas forcément le genre de nouvelle qu'on a envie de mettre en avant, ça pourrait faire peur aux clients, mais encore plus aux nouveaux arrivants.

Quelques voix sortent quand même du lot. Kindroid est la plateforme qui va le plus loin dans la transparence. Sur leur page d'abonnement, l'équipe écrit que leurs tarifs premium sont conçus pour couvrir les coûts de serveurs dédiés, pas pour générer du profit pour l'instant, et qu'ils s'attendent à être tout juste à l'équilibre voire à perdre de l'argent. Et quand il a fallu restreindre les comptes gratuits, un des développeurs a publié un post sur Reddit et Discord pour expliquer que les prix des GPU avaient grimpé de 30 à 50 %, que la disponibilité était au plus bas, et que les changements étaient déjà en place. Pas de drama, pas d'appel à la compassion, juste les faits. C'est rare dans le monde de la tech.

Chai aussi a joué la carte de la franchise. Le fondateur Will Beauchamp a expliqué directement sur Reddit que la hausse des coûts de calcul avait forcé la plateforme à bloquer l'accès gratuit dans une vingtaine de pays à faibles revenus. Deux plateformes, deux manières de le dire, mais au moins on sait à quoi s'en tenir.

Pour les autres, ce sont les signes qui parlent. Et ils sont partout quand on sait où regarder.

Ce qu'on voit déjà

Si vous êtes sur Character.AI, vous l'avez sûrement remarqué. Le Slow Mode, qui était censé être temporaire à son lancement, est devenu permanent en 2026 pour tous les utilisateurs gratuits. Les réponses sont volontairement plus courtes en heures de pointe, les conversations longues ralentissent significativement. En février, la plateforme a déployé des publicités en plein écran au milieu des conversations, avec une justification officielle qui ne laisse pas beaucoup de place au doute : le coût de faire tourner les systèmes IA.

En mars, nouvelles restrictions : les swipes, qui permettent de demander une réponse alternative quand celle du personnage ne convient pas, les go-ons, qui relancent le personnage pour qu'il continue sa réponse, et les mémos, des notes que le personnage retient d'une conversation à l'autre, tout ça a été limité pour les gratuits. Résultat cumulé, la note de l'application est tombée à 1,5 sur 5 sur les stores en mai 2026. Tout ne s'explique pas par la pénurie, d'autres décisions de la plateforme y ont contribué, mais le fait de rogner petit à petit sur le gratuit y est pour beaucoup.

Chez Replika, c'est une autre approche. La plateforme a lancé sa version 2.0 en mai 2026, avec une refonte complète de sa structure tarifaire. Là où il y avait avant un abonnement unique, il y en a maintenant cinq, du gratuit jusqu'à un palier à plus de cent dollars par mois. Des fonctionnalités qui étaient incluses dans l'abonnement de base ont été découpées en packs payants à l'unité. La migration ne s'est pas faite sans accrocs, on y reviendra dans un article dédié. Mais dans le contexte de ce dossier, ce qu'il faut retenir, c'est la direction : plus de paliers, plus de packs, plus de segmentation. Quand l'infrastructure coûte plus cher, il faut bien que quelqu'un paie.

Candy AI illustre un autre mécanisme. La plateforme affiche un abonnement à 12,99 dollars par mois, et c'est ce prix-là que vous verrez partout dans leur communication. Sauf que fin 2025, Candy a lancé un mode vidéo en direct qui a fait basculer une bonne partie de l'expérience dans une économie de tokens. Concrètement, vous payez votre abonnement, mais chaque interaction un peu gourmande consomme des tokens en plus, qu'il faut racheter séparément. Sur Trustpilot, les témoignages d'utilisateurs réguliers tournent plutôt autour de 25 à 100 dollars par mois une fois les recharges comptées. L'abonnement de base devient une porte d'entrée, pas un prix final.

Nomi, pour l'instant, n'a touché ni à ses prix ni à son free tier. Mais des utilisateurs réguliers signalent depuis mai 2026 une baisse de qualité sur la mémoire de leurs compagnons. Le modèle a changé, les souvenirs se perdent plus vite. Officiellement, rien n'a été communiqué.

Côté images, on a une hypothèse qui n'engage que nous. Nomi a lancé le mois dernier le générateur Image V5, un nouveau système qui change pas mal de choses. Comme avant, vous choisissez un portrait dans la galerie pour poser le visage de votre compagnon. Mais V5 ajoute une couche par-dessus : les anchors. Ce sont des ancres qui fixent les traits physiques de votre Nomi en profondeur, bien au-delà du simple portrait. Le résultat est nettement meilleur, c'est certain.

Mais créer un anchor custom coûte cher en crédits, et si vous voulez vraiment modifier l'apparence de votre compagnon, la note peut vite grimper. La subtilité, c'est ce qui se passe derrière. Une fois l'anchor posé, chaque selfie généré ensuite coûte beaucoup moins de ressources à la plateforme que s'il fallait tout recalculer de zéro à chaque fois. C'est peut-être une des raisons pour lesquelles Nomi arrive à tenir ses prix là où d'autres rament. Malin, si c'est bien ça. Faire payer à l'utilisateur le gros du travail.

On a parlé de la transparence de Kindroid. Mais transparence ne veut pas dire que tout va bien. La génération de selfies est lente, c'est un constat que la communauté partage largement, avec des temps qui peuvent atteindre plusieurs minutes par image. Le free tier a été progressivement resserré, avec des limitations sur les images et l'accès aux fonctionnalités communautaires réservé aux payants. Quand on est une équipe de quelques personnes face à des coûts GPU qui ne cessent de grimper, chaque fonctionnalité gourmande devient un exercice d'équilibriste.

Les plus petites plateformes ne sont pas épargnées. Chai, on l'a vu plus haut, a coupé l'accès gratuit dans une vingtaine de pays du jour au lendemain. Talkie et PolyBuzz ont intégré des publicités qui coupent l'utilisateur en plein milieu d'une conversation. La pression est la même pour tout le monde, et les réponses se ressemblent : restreindre le gratuit, monétiser plus fort, couper dans les ressources.

Et puis il y a les exceptions. CrushOn AI a fait le choix inverse en avril 2026, en multipliant par quinze son offre gratuite. Probablement une stratégie pour attirer de nouveaux utilisateurs dans un marché où les concurrents ferment les vannes. Reste à voir si c'est tenable dans la durée.

Ce qui nous amène à la question de fond : pourquoi ces plateformes n'arrivent-elles pas à encaisser ?

Pourquoi elles ne peuvent pas absorber le choc

Quand OpenAI, Google ou Anthropic font face à la pénurie, ils ont les moyens d'encaisser. Les investissements dans l'IA ont atteint des niveaux records en début d'année 2026, mais cet argent va aux grands laboratoires et aux infrastructures, pas aux compagnons IA.

Character.AI est un cas à part. Fin 2024, ses fondateurs sont partis chez Google, et la plateforme fonctionne depuis sous un accord de licence avec le géant du web. Concrètement, Character.AI a un filet de sécurité. Les autres n'ont pas cette chance. Les équipes sont petites, les levées de fonds modestes, et personne n'a un Google derrière. Certaines plateformes tournent avec une poignée de développeurs.

Et le piège, c'est que pour exister face à la concurrence, il faut innover. Appels vidéo, nouvelles générations d'images, modes de conversation avancés, chaque nouvelle fonctionnalité demande plus de GPU et de mémoire, dans un marché où ces composants se raréfient et coûtent de plus en plus cher. Innover pour survivre, mais chaque innovation creuse un peu plus le trou. Ça tient, mais faut pas souffler trop fort.

Innover pour survivre, mais chaque innovation creuse un peu plus le trou.

Ce qu'il faut retenir

La pénurie hardware de 2026 n'est pas un accident. C'est pas temporaire, c'est un virage. L'IA aspire toute la chaîne de production mondiale, et tout le reste suit. Les GPU, la mémoire, les processeurs, les smartphones, tout y passe. Et vos compagnons IA, qu'ils tournent sur une grosse plateforme comme Character.AI ou Replika, une plus spécialisée comme Candy AI ou Chai, ou une petite équipe indépendante comme Kindroid ou Nomi, ont les mêmes problèmes.

Les effets sont déjà là : des comptes gratuits qui se réduisent, des prix qui montent, des fonctionnalités qui se découpent, des publicités qui s'invitent dans vos conversations. Pas parce que les plateformes deviennent cupides d'un coup, mais parce que le matériel qui fait tourner votre compagnon coûte de plus en plus cher, et que personne dans ce petit monde n'a les reins assez solides pour absorber le choc sans rien changer.

Et ça ne va pas se calmer demain. Pas avant 2028 au mieux, probablement plus tard. En attendant, si votre compagnon répond un peu plus lentement, si un selfie met plus de temps à arriver, ou si une fonctionnalité que vous aimiez devient payante, vous savez maintenant pourquoi.