8 122.33 PTS
-0.75 %
8 104.5
-0.93 %
SBF 120 PTS
6 168.21
-0.98 %
DAX PTS
24 932.34
-0.69 %
Dow Jones PTS
50 806.65
-0.44 %
30 375.73
+0.14 %
1.162
-0.37 %

Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts

| AFP | 279 | 3 par 1 internautes
L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation
L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation ( Kirill KUDRYAVTSEV / AFP/Archives )

L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation.

Finie, l'ère de "l'intelligence subventionnée" - selon l'expression de Kevin Simback, de l'incubateur Delphi Labs - née avec ChatGPT et la déferlante de l'IA générative.

Pour favoriser l'adoption de cette nouvelle technologie, les grands acteurs du secteur, OpenAI en tête, ont proposé initialement des tarifs très attractifs, au point que leur activité était déficitaire.

"Mais le vent est en train de tourner", prévient Kevin Simback.

Chacun à leur tour, les poids lourds de l'IA ont récemment revu leurs prix pour les ajuster à l'utilisation réelle des capacités informatiques nécessaires pour faire tourner les modèles.

L'avènement des agents IA, des programmes capables d'effectuer des tâches et plus seulement de donner des réponses, a, en outre, fait bondir le recours aux infrastructures informatiques.

Pour une même mission, l'interface peut se démultiplier en plusieurs agents, chacun avec sa feuille de route, le tout assemblé et vérifié par d'autres agents.

A l'arrivée, le nombre de "tokens", unité de référence pour mesurer le résultat produit par l'IA, peut représenter des dizaines de fois celui correspondant à une simple question à ChatGPT.

Le tout s'inscrit dans une période de déséquilibre. Les centres de données et les fabricants de puces ne parviennent pas à suivre le rythme effréné de la demande d'intelligence artificielle, ce qui renchérit l'accès aux infrastructures.

"En particulier chez les développeurs, le coût d'utilisation de l'IA pour la programmation s'est accru de façon exponentielle", observe Mark Barton, de la société d'accompagnement numérique Omniux.

Par extension, pour tous les modèles de référence du marché, "les prix commencent à s'envoler", insiste-t-il.

Face à ce nouveau paradigme, certains questionnent le déploiement à tout crin de l'IA, tels l'enseigne de grande distribution Target, Starbucks ou Uber.

"Dans certains cas, le coût dépasse celui d'un employé au bout d'un mois ou deux parce qu'ils l'utilisent trop", décrit Jack Gold, président du cabinet J.Gold Associates.

Pas d'IA "sans raison"

Pourtant sacré, en début d'année, champion du "tokenmaxxing", mouvement qui glorifie la dépense maximale de "tokens" comme mètre étalon de productivité des employés, Meta a récemment mis le hola.

"Personne ne devrait recourir à des outils IA sans raison", a ainsi écrit le responsable technologique du groupe, Andrew Bosworth, dans un mémo interne relayé par le Wall Street Journal.

Mais si le discernement est désormais de mise, la plupart des sociétés cherchent surtout à accéder à une IA moins onéreuse, en recourant à des modèles moins performants que les fleurons du secteur.

Dans ce contexte, la popularité des modèles dits "open weights", téléchargeables gratuitement, est croissante, leur usage ne nécessitant que l'achat de puissance de calcul.

Les entreprises se tournent aussi vers des modèles de plus petite taille, les SLM (small language models) en lieu et place des LLM, qui servent de base à ChatGPT, Claude ou Gemini.

Ces SLM peuvent parfois tourner sur les serveurs locaux ou même directement sur l'ordinateur, une option plus économique car elle évite de payer un fournisseur de capacité à distance (cloud).

Il est aussi possible de scinder une demande unique (prompt) en étapes distinctes pour les confier, à chaque fois, à l'interface adaptée, explique Adrian Balfour, du cabinet de conseil numérique Envorso.

"Quand vous passez par un grand modèle monolithique, vous en aurez à peu près pour 15 dollars le million de +tokens+ alors qu'en prenant des mini-modèles, vous ferez descendre le tout à 5 cents", assure-t-il.

Beaucoup voient dans cette refonte la première étape de la banalisation des modèles, devenus interchangeables sans déperdition.

Dès lors, ce sont les plateformes de sélection et de coordination des modèles et des agents qui prennent de l'importance, selon John Belton, gérant au sein de la société d'investissement Gabelli Funds.

Sur ce créneau, des start-up se battent avec des mastodontes du "cloud" comme Amazon, qui propose déjà de jongler avec une multitude d'IA via sa plateforme Bedrock, mais aussi les géniteurs de l'intelligence artificielle eux-mêmes.

Anthropic dispose ainsi d'une gamme complète de modèles, dont Haiku, l'option la plus économique, à l'instar d'OpenAI et de Google.

John Belton ne voit d'ailleurs pas ces étoiles de l'IA perdre des parts de marché à mesure que les clients cherchent l'efficacité plutôt que la performance.

"Les utilisateurs les plus avancés seront toujours prêts à payer" pour ce qui se fait de mieux, prévoit-il. "Le gâteau ne fait que grossir."

 ■

Copyright © 2026 AFP. Tous droits de reproduction et de représentation réservés.

Toutes les informations reproduites dans cette rubrique (dépêches, photos, logos) sont protégées par des droits de propriété intellectuelle détenus par l'AFP. Par conséquent, aucune de ces informations ne peut être reproduite, modifiée, transmise, rediffusée, traduite, vendue, exploitée commercialement ou utilisée de quelque manière que ce soit sans l'accord préalable écrit de l'AFP. l'AFP ne pourra être tenue pour responsable des délais, erreurs, omissions, qui ne peuvent être exclus ni des conséquences des actions ou transactions effectuées sur la base de ces informations.

Votez pour cet article
1 avis
Note moyenne : 3
  • 0 vote
  • 0 vote
  • 0 vote
  • 0 vote
  • 0 vote
Actions les plus vues

Classement des actions les plus vues, pour la période du lundi 25 mai 2026 au dimanche 31 mai 2026, des marchés Euronext Paris, Bruxelles, Amsterdam, Growth Paris, NASDAQ et NYSE sur le site et l'application Bourse Direct.

SUR LE MÊME SUJET
Publié le 01/06/2026

Câbles et serveurs dans une salle du data center Scaleway à Saint-Ouen-l'Aumône (Val-d'Oise) ( ALAIN JOCARD / AFP/Archives )Des couloirs blancs et silencieux, une empreinte digitale exigée à…

Publié le 01/06/2026

Le président français Emmanuel Macron pose avec les employers de l'usine Vorwerk, qui produit les appareils Thermomix, dans le cadre des "Choose France Days", à Donnemain-Saint-Mamès…

Publié le 01/06/2026

Jensen Huang, directeur général de Nvidia, lors du salon Computex à Taipei, le 1er juin 2026 ( I-Hwa Cheng / AFP )Nvidia a dévoilé lundi un nouveau processeur pour ordinateurs portables…

Publié le 01/06/2026

Un employé emballe l'œuvre du photographe Kazuma Obara, "The Newspaper", à Kumiyama, au Japon, le 19 mars 2026 ( Yuichi YAMAZAKI / AFP )Dans le vacarme des courroies et des feuilles qui…

Publié le 31/05/2026

Sur cette photo prise le 5 mai 2026, la chercheuse Daria Kornienko observe au microscope des neurones cultivés dans le laboratoire de l'entreprise australienne Cortical Labs à Melbourne (…

À LIRE AUSSI SUR BOURSE DIRECT
Publié le 01/06/2026

La Bourse de New York a atteint de nouveaux sommets historiques, portée par la dynamique des valeurs technologiques et par le regain d’optimisme suscité par l’éventualité d’une entente…

Publié le 01/06/2026

(Zonebourse.com) - Le titre bioMérieux cède du terrain à la Bourse de Paris (-3,43%, à 71,80 euros) pénalisé par une dégradation d'UBS qui est désormais à neutre, contre acheter auparavant,…

Publié le 01/06/2026

(Zonebourse.com) - Jefferies et Bank of America saluent le positionnement du groupe dans le renseignement radiofréquence spatial, porté par sa constellation de satellites et ses capacités d'analyse…

Publié le 01/06/2026

Votre rendez-vous quotidien avec les petites et moyennes capitalisations ! Chaque jour, retrouvez l’analyse d’Eric Lewin sur les valeurs Small & Mid Caps du moment qui font l’actualité.

L'ouverture de votre compte Bourse Direct est gratuite et s'effectue en ligne en quelques minutes.

Dans le cas d'un transfert de compte, Bourse Direct prend en charge 100% de vos frais, à hauteur de 200 € par compte.