Selon une estimation, ChatGPT pourrait coûter jusqu’à 700 000 $ par jour à OpenAI à cause des serveurs très onéreux dont il dépend. Ce coût élevé est dû à l’énorme puissance informatique nécessaire pour répondre aux requêtes des utilisateurs. Microsoft travaillerait en secret pour réduire ces frais en développant une puce d’IA appelée Athena.
Un coût opérationnel élevé pour le modèle ChatGPT
D’après Dylan Patel, analyste en chef chez SemiAnalysis, une entreprise de recherche en semi-conducteurs, il en coûterait près de 700 000 $ par jour à OpenAI pour faire fonctionner ChatGPT. Cette somme est principalement due aux serveurs onéreux nécessaires au fonctionnement de l’IA.
Le coût opérationnel actuel de ChatGPT serait probablement encore plus élevé, puisque l’estimation initiale de Patel repose sur le modèle GPT-3 d’OpenAI. GPT-4, le dernier modèle de l’entreprise, serait encore plus coûteux à faire fonctionner.
OpenAI n’a pas répondu immédiatement à la demande de commentaire d’Insider avant la publication de cet article.
Bien qu’entraîner les grands modèles de langage de ChatGPT coûte probablement des dizaines de millions de dollars,
Les dépenses opérationnelles, ou coûts d’inférence, “dépassent largement les coûts de formation à l’échelle raisonnable”, ont déclaré Patel et Afzal Ahmad, un autre analyste de SemiAnalysis à Forbes.
Microsoft développe une puce IA baptisée Athena
Microsoft serait en train de développer une puce IA baptisée Athena pour réduire le coût d’exploitation des modèles d’IA générative. Le projet, lancé en 2019, fait suite à un accord de 1 milliard de dollars entre Microsoft et OpenAI, où OpenAI a accepté d’exploiter ses modèles exclusivement sur les serveurs cloud Azure de Microsoft.
L’idée derrière la création d’Athena était double:
- les dirigeants de Microsoft se sont rendu compte qu’ils avaient du retard par rapport à Google et Amazon dans leurs efforts pour créer leurs propres puces maison,
- en même temps, ils recherchaient des alternatives moins coûteuses pour leurs modèles d’IA, qui fonctionnaient alors sur les puces de Nvidia appelées GPU.
Aujourd’hui, plus de 300 employés de Microsoft travailleraient sur cette puce, selon les informations recueillies. Athena pourrait être disponible pour une utilisation en interne par Microsoft et OpenAI dès l’année prochaine.
Microsoft n’a pas souhaité commenter ces informations.