Deepseek est étonnamment bon marché, le modèle d'IA défie les géants de l'industrie. La V3 Deepseek de la startup chinoise, avec des technologies innovantes comme la prédiction multi-token (MTP), le mélange d'experts (MOE) utilisant 256 réseaux neuronaux et l'attention latente multi-têtes (MLA), a initialement réclamé un coût de formation de seulement 6 millions de dollars en utilisant 2048 2048 GPUS. Ce chiffre apparemment bas, cependant, contraste fortement avec les résultats de la semianalyse révélant une infrastructure massive d'environ 50 000 GPU NVIDIA (y compris les unités H800, H100 et H20 H20) dans plusieurs centres de données, représentant un investissement total de serveur d'environ 1,6 milliard de dollars et des dépenses opérationnelles à proximité des dépenses de fonction 944 millions de dollars.
Image: esigame.com
Image: esigame.com
Deepseek, une filiale du hedge fund de haut vol, possède ses centres de données, favorisant l'innovation et l'optimisation rapides. Sa nature autofinancée et ses salaires élevés (certains chercheurs gagnent plus de 1,3 million de dollars par an) attirent les meilleurs talents chinois, contribuant à son succès. Le chiffre initial de 6 millions de dollars ne reflète que les coûts de GPU avant la formation, l'omission de la recherche, du raffinement, du traitement des données et des dépenses d'infrastructure. L'investissement réel de Deepseek dans le développement de l'IA dépasse 500 millions de dollars. Malgré cet investissement important, sa structure Lean permet une innovation efficace par rapport à des concurrents plus importants et plus bureaucratiques.
Image: esigame.com
Image: esigame.com
Alors que la revendication du "budget révolutionnaire" de Deepseek est sans doute gonflée, son succès met en évidence le potentiel concurrentiel d'une société d'IA indépendante bien financée. Le contraste est frappant lors de la comparaison des coûts de formation: le R1 de Deepseek coûte 5 millions de dollars, tandis que ChatGPT-4 aurait coûté 100 millions de dollars, soulignant la rentabilité relative de Deepseek, même avec son investissement global substantiel.