Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri devlerine meydan okuyor. Çinli girişimin Deepseek V3'ü, çoklu eğimli tahmin (MTP), 256 sinir ağı kullanan uzmanların (MOE) karışımı ve çok başlı gizli dikkat (MLA) gibi yenilikçi teknolojilere sahip, başlangıçta 2048 kullanarak sadece 6 milyon dolarlık bir eğitim maliyeti iddia etti. GPUS. Bununla birlikte, bu görünüşte düşük figür, semanaliz bulgularıyla keskin bir tezat oluşturuyor 'yaklaşık 50.000 NVIDIA GPU'ların (H800, H100 ve H20 birimleri dahil) birden fazla veri merkezinde, kabaca 1,6 milyar dolarlık toplam sunucu yatırımını temsil eden yaklaşık 1,6 milyar dolarlık ve operasyonel masrafları yakının. 944 milyon dolar.
%İmgp%resim: ensigame.com
%İmgp%resim: ensigame.com
High Flyer Hedge Fund'ın bir yan kuruluşu olan Deepseek, hızlı inovasyon ve optimizasyonu teşvik eden veri merkezlerinin sahibidir. Kendini finanse eden doğası ve yüksek maaşları (bazı araştırmacılar yılda 1,3 milyon doların üzerinde kazanıyor) en iyi Çin yeteneklerini çekerek başarısına katkıda bulunuyor. İlk 6 milyon dolarlık rakam yalnızca eğitim öncesi GPU maliyetlerini, araştırmayı, arıtmayı, veri işleme ve altyapı masraflarını yansıtır. Deepseek'in AI gelişimine gerçek yatırımı 500 milyon doları aşıyor. Bu önemli yatırıma rağmen, yalın yapısı, daha büyük, daha bürokratik rakiplere kıyasla verimli bir yeniliğe izin verir.
%İmgp%resim: ensigame.com
%İmgp%resim: ensigame.com
Deepseek'in "devrimci bütçe" iddiası tartışmalı olarak şişirilirken, başarısı iyi finanse edilen, bağımsız bir AI şirketinin rekabet potansiyelini vurgulamaktadır. Eğitim maliyetlerini karşılaştırırken kontrast keskindir: Deepseek'in R1'in 5 milyon doları, ChatGPT-4'ün 100 milyon dolara mal olduğu bildiriliyor ve Deepseek'in göreceli maliyet etkinliğinin altını çiziyor.