DeepSeek令人驚訝的是,廉價的AI模型挑戰了行業巨頭。中國初創公司的DeepSeek V3,具有創新技術,例如多鍵預測(MTP),專家(MOE)使用256個神經網絡和多頭潛在注意力(MLA),最初聲稱培訓成本僅為600萬美元,僅使用2048美元GPU。然而,這個看似低的數字與半分析的發現形成鮮明對比,揭示了多個數據中心的大量基礎架構(包括H800,H100和H20單位),代表了總計16億美元的總投資,附近的服務器投資和運營費用約為16億美元。 9.44億美元。
圖像:ensigame.com
圖像:ensigame.com
高級對衝基金的子公司DeepSeek擁有其數據中心,從而促進了快速的創新和優化。它的自籌資金性質和高薪(一些研究人員每年的收入超過130萬美元)吸引了中國頂級人才,從而促進了其成功。最初的600萬美元數字僅反映了培訓前的GPU成本,省略了研究,改進,數據處理和基礎設施費用。 DeepSeek對AI開發的實際投資超過5億美元。盡管進行了巨大的投資,但與更大的官僚競爭者相比,其精益結構允許有效的創新。
圖像:ensigame.com
圖像:ensigame.com
盡管DeepSeek的“革命預算”主張可以說是誇大的,但其成功凸顯了一家資金充足的獨立AI公司的競爭潛力。在比較培訓成本時,對比很明顯:DeepSeek的R1耗資500萬美元,而Chatgpt-4據說耗資1億美元,即使大量的整體投資也強調了DeepSeek的相對成本效益。