DeepSeek令人惊讶的是,廉价的AI模型挑战了行业巨头。中国初创公司的DeepSeek V3,具有创新技术,例如多键预测(MTP),专家(MOE)使用256个神经网络和多头潜在注意力(MLA),最初声称培训成本仅为600万美元,仅使用2048美元GPU。然而,这个看似低的数字与半分析的发现形成鲜明对比,揭示了多个数据中心的大量基础架构(包括H800,H100和H20单位),代表了总计16亿美元的总投资,附近的服务器投资和运营费用约为16亿美元。 9.44亿美元。
图像:ensigame.com
图像:ensigame.com
高级对冲基金的子公司DeepSeek拥有其数据中心,从而促进了快速的创新和优化。它的自筹资金性质和高薪(一些研究人员每年的收入超过130万美元)吸引了中国顶级人才,从而促进了其成功。最初的600万美元数字仅反映了培训前的GPU成本,省略了研究,改进,数据处理和基础设施费用。 DeepSeek对AI开发的实际投资超过5亿美元。尽管进行了巨大的投资,但与更大的官僚竞争者相比,其精益结构允许有效的创新。
图像:ensigame.com
图像:ensigame.com
尽管DeepSeek的“革命预算”主张可以说是夸大的,但其成功凸显了一家资金充足的独立AI公司的竞争潜力。在比较培训成本时,对比很明显:DeepSeek的R1耗资500万美元,而Chatgpt-4据说耗资1亿美元,即使大量的整体投资也强调了DeepSeek的相对成本效益。