Deepseek รุ่น AI ที่ไม่แพงอย่างน่าประหลาดใจท้าทายยักษ์ใหญ่ในอุตสาหกรรม Deepseek V3 ของจีนเริ่มต้นด้วยเทคโนโลยีที่เป็นนวัตกรรมเช่นการทำนายแบบหลายจุด (MTP) การผสมผสานของผู้เชี่ยวชาญ (MOE) โดยใช้เครือข่ายประสาท 256 เครือข่ายและความสนใจแฝงหลายหัว (MLA) เริ่มแรก GPU อย่างไรก็ตามตัวเลขที่ดูเหมือนต่ำนี้ตรงกันข้ามกับผลการวิจัยของ Semianalysis เผยให้เห็นโครงสร้างพื้นฐานขนาดใหญ่ประมาณ 50,000 NVIDIA GPU (รวมถึง H800, H100 และ H20 หน่วย) ในศูนย์ข้อมูลหลายแห่งซึ่งเป็นตัวแทนของการลงทุนเซิร์ฟเวอร์รวมประมาณ 1.6 พันล้านดอลลาร์และค่าใช้จ่ายในการดำเนินงาน $ 944 ล้าน
IMGP%Image: Ensigame.com
IMGP%Image: Ensigame.com
Deepseek ซึ่งเป็น บริษัท ย่อยของกองทุนป้องกันความเสี่ยงสูงเป็นเจ้าของศูนย์ข้อมูลส่งเสริมนวัตกรรมและการเพิ่มประสิทธิภาพอย่างรวดเร็ว ธรรมชาติที่ได้รับการสนับสนุนตนเองและเงินเดือนสูง (นักวิจัยบางคนมีรายได้มากกว่า $ 1.3 ล้านต่อปี) ดึงดูดความสามารถของจีนชั้นนำซึ่งมีส่วนทำให้เกิดความสำเร็จ ตัวเลขเริ่มต้น $ 6 ล้านสะท้อนถึงค่าใช้จ่าย GPU ก่อนการฝึกอบรมการละเว้นการวิจัยการปรับแต่งการประมวลผลข้อมูลและค่าใช้จ่ายโครงสร้างพื้นฐาน การลงทุนที่แท้จริงของ Deepseek ในการพัฒนา AI เกินกว่า $ 500 ล้าน แม้จะมีการลงทุนที่สำคัญนี้โครงสร้างแบบลีนช่วยให้มีนวัตกรรมที่มีประสิทธิภาพเมื่อเทียบกับคู่แข่งที่มีขนาดใหญ่และมีระบบราชการมากขึ้น
IMGP%Image: Ensigame.com
IMGP%Image: Ensigame.com
ในขณะที่การเรียกร้อง "งบประมาณการปฏิวัติ" ของ Deepseek นั้นสูงเกินจริง แต่ความสำเร็จของมันก็เน้นถึงศักยภาพในการแข่งขันของ บริษัท AI ที่ได้รับการสนับสนุนและได้รับการสนับสนุนอย่างดี ความแตกต่างนั้นเกิดขึ้นอย่างสิ้นเชิงเมื่อเปรียบเทียบค่าใช้จ่ายในการฝึกอบรม: R1 ของ Deepseek มีราคา $ 5 ล้านในขณะที่ ChatGPT-4 มีราคา $ 100 ล้านที่มีราคา $ 100 ล้านซึ่งเป็นการเน้นย้ำถึงความคุ้มค่าของ Deepseek แม้จะมีการลงทุนโดยรวมที่สำคัญ