दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। चीनी स्टार्टअप के दीपसेक वी 3, मल्टी-टोकन प्रेडिक्शन (एमटीपी), मिक्सचर ऑफ एक्सपर्ट्स (एमओई) जैसी नवीन तकनीकों का दावा करते हुए 256 तंत्रिका नेटवर्क का उपयोग करते हुए, और मल्टी-हेड लेटेंट ध्यान (एमएलए) ने शुरू में 2048 का उपयोग करके केवल $ 6 मिलियन की प्रशिक्षण लागत का दावा किया। Gpus। यह प्रतीत होता है कि यह कम आंकड़ा है, हालांकि, सेमायनालिसिस के निष्कर्षों के साथ तेजी से विपरीत है, जिसमें कई डेटा केंद्रों में लगभग 50,000 एनवीडिया जीपीयू (एच 800, एच 100, और एच 20 यूनिट सहित) के बड़े पैमाने पर बुनियादी ढांचे का पता चलता है, जो लगभग 1.6 बिलियन डॉलर और परिचालन खर्चों के कुल सर्वर निवेश का प्रतिनिधित्व करता है। $ 944 मिलियन।
छवि: ensigame.com
छवि: ensigame.com
हाई-फ्लाइर हेज फंड की सहायक कंपनी दीपसेक, अपने डेटा सेंटरों का मालिक है, जो तेजी से नवाचार और अनुकूलन को बढ़ावा देती है। इसकी स्व-वित्त पोषित प्रकृति और उच्च वेतन (कुछ शोधकर्ता सालाना $ 1.3 मिलियन से अधिक कमाते हैं) शीर्ष चीनी प्रतिभा को आकर्षित करते हैं, इसकी सफलता में योगदान करते हैं। प्रारंभिक $ 6 मिलियन का आंकड़ा केवल पूर्व-प्रशिक्षण जीपीयू लागत, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे के खर्चों को दर्शाता है। एआई विकास में दीपसेक का वास्तविक निवेश $ 500 मिलियन से अधिक है। इस महत्वपूर्ण निवेश के बावजूद, इसकी दुबला संरचना बड़े, अधिक नौकरशाही प्रतियोगियों की तुलना में कुशल नवाचार के लिए अनुमति देती है।
छवि: ensigame.com
छवि: ensigame.com
जबकि दीपसेक के "क्रांतिकारी बजट" का दावा यकीनन फुलाया जाता है, इसकी सफलता एक अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनी की प्रतिस्पर्धी क्षमता पर प्रकाश डालती है। प्रशिक्षण लागतों की तुलना करते समय इसके विपरीत है: दीपसेक की आर 1 की लागत $ 5 मिलियन है, जबकि CHATGPT-4 की कथित तौर पर $ 100 मिलियन खर्च होती है, जो कि डीपसेक की सापेक्ष लागत-प्रभावशीलता को रेखांकित करती है, यहां तक कि इसके पर्याप्त समग्र निवेश के साथ भी।