दीपसेक की आश्चर्यजनक रूप से सस्ती एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। चीनी स्टार्टअप ने दावा किया है कि उसने अपने शक्तिशाली दीपसेक वी 3
को केवल $ 6 मिलियन के लिए प्रशिक्षित किया है, केवल 2048 जीपीयू का उपयोग करते हुए, प्रतियोगियों को काफी कम कर दिया। यह प्रतीत होता है कि कम लागत, हालांकि, बहुत बड़ा निवेश करता है।
दीपसेक वी 3 की अभिनव वास्तुकला इसकी दक्षता में योगदान देती है। प्रमुख प्रौद्योगिकियों में एक साथ शब्द भविष्यवाणी के लिए बहु-टोकन भविष्यवाणी (एमटीपी), विशेषज्ञों का मिश्रण (एमओई) 256
एस, और मल्टी-हेड अव्यक्त ध्यान (एमएलए) का उपयोग महत्वपूर्ण वाक्य तत्वों पर बढ़ाया ध्यान केंद्रित करने के लिए शामिल है।
हालांकि, एक नज़दीकी नज़र से एक पर्याप्त बुनियादी ढांचा निवेश का पता चलता है। सेमियालिसिस ने डीपसेक के लगभग 50,000 एनवीडिया हॉपर जीपीयू के उपयोग को उजागर किया, जो सर्वर लागत में लगभग 1.6 बिलियन डॉलर और परिचालन खर्चों में $ 944 मिलियन था। यह प्रारंभिक $ 6 मिलियन प्रशिक्षण लागत दावे के साथ तेजी से विपरीत है, जो केवल पूर्व-प्रशिक्षण GPU उपयोग के लिए जिम्मेदार है, अनुसंधान, शोधन, डेटा प्रसंस्करण और समग्र बुनियादी ढांचे को छोड़कर।
छवि: ensigame.com
डीपसेक की सफलता अपनी स्वतंत्र संरचना से उपजी है, जो तेजी से नवाचार और कुशल संसाधन आवंटन के लिए अनुमति देती है। कंपनी, हाई-फ्लाइर हेज फंड की सहायक कंपनी, क्लाउड-रिलेटिक प्रतियोगियों के विपरीत, अपने डेटा केंद्रों का मालिक है। इसके अलावा, इसकी उच्च वेतन चीनी विश्वविद्यालयों से शीर्ष प्रतिभा को आकर्षित करती है। एआई विकास में दीपसेक का कुल निवेश $ 500 मिलियन से अधिक है।
छवि: ensigame.com