Deepseek's verrassend goedkope AI -model daagt reuzen uit de industrie uit. De Chinese startup beweert zijn krachtige Deepseek V3
te hebben getraind voor slechts $ 6 miljoen, met slechts 2048 GPU's, die concurrenten aanzienlijk ondermijnt. Dit schijnbaar lage kosten, echter, schuilt een veel grotere investering.
De innovatieve architectuur van Deepseek V3 draagt bij aan de efficiëntie ervan. Belangrijkste technologieën omvatten multi-token voorspelling (MTP) voor gelijktijdige woordvoorspelling, mengsel van experts (MOE) met behulp van 256
s en multi-head latente aandacht (MLA) voor verbeterde focus op cruciale zinselementen.
Afbeelding: ensigame.com
echter, een nadere blik onthult echter een substantiële investering in infrastructuur. Semianyse ontdekte het gebruik van Deepseek van ongeveer 50.000 NVIDIA Hopper GPU's, in totaal ongeveer $ 1,6 miljard aan serverkosten en $ 944 miljoen aan operationele kosten. Dit contrasteert scherp met de initiële trainingskostenclaim van $ 6 miljoen, die alleen verantwoordelijk is voor GPU-gebruik pre-training, exclusief onderzoek, verfijning, gegevensverwerking en algemene infrastructuur.
Het succes van Deepseek komt voort uit zijn onafhankelijke structuur, waardoor snelle innovatie en efficiënte middelenallocatie mogelijk zijn. Het bedrijf, een dochteronderneming van het high-flyer hedgefonds, bezit zijn datacenters, in tegenstelling tot cloud-reliante concurrenten. Bovendien trekken de hoge salarissen toptalent aan van Chinese universiteiten. De totale investering van Deepseek in AI -ontwikkeling is groter dan $ 500 miljoen.
Hoewel de "budgetvriendelijke" claim van Deepseek misleidend is, blijft de kosteneffectiviteit ten opzichte van concurrenten opmerkelijk. Het R1 -model van het bedrijf kost $ 5 miljoen om te trainen, vergeleken met de $ 100 miljoen van Chatgpt4. Het voorbeeld van Deepseek toont het potentieel van een goed gefinancierd, Agile AI-bedrijf om effectief te concurreren met gevestigde spelers, ondanks de overdrijving van de initiële kostenclaims. De realiteit is een belangrijke investering, technologische vooruitgang en een bekwaam personeelsbestand is de sleutel tot het succes ervan. Neural Network