Il modello di intelligenza artificiale sorprendentemente economico di DeepSeek sfida i giganti del settore. La startup cinese afferma di aver addestrato i suoi potenti DeepSeek V3
per soli $ 6 milioni, utilizzando solo 2048 GPU, sotto i concorrenti. Questo costo apparentemente basso, tuttavia, smentisce un investimento molto più grande.
L'architettura innovativa di DeepSeek V3 contribuisce alla sua efficienza. Le tecnologie chiave includono la previsione multi-token (MTP) per la previsione di parole simultanee, la miscela di esperti (MOE) utilizzando 256
s e attenzione latente a testa multipla (MLA) per una maggiore attenzione agli elementi della frase cruciale.
Immagine: Ensigame.com
Tuttavia, uno sguardo più attento rivela un sostanziale investimento di infrastrutture. La semianalisi ha scoperto l'uso da parte di Deepseek di circa 50.000 GPU di Nvidia Hopper, per un totale di circa $ 1,6 miliardi di costi del server e $ 944 milioni in spese operative. Ciò contrasta bruscamente con il reclamo iniziale di costi di formazione da 6 milioni di dollari, che rappresenta solo l'utilizzo della GPU pre-allenamento, esclusa la ricerca, la raffinatezza, l'elaborazione dei dati e l'infrastruttura complessiva.
Immagine: Ensigame.com
Il successo di DeepSeek deriva dalla sua struttura indipendente, consentendo una rapida innovazione e un'allocazione efficiente delle risorse. La società, una consociata di hedge fund ad alto flyer, possiede i suoi data center, a differenza dei concorrenti al cloud-affini. Inoltre, i suoi alti salari attirano i migliori talenti dalle università cinesi. L'investimento totale di DeepSeek nello sviluppo dell'IA supera $ 500 milioni.
Immagine: Ensigame.com
Neural Network Mentre l'affermazione "economica" di Deepseek è fuorviante, il suo efficacia in termini di costi rispetto ai concorrenti rimane notevole. Il modello R1 dell'azienda costa $ 5 milioni per l'allenamento, rispetto ai $ 100 milioni di CHATGPT4. L'esempio di Deepseek mostra il potenziale di una società di intelligenza artificiale ben finanziata e agile di competere efficacemente con i giocatori affermati, nonostante l'esagerazione delle sue richieste iniziali. La realtà è un investimento significativo, i progressi tecnologici e una forza lavoro qualificata sono fondamentali per il suo successo. Neural Network