Deepseek est étonnamment bon marché, le modèle d'IA défie les géants de l'industrie. La startup chinoise prétend avoir formé sa puissante V3
de sa puissanteek pour seulement 6 millions de dollars, utilisant seulement 2048 GPU, sous-coignant considérablement les concurrents. Ce coût apparemment bas, cependant, dément un investissement beaucoup plus important.
Image: esigame.com
L'architecture innovante de Deepseek V3 contribue à son efficacité. Les technologies clés comprennent la prédiction multi-token (MTP) pour la prédiction des mots simultanée, le mélange d'experts (MOE) utilisant 256 s, et l'attention latente multi-tête (MLA) pour une mise au point améliorée sur les éléments de phrase cruciaux.
Image: esigame.com
Cependant, un examen plus approfondi révèle un investissement substantiel d'infrastructure. La semianalyse a découvert l'utilisation par Deepseek d'environ 50 000 GPU Nvidia Hopper, totalisant environ 1,6 milliard de dollars de coûts de serveur et 944 millions de dollars de dépenses opérationnelles. Cela contraste fortement avec la réclamation de coût de formation initiale de 6 millions de dollars, qui ne représente que l'utilisation du GPU avant la formation, l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures globales.
Image: esigame.com
Le succès de Deepseek découle de sa structure indépendante, permettant une innovation rapide et une allocation efficace des ressources. La Société, une filiale de High Flyer Hedge Fund, possède ses centres de données, contrairement aux concurrents de Cloud Cread. De plus, ses salaires élevés attirent les meilleurs talents des universités chinoises. L'investissement total de Deepseek dans le développement de l'IA dépasse 500 millions de dollars.
Image: esigame.com Réseau neuronal Réseau neuronal Bien que la réclamation "conviviale" de Deepseek soit trompeuse, sa rentabilité par rapport aux concurrents reste notable. Le modèle R1 de l'entreprise a coûté 5 millions de dollars pour s'entraîner, par rapport aux 100 millions de dollars de ChatGPT4. L'exemple de Deepseek présente le potentiel d'une entreprise AGILE bien financée pour rivaliser efficacement avec les joueurs établis, malgré l'exagération de ses réclamations de coûts initiales. La réalité est un investissement important, les progrès technologiques et une main-d'œuvre qualifiée sont la clé de son succès. <🎵>