Удивительно недорогие модели ИИ Deepseek бросают вызов гигантам отрасли. Китайский стартап утверждает, что обучил свой мощный Deepseek V3
всего 6 миллионов долларов, используя только 2048 графических процессоров, значительно подрывая конкурентов. Это, казалось бы, низкая стоимость, однако, противоречит гораздо большей инвестиции.
Инновационная архитектура DeepSeek V3 способствует его эффективности. Ключевые технологии включают многократный прогноз (MTP) для одновременного прогнозирования слов, смеси экспертов (MOE), используя 256 🎵> и мультиголовое скрытое внимание (MLA) для улучшения фокусировки на решающих элементах предложения.
Однако более пристальный взгляд показывает существенные инвестиции в инфраструктуру. Семианализ выявил использование Deepseek примерно в 50 000 графических процессоров Nvidia Hopper, на общую сумму около 1,6 млрд. Долл. США затрат на сервер и 944 млн. Долл. США в виде эксплуатационных расходов. Это резко контрастирует с первоначальной заявлением о стоимости обучения в размере 6 миллионов долларов США, которая учитывает только предварительное обучение графического процессора, исключая исследования, уточнение, обработку данных и общую инфраструктуру.
Успех Deepseek проистекает из его независимой структуры, что позволяет быстро распределить инновации и эффективное распределение ресурсов. Компания, дочерняя компания Hedge Fund Hedge Fund, владеет своими центрами обработки обработки данных, в отличие от конкурентов. Кроме того, его высокие зарплаты привлекают лучшие таланты из китайских университетов. Общее количество инвестиций DeepSeek в развитие искусственного интеллекта превышает 500 миллионов долларов.
Хотя утверждение DeepSeek «Бюджетное» вводит в заблуждение, его экономическая эффективность относительно конкурентов остается заметной. Модель компании R1 стоила 5 миллионов долларов на тренировку по сравнению с CHATGPT4 на 100 миллионов долларов. Пример DeepSeek демонстрирует потенциал хорошо финансируемой, гибкой компании по искусству, чтобы эффективно конкурировать с известными игроками, несмотря на преувеличение ее первоначальных требований затрат. Реальность - это значительная инвестиция, технологические достижения и квалифицированная рабочая сила являются ключом к его успеху. Нейронная сеть