Дом Новости DeepSeek: AI Revolution представлен с инвестициями в 1,6 миллиарда долларов

DeepSeek: AI Revolution представлен с инвестициями в 1,6 миллиарда долларов

Автор : Scarlett Feb 12,2025

Удивительно недорогие модели ИИ Deepseek бросают вызов гигантам отрасли. Китайский стартап утверждает, что обучил свой мощный Deepseek V3

всего 6 миллионов долларов, используя только 2048 графических процессоров, значительно подрывая конкурентов. Это, казалось бы, низкая стоимость, однако, противоречит гораздо большей инвестиции.

DeepSeek Test

Изображение: Ensigame.com

Инновационная архитектура DeepSeek V3 способствует его эффективности. Ключевые технологии включают многократный прогноз (MTP) для одновременного прогнозирования слов, смеси экспертов (MOE), используя 256 🎵> и мультиголовое скрытое внимание (MLA) для улучшения фокусировки на решающих элементах предложения.

DeepSeek V3

Изображение: Ensigame.com

Однако более пристальный взгляд показывает существенные инвестиции в инфраструктуру. Семианализ выявил использование Deepseek примерно в 50 000 графических процессоров Nvidia Hopper, на общую сумму около 1,6 млрд. Долл. США затрат на сервер и 944 млн. Долл. США в виде эксплуатационных расходов. Это резко контрастирует с первоначальной заявлением о стоимости обучения в размере 6 миллионов долларов США, которая учитывает только предварительное обучение графического процессора, исключая исследования, уточнение, обработку данных и общую инфраструктуру.

DeepSeek

Изображение: Ensigame.com

Успех Deepseek проистекает из его независимой структуры, что позволяет быстро распределить инновации и эффективное распределение ресурсов. Компания, дочерняя компания Hedge Fund Hedge Fund, владеет своими центрами обработки обработки данных, в отличие от конкурентов. Кроме того, его высокие зарплаты привлекают лучшие таланты из китайских университетов. Общее количество инвестиций DeepSeek в развитие искусственного интеллекта превышает 500 миллионов долларов.

DeepSeek

Изображение: Ensigame.com

Хотя утверждение DeepSeek «Бюджетное» вводит в заблуждение, его экономическая эффективность относительно конкурентов остается заметной. Модель компании R1 стоила 5 миллионов долларов на тренировку по сравнению с CHATGPT4 на 100 миллионов долларов. Пример DeepSeek демонстрирует потенциал хорошо финансируемой, гибкой компании по искусству, чтобы эффективно конкурировать с известными игроками, несмотря на преувеличение ее первоначальных требований затрат. Реальность - это значительная инвестиция, технологические достижения и квалифицированная рабочая сила являются ключом к его успеху. Нейронная сеть
Последние статьи
  • Олимпийские киберспортивные игры 2025 года задерживаются

    ​Олимпийские киберспортивные игры, первоначально запланированные на 2025 год, были отложены. Несмотря на то, что мероприятие все еще запланировано, теперь оно будет проходить где -то между 2026 и 2027 годами. Международный олимпийский комитет (МОК) назвал необходимость больше времени для завершения подготовки в качестве причины задержки. Постпо

    by Aaron Feb 12,2025

  • Соединения Нью -Йорк Таймса: Завоевание № 583 с помощью нашего экспертного руководства (14 января)

    ​The New York Times Connections Connections #583, за 14 января 2025 года, представляет собой сложную игру, сортирующую слова. Шестнадцать слов должны быть классифицированы, требуют точности и стратегического мышления. Даже опытные игроки могут найти эту головоломку особенно сложной. Эта статья предоставляет всеобъемлющее как

    by Jason Feb 12,2025