Hogar Noticias Deepseek: revolución de IA presentada con $ 1.6 mil millones de inversiones

Deepseek: revolución de IA presentada con $ 1.6 mil millones de inversiones

Autor : Scarlett Feb 12,2025

Deepseek's Sorprendentemente económico modelo de IA desafía a los gigantes de la industria. La startup china afirma haber entrenado a su poderoso Deepseek V3

por solo $ 6 millones, utilizando solo 2048 GPU, significativamente socavando competidores. Este costo aparentemente bajo, sin embargo, desmiente una inversión mucho mayor.

DeepSeek Test

Imagen: ensigame.com

La arquitectura innovadora de Deepseek V3 contribuye a su eficiencia. Las tecnologías clave incluyen predicción múltiple (MTP) para la predicción simultánea de palabras, la mezcla de expertos (MOE) utilizando 256

s y atención latente de múltiples cabezas (MLA) para un enfoque mejorado en elementos de oraciones cruciales. DeepSeek V3

Imagen: ensigame.com

Sin embargo, una mirada más cercana revela una inversión de infraestructura sustancial. Semianalysis descubrió el uso de Deepseek de aproximadamente 50,000 GPU Nvidia Hopper, por un total de alrededor de $ 1.6 mil millones en costos del servidor y $ 944 millones en gastos operativos. Esto contrasta fuertemente con el reclamo inicial de costos de capacitación de $ 6 millones, que solo representa el uso de GPU previa al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura general. DeepSeek

Imagen: ensigame.com

El éxito de Deepseek proviene de su estructura independiente, lo que permite una innovación rápida y una asignación eficiente de recursos. La compañía, una subsidiaria de High-Flyer Hedge Fund, posee sus centros de datos, a diferencia de los competidores reliños de la nube. Además, sus altos salarios atraen al máximo talento de las universidades chinas. La inversión total de Deepseek en el desarrollo de IA supera los $ 500 millones. DeepSeek

Imagen: ensigame.com

Red neuronal Si bien el reclamo "económico" de Deepseek es engañoso, su rentabilidad en relación con los competidores sigue siendo notable. El modelo R1 de la compañía costó $ 5 millones para entrenar, en comparación con los $ 100 millones de CHATGPT4. El ejemplo de Deepseek muestra el potencial de una compañía de IA ágil y bien financiada para competir de manera efectiva con los jugadores establecidos, a pesar de la exageración de sus reclamos de costos iniciales. La realidad es una inversión significativa, avances tecnológicos y una fuerza laboral calificada son clave para su éxito. Red neuronal
Últimos artículos
  • Los Juegos de Esports Olímpicos 2025 se retrasan

    ​Los Juegos Olímpicos de Esports, inicialmente programados para 2025, se han pospuesto. Si bien el evento aún está planeado, ahora tendrá lugar en algún momento entre 2026 y 2027. El Comité Olímpico Internacional (COI) citó la necesidad de más tiempo para finalizar los preparativos como el motivo de la demora. El pospo

    by Aaron Feb 12,2025

  • NYT Connections: Conquer #583 con nuestra Guía de expertos (14 de enero)

    ​El rompecabezas del New York Times Connections #583, para el 14 de enero de 2025, presenta un juego desafiante que organiza palabras. Dieciséis palabras deben clasificarse, exigiendo precisión y pensamiento estratégico. Incluso los jugadores experimentados pueden encontrar este rompecabezas particularmente difícil. Este artículo proporciona

    by Jason Feb 12,2025

Últimos juegos
Poker Legends

Tarjeta  /  0.8.19  /  111.3 MB

Descargar
Solitaire Story - Ava's Manor

Tarjeta  /  47.0.0  /  151.2 MB

Descargar
Truco MegaJogos: Cartas

Tarjeta  /  136.1.3  /  87.6 MB

Descargar