Zaskakująco niedrogie modele AI Deepseeka rzuca wyzwanie gigantom branżowym. Chiński startup twierdzi, że wyszkolił swoje potężne głębokie miejsce V3
za zaledwie 6 milionów dolarów, wykorzystując tylko 2048 GPU, znacząco podcinając konkurentów. To pozornie tani koszty zaprzecza jednak znacznie większej inwestycji.obraz: engame.com
Innowacyjna architektura Deepseek V3 przyczynia się do jej wydajności. Kluczowe technologie obejmują prognozę wielofunkcyjną (MTP) do jednoczesnej prognozy słów, mieszanki ekspertów (MOE) z wykorzystaniem 256
s oraz wielopogowałą utajoną uwagę (MLA) w celu zwiększenia skupienia się na kluczowych elementach zdań.
obraz: engame.com
Jednak bliższe spojrzenie ujawnia znaczną inwestycję w infrastrukturę. Semianaliza odkryła wykorzystanie Deepeek w wysokości około 50 000 GPU Nvidia Hopper, o łącznej wartości kosztów serwera około 1,6 miliarda dolarów i 944 miliony dolarów na wydatki operacyjne. Kontrastuje to ostro z początkowym roszczeniem o koszty szkolenia w wysokości 6 milionów dolarów, które uwzględnia tylko korzystanie z GPU przed treningiem, z wyłączeniem badań, udoskonalania, przetwarzania danych i ogólnej infrastruktury.
obraz: engame.comSukces Deepseek wynika z jego niezależnej struktury, umożliwiając szybkie innowacje i wydajne alokacja zasobów. Firma, spółka zależna od funduszu hedgingowego o wysokiej zawartości flyer, jest właścicielem swoich centrów danych, w przeciwieństwie do konkurentów w chmurze. Ponadto jego wysokie pensje przyciągają najlepsze talenty chińskich uniwersytetów. Całkowita inwestycja Deepseek w rozwój sztucznej inteligencji przekracza 500 milionów dolarów.
obraz: engame.com
Podczas gdy „przyjazne budżecie” roszczenia Deepseeka jest mylące, jego opłacalność w stosunku do konkurentów pozostaje godna uwagi. Model firmy R1 kosztował 5 milionów dolarów na szkolenie, w porównaniu do 100 milionów dolarów Chatgpt4. Przykład Deepseek pokazuje potencjał dobrze finansowanej, zwinnej firmy AI do skutecznego konkurowania z uznanymi graczami, pomimo przesadzania jej początkowych roszczeń kosztów. Rzeczywistość jest znaczącą inwestycją, postępem technologicznym i wykwalifikowana siła robocza są kluczem do jej sukcesu.