Openai podejrzewa, że modele Deepeek AI w Chinach, znacznie tańsze niż zachodnie odpowiednicy, mogły zostać przeszkolone przy użyciu danych OpenAI. To objawienie, po ogromnym spadku akcji Nvidii, zostało nazwane „budzeniem” amerykańskiego przemysłu technologicznego przez Donalda Trumpa.
Model R1 Deepseek, zbudowany na open source Deepseek-V3, oferuje znacznie niższe koszty szkolenia (szacowane na 6 milionów dolarów) i wymagania obliczeniowe w porównaniu z modelami zachodnimi, takimi jak Chatgpt. Chociaż roszczenie to jest kwestionowane, podsyciło obawy inwestorów o miliardy zainwestowane w sztuczną inteligencję przez amerykańskich gigantów technologicznych, powodując pogorszenie koniunktury na rynku dotykających firm takich jak Nvidia, Microsoft, Meta, Alphabet i Dell. Aplikacja Deepseek na szczycie wykresów pobierania USA wśród kontrowersji.
Openai i Microsoft badają, czy DeepSeek naruszyło warunki usług Openai, stosując „destylację”, technikę wyodrębnienia danych z większych modeli, potencjalnie wykorzystującą interfejs API Openai. Openai przyznaje, że chińskie firmy często próbują odtworzyć wiodące modele AI w USA i współpracują z rządem USA w celu ochrony własności intelektualnej.
David Sacks, AI CZAR prezydenta Trumpa, popiera twierdzenie, że Deepseek zastosował destylację danych z modeli Openai. Przewiduje dalsze środki wiodących firm AI w celu zapobiegania takich praktyk.
Sytuacja podkreśla znaczącą ironię: samai, oskarżona o wykorzystanie treści internetowych chronionych prawem autorskim do szkolenia chatgpt, protestuje teraz protestującymi działaniami Deepeek. Ta hipokryzja była szeroko odnotowana w mediach społecznościowych. Openai wcześniej argumentował w Wielkiej Brytanii Izby Lordów, że szkolenie dużych modeli językowych bez materiałów chronionych jest niemożliwe, stanowisko podkreślające trwające pozwy z New York Times i 17 autorów zarzucających naruszenie praw autorskich. Te procesy, wraz z orzeczeniem amerykańskiego biura praw autorskich w 2018 r. Przeciwko prawom autorskim sztuki generowanej przez AI, podkreślają złożony prawny krajobraz dotyczący danych szkoleniowych AI.