Świat, Weekend

Acemoglu: Moment na miarę Sputnika?

Czy DeepSeek zgotował amerykańskim Big Techom moment dziejowy na miarę Sputnika? To się dopiero okaże, ale z pewnością wyrwał je z samozadowolenia, a nas skłonił do postawienia kilku trudnych pytań.

20 stycznia, tuż po otwarciu dostępu do usługi DeepSeek-R1, runął kurs akcji firmy Nvidia, która produkuje procesory graficzne, i gwałtownie spadła wycena przeróżnych innych spółek z branży technologicznej. Niektórzy komentatorzy ogłosili, że mamy do czynienia z „momentem dziejowym na miarę Sputnika” w chińsko-amerykańskim wyścigu o palmę pierwszeństwa w dziedzinie sztucznej inteligencji. Amerykańskiej branży AI chyba potrzebny był pewien wstrząs, jednak cała ta historia każe postawić kilka trudnych pytań.

Branża technologiczna w USA zainwestowała w AI gigantyczne środki. Goldman Sachs szacuje, że „giganci technologiczni, korporacje i spółki zajmujące się dostarczaniem energii elektrycznej postanowili przeznaczyć w najbliższych latach około jednego biliona dolarów na wydatki kapitałowe związane ze sztuczną inteligencją”. Tymczasem wielu obserwatorów – do których sam się zaliczam – od dawna już kwestionuje kierunek inwestycji i rozwoju w dziedzinie AI w USA.

Wszyscy najwięksi gracze stosują w zasadzie ten sam schemat (może z wyjątkiem firmy Meta, która idzie w nieco inną stronę, stosując model częściowo oparty na kodzie open-source) i wygląda na to, że cała branża postawiła wszystko na jedną kartę. Wszystkie spółki bez wyjątku mają obsesję na punkcie skali. Powołując się na wciąż niepotwierdzone „prawa wielkiej skali”, zakładają, że kluczem do odblokowania nowych możliwości sztucznej inteligencji jest zasilanie ich modeli coraz większą i większą ilością danych. Niektórzy posuwają się nawet do stwierdzenia, że oprócz skali „niczego więcej nie potrzeba”.

Žižek: Darowanej sztucznej inteligencji też zagląda się w zęby

Przed 20 stycznia amerykańskie firmy nie chciały brać pod uwagę rozwiązań innych niż tworzenie modeli AI w oparciu o trening przewidywania kolejnego słowa w sekwencji wyrazów na gigantycznych zestawach danych.

Mając takie priorytety, firmy skupiły się na modelach dyfuzyjnych oraz czatbotach, służących do wykonywania zadań na wzór (lub podobieństwo) człowieka. I chociaż podejście chińskiego DeepSeeka jest w ogólnym rozrachunku takie samo, to jednak wydaje się, że chińska firma posłużyła się w większym stopniu metodami uczenia przez wzmocnienie, architekturą „mixture of experts” (używanie wielu mniejszych, ale sprawniejszych modeli), destylacją wiedzy oraz techniką dopracowanego łańcucha myśli. Mówi się, że właśnie takie podejście umożliwiło DeepSeekowi stworzenie konkurencyjnego modelu za ułamek kosztów.

Mimo że pojawiły się pewne wątpliwości co do tego, czy DeepSeek powiedział nam całą prawdę o swoim modelu, cała ta historia obnażyła schemat myślenia stadnego, który zawładnął amerykańską branżą technologii sztucznej inteligencji. Właśnie taki schemat zaślepienia, odrzucenia wszelkich alternatywnych, tańszych lub bardziej obiecujących rozwiązań, w połączeniu z „hype”, czyli nakręcaniem szumu wokół jakiegoś zjawiska, przewidzieliśmy z Simonem Johnsonem w książce Power and Progress, którą napisaliśmy tuż przed rozpoczęciem się ery generatywnej sztucznej inteligencji.

Pytanie, które trzeba sobie teraz postawić, brzmi: Czy jest jeszcze coś innego, może bardziej niebezpiecznego, czego amerykański przemysł nie potrafi dostrzec? Może na przykład największym spółkom przechodzi koło nosa okazja, by rozwinąć swoje modele w stronę bardziej sprzyjającą ludziom? Podejrzewam, że odpowiedź na to pytanie jest twierdząca, ale jak będzie naprawdę, tylko czas pokaże.

Inne pytanie dotyczy tego, czy Chiny nie przeskakują właśnie Ameryki w rozwoju. A jeśli tak, to czy autorytarne, odgórne struktury (które wraz z Jamesem A. Robinsonem nazwaliśmy „instytucjami ekstraktywnymi”) mogą pobudzać innowacje równie dobrze lub nawet lepiej niż podejście oddolne?

Moje osobiste uprzedzenie polegało na przeświadczeniu, że odgórna kontrola blokuje innowacje, jak twierdziłem razem z Robinsonem w książce Dlaczego narody przegrywają. Sukces DeepSeeka wydaje się przeczyć tej tezie, ale nie jest to bynajmniej ostateczny dowód na to, że w systemie instytucji ekstrakcyjnych mogą pojawiać się równie trwałe i ważne innowacje co w systemie instytucji inkluzywnych. Pamiętajmy przecież, że chiński produkt opiera się na wielu latach osiągnięć, których dokonano w Ameryce i po części w Europie.

Wszystkie podstawowe metody uczenia AI zostały początkowo wdrożone w Stanach Zjednoczonych. Architektura „mixture of experts” oraz strategia uczenia ze wzmocnieniem powstały całe dekady temu w akademickich instytutach badawczych, a transformatory, metoda łańcucha myśli oraz destylacji zostały wprowadzone przez wielkie amerykańskie firmy z branży technologicznej.

Zwalnia, pozbawia mieszkań, szpieguje pracowników. AI to nie „problem przyszłości”

Osiągnięcie DeepSeeka polega na demonstracji sukcesu czysto inżynieryjnego: na zastosowaniu tych samych metod, których używają firmy w USA, ale w bardziej efektywny sposób. Jeszcze się okaże, czy chińskie firmy oraz instytuty badawcze są zdolne, by pójść dalej i wymyślić własne przełomowe techniki, produkty oraz innowacyjne podejścia.

Ponadto DeepSeek wydaje się różnić od większości pozostałych chińskich firm z branży sztucznej inteligencji, które generalnie dostarczają rozwiązania technologiczne państwu lub przy jego wsparciu finansowym. Jeśli ta akurat firma, wywodząca się z funduszu hedgingowego, działała do tej pory w cieniu, czy zachowa swój dynamizm i kreatywność teraz, gdy wszystkie oczy są na nią zwrócone? Cokolwiek się wydarzy, to i tak osiągnięcia jednej firmy nie mogą służyć za ostateczny dowód na to, że Chiny są w stanie przewyższyć bardziej otwarte społeczeństwa pod względem innowacji.

Inne pytanie dotyczy geopolityki. Czy cała ta historia z DeepSeekiem oznacza, że amerykańskie ograniczenia eksportu technologii oraz sposoby hamowania rozwoju chińskich badań nad AI zawiodły? Tu również nie ma jasnej odpowiedzi. Najnowsze modele DeepSeek (V3 i R1) zostały wytrenowane na starszych, słabszych procesorach. Może się okazać, że chcąc pójść dalej w skali i rozwoju, firma będzie potrzebowała najpotężniejszych produkowanych obecnie procesorów.

Niemniej nie ulega wątpliwości, że gra o sumie zerowej, w którą próbowała grać Ameryka, była nieprzemyślana i nie mogła przynieść dobrych efektów. Taka strategia miałaby sens tylko w przypadku, gdybyśmy byli przekonani, że zmierzamy do osiągnięcia ogólnej sztucznej inteligencji (AGI – modele, które mogą dorównać ludziom we wszystkich zadaniach wymagających kognicji) i że każdy, kto pierwszy stworzy AGI, zdobędzie gigantyczną przewagę geopolityczną.

Trzymając się kurczowo tych założeń (z których ani jedno nie zostało jak dotąd uzasadnione), straciliśmy szansę na owocną współpracę z Chinami w wielu różnych obszarach. Gdyby na przykład jeden kraj wypracował model pozwalający zwiększyć wydajność pracy ludzi albo pomógł w stworzeniu lepszych regulacji odnoszących się do energetyki, to skorzystać na tym mogłyby oba państwa – zwłaszcza, gdyby takie innowacje zostały wprowadzone na szeroką skalę.

Powrót ery kowbojstwa w amerykańskiej polityce lub polski spaghetti western

DeepSeek, podobnie jak amerykańscy kuzyni, ma aspiracje, by stworzyć AGI, a model, podczas gdy prawdziwym gamechangerem mógłby być prostszy i znacznie tańszy model. Jednak obniżenie kosztów i wykorzystanie znanych już metod nie przybliży nas w jakiś magiczny sposób do osiągnięcia AGI w ciągu najbliższych kilku lat. Pytanie, czy w krótkiej perspektywie AGI jest możliwe, pozostaje otwarte, a tym większą wątpliwość budzi to, czy ogólna sztuczna inteligencja jest w ogóle pożądana.

Nawet jeśli nie znamy jeszcze wszystkich szczegółów procesu powstania modelu DeepSeek ani nie wiemy, co ten – jak się wydaje – sukces oznacza dla przyszłości branży AI, jedna rzecz wydaje się jasna: chiński startup przebił bańkę obsesji branży technologicznej na punkcie skali i być może spowodował wstrząs, który wyrwie ją z samozadowolenia.

**
Daron Acemoglu – wykładowca ekonomii na MIT. Razem z Simonem Johnsonem i Jamesem A. Robinsonem otrzymał w 2024 roku Nagrodę Banku Szwecji im. Alfreda Nobla w dziedzinie nauk ekonomicznych. Współautor (razem z Simonem Johnsonem) książki Power and Progress: Our Thousand-Year Struggle Over Technology and Prosperity (PublicAffairs, 2023). Copyright: Project Syndicate, 2025. www.project-syndicate.org. Z angielskiego przełożył Maciej Domagała.

__
Przeczytany do końca tekst jest bezcenny. Ale nie powstaje za darmo. Niezależność Krytyki Politycznej jest możliwa tylko dzięki stałej hojności osób takich jak Ty. Potrzebujemy Twojej energii. Wesprzyj nas teraz.

Zamknij