⚙️ Rosnące limity i koszty korzystania z AI pokazują fizyczne granice infrastruktury obliczeniowej, podważając wizję powszechnego i nieograniczonego dostępu do zaawansowanych modeli.
🏢 Kontrola nad mocą obliczeniową i centrami danych coraz bardziej koncentruje się w rękach największych firm technologicznych, co wzmacnia ich wpływ na gospodarkę i użytkowników.
🚦 AI może prowadzić do cyfrowej segregacji, w której najbardziej zaawansowane narzędzia będą dostępne głównie dla dużych korporacji i zamożniejszych użytkowników, dlatego potrzebna jest debata o publicznej kontroli infrastruktury cyfrowej.
W drugiej połowie maja, tuż po dorocznej wielkiej konferencji Google I/O, internet został zalany protestami użytkowników modelu Gemini, głównie programistów, którzy zderzyli się ze ścianą w postaci nowych limitów dostępu.
„Niedawno ograniczono mi dostęp po wysłaniu zaledwie pięciu poleceń podczas jednej sesji. Jako użytkownik subskrypcji premium uważam, że to nowe ograniczenie poważnie zakłóca mój codzienny rytm pracy i sprawia, że subskrypcja staje się nieopłacalna” – napisał Cerz DInger na googlowskim forum dla programistów. I tak był w lepszej sytuacji niż Ashutosh Shrivastava, który osiągnął limit po napisaniu zaledwie jednego promptu, który wygenerował mu krótką animację.
Cała sytuacja jest konsekwencją wprowadzenia nowych zasad ograniczających dzienny dostęp do modelu. Dotychczas w najpopularniejszej płatnej wersji Pro można było korzystać z puli ok. 100 zapytań dziennie na najwyższym dostępnym poziomie „rozumowania”. Sporadycznie, w momentach najwyższego obciążenia systemu, nakładany był krótkotrwały „lejek”, ale jego ograniczenia były mniej więcej przewidywalne.
Teraz wzorem innych modeli (np. Claude) wprowadzono dynamiczne limity, ukryte za niejasnymi wartościami procentowymi. Algorytm, który przydziela zasoby, nie jest jawny. Tempo zużycia też zmienia się dynamicznie na podstawie takich zmiennych jak poziom skomplikowania zapytania, długość wcześniejszej konwersacji w danym oknie kontekstowym, ale także tak niejasne kwestie, jak aktualne obciążenie serwerów Google. W ten sposób można w ciągu kilku minut zużyć cały przydzielony zasób (mówimy o płatnej wersji, darmowa do bardziej zaawansowanych zadań jest skrajnie niepraktyczna).
Tak oto zapowiadany przez korpolordów powszechny dostęp do AI i demokratyzacja procesów rozumowania dotarły do coraz bardziej stromego zbocza górskiego, na które wspiąć się będą mogły już głównie najzamożniejsze korporacje. A nawet dla nich zbocze zaczyna być zbyt strome. Przykładowo Microsoft anulował wewnętrzny program pilotażowy dla narzędzia Claude Code firmy Anthropic, ponieważ model rozliczeń oparty na zużyciu tokenów wyczerpał roczny budżet firmy zarezerwowany na ten projekt w zaledwie kilka miesięcy.
Granice wzrostu
Ta sytuacja wynika z banalnej, ale z jakiegoś powodu często ignorowanej kwestii: wszystkie te rozwiązania „chmurowe” i „wirtualne” opierają się na jak najbardziej fizycznie istniejącej infrastrukturze, która ma swoje materialne ograniczenia. Wydaje się to być oczywistością i każdy rozsądny człowiek to przewidywał, ale mimo to big techy oraz stojący za nimi wizjonerzy karmili nas (a zwłaszcza inwestorów) wizją powszechnej dostępności i jednocześnie możliwości osiągnięcia przez te modele niemal nadludzkiej inteligencji, która zastąpi już wkrótce prawie wszystkie „białe kołnierzyki”. Ani jedno, ani drugie nie jest obecnie możliwe.
Pod naporem gwałtownych protestów w mediach społecznościowych, Google zwiększyło nieco limity w swojej, obecnie intensywnie promowanej, platformie dla programistów Antigravity, ale w innych usługach nadal są ograniczone, a użytkownicy nadal narzekają. Dla wielu więc maj 2026 r. to moment symboliczny, koniec baśni.
Korporacje dysponują jednym z najpotężniejszych dziś kapitałów: mocą obliczeniową. Nie dotyczy to zresztą tylko słynnego AI. Większość firm na świecie, od małych startupów po gigantyczne korporacje, nie utrzymuje już zazwyczaj swoich serwerów w piwnicach. Wynajmują moc obliczeniową i przestrzeń dyskową od big techu.
Rynek infrastruktury chmurowej i centrów danych jest dziś w dużym stopniu skoncentrowany wokół „Wielkiej Trójki” technologicznych hegemonów: Amazona, Microsoftu i Google’a. Skalę kontroli, jaką pośrednio lub bezpośrednio dzierżą nad infrastrukturą internetu, może uświadomić fakt, że centra danych stanowią fundament dla streamingu wideo i audio, systemów bankowych i giełdowych, systemów zarządzania globalnymi łańcuchami dostaw, pakietów biurowych (np. Microsoft 365, Google Workspace), komunikatorów i poczty e-mail, infrastruktury gamingu, w tym streamingu, backupów, archiwów itd.
To nie jest już tylko kwestia zakupu serwerów. Wielka Trójka wykupuje ogromne połacie ziemi, negocjuje z państwami priorytetowy dostęp do sieci energetycznych (a wręcz inwestuje we własne elektrownie), kładzie własne światłowody na dnach oceanów. Nie mówiąc już o pozyskiwaniu ulg podatkowych na rozbudowę tej infrastruktury. Tzw. AI to tylko część całej gigantycznej struktury, na której opiera się globalna gospodarka. Daje to big techowi ogromną przewagę negocjacyjną w rozmowach już nawet nie z poszczególnymi firmami, ale całymi krajami.
W tym kontekście ostatnia awantura o ograniczenia w dostępie do mocy obliczeniowej modeli AI jest tylko fragmentem rozwijającego w znacznie szerszej skali konfliktu o kontrolę nad infrastrukturą cyfrową. Jest to antagonizm o tyle znaczący, że dotyka podstaw utopijnej fantazji, na której opierała się opowieść o „zwiększeniu możliwości całej ludzkości”. Jak zwykle w praktyce okazuje się, że nie całej ludzkości, tylko konkretnych ludzi, którzy, korzystając z umiejscowienia w strukturze globalnego kapitalizmu, chcą przechwycić kontrolę nad całą gospodarką.
Gig economy białych kołnierzyków
W obliczu zderzenia z ograniczonymi zasobami korporacje robią to, co potrafią najlepiej – czyli wprowadzają selekcję klientów. Limity są celowo nieprzejrzyste: w razie wysokiego obciążenia firmy mogą powiedzieć, że „niczego nie obiecywały”.
Nie ma tu wypracowanej żadnej normy, do której można by było się odwoływać. Praca osób korzystających z modeli językowych przypomina sytuację pracowników platformowych, którzy nigdy nie wiedzą do końca, jakie stawki za przewóz osób czy towaru określi im platforma, a nawet nie wiedzą, czy danego dnia będą mieć klientów.
Tak wygląda współczesny kapitalizm działający w ramach tzw. gig economy. Sytuacja zmienia się z minuty na minutę, a wszystko w rytmie wyznaczanym przez tajemniczy algorytm, którego zasady działania nie są podawane w zrozumiałej i przejrzystej formie. Charakterystyczne dla tego modelu jest życie w ciągłej niepewności. Kierowca platformowy nie wie, czy w aplikacji pojawią się klienci i ile dostanie za przejazdy w ciągu danej dniówki, a programista nie wie, ile zostało mu zasobów do wykorzystania. Względnie: czy uda mu się skończyć zadanie w ramach limitów budżetowych, bo np. wspierający pracę autonomiczny agent AI nie wpadnie w pętlę i nie wygeneruje takiej liczby zapytań i tokenów, że doprowadziłoby to do bankructwa firmy.
Tworzy to ciągły stan niewiedzy i utrudnia planowanie. Notabene aplikacje dla kierowców też korzystają z centrów danych kontrolowanych przez Wielką Trójkę.
Zabawki dla mas, narzędzia dla korporacji
Segregacja zaczyna być rozwijana także w innej formie i jeszcze bardziej zamaskowanej. Korporacje dostarczające różne systemy tzw. AI, w pogoni za efektywnością i ograniczeniem kosztów wprowadziły tzw. „routing LLM”, który polega na kierowaniu zapytania użytkownika do odpowiednego modelu. Mniej „ambitne” pytania lądują w mniej zasobożernym modelu.
Brzmi rozsądnie, wszak nie ma sensu kierować zapytania o np. przepis na zupę do najbardziej zaawansowanego modelu. Podstawowym problemem nie jest zresztą to, że przeciętny użytkownik zużywa zasoby, generując w domu mema z kotkiem. Prawdziwym zagrożeniem jest coś odwrotnego: pod pretekstem optymalizacji zasobów postępuje proces systemowego odcinania indywidualnych użytkowników od najbardziej zaawansowanych narzędzi. W efekcie tzw. sztuczna inteligencja dla mas może zostać sprowadzona do roli taniej zabawki, podczas gdy najmocniejsze analityczne modele LLM staną się ekskluzywnym przywilejem największych korporacji.
Taka perspektywa rodzi obawy o kierunek, w jakim ta infrastruktura może ewoluować. Systemy AI coraz aktywniej profilują użytkowników i „uczą się ich” z czasem. Istnieje więc realne ryzyko, że w niedalekiej przyszłości mechanizm ten posłuży do trwałej kategoryzacji ludzi. Osoby sprofilowane na podstawie historii zapytań jako zadające „mniej inteligentne” pytania mogą wkrótce zostać systemowo zamknięte w słabszych, uboższych wersjach modeli, nie mając o tym pojęcia.
Tak więc doświadczenie użytkowania danego modelu LLM dla każdej osoby staje się w coraz większym stopniu odmienne. W skrajnych przypadkach może to doprowadzić do trwałej segregacji użytkowników ze względu na status społeczno-kulturowy czy zainteresowania oraz zasobność portfela. Tego rodzaju etyczne wyzwania zbyt rzadko są podnoszone w dyskusji publicznej. Etyka ustępuje pola efektywności i zyskowi, jak to w kapitalizmie zwykle bywa.
Osoby, które chciałyby uciec od tych ograniczeń, mogą uruchamiać mniejsze modele lokalnie, korzystając z mocy obliczeniowej procesorów swoich kart graficznych. Tutaj warto zauważyć, że to właśnie procesory GPU są podstawową strukturą tworzącą „mózg” systemów tzw. AI. Dotyczy to także rozwiązań lokalnych.
Problem polega na tym, że rynek konsumenckich kart graficznych, podobnie jak rynek specjalistycznych pamięci (tzw. HBM), jest pożerany przez rosnące centra obliczeniowe, co winduje ceny także na rynku konsumenckim, z powodu ograniczeń linii produkcyjnych. Ceny układów rosną w szybkim tempie i są coraz mniej dostępne dla mniej zamożnych klientów. W ten sposób realizuje się kolejny plan big techów, czyli przeniesienie większości mocy obliczeniowej, jaką do tej pory dysponowaliśmy w ramach naszych fizycznych maszyn, do chmury obliczeniowej. Pisałem o tym w grudniu zeszłego roku.
Jeśli ktoś uważa, że co najwyżej nie będzie korzystał z tzw. AI, to przypominam, że moc obliczeniowa dotyczy rozmaitych zadań i usług. Już teraz oglądanie filmów odbywa się nie na naszych sprzętach z fizycznych nośników, ale dzięki streamingowi z centrów danych. Co więcej, w przypadku gier czy zaawansowanych aplikacji w chmurze to serwery korporacji przejmują na siebie również cały ciężar obliczeniowy, zostawiając nam użytkowanie prostych terminali. Spora część naszej kultury przeniosła się do chmury, a co za tym idzie, jest kontrolowana przez wielkie korporacje i działa na ich infrastrukturze.
Czas na infrastrukturę publiczną
W tym kontekście nawoływania do bojkotu mogą być wręcz na rękę korporacjom, bo zwolnione w ten sposób zasoby będą mogły być drożej sprzedane innym korporacjom. To nie pojedynczy użytkownicy są tutaj klientami docelowymi. Walka o moc obliczeniową toczy się pomiędzy korporacjami, a nawet całymi krajami. Istotą problemu jest to, że klient indywidualny, zwłaszcza mniej zamożny, jest w tej big techowej układance drugorzędny. Jeśli bowiem nawet znacząca liczba klientów zbojkotuje jedną usługę (np. czaty AI), moc obliczeniowa będzie przekierowana na inne usługi lub do klientów instytucjonalnych.
Może to budzić polityczny sprzeciw w kontekście faktu, że cała ta technologia powstała m.in. dzięki badaniom ze środków publicznych, ulgom podatkowym, a w przypadku np. modeli LLM – dzięki trenowaniu ich na wspólnym dorobku całej ludzkości.
Najlepszym rozwiązaniem byłoby przejęcie kontroli nad infrastrukturą obliczeniową i potraktowanie jej jak infrastrukturę publiczną (np. drogi). Ale tu powstają kolejne problemy, w rodzaju pytania, kto powinien zarządzać infrastrukturą amerykańskich korporacji, które obecnie praktycznie zdominowały ten obszar gospodarki na tzw. Zachodzie i nie tylko. Inne kraje, zwłaszcza działając wspólnie, mogą podjąć rękawicę, ale jest to ogromne wyzwanie ze względu na to, że USA kontrolują w dużym stopniu technologię (np. NVIDIA, AMD, Intel w obszarze układów GPU i CPU, Broadcom, czy Cisco w obszarze infrastruktury sieciowej).
Aby choć w pewnym stopniu spróbować zmniejszyć tę dominację, potrzeba skoordynowanych działań politycznych i gospodarczych na poziomie międzynarodowym. Pojedyncze, zazwyczaj krótkotrwałe akty sprzeciwu i awantury na X czy Reddicie najpewniej nie wystarczą.



!["Odwagi! [o zaangażowaniu młodych]" Dominika Lasota](https://krytykapolityczna.pl/wp-content/uploads/2026/04/odwagi-plomienie-okladka-173x267.jpg)



![Utracony kompas [o europejskiej lewicy]](https://krytykapolityczna.pl/wp-content/uploads/2026/03/plomienie_utracony_kompas-171x267.jpg)


Komentarze
Krytyka potrzebuje Twojego głosu. Dołącz do dyskusji. Komentarze mogą być moderowane.