Kultura, Weekend

Królewna Śnieżka w stylu Beksińskiego, czyli kogo zastąpi sztuczna inteligencja

Tak jak Deep Blue, komputerowy program zaprojektowany do wygrywania turniejów szachowych, w latach 90. rzucił na kolana legendarnego szachistę Garriego Kasparowa, tak dziś kolejne pokolenie sztucznej inteligencji pokazuje swoją wyższość nad ludzkimi artystami. Ale czy na pewno? Czym właściwie są modne ostatnio generatory obrazów?

Colorado State Fair to coroczny festyn organizowany w amerykańskim mieście Pueblo, w stanie Kolorado. W ramach tej imprezy miasto organizuje szereg inicjatyw społecznych i artystycznych. Jedną z nich jest konkurs plastyczny, w którym uczestnicy i uczestniczki mogą pochwalić się swoim talentem w kreowaniu sztuk wizualnych. W żadnym wypadku nie jest to wydarzenie cieszące się jakimś wyjątkowym prestiżem – niemniej w 2022 roku zwycięska praca stała się przedmiotem artykułów prasowych na całym świecie.

I to nie, jak na ogół w takich przypadkach bywa, z powodu jej treści. Noszący tytuł Théâtre D’opéra Spatial obraz autorstwa pochodzącego z Pueblo West grafika komputerowego Jasona M. Allena przedstawia młodą kobietę stojącą na teatralnej scenie, kreślącą magiczny portal wiodący do innego miejsca – być może innego świata. Część osób mogłaby go uznać za niegustowny albo kiczowaty – w swojej estetyce narzuca bowiem skojarzenia z ilustracjami tworzonymi na potrzeby gier komputerowych albo tandetnych powieści fantasy – ale na pierwszy rzut oka nie ma w nim niczego, co mogłoby budzić aż tak wielkie kontrowersje.

Obraz „Théâtre D’opéra Spatial”

Przedmiotem kontrowersji jest nie treść, ale sposób stworzenia obrazu. Théâtre D’opéra Spatial powstał bowiem wyłącznie przy użyciu MidJourney, sztucznej sieci neuronowej generującej grafikę na podstawie tekstowych opisów, niemal bez udziału ludzkiego użytkownika. Jason M. Allen opisał proces tworzenia obrazu jako trwającą wiele godzin selekcję podsuwanych mu przez MidJourney propozycji w celu dalszego przetworzenia ich przez sieci neuronowe i uzyskania pożądanego efektu. Cała reszta pracy wykonana została jednak przez komputerowy program interpretujący wpisane komendy i przekładające je na wizualia.

Tak jak Deep Blue, komputerowy program zaprojektowany do wygrywania turniejów szachowych, w latach 90. rzucił na kolana legendarnego szachistę Garriego Kasparowa, tak dziś kolejne pokolenie sztucznej inteligencji pokazuje swoją wyższość nad ludzkimi artystami.

Ale czy na pewno? Czym właściwie są modne ostatnio generatory obrazów?

Technologia sztucznych sieci neuronowych (ang. artificial neural networks, w skrócie ANN) ma ambicję odtworzenia i zautomatyzowania ludzkiego procesu przyswajania i przetwarzania informacji za pomocą komputerów. W praktyce oznacza to stworzenie skomplikowanego programu komputerowego, który będzie miał możliwość uczenia się, rozpoznawania wzorców i tworzenia na ich podstawie nowych rzeczy.

To może brzmieć jak coś wyciągniętego z powieści Isaaca Asimova, jednak tego typu technologia rozwijana jest już co najmniej od lat 40. XX wieku. Funkcjonowanie ANN jest dość skomplikowane i opiera się na „karmieniu” sieci neuronowej informacjami tak długo, aż program na podstawie wbudowanych w jego strukturę wytycznych „zrozumie” zależności między tymi informacjami i dzięki temu „nauczy się” tych zależności w stopniu, który pozwoli mu je reprodukować.

Obwarowanie cudzysłowami takich słów jak „rozumie” i „nauczy się” jest w tym przypadku dość kluczowe – sztuczne sieci neuronowe często nazywane są bowiem sztuczną inteligencją (ang. artificial intelligence, w skrócie AI) i o ile faktycznie można być pod wrażeniem tego, do czego zdolne są ich najnowsze modele, o tyle nie są one „inteligentne” w żadnym konwencjonalnym rozumieniu tego słowa.

Ludzie dyskryminują, więc algorytmy też

Są natomiast bardzo wydajne – i coraz lepsze w robieniu tego, czego się od nich oczekuje. W 2020 roku brytyjski „Guardian” opublikował na swojej stronie internetowej artykuł w całości stworzony za pomocą generatora tekstu GPT-3. Artykuł jest zaskakująco koherentny i choć nie stanowi popisu jakiejś wybitnej publicystycznej wirtuozerii, to jest zrozumiały, a momentami nawet całkiem błyskotliwy. W odredakcyjnym komentarzu umieszczonym pod koniec materiału pojawia się informacja, że jego redakcja zajęła mniej czasu niż redakcja wielu tekstów pisanych przez ludzkich autorów.

Gdy przeczytałem o tym po raz pierwszy, ogarnął mnie lęk natury egzystencjalnej. Od 2020 roku generatory tekstu – nawet te darmowe i dostępne publicznie, jak OpenAI, AI Dungeon czy Dreamily, by wymienić jedynie najpopularniejsze – stały się już na tyle zaawansowane, że bez większego problemu można wyobrazić sobie sytuację, w której w niedalekiej przyszłości pracownik medialny, ścigając się z deadline’ami, po prostu wygeneruje za pomocą sztucznej inteligencji kilkadziesiąt akapitów tekstu, który potem przytnie do wymaganego rozmiaru, przeredaguje i zainkasuje honorarium.

Jeśli jednak może zrobić to publicysta, równie dobrze może to zrobić osoba zlecająca mu napisanie tekstu, w rezultacie eliminując pośrednika. Choć sieci neuronowe nadal nie są (jeszcze?) na tyle zaawansowane, by w pełni zastąpić pracę dziennikarską, to w przypadku neutralnie brzmiącego pustosłowia tworzonego wyłącznie pod SEO i niezobowiązującej portalozy, która niemal z zasady powinna być napisana prostym językiem i poruszać trywialne, nieskomplikowane tematy… cóż, możemy się spodziewać, że wielu media workerów w najbliższych latach znajdzie się w bardzo niefortunnej sytuacji zawodowej.

Plaga gównodziennikarstwa. O kondycji autorów pogardzanych

Podobnie sprawa ma się z artystami wizualnymi utrzymującymi się z pracy na zlecenie, na przykład w reklamie albo mediach. Znów – prawdopodobnie zawodowcy zajmujący się tworzeniem, powiedzmy, grafik koncepcyjnych na potrzeby wysokobudżetowych filmów i seriali nie mają się czym przejmować. Ale mniejsi lub początkujący artyści utrzymujący się z mało prestiżowych prac dla niszowych wydawców albo klientów, dla których priorytetem nie jest wysoka jakość czy artystyczna spójność produktu? Upowszechnienie się tej technologii może zmieść z powierzchni ziemi całe segmenty i tak już cienko przędącego rynku.

Jak zawsze w przypadku automatyzacji – w idealnym świecie byłby to fantastyczny wynalazek odciążający przepracowanych ludzi. W neoliberalnym kapitalizmie sprawia on jedynie, że mnóstwo osób, które włożyły w swoje wykształcenie wiele czasu i wysiłku, niemal z dnia na dzień może stracić źródło utrzymania, bo ich rzemieślniczy kunszt zastąpiony zostanie szybszą, bardziej wydajną produkcją automatyczną.

Stworzenie okładki do książki może zająć ludzkiemu artyście od kilku dni do kilku tygodni pracy, w zależności od kompleksowości zlecenia. Generator MidJourney jest w stanie wygenerować gotową pracę w kilkadziesiąt sekund – daje również możliwości przetworzenia wygenerowanej grafiki, oferując użytkownikowi kilka jej wariantów.

Usługa jest płatna – po określonej liczbie wygenerowanych obrazów MidJourney oferuje kilka progów subskrypcji – ale z punktu widzenia, dajmy na to, właściciela wydawnictwa, który szuka okładek dla publikowanych przez siebie książek, nadal jest to znacznie lepszy interes niż płacenie grafikom i ilustratorom, którzy nie są w stanie konkurować z maszyną pod względem tempa pracy. Z punktu widzenia potencjalnego czytelnika najprawdopodobniej nie będzie to miało większego znaczenia. Mimo że żyjemy w kulturze opartej na obrazie i wizualiach – a może właśnie dlatego – istnieje tendencja do traktowania ilustracji w czysto utylitarny sposób. Na ogół nie muszą być wybitne. Muszą być tylko dostatecznie dobre.

Co jest bardzo złą informacją dla artystów, ale bardzo dobrą dla właścicieli sieci neuronowych. Najprawdopodobniej tworzone przez nie dzieła nigdy nie będą wybitne – sztuka jest czymś mocno kontekstowym i nic nie zastąpi żywego, świadomego artysty podejmującego przemyślane, intencjonalne decyzje twórcze – ale już na tym etapie często są dostatecznie dobre.

Oczywiście za całą tą technologią ciągnie się długi warkocz moralnych, filozoficznych, politycznych i prawnych implikacji, których jeszcze długo nie będziemy w stanie rozplątać. Nieoczywista pozostaje choćby kwestia tego, kto właściwie może przypisać sobie autorstwo wygenerowanego w ten sposób dzieła – literackiego lub graficznego.

Na kogo głosuje sztuczna inteligencja?

Czy za autora rezultatów tego, częściowo losowego, częściowo intencjonalnego procesu należy uznać autora promptu (opisu)? Architektów sieci neuronowych, którzy ustalają ich parametry i w ten sposób przynajmniej częściowo odpowiadają za pośredni rezultat ich działań? Artystów prac, na których wytrenowana została sztuczna inteligencja?

Szczególnie ten ostatni aspekt budzi wiele kontrowersji. Po tym jak generatory ilustracji zyskały szerszy rozgłos, wielu artystów, których prace zostały wykorzystane w procesie szkolenia sieci neuronowych, wyraziło w mediach społecznościowych niezadowolenie z tego faktu. I trudno się temu dziwić. Jeśli sieci neuronowe będą w stanie stworzyć dostatecznie dobrą grafikę w stylu jakiegoś artysty, ten konkretny artysta – który pracował na swoją renomę wiele lat i włożył wiele wysiłku w wypracowanie unikatowego stylu – stanie się niepotrzebny. Niektórzy otwarcie określają generatory mianem wyrafinowanej formy plagiatu.

To niezwykle fascynująca sytuacja właśnie z tego powodu, że mamy do czynienia z precedensem – proces generowania treści przez sieci neuronowe jest na tyle odmienny od wszystkich podobnych przypadków plagiatu/tworzenia prac zależnych, że prawo dotyczące własności intelektualnej zwyczajnie nie ma regulacji dotyczących konkretnie czegoś takiego. Stąd chwilowa wolna amerykanka, bo z pewnością prędzej czy później zostanie to uregulowane. Raczej później niż prędzej, bo prawo właściwie nigdy nie nadąża za technologicznymi nowinkami.

Najprawdopodobniej już teraz przedstawiciele Disneya przeczesują bazy danych, na których pasły się sieci neuronowe, by sprawdzić, czy nie ma tam czegoś, co należy do tego koncernu, by potem przywalić ich twórcom taktyczną bombą prawniczą.

Jednak dopóki nikt nie powie „sprawdzam” i nie zakwestionuje praw do szkolenia sieci neuronowych na publicznie dostępnych pracach, tego typu praktyki pozostaną szarą strefą.

Żołnierz może się cofnąć, maszyna nigdy. Sztuczna inteligencja zaczyna zabijać

Przy czym warto zauważyć, że my wszyscy – mam na myśli żywych, oddychających ludzi, artystów, twórców – szkolimy nasze własne, organiczne sieci neuronowe w taki sam sposób. Jeśli jestem pisarzem fantasy, który uczył się pisania, naśladując styl Sapkowskiego, w mojej prozie będzie się przewijał podobny styl wypowiedzi, podobne poczucie humoru, może od czasu do czasu pojawi się w niej jakaś fraza czy zdanie niemal od Sapkowskiego ściągnięte. Czy to oznacza, że plagiatuję Sapkowskiego? Nie, bo transformuję tę prozę w mojej głowie, inspiruję się wpływem twórczości pana Andrzeja i traktuję ją jako punkt odniesienia do tworzenia czegoś innego. Własnego.

Jedyna różnica polega na tym, że sieć neuronowa jest nieświadoma i pracuje automatycznie. Jeśli każe jej narysować Królewnę Śnieżkę w stylu Zdzisława Beksińskiego – to ona to zrobi. W niecałe trzydzieści sekund.

Kwestie dotyczące autorstwa to tylko wierzchołek góry lodowej, jeśli chodzi o potencjalne problemy z tą technologią. Jest to jednak tak nowe zjawisko, że więcej tu niewiadomych niż konkretnych prognoz. Historię tego fenomenu w przestrzeni publicznej nadal możemy liczyć w tygodniach, nawet nie w miesiącach. Dopiero niecały miesiąc temu, 22 września, jedna z najbardziej zaawansowanych sieci neuronowych, Stable Diffusion, udostępniła swoje oprogramowanie w ramach open source, do pobrania i dowolnego modyfikowania dla każdej chętnej osoby. Wbrew pozorom, by używać swojej wersji sieci neuronowych nie potrzeba komputerów NASA – już przyzwoity laptop do gier pozwala uzyskać całkiem zadowalające efekty.

Tak naprawdę stoimy dopiero u progu tego fenomenu.

Czy odnowią oblicze sieci, tej sieci?

czytaj także

W teorii sieci neuronowe mogą wygenerować wszystko, czego tylko się od nich zażąda – pornografię z udziałem osób małoletnich, revenge porn z doklejoną twarzą dowolnej osoby, której zdjęcia posiadasz, fotorealistyczne ilustracje z twardą erotyką z udziałem dowolnej osoby publicznej (albo po prostu dostatecznie obfotografowanej osoby prywatnej), gore… pole do nadużyć jest absolutnie zatrważające i im dłużej o tym myślę, tym gorzej sypia mi się w nocy.

Jak na razie nawet najbardziej zaawansowane sieci neuronowe nie są jeszcze na tyle dobre, by tworzyć ilustracje nieodróżnialne od zdjęć – zawsze pojawiają się jakieś deformacje zdradzające sztuczność – ale biorąc pod uwagę to, w jakim tempie rozwija się ta technologia, nie zdziwię się, jeśli bardzo szybko przestanie to być problemem. To znaczy – przestanie być problemem dla sieci neuronowych. Dla nas zacznie się cały łańcuch problemów, na które dramatycznie nie jesteśmy przygotowani.

Kto nie mruga, ten deepfake

czytaj także

Kto nie mruga, ten deepfake

Helena Chmielewska-Szlajfer

Twórcy MidJourney, najpopularniejszej sieci neuronowej, którzy w całości kontrolują output (rezultaty) swojego programu, wmontowali do niego blokady uniemożliwiające generowanie treści gore i pornograficznych. Wspomniane wyżej Stable Diffusion to już jednak inny, znacznie groźniejszy zwierz – jego twórcy umywają ręce, przerzucając na użytkowników odpowiedzialność za to, czym nakarmią sieci neuronowe i co w zaciszu swoich domów wygenerują za ich pomocą.

Ta technologia ma zatem przerażający potencjał. Ale w tym momencie próby przewidywania, co się z nią stanie, jak się rozwinie (o ile jakkolwiek), do jakich nieszczęść doprowadzi (o ile jakichkolwiek), jak zareaguje na to prawo (o ile w jakikolwiek sposób), to pisanina palcem po wodzie, bo nawet nie po piasku. Może twórcy sieci neuronowych dojdą do ściany, która uczyni tę technologię fascynującą, ale koniec końców mało użyteczną ciekawostką, a może to dopiero początek i za kilka miesięcy AI stanie się szybszym i tańszym zamiennikiem artystów.

Może oznacza to koniec sztuki w jej dotychczasowym rozumieniu, a może nowy jej początek.

**
Michał Ochnik (1990) – pisarz, publicysta, wideoeseista i komentator kultury popularnej, twórca bloga Mistycyzm Popkulturowy. Współpracował, m.in. z portalem Popmoderna oraz miesięcznikiem „Nowa Fantastyka”.

__
Przeczytany do końca tekst jest bezcenny. Ale nie powstaje za darmo. Niezależność Krytyki Politycznej jest możliwa tylko dzięki stałej hojności osób takich jak Ty. Potrzebujemy Twojej energii. Wesprzyj nas teraz.

Zamknij