Esej / DOLE PO ŠPIRÁLE: TEXT-TO-IMAGE

V tomto mesiaci sa Dean Kissick zamýšľa nad literárnou povahou obrazov generovaných umelou inteligenciou.

Dielo Crucifixion – Roberto Matta (1979) skombinované s dielom Leonora in the Morning Light – Max Ernst (1940) vytvorené Deanom Kissickom s pomocou Midjourney, 2022, zdroj: spikeartmagazine.com

O spoločnosti Midjourney som prvýkrát počul na jar na večierku lifestylovej influencerky Caroline Callowayovej, ktorá opúšťala New York. Ukázalo sa, že v ten týždeň mala každý večer odchodovú párty a pozývala rôzne skupiny hostí do svojej tmavej a útulnej garsónky vo West Village, ktorá bola v tom čase takmer plná prázdnych alebo napoly vypitých fliaš vína a váz a rozpadávajúcich sa kytíc kvetov a sviečok, ktoré sa rozplývali po celom byte. Kúpeľňa bola voňavá a na jej hladine plávali kvety ako lekná. Nebolo si kam sadnúť a nebolo dosť pohárov na víno a my sme museli piť zo stále cudzích nádob, hostiteľ nám stále podával dlhšie, špicatejšie a ťažkopádnejšie keramické a sklenené predmety, z ktorých sme mohli popíjať. Softvérový inžinier menom Duncan, s ktorým som sa práve v ten večer zoznámila, mi začal rozprávať o serveri Discord, na ktorom sa podieľa len na pozvánkach a kde sa dajú vyčarovať obrazy jednoduchým zadaním krátkeho opisu; hovoril, že niektorí umelci, ktorých sme poznali, sú tiež jeho súčasťou a hrajú sa s týmto vyvíjaným softvérom na tomto polotajnom serveri, vykresľujú obrazy a experimentujú v jeho kanáloch. Bol to jeden z tých večerov, keď máte pocit, že sa realita okolo vás rozplýva.

Midjourney a ďalšie generátory textov na obrázky, ako napríklad DALL-E 2 od OpenAI a Imagen a Parti od Googlu, umožňujú tým, ktorí majú včasný prístup, rýchlo a jednoducho vyvolať komplikované počítačom generované obrázky pomocou jednoduchých textových pokynov, a ak chcete, aj odkazov na obrázky. Všetky tieto umelé inteligencie (AI) sa učia jazykové vzťahy medzi obrázkami a ich opismi a učia sa aj obrázky procesom „difúzie“: začínajú s náhodným šumovým vzorom farebných pixelov, hľadajú v ňom rozpoznateľné aspekty obrázka, ktorý dostali pokyn nájsť, a stále ho spresňujú do variácií tohto obrázka. Pracujú tak, že najprv zničia svoje tréningové údaje postupnými vrstvami vizuálneho šumu a potom sa naučia, ako tento proces zrušiť a obnoviť obrazy zo šumu. Je to druh pointilizmu v opačnom garde; namiesto toho, aby sa začalo na l’Île de la Grande Jatte v nedeľu popoludní a potom sa táto scéna v priebehu niekoľkých rokov rozdelila na približne 220 00 drobných maliarskych bodov, ako to urobil Georges Seurat, umelá inteligencia začína v oblaku rozptylu a hľadá formu a obsah. Podobne ako starý mystický vizionár, ktorý pozoruje oheň a verí, že sa v ňom nakoniec objaví postava, program nájde v dyme posolstvá, ktoré hľadá.

Je to jedinečný literárny prístup k tvorbe obrazov. Namiesto toho, aby ste sa snažili vytvoriť obrazy v mysliach svojich čitateľov alebo zaznamenať videné pamiatky slovami, pokúšate sa vyčarovať nové obrazy v mysli umelej inteligencie. Musíte sa naučiť opísať niečo, čo možno neexistuje, a to jazykom, ktorý je prispôsobený pre stroj a ktorý dokáže analyzovať. Je to radikálny skok z jednej formy tvorivosti (písanie) do druhej (počítačom generované obrazy) a pre spisovateľa, ako som ja, neobyčajne uspokojivý a bezprostredný.

Obrázok ruky vytvorený Gray Crawford s pomocou DALL·E 2, 2022, zdroj: spikeartmagazine.com

Textovo-obrazová umelá inteligencia je vycvičená tak, aby nevytvárala fotorealistické zobrazenia tvárí skutočných ľudí, čo znamená, že ide o formu fotografickej technológie, ktorá neumožňuje selfie. Nemôžeme sa umiestniť do centra týchto snímok: nie sme objektom a ani naša emocionálna subjektivita nie je kreatívne vyjadrená. Obrazy, ktoré vytvára, nie sú ani kópie, ani originály. Nie je to ako fotoaparát, ktorý dokáže reprodukovať vonkajší svet, ale zároveň ho nemožno priamočiaro presvedčiť, aby vyjadril, ako sa cítite vo svojom vnútri, pretože o väčšine jeho estetických rozhodnutí rozhoduje algoritmus a náhoda.

Tieto obrazy akoby pochádzali odinakiaľ, z inej dimenzie. Umelá inteligencia je kognitívny systém, ktorý sa učí, ako sa svet javí, prostredníctvom stoviek miliónov nájdených obrázkov vo svojom súbore údajov; obrovskej kolektívnej pamäti vytvorenej z obrazov, ktoré sme vytvorili, vizuálnej ríše, ktorú sme vytvorili ako ľudia. Hoci pracuje s fotografiami, pracuje aj s umeleckými dielami a ilustráciami a inými druhmi vizuálnych informácií, pričom všetky majú rovnakú váhu. Vidí bez uhla pohľadu. Obrazy, ktoré vytvára, nepoukazujú na jednu konkrétnu realitu, ale skôr na mnoho, mnoho rôznorodých zdrojov spojených dohromady, ktoré sú samy o sebe reprezentáciami. Jeho kompozícia ukazuje do toľkých rôznych smerov naraz a dala by sa prirovnať ku kubistickej maľbe; ale namiesto toho, aby sme videli ten istý predmet z rôznych uhlov a momentov v čase súčasne, vidíme rôzne prípady toho istého podvidíme rôzne prípady tej istej predmetovej kategórie zhromaždené a zložené dohromady.

Obrázok nočného obradu, ktorý vytvoril Honor Levy s programom Midjourney, 2022, zdroj: spikeartmagazine.com

Vo svojej nedávnej eseji „Nekonečné obrazy a latentná kamera“ umelci Holly Herndon a Matthew Dryhurst prechádzajú z niektorých vlastných experimentov s DALL-E 1 a súvisiacim softvérom a naznačujú, že „tieto nástroje budú čoskoro obsahovať všetky prvky potrebné na vytváranie kompozícií s neobmedzeným rozlíšením riadených jazykom a štylistickými podnetmi“. Čoskoro bude možné vytvárať obrazy, ktoré budú smerovať k nekonečnu, zložené z rozľahlého borgesovského labyrintu odkazov. Zatiaľ ukazujú príklad krajiny Charlesa Guillouxa L’allée d’Eau (1895) rozšírenej smerom von za hranice jej rámu DALL-E. Keď navštevujem múzeá, často si želám vstúpiť do starých obrazov a zažiť časy a miesta, v ktorých vznikli; to je zatiaľ nemožné, ale tieto obrazy by teraz mohli byť rozšírené na horizont. Obľúbený obraz by mohol narásť do veľkosti múzea alebo kam až oko dovidí.

Umelcovo dielo možno (ak necháme bokom otázky autorstva a autenticity) teraz doplniť aj automatizovanou imitáciou, a Herndon a Dryhurst pre to navrhujú termín: „Ak samplovanie umožnilo umelcom manipulovať s umeleckými dielami iných ľudí, aby vytvorili koláž niečoho nového,“ hovoria, „spawning umožňuje umelcom vytvárať úplne nové umelecké diela v štýle iných ľudí zo systémov umelej inteligencie vyškolených na ich dielach alebo podobizniach.“

V tomto veku opakovania a mimézis donekonečna pretvárame minulosť. Zdá sa, že dokonca aj naše najmodernejšie umelé inteligencie sú vyškolené na minulosti a v istom zmysle sú vo svojom prístupe konzervatívne (sú vyškolené na historických obrazoch, ich súbory údajov sú cenzurované a sexuálne explicitné, násilné alebo inak provokatívne podnety sú zakázané). Obrazy, ktoré vytvárajú, sú „gýč“ podľa definície Clementa Greenberga: derivované príklady nízkej, populárnej kultúry, ktoré sa živia „dostupnosťou v blízkosti plne vyzretej kultúrnej tradície, ktorej objavy, akvizície a zdokonalené sebavedomie môže gýč využiť na svoje vlastné ciele“. Sú to napodobeniny života. Často sú imitáciou umenia a jeho účinkov. Ich krása, ak sú krásne, vzniká skôr náhodou ako zámerom. Tieto stroje sú vycvičené na objektívne komponovanie obrazov, takže aj štýly vyjadrovania by sa mohli reprodukovať mechanicky a ľahostajne. Niektoré popredné výskumné laboratóriá vyvíjajú schopnosť programovať (imitácie) štýlov, privlastňovať si štýly rôznych umelcov ako materiál a dokonca ich kombinovať. Manieristická umelosť sa mieša s umelým učením. S dobrými písomnými podnetmi existuje spôsob, ako možno, dúfam, posunúť gýč tak ďaleko, že sa stane niečím zvláštnym a lákavým, dokonca dojemným.

Obraz maliara vytvorili Holly Herndon a Matthew Dryhurst pomocou DALL·E 1, 2022, zdroj: spikeartmagazine.com

Tento obraz, ktorý vytvorili Herndonová a Dryhurst pomocou DALL-E, mi pripomína maliara Novej lipskej školy Nea Raucha: má podobne sociálnorealistický štýl a bizarný a mýticky vyzerajúci obsah a je podobne stvárnený s výrazným nedostatkom radosti zo života. Väčšina obrazov vytvorených umelou inteligenciou má túto znervózňujúcu kvalitu bez života, tento pocit zvláštneho údolia, že ani nezobrazuje, ani nebol vytvorený skutočným človekom. Práve táto neživotnosť ich robí pre mňa presvedčivými. Ich zvláštne a nezamýšľané abstraktné vlastnosti im dodávajú novú estetiku v čase, keď je tak ťažké nájsť novú estetiku.

Umelá inteligencia sa dá použiť jemným spôsobom, aby sa obrazom dodal nádych nereálnosti. Na výstave, ktorú som práve otvoril v New Yorku, Ezra Miller používa obrazy generované neurónovými sieťami na vytváranie abstraktných textúr, farebných paliet a zvláštnych fotografií krajiny; tie sú zasa použité ako zdrojový materiál pre jeho vlastnú generatívnu simuláciu maľby v reálnom čase Imago.

Ezra Miller, Imago, 2022, foto: Tom Powel Imaging, zdroj: spikeartmagazine.com

Samozrejme, dá sa použiť aj oveľa menej rafinovanými spôsobmi. Postavy nakreslené pomocou Midjourney (jediná umelá inteligencia, ktorú som si vyskúšal na vlastnej koži) majú tendenciu vychádzať rovnako mučivo a deformovane ako Francis Bacon. Program má stále veľké problémy s orientáciou objektov v priestore alebo so zladením ich fragmentov. Nedokáže znovu poskladať realitu. Trhliny v jeho iluzórnom svete sú jasne viditeľné. Keď som ho však začal skúšať prvýkrát, vyvolal vo mne pocit závrate a úžasu. Pre človeka by bolo veľmi ťažké vytvoriť takéto obrazy samostatne. Narodili sme sa na planéte, kde väčšinu vecí vytvorila príroda alebo ľudské vedomie, a teraz prechádzame do veku, v ktorom bude čoraz viac nášho okolia vytvoreného umelým vedomím alebo v spojení s ním.

Nakoniec sa stroje môžu naučiť, čo si želáme vidieť, a to prostredníctvom výberu z ponúkaných variantov. Mohli by byť novým druhom nástroja, ktorý sa učí za pochodu. Alebo by nás mohli prekvapiť a zmiasť. Postupom času, s toľkými podnetmi, variantmi a možnosťami výberu, s neustále sa meniacou umelou inteligenciou, by sme mohli spoločne vytvoriť skutočne nezvyčajné a nečakané obrázky. Mohli by sme sa k nim dostať veľmi rýchlo, mohli by sme veľmi skoro dosiahnuť presvedčivý fotorealizmus a maliarske deepfakes a preraziť priamo, ako to urobili modernisti s maľbou, do nových spôsobov abstrakcie a surrealizmu alebo digitálneho vznešeného. Táto estetika je v plienkach. Midjourney, DALL-E a podobne sú konkrétne spôsoby, ako k nej pristupovať; ale talentovaný programátor by mohol napísať vlastnú umelú inteligenciu a vycvičiť vlastného virtuálneho učňa, ktorý by sa hnal za akoukoľvek estetikou, technikou alebo konceptom, ktorý sa mu páči.

Obrázok serafína, ktorý vytvoril Jon Rafman pomocou programu Midjourney, 2022, zdroj: spikeartmagazine.com

Možnosti vizuálnej umelej inteligencie siahajú ďaleko za hranice aj pri prevode textu na obraz. Pierre Huyghe pri svojej pokračujúcej sérii prác „mentálneho obrazu“, ktorú prvýkrát predstavil na výstave „UUmwelt“ v Serpentine v roku 2018 a teraz na online výstave „Of Ideal“ s Hauser & Wirth, požiadal dobrovoľníkov, aby sa pozerali na obraz alebo o ňom premýšľali, zatiaľ čo ich mozog bol skenovaný v prístroji magnetickej rezonancie. Potom sa Huyghe pomocou softvéru umelej inteligencie vyvinutého v spolupráci s neurológom z Kjótskej univerzity Yukiyasu Kamitanim pokúsil dekódovať aktivitu v ich mozgu a vykresliť ju späť do obrazu toho, na čo sa pozerali alebo na čo mysleli. Je to úplne iný prístup ako prevod textu na obraz, ale v oboch prípadoch ide o pokusy preniesť myšlienky priamo z predstavivosti do obrazu na obrazovke. Je to veľký skok a veľmi odlišný spôsob uvažovania o tvorbe. Jedného dňa by dokonca mohlo byť možné, aby sa vaše podvedomie alebo vaše sny zo spánku vykreslili ako prúd obrazov pomocou umelého vedomia, čo by umožnilo úplne nové prístupy k surrealizmu a automatickému písaniu.

 

DEAN KISSICK je prispievateľ do časopisu Spike New York. Po špirále dole sa objavuje online každú druhú stredu v mesiaci.
15 / 8 / 2022
by Dean Kissick
Zdieľaj na Facebook