În lumea totului-Imagine: Despre Sora AI

28 martie, 2024

Cei de la Open AI – responsabili, printre altele, de ChatGPT – au lansat de curând Sora AI: un dispozitiv care generează imagini video pe baza oricărui text dat. Suficient, în ciuda unor limitări de moment, cât să suscite o reflecție „sălbatică” despre paradigma vizuală în care ne pregătim să intrăm.

„A dispune de o fotografie a lui Shakespeare ar fi la fel cu a ține în mână un cui din Crucea Adevărată”, zicea prin anii ‘70 Susan Sontag. Ne aflam, atunci, într-o epocă în care legătura cvasi-imediată dintre imaginea fotografică și adevăr era încă în picioare. În gândirea occidentală, fotografia – și, prin extensie, imaginea în mișcare – se impusese drept forma nec plus ultra a obiectivității și a autenticității. Sontag continua în același eseu, On Photography: „fotografia furnizează dovezi. Un lucru despre care auzim, dar de care ne îndoim, pare confirmat atunci când ni se arată o fotografie a sa.” În aceeași perioadă, Roland Barthes afirma, în a sa Cameră luminoasă, ceva similar: „orice fotografie e un certificat de prezență”. Cu treizeci de ani înainte, în imediatul celui de-al doilea război mondial, criticul André Bazin punea bazele acestei argumentații longevive: „pentru prima dată, între obiectul originar și reproducerea sa intervine numai instrumentalitatea unui agent inanimat. Pentru prima dată o imagine a lumii este formată automat, fără intervenția creatoare a omului.” Exit, așadar, agentul uman, prin excelență failibil – și enter tehnica impersonală, al cărei produs imediat rămâne, a priori, imposibil de falsificat.

Desigur că situația este – și a fost dintotdeauna – mai complexă. Dubiul, lipsa și manipularea nu au fost niciodată retrase complet din joc. În fond, aceste citate scoase din context nu își propun să niveleze gândirea contradictorie a unor teoreticieni, ci să forțeze apariția unui fir roșu care leagă fotografia nu de o credință oarbă în supremația procesului mecanic al obținerii, ci de o sete de vizibil. E vorba că, între Holocaust și Răstignire (și dincolo de ea), paradigma vizuală s-a confruntat în permanență dacă nu cu o lipsă totală, atunci cu o insuficiență, o raritate a probelor, din motive mai mult sau mai puțin evidente. Când Bazin scria acele rânduri, el avea în fața ochilor actualitatea unei grave deziluzii mondiale, cu atrocitatea lagărelor de concentrare trecând aproape neînregistrată, perfect ascunsă – și, deci, aproape imposibil de certificat pe cale nemediată. În fața acestei enormități – dispariția fără urmă a milioanelor de oameni –, paradigma (audio)vizuală ținea loc de compensație, căci ea se poate lipsi, în absolut, de acțiunea umanului, „prin natura sa subiectivă și destinată inexactității” (dixit istoricul Annette Wieviorka). Acest curent, să-i spunem ontologic-tehnicist, reverberează până în anii ‘70, când tot mai multe – dintre foarte puținele, de fapt – mostre vizuale ale Holocaustului se văd dezgropate de arhiviști și cineaști, în același timp în care – lucru deloc neglijabil – se fortifică un curent contrar de gândire: acela al interdicției realizării imaginilor de orice fel, sub impulsul tutelar al regizorului Claude Lanzmann (autorul monumentalului Shoah, din 1985). De o parte, mărturia incontestabilă, deci necesară; iar de cealaltă, alunecarea inevitabilă în spectacular și estetic, deci abjectă: două principii ireconciliabile, care fac din imagine vectorul polarizant al reprezentării. (Un film precum The Zone of Interest, doar ce lansat, participă la aceeași dezbatere.)

Noua vârstă a imaginii

Se poate spune, însă, că această discuție aparține zilei de ieri. Dacă Bazin nu a murit (din nou), atunci cu siguranță că, asaltată de inteligența artificială care promite să „facă” imagine din nimic, moștenirea sa devine din ce în ce mai minoritară – o felie cu iz de purism și nostalgie extrasă din ditamai sfera audiovizuală întreagă la care putea pretinde cândva. În trecut, o definiție înglobantă a cinemaului încă mai putea fi stabilită pornind de la preceptul bazinian; acum, ea nu mai consfințește decât o anumită tradiție a practicii. Evident că traiectoria aceasta a fost amorsată de ani buni, sub acțiunea concertată a CGI-ului și a tranziției galopante spre aparatură pur digitală, care aseamănă tot mai mult cameramanul unui pictor – cineva care „pune de la el” –, iar tehnica, unui ersatz palid al acelei raze de lumină întipărite demult pe peliculă.

Legătura dintre om și imagine – care încă mai persista, de bine, de rău, chiar și atunci când un tehnician crea el însuși, pe computer, niște imagini de la zero – devine tot mai opacă. Translatarea scriiturii celei mai banale în imagini e, după toate aparențele, epocală, deoarece leagă două medii diferite, iar consecințele nu se vor lăsa așteptate.

În continuarea citatului de mai sus, Bazin susținea aprobator faptul că omul participă în procesul fotografic „doar în selecția obiectului de fotografiat și prin scopul pe care și l-a propus.” Diferența fundamentală e că Sora se lipsește cu totul de aportul uman concret – de manualitate – în generarea elementului vizual. Legătura dintre om și imagine – care încă mai persista, de bine, de rău, chiar și atunci când un tehnician crea el însuși, pe computer, niște imagini de la zero – devine tot mai opacă. Translatarea scriiturii celei mai banale în imagini e, după toate aparențele, epocală, deoarece leagă două medii diferite, iar consecințele nu se vor lăsa așteptate.

De fapt, ne aflăm acum în mijlocul unei tornade, ceea ce face ca lucrurile să fie deopotrivă stimulante și pline de risc: dificil, într-adevăr, să prezicem cu exactitate încotro o vor apuca imaginile; dificil, cu alte cuvinte, să evităm capcana unor judecăți clișeizate, care să speculeze leneș asupra rapidității cu care totul evoluează. Ajunge să privim o mostră de video AI lansată acum vreun an, în care îl vedeam pe Will Smith cum interacționa comic-grotesc cu un bol de paste, în loc să le mănânce ca lumea, într-o deformare plastică aproape caricaturală. A susține, deci, că peste încă un an tot ceea ce azi pare imposibil – de pildă, prezența sunetului peste imagine – va fi floare la ureche nu mai e deloc radical.

Mai importantă pare a fi examinarea acestor mostre preliminare transmise de Sora, ca un fel de stop motion într-un stadiu intermediar al dezvoltării tehnicii, asupra căruia riscăm să trecem cu privirea, peste ani, amuzați și nostalgici. În aceste zile de proto-tehnologie, când încă mai putem stabili cu certitudine ce conținut vine de la AI și ce nu, se cuvine să facem iarăși apel la uneltele analizei filmice – la vocabularul și sensibilitățile puse de atâtea ori în joc – pentru a vedea ce și cum ne comunică Sora. Pentru a vedea, cu alte cuvinte, opțiunile stilistice și formale către care algoritmul ne face acum cu ochiul. În calitatea lor de produse rezultate în urma unei operațiuni infinite de remix de date și probabilități, ele, de fapt, sunt cele care ne pot orienta mai bine în legătură cu preferințele ideologice înnăscute – sau, mai bine zis, inculcate – ale acestui dispozitiv. Fiindcă ele sunt mai mult decât niște mostre disparate de audiovizual – sunt simptomul unor tendințe contemporane mai largi de producție a experienței sensibile, o reciclare a trendurilor care astăzi domină spațiul cultural al planetei.

Imaginile inteligenței artificiale

Probabil cel mai cunoscut video arătat de creatorii Sora este cel care prezintă „o femeie stilată” mergând „pe o stradă din Tokyo plină de lumini calde de neon și de aerul de oraș animat” (am citat din prompt-ul livrat algoritmului). Rezultatul e o bucată de vizual glossy alcătuită din două cadre – primul, ceva mai lung, e un plan general cu femeia ce avansează pe un fundal bombastic à la Times Square, iar al doilea e un gros-plan cu chipul persoanei –, al cărui strămoș e cât se poate de străveziu: reclama. În fond, ce vedem aici – pasul ușor slow-mo-izat al femeii, orașul care scânteiază simbolic prin băltoace fotogenice – constituie simultan o publicitate pentru lifestyle-ul urban occidentalizat, ca și pentru diverse piese vestimentare: de la geaca de piele frumos randată la ochelarii de soare (mică incongruență deloc supărătoare pentru această vinietă nocturnă) pe a căror ramă am putea citi, dacă am vrea neapărat, o marcă inventată ad hoc.

Remarcabilă e tocmai neputința AI-ului de a propune ceva nemaivăzut, de la zero: el preia din codurile formale care au împânzit toate orașele lumii prin pancarte, ecrane, slot-uri arhitecturale menite să vândă. Desigur, există o preferință pentru acele reclame high end: deloc greu să ne imaginăm departamentul de PR al unui brand de lux frecându-și mâinile la vederea acestui spot mai lins, mai neted și mai kitschos chiar decât ceea ce se face acum. Ce vreau să spun, cu alte cuvinte, e că decriptarea surselor acestor imagini nu e fetiș cinefil – e o pătrundere în însuși modul de operare al dispozitivului, care a înțeles, vorba lui Ezra Pound, că a inventa înseamnă a reinventa, așa că transformă totul într-o imensă procedură de reciclare a conținutului dominant disponibil pe Net.

E interesant de văzut cum, în anumite prompt-uri transmise dispozitivului, se menționează chiar și aparatura pe care, teoretic, s-a tras videoul: 70mm pentru un ochi filmat în gros-plan, în toată plinătatea texturală, cu pădurea de gene și cristalinul în care se reflectă frumusețea lumii. Moment în care criticului de film îi vine în minte un flash melancolic din capodopera lui João César Monteiro Vai e Vem (2003), care se încheie cu un cadru similar ridicat la rang de vinietă testamentară, apoi decide să îl reprime numaidecât. Sau, dimpotrivă, o filmare cu telefonul pentru acest „frumos homemade video care arată oamenii din Lagos, Nigeria, în anul 2056”, ceea ce rezultă într-un filmuleț forțos de tip Alfonso Cuarón, capabil să ne bâțâie („telefon”, v-ați prins?) dinspre o piață proletară în care se pogoară miraculos, din ceruri, înspre o linie a orizontului brăzdată de zgârie-nori și autostrăzi cu multe benzi.

Cadru din Vai e Vem (2003) — Cadru din *Vai e Vem* (2003)

Alte exemple sunt mai puțin ofertante pentru analiză: recunoaștem influența zdrobitoare a jocului video în acest material filmat, în teorie, cu o dronă care urmărește un SUV ce aleargă voinicește pe un drum de țară, stârnind o furtună de colb care evocă franciza de jocuri video „Colin McRae”, inspirată de marele pilot de raliuri. De asemenea, efectul de stranietate e mult mai puțin pronunțat în acele videouri care imită animația – poate pentru că ne-am obișnuit, în aceste cazuri, să punem deoparte ideea de „indexicalitate” (urma obiectului real care să rămână înscrisă în fotografie) și să luăm totul de bun.

Dar adevărul este că Sora e cel mai palpitant atunci când permite esteticii predominant plăsticos-publicitare să se spargă într-un moment de virtuozitate tehnică. Cum e acest video cu titlul „Reflexii în geamul unui tren care călătorește prin suburbia orașului Tokyo”, în care ni se oferă ceva mai mult decât sugerează titlul: nu doar imaginea extraordinară a unui cartier plauzibil de case înghesuite, mascată în parte de interfața realistă a geamului, ci și această clipă când trenul trece pe sub un pod, ceea ce dezvăluie, în întuneric, silueta unei tinere aflate, chipurile, la originea videoului: ea ține telefonul în mână. Există aici o gândire ceva mai adâncă, care face din video o urmă plauzibilă prin lume – AI-ul având parcă deja conștiința că orice imagine e produsă de un agent viu, sau cel puțin așa se întâmpla până acum –, în locul unei simple vederi descărnate, abstracte, plăsmuite de mintea unui IT-ist. Tocmai mimarea acestui act de a produce imagini, care până mai ieri încă era legat de om, s-ar putea să împingă deja tehnologia pe panta dezinformării și a confuziei.

Un video, în fine, pare să încapsuleze toată miza epistemologică a acestei schimbări de paradigmă. E vorba despre acest „material istoric [sic] cu California din timpul goanei după aur”, unde o privire din dronă ne poartă printr-un burg plin de viață al Vestului Sălbatic, animat de cetățeni, cai (inclusiv unul care dispare) și pâraie, de-a lungul unei panoramări care dezvăluie împrejurimile și strada principală. Te-ai crede în Red Dead Redemption, dacă n-ar exista această inscripție cu „historical footage” care, în mod inevitabil, tulbură apele. Căci ce e de făcut cu aceste imagini născute din pretenția unui adevăr istoric, și tocmai de aceea perfect mincinoase, dacă nu chiar imposibile? E această falsificare o simplă agravare a acelor imagini colorizate post factum, care ne prezintă cine știe ce oraș de la 1900 strălucind în toată paleta de culori a tehnicii actuale? E mai mult decât un joc de-a istoria contrafactuală, o fantezie copilărească a hipervizibilității?

Dincolo de necesarele considerații estetice, care ne pot îndruma pertinent în ce privește la originea și modul de funcționare al acestor imagini născute din eterogenul actual al audiovizualului, ceva mai profund și mai îngrijorător se întrevede în miezul acestui nou regim al vizibilului propus de Sora: o relativizare fără limite a adevărului obiectiv.

Cu siguranță ne putem aștepta ca până și noțiunile de autoritate, credibilitate și consens – deja destabilizate în urma recentelor evenimente istorice, de la Revoluția Română și „falsele” gropi comune de la Timișoara la asaltul Capitoliului de către susținătorii lui Donald Trump – să evolueze. Vom avea la dispoziție, de acum, imagini cu Crucea Adevărată, cu Shakespeare și chiar cu nevăzutul și negânditul. Dincolo de necesarele considerații estetice, care ne pot îndruma pertinent în ce privește la originea și modul de funcționare al acestor imagini născute din eterogenul actual al audiovizualului, ceva mai profund și mai îngrijorător se întrevede în miezul acestui nou regim al vizibilului propus de Sora: o relativizare fără limite a adevărului obiectiv.

Imagine principală: Albrecht Dürer, Iepure tânăr (1502), capodoperă timpurie a artei observaționale, ce aduce laolaltă rigoare științifică și fantezie creatoare.

Victor Morozov

Critic de film și jurnalist. Scrie săptămânal pentru Scena9 și Dilema veche. A studiat teorie de film în Grenoble, Paris, Dublin.

Limbă:

În lumea totului-Imagine: Despre Sora AI

Victor Morozov

Articole Recente

Oglinzi sparte: adolescența între real și virtual

Cum ajunge poezia în film? Răspund 7 cineaști

Binka Jeliazkova, forme de nesupunere