Garnéla-Jézus és amorf Budapest – kamuképek özönét önti nyakunkba a Facebook
2024. október 2. szerda, 9:28
Egyre terebélyesebben hömpölyög a közösségi médiában a mesterséges intelligenciával (MI) generált képek vizuális szemétfolyama. A Facebookon biznisz lett a csöpögős tájképek, a vallásos giccs, a hamis történelmi fotók vagy az együttérzésre bazírozó MI-képek megosztása, és ehhez a platform vígan asszisztál. Bár a jelenség első pillantásra nem tűnik civilizációs veszélynek, komoly károkat okozhat az emberiség kollektív vizuális kultúrájában. Hacsak nem éppen ettől omlik össze maga a mesterséges intelligencia. / A TTE konfenciája kapcsán Bárány Balázs nyilatkozik.
Amikor 2022 végén elindult a ChatGPT, a mesterséges intelligencia (MI) pedig betört a fősodratú közbeszédbe, felerősödtek a technológia veszélyeire figyelmeztető hangok. A gépek hatalomátvétele és a munkahelyek tömeges megszűnése mellett a legnagyobb fenyegetést az olyan megtévesztő képekben és videókban látták a pesszimisták, amelyek a közvéleményt próbálják befolyásolni. 2023 tavaszán például még a pénzpiacokon is riadalmat okozott egy kép a Pentagonnál történt robbantásról – amiről kiderült, hogy MI-hamisítvány.
Több ilyen eset azonban nem nagyon történt. Noha 2024 választási szuperév, amikor több mint kétmilliárd szavazó járul az urnákhoz, az MI-hamisítványok, deepfake-ek egyik kampányban sem játszottak főszerepet. A legrosszabbat egyelőre elkerültük – már ha legrosszabbon a politikai megtévesztést, az álhírek tudatos terjesztését értjük. Ám eközben lassan, de biztosan az életünk részévé válik a mesterséges intelligenciának egy kevésbé veszélyes, de hosszú távon biztosan korrozív megjelenési formája: az úgynevezett slop.
Az eredetileg löttyöt jelentő angol szóval a világsajtó azt a jelenséget kezdte leírni az elmúlt évben, hogy a közösségi médiában egyre több MI-generált kép jön szembe. Ezek azonban nem tömegek befolyásolására készültek, hanem poénból, lájkvadászatból, pőre pénzszerzési célból. Így kaptunk Pentagon-robbantás helyett pufidzsekis Ferenc pápát, lejárató politikusi deepfake-ek helyett debil dalokat éneklő politikusi deepfake-eket, bombasztikus hamisítványok helyett banális hamisítványokat. „A világ így ér véget. Nem bummal, csak nyüszítéssel” – írhatnánk le T.S. Eliot híres soraival az MI-korszak első éveit.
Szövegből kép, gombnyomásra
Az MI-slop jelenség egyik első ikonikus képe az úgynevezett Garnéla-Jézus (Shrimp Jesus) volt: az apró rákokból összeálló Jézus-képek 2024 tavaszán kezdtek el terjedni a Facebookon. Ám a hasonlóan abszurd, groteszk, bizarr, gyakran rémálomszerű, és első pillantásra sem valódi alkotások csak az egyik válfaját képezik annak a sok millió MI-képnek, amelyek elárasztották a legnagyobb közösségi oldalt. A másik nagy alaptípust az olyan képek jelentik, amelyek a témában járatlan és felületes felhasználók számára valóságos fotónak tűnnek fel, és a giccs, a cukiság vagy egyszerűen csak az érdekesség kategóriájában támadják a vizuális érzékünket.
Nagyjából a chatbotokkal egy időben váltak népszerűvé azok az MI-alkalmazások, amelyek szöveges utasítások, promptok alapján képesek képeket generálni. Ilyen a Stability AI, a Midjourney, a Dream Studio, az Adobe Firefly, a Google Gemini modelljére épülő Imagen, valamint az OpenAI DALL-E modelljére épülő ChatGPT image generator és Bing Image Creator. Friss statisztika nincs arról, hogy hány kép készült velük, de alighanem sok tízmilliárd. Egy tavalyi összesítés szerint 2022 és 2023 nyara között 15 milliárd képet generáltak a felhasználók.
A DALL-E második verziójának elindulása után napi 34 millióra tették a naponta keletkező MI-képek mennyiségét, és az eltelt egy évben ez a szám bizonyára jelentősen növekedett.
A Stanford Egyetem kutatói szerint az ilyen tartalmak több százmilliós nagyságrendben terjednek a közösségi médiában, elsősorban a Facebookon. A jelenség Magyarországot is elérte. Itthon nem annyira a bizarr, hanem a megtévesztő válfaja hódít. Az Emberek, akik azt hiszik, hogy az Al által generált képek valódiak című Facebook-csoportban széles keresztmetszetét látjuk a leggyakrabban előforduló képtípusoknak:
Szegény / hajléktalan / fogyatékossággal élő emberek, akik együttérzésre vágynak.
Kézműves büszkeségek: jég- és homokszobrokkal vagy valószerűtlen formájú süteményekkel pózoló emberek, akiknek kreálmányát „nem dicsérte meg senki”.
Fiktív emberek, akiket senki sem köszöntött fel vagy senki sem ülne le velük kávézni.
Idős házaspárok, akik évtizedek óta élnek együtt hűségben, szeretetben.
A vallási giccs minden formája.
Fiktív tájképek (sosemvolt görög táj) vagy városképek (Budapest, ahogy még nem láttad, és a valóságban nem is fogod).
Lakberendezési fantáziák, elsősorban festői erdei házak és cuki konyhák.
Meghökkentő, de a természetben nem létező madarak, virágok, fák.
Fekete-fehér, valamilyen állítólagos történelmi jelenetet, személyeket ábrázoló képek.
Az ilyen típusú MI-képek jellemzően olyan csoportokban vagy oldalakon jelennek meg, amelyek valami hasonló címet viselnek: Olcsó, de kiadós receptek, Jézus szeret minket, A kegyelem evangéliuma, Minden, ami szép a világban, Álomházak, Imádnivaló természet és így tovább. Ezeknek az oldalaknak/csoportoknak gyakran sok ezer, tízezer vagy akár százezer követője/tagja van és napi több tucat MI-generált képet tesznek ki.
A fotók egy részénél azonnal felismerhető, hogy MI-alkotások. Árulkodó jegyek az elmosódott, értelmetlen betűk (a képgenerátorok nem tudják az írást jól kezelni), az egymásba olvadó, nem megfelelő számú ujjak (a kezek szintén kifognak a mai programokon). Építészeti képek esetén gyakran találkozunk értelmetlen struktúrákkal, például sehová nem vezető lépcsőkkel, városképeken pedig különösen könnyű felismerni a csalást, ha ismerjük az adott települést. Budapest esetében általában az Országház és a Lánchíd valamilyen kombinációját látjuk az MI-képeken, de gyakran – mint az nyitóképünkön is látszik – rossz arányokkal, orientációval, oda nem illő formákkal. Az ilyen „hallucináció” az MI működési elvéből fakad: a modelleket az interneten fellelhető fotók halmazán tréningezték, az ott látott információkat kombinálja újra, de mélyebb megértés nélkül.
A fizika törvényeinek ismeretére és a józan észre hagyatkozva arra is rájöhetünk, hogy nem lehet tökéletes sertés formájú kenyeret vagy ló formájú süteményt sütni, és hogy 90+ éves nagymamák általában nem fotorealisztikus tollrajzok készítésével vannak elfoglalva. Ezeken az oldalakon mégis azt látjuk, hogy nagyrészt elismerő, gratuláló jókívánságokat, emojikat és gifeket hagynak a posztok alatt a kommentelők, és legfeljebb egy-két kétkedő hanggal vagy nevető szmájlival lehet találkozni.
Ez már a halott internet?
Vajon tényleg ilyen sokan elhiszik-e, hogy igazi fotókat látnak, és valódi felhasználók generálják a sok ezer interakciót a Facebookon, nem pedig botok és automatizált álprofilok? Ez a felállás, miszerint gépek lájkolnak gépek által generált tartalmakat, tökéletesen illene az úgynevezett halott internet elméletébe. Ez a teória arról szól, hogy az internet nagy része már nem valódi emberek tevékenységéből áll, hanem automatizált rendszerek (botok, mesterséges intelligencia, algoritmusok) által kreált tartalmakból és interakcióiból.
Ha azonban belekattintunk az MI-giccsek alatt jókívánságokat és ámeneket hagyó profilokba, többnyire hús-vér embereket látunk, valódi ismerősökkel, fotókkal, kommentekkel, nem pedig eldobható, „múlt nélküli” álprofilokat.
A 404 Media amerikai techportál az angol nyelvű hasonló csoportokat végigböngészve arra jutott, hogy a valószerű (giccses/cuki) képek forgalmát elsősorban valódi emberek pörgetik, míg az abszurd/bizarr gépi hallucinációknál álprofilok, botok hozzák az interakciók zömét. Bár az MI-slop jelensége más platformokon is előfordul, a Facebookon a leggyakoribb, és ebben szerepet játszik, hogy ezen a platformon a legmagasabb a felhasználók átlagéletkora, itt találhatók meg a legnagyobb számban azoknak a nemzedékeknek a tagjai, akik még nem a digitális világban szocializálódtak, és maguk jellemzően sohasem használtak MI-alkalmazásokat.
De miért éri meg felépíteni olyan oldalakat, amelyek százszámra ontják magukból ezeket a silány minőségű MI-illusztrációkat? A válasz egyszerűen a pénz. Ha rákeresünk a YouTube-on arra, hogyan tudunk pénz keresni a Facebookon MI-képekkel, kismillió oktatóvideót találunk, amelyek részletesen elmondják, hogyan kell felépíteni az ilyen oldalakat. Oktatóanyagokat árulnak is, szükség esetén még azokat a promptokat is értékesítik, amelyeket a vásárlók egy az egyben beilleszthetnek a képgeneráló programokba, és megosztják egymással azokat a praktikákat, amelyek a legtöbb interakcióhoz vezetnek (például hogy óránként stabilan legalább két posztot kell kitenni, hogy a Facebook algoritmusa felkapja az oldalt).
Itt terjednek el azok a féllegális szoftverek is, amelyekkel akár nagyobb számú Facebook-fiókban lehetővé teszik az automatizált, időzített posztolást, de arra is képesek például, hogy átvegyék az adminjogot inaktív vagy elárvult, de sok követővel bíró oldalak és csoportok felett. Amint az RTL egy nyári cikkében rámutatott: a most MI-képeket öntő oldalak tekintélyes része néhány hónappal ezelőttig teljesen más profillal működött.
De hogyan lesz az interakciókból pénz? Alapvetően két csatornán: közvetlenül a Facebooktól és közvetetten a Facebookon kívülre terelt forgalomból. Az utóbbira több mód is van. Létre lehet hozni például egy sablon weboldalt, majd azon Google Ads vagy más display hirdetéseket elhelyezni. De léteznek olyan online piacterek is, ahol egymásra találnak a különböző termékeket értékesítő webáruházak és az olyan Facebook-oldalak, amelyek számukra releváns felhasználókat tudnak terelni honlapjukra. Például egy főzési témájú Facebook oldalról egy konyhai eszközöket értékesítő áruházba. Ez még a jobbik eset – adathalász vagy csaló oldalakra is kiterelhetik a gyanútlan felhasználókat, bár ez egyelőre kevéssé jellemző.
Az érdekesebb a közvetlen bevétel, amit a Facebook fizet a népszerű oldalak gazdáinak. A platform Performance Bonus Programja keretében a Meta a hirdetési bevétel egy részét szétosztja azok között, akik a leginkább virális tartalmat töltik fel az oldalra. Vagyonokat nem lehet így keresni: napi néhány tíz, legjobb esetben is néhány száz dolláros bevételt lehet termelni. Csakhogy az ilyesmivel foglalkozó tartalomfarmok zöme nem a fejlett világban, hanem szegényebb országokban – például Indiában, Pakisztánban, Bangladesben, Vietnámban, Indonéziában – működik, ahol ez gyakran már tisztes megélhetést tesz lehetővé, ha meggazdagodást nem is.
Az „elszaródás” tetőzése
Sokan kérdezik, hogy a Facebook miért nem tiltja vagy akár csak jelöli az MI-szemetet. A Meta globális ügyekért felelős elnöke, Nick Clegg volt brit miniszterelnök-helyettes egy februári blogposztban megígérte, hogy a cég dolgozik egy rendszeren, amely automatikusan kiírná a felhasználóknak, ha MI tartalomról van szó. Ez azonban még nem valósult meg, és kemény dió is – az említett pénzcsinálási útmutatók arra is kitérnek, hogy lehet eltüntetni, kijátszani a képgeneráló programok látható vagy láthatatlan vízjeleit. Csakhogy a Facebook ma nemhogy nem lép fel az ilyen tartalmak ellen, még aktívan támogatja is a jelenséget.
Ez tökéletesen illeszkedik a gyakorlatba, amelyet a platform az elmúlt években folytatott. A Facebook úgy alakította át algoritmusát, hogy a felhasználók hírfolyamában egyre kevesebb olyan tartalmat helyez el, amelyet ők maguk aktívan kérnek. Vagyis az ismerőseik posztjait, az általuk tudatosan bekövetett oldalak bejegyezéseit vagy azoknak a csoportoknak az aktivitásait, amelyeknek tagjai. Ezek a tartalmak már kevesebb mint a felét teszik ki a hírfolyamnak. A maradék a fizetett, célzott hirdetés, valamit a „neked ajánlott” tartalom.
Az ezeket kiválasztó, egyébként szintén MI-alapú algoritmus olyan posztokat ajánl, amilyeneket a felhasználó a legnagyobb eséllyel lájkol vagy kommentál.
Mark Zuckerberg egy befektetői tájékoztatón 30 százalékra becsülte az ilyen típusú kéretlen posztok arányát az emberek hírfolyamában, de sok felhasználó személyes tapasztalatai szerint az már ezt is meghaladja, és egyre nő.
Sokan hajlamosak panaszkodni arra, hogy emiatt kevésbé használható a Facebook, mivel buta mémek árasztják el az ember falát mondjuk a bekövetett médiatermékek cikkmegosztásai helyett, de a Meta mossa kezeit: az algoritmus nem hazudik, ha egyszer a buta mémekkel lép interakcióba a felhasználó, akkor bizony abból fog egyre többet látni. És az már mindegy, hogy ezek ember alkotta mémek vagy épp giccses/félrevezető MI-képek. A Facebook számára csak annyi a lényeg, hogy a felhasználó ott maradjon, lájkoljon és kommentáljon, mert amíg ott van a platformon, addig tudja a felhasználót mint terméket értékesíteni a hirdetők számára.
A halott internet teória mellett az utóbbi évek másik online jelensége a platformok úgynevezett „elszaródása” (shittification), amelyet Cory Doctorow kanadai techblogger és sci-fi író dobott be a köztudatba 2022 őszén. A Facebook szerinte ennek az elszaródási folyamatnak a legvégén tart az imént leírt algoritmikus disztópiával. A folyamat nagy vonalakban így néz ki:
A platform jó és érdekes szolgáltatást kínál, hogy mindenki használni kezdje. A Facebooknál ez bejött, globálisan 3 milliárdan, Magyarországon több mint 7 millióan vannak fenn.
Miután megvan a kritikus tömeg, következik a hirdetők beetetése azzal, hogy itt érhetik el célzott reklámokkal a legtöbb potenciális fogyasztót.
Miután mindkét oldalt magához kötötte, és immár egyik sem engedheti meg magának, hogy ne legyen fönn a platformon, elkezdi szorítani a hurkot mindkét célcsoport nyaka körül: a felhasználók egyre több kéretlen tartalmat és hirdetést látnak, a hirdetők egyre drágábban érik el a célcsoportjukat.
A Facebookon volt egy harmadik célcsoport is: a médiatermékeké. A platform elhitette a kiadókkal, hogy itt érik el olvasóikat. Aztán a médiumok organikus elérését a Meta szinte a nullára csavarta vissza – részben azért, hogy a kiadók pénzt költsenek tartalmaik kiemelésére, részben azért, mert rengeteg bírálat érte a politikai paletta mindkét oldaláról, hogy a másik híreit részesíti előnyben, cenzúráz és álhíreket terjeszt. A közélet tehát le lett tekerve, az algoritmus a könnyed, sok esetben debil javaslatokat tolja a felhasználóknak – ennek a folyamatnak a csodálatos betetőzése az MI-képözön.
Érdemi hírek helyett féllábú veteránok és karfiolszobor – politikai kockázat nincs, az emberek lájkolják, a hirdetők fizetnek.
A Facebook nem egyedül sáros. A TikTok szintén túl van a beetetési fázison, és támogatja anyagilag a virálisan terjedő MI-slopot is. Itt persze nem képek, hanem videók terjednek, például táncoló állatokról, és Kínában virágzik az a fajta MI-re épülő tartalomgyártó szürkegazdaság, ami a Facebooknál Délkelet-Ázsiára jellemző. A Twitteren pedig hiába ígérte Elon Musk, hogy véget vet a botok uralmának, az X-re átkeresztelt platformon is virágzanak az automatizált felhasználói fiókok, amelyek egy része szintén MI-vel generált (itt szöveges) tartalmakat posztol. A képmegosztóként indult Instagram egyelőre kevésbé fertőzött az MI-szemétfolyamtól.
Miért baj ez?
A munkahelyek tömeges megszűnéséhez, a választások manipulációjához és Skynet hatalomátvételéhez képest kevésbé tűnik veszélyesnek, hogy megvezetett nyugdíjasok fake tortákat lájkolnak, és ezért egy bangladesi családnak 10 dollárral több lesz a napi betevője, a Facebook-részvényeseknek pedig egy kicsit nagyobb az osztaléka. Az MI-képek áradata azonban több szempontból is aggasztó.
Giccs mindig is volt, de valamiféle tudásra azért szükség volt a termeléséhez, ami határt szabott a terjedésének. Az MI lehetővé tette a giccs határtalan tömegtermelését, és ez vizuális kultúránk további silányodását vetíti előre.
Ezzel korántsem azt mondjuk, hogy minden MI-vel készült képi alkotás automatikusan giccs vagy értéktelen – nyilván van sok alkotó, aki minőségi standardok és valamiféle művészi vízió mentén generál képeket. Hogy ez művészet vagy sem, vita tárgya és egy másik cikk témáját képezhetné. Az is, mennyire etikus ez a gyakorlat abból a szempontból, hogy az MI-modelleket hús-vér fotósok és képzőművészek képein tréningezték, azok megkérdezése nélkül. (Cory Doctorow szerint például ez nem a szerzői jog megsértése.)
A facebookos képáradat görbe tükröt tart az internethasználó kritikai érzéke, valóságérzékelése elé is: az, hogy sok ezer felhasználó láthatóan képtelen különbséget tenni valódi és hamis képek között, azzal fenyeget, hogy a jövőben még jobban elmosódik a határ a valóság és a fantázia között a digitális térben. Főleg, ha belekalkuláljuk azt is, hogy a már eddig is rohamléptekben fejlődő szoftverek a következő években még közelebb lépnek a fotorealizmushoz.
Sőt: eljuthatunk odáig is, amikor az igazi fotók nem rúgnak labdába a géppel kreáltakhoz képest, ahogy
a valóság a maga tökéletlenségeivel nem tudja felvenni a versenyt a fotók millióin kiképzett, eszményi világot álmodó MI-víziókkal szemben.
Az MI-képek esztétikája visszahat az igazi képekére is, hiszen afelé tereli a fotókat megosztókat is, hogy minél tökéletesebbre retusálják saját felvételeiket (amire amúgy szintén egyre több MI-megoldás áll rendelkezésre).
Vannak területek, ahol már ma is nagy gondot okoznak az MI-képek. Például a természetfotózás. A Nemzeti Audubon Társaság nevű amerikai madárvédelmi egyesület lapja érdekes kísérlettel próbálta felhívni a figyelmet, hogyan nő a természetfotósok nyakára az MI. Felkérték 2023-as madárfotó-pályázatuk díjazottjait, hogy írják le nyertes képeiket, majd a leírásokat betáplálták képgenerátorokba, és a végeredményt az eredeti mellé tették. Az igazi természetfotók ma még minden tekintetben jobbak, de nem biztos, hogy a promptok további finomításával vagy a képgenerátorok további fejlődésével nem készíthetők hatásosabb, drámaibb és minden tekintetben fotószerű felvételek.
Ez pedig több mint vizuális probléma: a természetfotózás fontos eszköze a természetvédelemnek, ezért ha a hitelességét MI-hamisítványok ássák alá, az az élőhelyeket megőrző törekvéseknek is árthat. Nem beszélve arról, hogy már most is sok természetfotós panaszkodik rá, hogy egyébként igazi képeire a kommentelők egy része azt írja, hogy biztosan MI-vel készült – a negatív visszacsatolás oda-vissza működik.
Sosemvolt történelem
Egy másik érzékeny terület a hamis történelmi képeké, amelyekből szintén egyre több van. Nemrég a magyar Facebookon is nagyot ment egy „fotó”, amelyen Rimbaud és Verlaine abszintot iszik. Ez is MI-hamisítvány volt. A képgenerátorok szinte tökéletesen tudják reprodukálni az archív fotók árnyalatait, képhibáit, sérüléseit – hívta fel a figyelmet a blogján egy régi fotók restaurálásával és színezésével foglalkozó művész. Szerinte egy forrás nélküli, réginek tűnő fotón – ha az ügyesen van megcsinálva – szinte semmilyen támpont alapján nem lehet megállapítani, hogy egy modell képzeletének szülötte vagy kordokumentum.
A probléma a pedagógusok munkáját is érinti. Nem véletlenül lesz téma a Történelemtanárok Egylete éves konferenciáján szombaton, ahol Mesterséges intelligencia az oktatásban címmel is rendeznek kerekasztalt. A szakmai programot szervező Bárány Balázs szerint ma még nem okoz mindennapi problémát az iskolákban az egyre több történelmi MI-kép, mert minőségük nem üti meg azt a szintet, hogy összetéveszthetők legyenek a valódiakkal (főleg annak a korosztálynak, amely maga is használ MI-t). Ugyanakkor tud olyan kollégákról, akik maguk is készítenek kamuképeket, és órán tesztelik velük a gyerekek kritikai érzékét – ha úgy tetszik, a 21. századi forráskritika része lesz ez is.
Arra is van némi esély, hogy a probléma megoldja magát. Ha az MI-képek a mostanihoz hasonló ütemben árasztják el az internetet, hamar többségbe kerülhetnek – az Europol szerint már 2026-ban 90 százalék felett lesz a kapuképek aránya az interneten. Ez talán túlzás, de a tendencia erre mutat. Ez viszont visszahathat magára az MI-re is, hiszen a képgenerátorokat az interneten található képeken tréningezik. Márpedig, ha a tréningadatokon belül már a generált képek lesznek többségben, az egyes kutatók szerint „modellösszeomláshoz” vezethet – mások az uralkodóház belterjességére utalva Habsburg-MI-nek nevezik ezt a jelenséget.
Ebben azért ne nagyon bízzunk: sok kutató kételkedik az elméletben, és az MI-cégek is lépéseket tesznek a tréningadatok védelmére. Gondosan lementették például a 2023 előtti adatbázisokat – az emberiség MI előtti vizuális kultúrájának nyomatát. Bárcsak mi is megtehetnénk!