Takto vypadá dle AI ideální žena
Zadáte do AI generátoru obrázků neutrální popis ženy – a výsledek vás možná překvapí. Technologie, která měla být objektivní, vytváří obrazy plné skrytých předsudků. Odkud se berou? A co nám vlastně říkají o společnosti, která je vytvořila?
Generativní umělá inteligence dnes dokáže vytvořit fotorealistický portrét člověka na základě několika slov. Stačí zadat „žena, 30 let“ – a za pár vteřin máte výsledek. Jenže právě tady začíná problém. Výsledný obraz totiž není neutrální. Je to zrcadlo, které odráží vliv tisíců hodin lidských rozhodnutí, kulturních zvyklostí a společenských očekávání.
Než se dostaneme k tomu, co AI vlastně „vidí“, musíme pochopit, jak vůbec vzniká. Každý generátor obrázků – ať už jde o Midjourney, DALL-E nebo Stable Diffusion – byl natrénován na obrovských datasetech fotografií a popisů. Miliony snímků z internetu, z fotobank, ze sociálních sítí. A právě tady se skrývá jádro problému: tyto datasety nejsou neutrálním vzorkem reality. Jsou odrazem toho, co lidé na internet nahrávají, co fotografují, co sdílejí.
Když anotátoři – lidé, kteří označují obrázky popisky – procházejí tisíce fotografií, nevědomky do dat promítají vlastní kulturní kontext. Fotka ženy v obleku se označí jako „profesionální“, zatímco stejná žena v šatech může dostat štítek „elegantní“ nebo „atraktivní“. Tyto zdánlivě nevinné volby se pak stanou součástí toho, jak AI „myslí“.
Demografické složení týmů, které tyto systémy vyvíjejí, hraje roli více, než by se mohlo zdát. Pokud většina vývojářů a anotátorů pochází z určitého kulturního prostředí, jejich vnímání „normálu“ se stává normou pro celý systém. Není to zlý úmysl – je to prostě lidská přirozenost. Problém nastává ve chvíli, kdy se tento partikulární pohled prezentuje jako univerzální pravda.
Co se stane, když zadáte „žena“?
Experimenty s různými generátory ukazují překvapivě konzistentní vzorce. Neutrální prompt často vede k zobrazení mladé, štíhlé ženy s konvenčně atraktivními rysy. Proč? Protože algoritmy se učily na datech, kde právě takové obrazy dostávaly nejvíce pozornosti, lajků, sdílení. Komerční logika sociálních sítí a fotobank upřednostňuje obsah, který generuje interakci – a ten bývá často esteticky „bezpečný“ a konvenční.
Výzkumnice zabývající se etikou AI popisuje: „Když analyzujeme výstupy různých generátorů, vidíme jasné vzorce. Ženy jsou mladší než muži, častěji se usmívají a jsou v pasivnějších pózách. Není to náhoda – je to odraz miliard rozhodnutí o tom, jaké obrázky se sdílejí a oceňují.“
Ještě zajímavější je geografické srovnání. Modely trénované převážně na západních datech mají tendenci generovat eurocentrické rysy, i když prompt specifikuje jinou etnickou příslušnost. Systémy, které měly přístup k rozmanitějším datasetům, vytvářejí pestřejší výsledky – ale stále v rámci určitých estetických konvencí.
Problém není jen v tom, co AI vytváří, ale také v tom, co tyto obrazy dělají s námi. Psychologické studie ukazují souvislost mezi vystavením idealizovaným obrazům a nárůstem nespokojenosti s vlastním tělem. Když se syntetické „ideály“ stávají všudypřítomnými – v reklamě, v médiích, v online obsahu – hranice mezi realitou a umělým konstruktem se stírá.
Skrytá smyčka, která zesiluje stereotypy
Tady vstupuje do hry další mechanismus: algoritmická zpětná vazba. Když AI vygeneruje obrázek, který odpovídá konvenčním standardům, dostane více interakcí. Tyto interakce pak zpětně posilují preference systému. Vzniká uzavřený kruh, kde se stereotypy nejen reprodukují, ale aktivně zesilují.
Vývojář pracující na etických aspektech generativních modelů vysvětluje: „Není to tak, že bychom do systému programovali předsudky. Ale když necháme algoritmus optimalizovat se na základě uživatelské odezvy, automaticky směřuje k tomu, co funguje – a to bohužel často znamená konvenční, někdy problematické vzorce.“
Některé týmy začínají experimentovat s kompenzačními mechanismy. Jde o techniky, které záměrně diverzifikují výstupy, nebo o filtry, které detekují a omezují hypersexualizované zobrazení. Není to však snadné – kde přesně vést hranici mezi uměleckým vyjádřením a problematickou objektivizací? Kdo má rozhodovat o tom, co je „přijatelné“?
Zajímavý přístup zvolily některé výzkumné skupiny, které do tréninkových dat záměrně zahrnuly širší spektrum tělesných typů, věkových kategorií a kulturních kontextů. Výsledky ukazují, že modely jsou schopné generovat rozmanitější a realističtější obrazy – pokud k tomu dostanou příležitost prostřednictvím kvalitních dat.
Zásadní otázka zní: měly by generátory obrázků aktivně bojovat proti společenským stereotypům, nebo jen věrně odrážet realitu dat, na kterých byly trénovány? Je role technologie být zrcadlem, nebo katalyzátorem změny?
Když dnes zadáváte prompt do AI generátoru, dostáváte mnohem více než jen obrázek. Dostáváte okamžitý obraz kolektivního vědomí – směs kulturních norem, komerčních tlaků, historických předsudků a technologických omezení. Není to neutrální nástroj. Je to produkt společnosti, která ho vytvořila.
A možná právě v tom spočívá největší hodnota této technologie: ne v tom, co vytváří, ale v tom, co nám odhaluje o nás samých. Každý generovaný obraz je příležitostí položit si otázku – proč vypadá právě takhle? A co to vypovídá o světě, ve kterém žijeme?