Zavřít reklamu

Ještě v minulém roce jste mohli obrázky postav generované umělou inteligencí spolehlivě rozpoznat – chodidla byla zdeformovaná, prsty nepřirozeně dlouhé, anebo přebývaly jednotlivé části těl. Během několika měsíců ale vývoj poskočil natolik, že dnes už obrázky generované AI nerozpoznají ani odborníci. A to přitom ty první začaly vznikat teprve v roce 2014.

Deník The Wall Street Journal zveřejnil 3. února 2014 článek o revoluční technologii. Pojednával o tom, že startupy a technologičtí giganti rozšiřují svět umělé inteligence, a to díky vyvinutí specializovaného softwaru s „představivostí“. Společnost Vicarious sídlící poblíž San Francisca tehdy dokázala s pomocí předchůdce umělé inteligence vygenerovat sérii obrázků krav poté, co softwaru byla ukázána fotka jedné krávy.

Pokud byste čekali realistickou fotku, jste na omylu. Málokdo by z rozpixelovaných digitálních renderů dnes poznal, že jde vlastně právě o krávu. Ale pak nastal velmi rychlý posun vpřed.

Průlom díky difuzním modelům

Proč před 12 lety vypadaly obrázky generované AI tak zvláštně? Proč měly podivnou strukturu, nepřirozené rozměry i pozice? Nejde jen o to, že šlo o první krůčky s modely schopnými učit se na základě obrázků. Tehdejší software byl založen na tom, že se program učil podle základních vzorců, nedokázal zcela porozumět fyzikálním zákonům reálného světa a realitu jen odhadoval.

 

Zobrazit příspěvek na Instagramu

 

Příspěvek sdílený Technology (@technology)

Postupem času docházelo k vylepšování, ale průlom nastal až zhruba v posledních 3 letech, kdy zazářily modely jako Midjourney. I u nich je srovnání prvotních vygenerovaných výstupů s těmi dnešními spíš úsměvné. Ale rychlost pokroku je neuvěřitelná a dnes na základě jednoduchého pokynu vygenerují tak dokonalý obrázek, že ho nerozpoznáte od fotografie.

Důvodem je, že difuzní generativní modely už jen neodhadují. Mají k dispozici obrovské datové sady a mají výrazně vylepšený výpočetní výkon. Díky tomu už AI dokáže doslova porozumět světlu, materiálům a hloubce. Nekopíruje obsah, ale znovu vytváří realitu – nebo spíš to, jak se realita chová.

Jen málokdo si troufne říct, že rozpozná AI generovaný obrázek. Posun je tak neuvěřitelný, že Google raději dal do Gemini detektor obrázků, který odhalí vygenerované snímky. Ale pouze některé a s určitou procentuální pravděpodobností. Bez těchto specializovaných nástrojů už jsme zcela bezmocní. Jelikož jsou AI generátory volně dostupné a obrázky a AI videa zaplavují sociální sítě i YouTube, je čím dál složitější odhalit skutečnost. Zároveň je čím dál snazší zneužít AI k oklamání důvěřivců za účelem podvodu. A bude hůř.

I Galaxy A57 nabízí mnoho AI funkcí

Dnes nejčtenější

.