Zavřít reklamu

Společnost Google v rámci své platformy Gemini posouvá hranice toho, co dnes dokáže běžná umělá inteligence. Nový model Gemini 3.5 Flash přichází s funkcí, která ještě donedávna působila spíš jako experiment z výzkumných laboratoří – tzv. „computer use“. V praxi to znamená, že AI dokáže pracovat s počítačem podobně jako člověk. Vidí obrazovku, orientuje se v prostředí a provádí konkrétní kroky.

Nejde přitom jen o pouhou demonstraci schopností. Funkce už je dostupná přes Gemini API a také v rámci Enterprise Agent Platform, což jasně ukazuje, že Google míří především na vývojáře a firemní využití. Ale dočkají se i běžní uživatelé.

Jak funguje „computer use“ v praxi?

Zásadní změna spočívá v tom, že vývojáři už nemusí stavět vlastní specializované modely pro ovládání prostředí. Gemini 3.5 Flash dostává tuto schopnost přímo „v balíčku“. AI tak dokáže například:

  • procházet webové stránky a vyhledávat informace
  • vyplňovat formuláře a pracovat s aplikacemi
  • provádět vícekrokové úkoly bez zásahu uživatele

Google ukázal novou technologii na jednoduchých příkladech – od vyhledávání letenek až po hraní logických her, kde model sám analyzuje situaci a rozhoduje o dalším kroku.

Bezpečnost na prvním místě

S rostoucí autonomií přichází i větší odpovědnost. Ovládání počítače AI totiž otevírá citlivé otázky kolem bezpečnosti, zejména ve firemním prostředí. Google proto zapojuje několik vrstev ochrany.

Model je trénován tak, aby odolával manipulativním vstupům, a zároveň nabízí možnost vyžadovat potvrzení uživatele před provedením důležitých nebo nevratných kroků. V některých případech může také sám zastavit úkol, pokud vyhodnotí podezřelé chování.

Pro běžné uživatele se zatím nic dramatického nemění – funkce je primárně dostupná přes API a firemní nástroje. Pro firmy ovšem jde o významný posun. Gemini 3.5 Flash může zrychlit automatizaci rutinních úkolů, od zákaznické podpory až po interní analytiku. V kombinaci s ekosystémem Google Workspace a dalšími nástroji může vzniknout nová generace „digitálních operátorů“, kteří pracují nepřetržitě a napříč aplikacemi.

Dnes nejčtenější

.