Generativní umělá inteligence změnila způsob, jakým pracujeme s textem, obrázky nebo programováním. Zdá se ale, že éra chatbotů pomalu přestává být tím největším tématem. Největší technologické společnosti totiž obracejí pozornost k další velké evoluci – takzvané Spatial AI. Právě ta má dát umělé inteligenci schopnost chápat prostor kolem sebe, orientovat se v reálném světě a reagovat na něj podobně jako člověk.
Do vývoje investují obrovské prostředky Apple, Meta, OpenAI, Google i NVIDIA. Cíl je přitom společný – vytvořit namísto AI chatbotů takovou umělou inteligenci, která skutečně porozumí tomu, co se kolem uživatele děje.
Mohlo by vás zajímat
Proč je Spatial AI tak důležitá?
Dnešní chatboty znají obrovské množství informací, protože byly natrénovány na miliardách textů. Spatial AI jde ale mnohem dál. Využívá kamery, hloubkové senzory, mapování prostoru i pokročilé fyzikální modely k tomu, aby si vytvářela průběžný trojrozměrný model okolního prostředí.
Rozdíl je poměrně jednoduchý. Klasická AI analyzuje jednu fotografii nebo video. Spatial AI naopak chápe, kde se objekty nacházejí, jak jsou od sebe vzdálené, jak se pohybují a co se pravděpodobně stane za několik sekund. Díky tomu může reagovat mnohem přirozeněji a přesněji. Právě schopnost porozumět fyzickému světu je přitom považována za jeden z nejdůležitějších kroků ve vývoji umělé inteligence za poslední roky.
Apple, Meta i OpenAI
Každý z technologických gigantů se snaží získat náskok trochu jinou cestou.
- Apple staví na technologiích vyvinutých pro Vision Pro. Díky hloubkovým kamerám a prostorovým senzorům vznikají nové funkce, které dokážou lépe chápat okolní prostředí. Výsledky se postupně dostávají také do iPhonů a dalších zařízení.
- Meta sází především na chytré brýle. Jejich současná generace už umí rozpoznávat objekty nebo odpovídat na otázky o tom, na co se uživatel právě dívá. Budoucí modely mají nabídnout ještě pokročilejší prostorové vnímání, což zároveň otevírá debatu o ochraně soukromí.
- OpenAI rozšiřuje vývoj daleko za hranice chatbotů. Firma investuje do robotiky, multimodálních modelů i systémů, které dokážou simulovat fungování reálného světa.
- Google DeepMind propojuje jazykové modely s robotikou a vytváří systémy, které dokážou chápat prostor, pohyb i fyzikální zákony při manipulaci s předměty.
Vedle těchto společností investují miliardy dolarů do vývoje také další hráči, protože právě schopnost orientace v prostoru může rozhodnout o tom, kdo bude dominovat příští generaci umělé inteligence. Na rozdíl od chatbotů ale pravděpodobně nevznikne žádná samostatná aplikace s názvem Spatial AI. Technologie se bude postupně nenápadně objevovat v produktech, které už dnes používáme.
První změny se očekávají především u:
- smartphonů, které budou lépe rozumět scéně před fotoaparátem,
- chytrých brýlí poskytujících informace v reálném čase,
- robotů schopných bezpečně pracovat v běžném prostředí,
- autonomních vozidel, která budou přesněji předvídat pohyb ostatních účastníků provozu.
Právě chytré brýle jsou mnohými považovány za zařízení, na kterém bude potenciál Spatial AI nejlépe vidět. Uživatel nebude muset vytahovat telefon z kapsy – informace získá okamžitě podle toho, na co se právě dívá.
Samsung nechce zůstat pozadu
Přestože se v souvislosti se Spatial AI nejčastěji mluví o Applu nebo Metě, významnou roli bude hrát také Samsung. Společnost dlouhodobě rozvíjí vlastní ekosystém Galaxy AI a zároveň úzce spolupracuje s Googlem na platformě Android XR pro novou generaci zařízení s rozšířenou realitou.
Právě propojení smartphonů Galaxy, nositelné elektroniky, budoucích XR headsetů i cloudových AI služeb může Samsungu umožnit nabídnout podobné prostorové funkce napříč celým ekosystémem. Stejně jako generativní AI před několika lety odstartovala revoluci v práci s informacemi, Spatial AI může představovat další zásadní milník.