Zavřít reklamu

Společnost Google nedávno představila svou aplikaci Gemini 2.0, která oproti předešlé verzi nabízí řadu nových funkcí a možností. Gemini 2.0 zpracovává informace jinak než jeho předchůdce a zvládá i řešení složitějších úkolů. Jaké konkrétní novinky nabízí?

Nativní zpracování obrazu a zvuku

Gemini 2.0 identifikuje objekty v obraze a chápe jejich vztahy a kontext scény. Na rozdíl od předchozích modelů, které vyžadovaly před analýzou převod obrázků a zvuku na text, je Gemini 2.0 zpracovává přímo. Cílem je eliminovat ztrátu informací, spojenou s převodem. Přímé zpracování umožňuje bohatší porozumění vstupním informacím, zachycuje detaily a kontextové náznaky, které by jinak byly při převodu ztraceny. Gemini 2.0 slibuje přesnější a efektivnější interpretaci multimediálního obsahu tím, že obejde zprostředkující krok převodu textu.

Gemini

Agentic AI

Gemini 2.0 toho zvládne více s menším množstvím prostředků. Výraz Agentic AI označuje modely umělé inteligence, které aktivně komunikují se světem, aby dosáhly konkrétních cílů. Gemini 2.0 pohání tyto modely AI a umožňuje jim vykonávat složité, vícekrokové úkoly, které vyžadují plánování, rozhodování a interakci s vnějšími systémy. Příslušné schopnosti Gemini 2.0 se mají integrovat s externími nástroji, jako jsou Google Search, Maps a Lens. Agent AI Gemini 2.0 by například mohl využít Mapy Google k naplánování komplexního itineráře zahrnujícího více destinací a způsobů dopravy.

Prohloubení integrace napříč ekosystémem Google

S Gemini 2.0 se umělá inteligence dostane všude. Gemini 2.0 se hluboce integruje napříč ekosystémem produktů a služeb společnosti Google. Příslibem je jednotnější a plynulejší uživatelská zkušenost. Rozšířené integrace Gemini 2.0 ukazují na strategii společnosti Google používat Gemini jako společnou nit, která se vine celým Workspace. Vyhledávání Google získává hlubší integraci s Gemini 2.0, což usnadňuje konverzační vyhledávání a využívá přehledy umělé inteligence pro komplexní odpovědi na složité dotazy, jak jsme předpovídali na začátku listopadu. V rámci Google Workspace jsou funkce poháněné umělou inteligencí, které využívá Gemini 2.0, začleněny do aplikací, jako jsou Dokumenty, Prezentace a Meet, a zvyšují tak produktivitu a spolupráci.

Rychlejší reakce a lepší výdrž baterie

Gemini 2.0 Flash zdvojnásobuje rychlost verze 1.5. Celý název nejnovější verze zní Gemini 2.0 Flash Experimental. Byla zefektivněna s ohledem na rychlost a odezvu. Gemini 2.0 Flash přináší vyšší výkon a zároveň snižuje latenci. Díky tomu může Gemini 2.0 Flash lépe podporovat multimodální interakce v reálném čase. Gemini 2.0 Flash deklaruje výrazné zlepšení výkonu. Google tvrdí, že je dvakrát rychlejší než jeho předchůdce. Díky rychlejší odezvě jsou interakce přirozené a plynulé. U zvukových konverzací by snížená latence mohla snížit prodlevy a vytvořit poutavější a realističtější zážitek. Gemini 2.0 Flash by mohl prodloužit výdrž baterie pro procesy umělé inteligence v mobilních zařízeních, což by mohlo znamenat méně časté nabíjení, což ocení každý.

Li-ion_baterie_ilustr._obr.

Znovuobjevené uživatelské rozhraní NotebookLM

Příchod Gemini 2.0 znamená paralelní iteraci v NotebookLM. Tato iterace přesahuje jeho základní schopnosti umělé inteligence a zasahuje do jeho uživatelského rozhraní. Cílem přepracování je, aby uživatelé mohli se svými poznámkami a dokumenty pracovat intuitivněji a efektivněji. Zaměřuje se na zefektivnění pracovních postupů, zlepšení navigace a poskytnutí propracovanějšího vizuálního prostředí.

Gemini_2_0_highlighty
Gemini 2.0 ve srovnání se staršími verzemi

Dnes nejčtenější

.