Zavřít reklamu

Google koncem minulého roku představil svou novou generativní umělou inteligenci s názvem Gemini, kterou vyvinula jeho výzkumná laboratoř umělé inteligence DeepMind. Jedná se o jeden z nejpokročilejších AI modelů současnosti, který lze provozovat na různých zařízeních, od telefonů po datová centra. Zde je vše, co o něm potřebujete vědět.

Co je to Google Gemini?

Google Gemini je velký jazykový model (LLM), který je schopen provádět celou řadu úkolů, od přepisu řeči přes vytváření popisků k obrázkům, titulkování videí až po generování uměleckých děl. Dostupný je ve třech různých velikostech:

Gemini Nano: Nejmenší velikost modelu Gemini, která je navržena tak, aby fungovala na smartphonech a prováděla úkoly, které vyžadují efektivní zpracování umělé inteligence bez nutnosti se připojovat k externím serverům, jako je navrhování odpovědí v chatovacích aplikacích nebo shrnutí textu.

Gemini Pro: Model, jenž běží v datových centrech Googlu a je navržen tak, aby poháněl nejnovější verzi firemního AI chatbota Barda. Je schopen zajistit rychlou odezvu a porozumět složitým dotazům.

Gemini Ultra: Tento model není – alespoň prozatím, brzy však má být – dostupný pro širší veřejnost. Google jej popisuje jako svůj nejschopnější AI model, který překonává „nejnovější výsledky ve 30 z 32 široce používaných akademických měřítek, které se používají ve výzkumu a vývoji LLM“. Je navržen pro vysoce komplexní úlohy z nejrůznějších oborů, jako je matematika, fyzika, historie, právo, medicína nebo etika.

Jak se Gemini liší od dalších AI modelů, jako je GPT-4?

Gemini se od jiných AI modelů liší svou multimodální povahou, zatímco jiné modely, jako je např. GPT-4, pohánějící chatbota ChatGPT, spoléhají na to, že pluginy a integrace jsou skutečně multimodální. Ve srovnání s GPT-4, který je primárně textovým modelem, Gemini snadno provádí multimodální úkoly nativně. I když GPT-4 vyniká v úlohách souvisejících s jazykem, jako je tvorba obsahu a komplexní analýza textu, nativně se uchyluje k zásuvným modulům OpenAI k provádění analýzy obrazu a přístupu na web a při generování obrázků a zpracování zvuku se spoléhá na modely DALL-E 3 a Whisper.

Gemini se také zdá být více zaměřený na integraci do produktů než jiné aktuálně dostupné modely. Jiné modely, jako zmíněný GPT-4 a nebo Llama od společnosti Meta, jsou více orientované na služby a jsou dostupné pro různé vývojáře třetích stran pro aplikace, nástroje a služby.

Na kterých zařízeních a kde je Gemini k dispozici?

Gemini byl jako aplikace původně k dispozici jen pro telefony Pixel 8 a Pixel 8 Pro. To se nyní mění, neboť Google oznámil, že dostupnost aplikace se rozšiřuje na jiné telefony s Androidem i iOS, konkrétně v USA. Dodejme, že aby mohla aplikace na androidovém smartphonu fungovat, ten musí mít minimálně 4 GB operační paměti a běžet alespoň na Androidu 12.

Od příštího týdne se začne mobilní Gemini zavádět do dalších částí světa, jako je Jižní Amerika, asijsko-pacifický region nebo Afrika, a později dorazí i do Evropy včetně Česka. Mezitím si můžete vyzkoušet jeho webovou verzi.

Dnes nejčtenější

.