Jen něco málo přes rok po verzi 1.0 včera Google představil verzi 2.0 svého AI modelu Gemini. Propaguje ji jako „nový model umělé inteligence pro éru agentů“.
Šéf Googlu Sundar Pichai novou generaci modelu Gemini shrnul takto: „Pokud Gemini 1.0 bylo o organizování a porozumění informacím, Gemini 2.0 je o tom, aby byly mnohem užitečnější.“ Pro Google jsou agenti systémy, které za vás něco dělají tím, že jsou schopny uvažovat, plánovat a mít paměť.
Gemini 2.0 je podle Googlu v klíčových oblastech, jako je zpracování kódu, matematika, argumentace nebo faktičnost, dvakrát rychlejší než verze 1.5 Pro. Podporuje multimodální výstup, jako jsou nativně generované obrázky kombinované s textem a vícejazyčný zvuk, který si vývojáři mohou přizpůsobit (včetně hlasů, jazyků a akcentů). Kromě toho může nativně spouštět nástroje, jako je Vyhledávání Google (pro více věcných odpovědí), a kód.
Experimentální verze modelu Gemini 2.0 je od této chvíle dostupná na platformách AI Studio a Vertex AI pro vývojáře. V lednu by měl být model zpřístupněn pro širokou veřejnost. Google má vedle toho i nové API Multimodal Live pro „vstup zvuku a videa v reálném čase“ z kamer nebo obrazovek.
Mohlo by vás zajímat

Google říká, že pro koncové uživatele aplikace Gemini bude výsledkem nového modelu „ještě užitečnější asistent Gemini“. Uživatelé Gemini i Gemini Advanced budou moci ještě tento týden na webu gemini.google.com používat experimentální verzi 2.0 optimalizovanou pro chat. Brzy by měla také dorazit do mobilní aplikace a začátkem příštího roku se prý dostane do dalších produktů Googlu.