Zavřít reklamu

Umělá inteligence neboli AI je termín, který se dnes často používá. Ať už na chytrém telefonu s Androidem, streamovací službě doporučující váš další film nebo hudební platformě automaticky vytvářející playlist – zdá se, ž  že AI je zkrátka všude. Ale jak se definice AI vyvinula a co vlastně znamenají některé z technických termínů AI?

Co je vlastně AI?

Historicky se AI odkazovalo na lidskou úroveň inteligence dosaženou uměle prostřednictvím strojů. Tento termín však v průběhu let mírně změnil svůj původní význam a nyní se často používá kromě jiného také jako široký marketingový termín. Dnes je téměř cokoli, co vykazuje známky inteligence, od doporučení e-commerce až po systémy rozpoznávání hlasu, označováno jako AI. S umělou inteligencí je ale spojená řada dalších termínů a zkratek. Pojďme si osvětlit ty nejčastější.

Strojové učení (ML – machine learning)

Strojové učení je podkategorie AI, ve které se systémy učí z dat a zkušeností za účelem rozhodování nebo provádění nejrůznějších akcí – například pokud algoritmus nakrmíte tisícovkami obrázků koček, naučí se kočku identifikovat. Poté můžete poskytnout obrázky koček, psů a dalších zvířat. Systém by pak měl být schopen vybrat obrázky koček na základě toho, co se „naučil“. Tento proces učení zahrnuje dvě hlavní fáze: trénink a odvozování, čímž se dostáváme k dalším termínům.

Trénink

Fáze tréninku je dlouhá etapa strojového učení, kdy je systém krmen obrovským množstvím dat, aby se z nich učil – například zmíněné obrázky koček. Použitá data však mohou být konkrétní položky, jako jsou květiny, nebo zahrnovat větší vzorky, jako je celý internet. Trénování moderních systémů AI jako ChatGPT může stát miliony a vyžadovat obrovské výpočetní zdroje.

Odvozování

Po trénování systém aplikuje své získané znalosti na nová data. Tato fáze je místem, kde dochází ke vstupu koncového uživatele a jeho přímé integraci s AI. Například nyní, když systém ví, co je kočka, můžeme mu poskytnout její obrázek a on ho identifikuje. Zeptejte se chatbotů Google Gemini nebo Microsoft Copilot, jaké je hlavní město Anglie, a poskytnou vám odpověď. V této fázi systém čerpá ze svých zavedených poznatků. Tato fáze vyžaduje výrazně méně výpočetní výkonu.

Umělá všeobecná inteligence (AGI)

AGI se odkazuje na stroje s lidskou úrovní inteligence, schopné rozhodování, plánování a porozumění světu v širším kontextu. Na rozdíl od současných systémů AI by AGI měla hlubší pochopení a povědomí, podobně jako to, co vidíme ve sci-fi. Ačkoli je AGI zatím jen hudbou vzdálené budoucnosti, protože rozlousknutí tohoto kódu by vyžadovalo spoustu technických, filozofických a morálních otázek, je to významná oblast výzkumu.

Generativní AI

Tradičně byla AI vynikající v klasifikaci a rozpoznávání, ale generativní AI jde nad rámec těchto myšlenek a vytváří nový obsah, jako jsou texty, obrázky a hudba. Tento revoluční pokrok otevřel nové možnosti v AI a umožnil systémům generovat kreativní výstupy na základě vstupních dat. Tato forma AI také přináší nejvíce hmatatelných výhod pro každodenní uživatele, zejména pokud jste někdy použili ChatGPT k navržení e-mailu nebo Midjourney k vygenerování obrázku kočky.

Neuronové sítě

Neuronové sítě jsou základními stavebními kameny a páteří moderní AI. Existují již desítky let a jsou modelovány podle lidského mozku. Skládají se z propojených neuronů, které zpracovávají data prostřednictvím různých vrstev, což nakonec produkuje výstup. Trénování neuronové sítě zahrnuje úpravu spojení mezi neurony ke zlepšení přesnosti.

Transformační sítě

Speciální typ neuronové sítě, transformační sítě, umožnil vývoj velkých jazykových modelů (LLM) jako ChatGPT. Tyto sítě vynikají v pochopení kontextu a vztahů v datech, což je činí ideálními pro úkoly zpracování jazyka.

Velké jazykové modely (LLM)

Když se zkombinují neuronové sítě, transformátory a trénink pro velmi rozsáhlou neuronovou síť, rodí se velké jazykové modely. Takzvané LLM jsou trénovány na obrovském množství textových dat, což jim umožňuje generovat odpovědi podobné lidským. Jako příklad může sloužit třeba ChatGPT, Claude, LLaMA a Grok. Tyto modely fungují tak, že předpovídají další slovo v sekvenci a vytvářejí koherentní a kontextuálně relevantní výstupy. Tato prediktivní povaha však může vést k problémům jako halucinace, kdy model generuje věrohodné, ale nesprávné informace. A co jsou to vlastně ty halucinace?

Halucinace

Takzvané halucinace nastávají tehdy, když AI generuje nesprávnou kvůli své závislosti na prediktivním modelování informaci. To je významná výzva pro LLM, protože mohou produkovat přesvědčivé, ale falešné výstupy. Klasickým příkladem halucinace může být doporučení vteřinového lepidla nebo tavné pistole na základě dotazu, jak zabránit tomu, aby sýr sklouzával z pizzy.

Parametry a velikost modelu

Účinnost modelů AI se často měří podle jejich celkových parametrů, které představují spojení v neuronové síti. Větší modely s více parametry obecně fungují lépe, ale vyžadují více zdrojů. Menší modely jsou teoreticky méně přesné, ale mohou běžet na úspornějším hardwaru. Například obrovský cloudový model LLaMA 3.1 má 405 miliard parametrů, zatímco modely, které běží nativně na smartphonech, se skládají pouze z několika miliard parametrů.

Difuzní modely

Difuzní modely jsou modely, používané pro generování obrázků, difuzní modely obrací proces přidávání šumu do obrázků během školení. To jim umožňuje vytvářet nové obrázky z náhodného šumu, vedené naučenými vzory.

Retrieval Augmented Generation (RAG)

RAG kombinuje generativní AI s externími zdroji dat k tomu, aby produkoval přesné a kontextuálně relevantní výsledky. Tím, že si tyto modely stahují další data, mohou vylepšit své výstupy, což je činí spolehlivějšími a užitečnějšími.

Dnes nejčtenější

.