Umjetna inteligencija, ili AI, pojam je koji se ovih dana često koristi. Bilo na pametnom telefonu sa Androidem, usluga strujanja koja preporučuje vaš sljedeći film ili glazbena platforma koja automatski stvara popis za reprodukciju – čini se da je AI jednostavno posvuda. Ali kako je evoluirala definicija umjetne inteligencije i što zapravo znače neki od tehničkih pojmova umjetne inteligencije?
Što je zapravo AI?
Povijesno gledano, umjetna inteligencija se odnosila na inteligenciju na ljudskoj razini koja se postiže umjetno putem strojeva. Međutim, pojam je tijekom godina neznatno promijenio svoje izvorno značenje i sada se između ostalog često koristi kao široki marketinški pojam. Danas se gotovo sve što pokazuje znakove inteligencije, od preporuka za e-trgovinu do sustava za prepoznavanje glasa, naziva AI. Međutim, niz drugih pojmova i kratica povezuje se s umjetnom inteligencijom. Bacimo malo svjetla na one najčešće.
Strojno učenje (ML – strojno učenje)
Strojno učenje potkategorija je umjetne inteligencije u kojoj sustavi uče iz podataka i iskustva kako bi donosili odluke ili izvodili razne radnje – na primjer, ako algoritmu unesete tisuće slika mačaka, on će naučiti identificirati mačku. Zatim možete dati slike mačaka, pasa i drugih životinja. Sustav bi tada trebao moći odabrati slike mačaka na temelju onoga što je "naučio". Ovaj proces učenja uključuje dvije glavne faze: obuku i zaključivanje, što nas dovodi do sljedećih pojmova.
Trening
Faza obuke duga je faza strojnog učenja u kojoj se sustavu unose ogromne količine podataka iz kojih može učiti – na primjer, gore spomenute slike mačaka. Međutim, korišteni podaci mogu biti specifični predmeti, poput cvijeća, ili uključivati veće uzorke, poput cijelog interneta. Obuka modernih AI sustava kao što je ChatGPT može stajati milijune i zahtijevati ogromne računalne resurse.
Derivacija
Nakon obuke, sustav svoje stečeno znanje primjenjuje na nove podatke. U ovoj fazi dolazi do unosa krajnjeg korisnika i izravne integracije s umjetnom inteligencijom. Na primjer, sada kada sustav zna što je mačka, možemo mu dati sliku i on će je identificirati. Pitajte chatbotove Google Gemini ili Microsoft Copilot koji je glavni grad Engleske i oni će vam dati odgovor. U ovoj fazi sustav se oslanja na svoja utvrđena znanja. Ova faza zahtijeva znatno manje računalne snage.
Umjetna opća inteligencija (AGI)
AGI se odnosi na strojeve s ljudskom inteligencijom, sposobne donositi odluke, planirati i razumjeti svijet u širem kontekstu. Za razliku od sadašnjih AI sustava, AGI bi imao dublje razumijevanje i svijest, slično onome što vidimo u znanstvenoj fantastici. Iako je AGI još uvijek glazba daleke budućnosti, jer bi razbijanje ovog koda zahtijevalo mnogo tehničkih, filozofskih i moralnih pitanja, to je značajno područje istraživanja.
Generativna AI
Tradicionalno, umjetna inteligencija briljirala je u klasifikaciji i prepoznavanju, ali generativna umjetna inteligencija nadilazi te ideje i stvara nove sadržaje poput teksta, slika i glazbe. Ovaj revolucionarni napredak otvorio je nove mogućnosti u umjetnoj inteligenciji, omogućujući sustavima generiranje kreativnih rezultata na temelju ulaznih podataka. Ovaj oblik umjetne inteligencije također donosi najopipljivije prednosti svakodnevnim korisnicima, posebno ako ste ikada koristili ChatGPT za dizajniranje e-pošte ili Midjourney za generiranje slike mačke.
Neuronske mreže
Neuronske mreže osnovni su građevni blokovi i okosnica moderne umjetne inteligencije. Postoje desetljećima i modelirani su prema ljudskom mozgu. Sastoje se od međusobno povezanih neurona koji obrađuju podatke kroz različite slojeve, što u konačnici proizvodi izlaz. Uvježbavanje neuronske mreže uključuje prilagodbu veza između neurona radi poboljšanja točnosti.
Transformacijske mreže
Posebna vrsta neuronske mreže, transformacijska mreža, omogućila je razvoj velikih jezičnih modela (LLM) kao što je ChatGPT. Ove mreže izvrsne su u razumijevanju konteksta i odnosa u podacima, što ih čini idealnim za zadatke obrade jezika.
Veliki jezični modeli (LLM)
Kada se kombiniraju neuronske mreže, transformatori i obuka za vrlo veliku neuronsku mrežu, rađaju se veliki jezični modeli. Takozvani LLM obučeni su na golemim količinama tekstualnih podataka, što im omogućuje generiranje odgovora sličnih ljudskim. Primjeri uključuju ChatGPT, Claude, LLaMA i Grok. Ovi modeli funkcioniraju tako što predviđaju sljedeću riječ u nizu i proizvode koherentne i kontekstualno relevantne rezultate. Međutim, ova prediktivna priroda može dovesti do problema kao što su halucinacije, gdje model generira vjerojatne, ali netočne informacije. A što su zapravo te halucinacije?
Halucinacija
Takozvane halucinacije javljaju se kada AI generira netočne informacije zbog oslanjanja na prediktivno modeliranje. Ovo je značajan izazov za LLM jer mogu proizvesti uvjerljive, ali lažne rezultate. Klasičan primjer halucinacije može biti preporuka superljepila ili pištolja za topljenje na pitanje kako spriječiti da sir sklizne s pizze.
Parametri i veličina modela
Učinkovitost AI modela često se mjeri njihovim ukupnim parametrima, koji predstavljaju veze u neuronskoj mreži. Veći modeli s više parametara općenito rade bolje, ali zahtijevaju više resursa. Manji modeli su teoretski manje točni, ali mogu raditi na ekonomičnijem hardveru. Na primjer, ogromni model oblaka LLaMA 3.1 ima 405 milijardi parametara, dok se modeli koji nativno rade na pametnim telefonima sastoje od samo nekoliko milijardi parametara.
Difuzijski modeli
Difuzijski modeli su modeli koji se koriste za generiranje slika, difuzijski modeli obrću proces dodavanja šuma slikama tijekom obuke. To im omogućuje stvaranje novih slika od nasumičnog šuma, vođeni naučenim uzorcima.
Proširena generacija dohvaćanja (RAG)
RAG kombinira generativnu umjetnu inteligenciju s vanjskim izvorima podataka kako bi proizveo točne i kontekstualno relevantne rezultate. Preuzimanjem dodatnih podataka ovi modeli mogu poboljšati svoje rezultate, čineći ih pouzdanijima i korisnijima.