Roboti, ki ustvarjajo slike, pripovedujejo šale in pišejo članke
Videli smo že robote, ki tečejo in skačejo, pomagajo pri strežbi ali v proizvodnih procesih in celo komunicirajo z ljudmi v srhljivo poglobljenih pogovorih. In čeprav se počasi utrjuje zavedanje družbe, da bodo roboti v bližnji prihodnosti prevzeli kar nekaj človeških delovnih mest in nalog, je veljalo neko splošno mnenje, da bodo varni vsaj tisti poklici, ki zahtevajo ustvarjalno žilico in človeški dotik.
Očitno pa so nas roboti, umetna inteligenca in druge tehnologije, dohitele tudi na tem področju. Raziskovalci namreč razvijajo različne modele, ki lahko zgolj iz opisa (besedila) ustvarijo realistične slike in umetnine, denimo koalo, ki igra košarko ali plišaste medvedke, ki na Luni delajo raziskave o umetni inteligenci.
Temeljni modeli
Obstaja verjetnost, da ste bili v popolni nevednosti že izpostavljeni novemu trendu na področju umetne inteligence. Morda ste videli kakšno nenavadno čudno sliko na spletu ali prebrali precej zanimiv članek, ki ga je za priznani britanski časnik spisal kar robot sam (povezava do članka). Programi umetne inteligence oziroma bolj natančno sistemi strojnega učenja, imenovani DALL-E, GPT in PaLM, navdušujejo s svojo neverjetno sposobnostjo ustvarjanja različnih kreativnih vsebin.
Ti sistemi so znani kot 'temeljni modeli' (ang. foundation models) in niso zgolj zabavni triki. Temeljni modeli delujejo tako, da se en sam velik sistem usposobi na velikih količinah splošno dostopnih podatkov, nato pa se sistem prilagodi novim problemom. Prejšnji modeli so bili nagnjeni k temu, da so za vsak nov problem začeli z ničle.
Sistem DALL-E 2 je bil denimo usposobljen za primerjanje slik (fotografija hišne mačke) z opisom ('Maček Tačko se sprošča na soncu') s pregledovanjem več sto milijonov primerov. Ko je bil ta model usposobljen, je vedel, kako so mačke, in druge stvari, videti na slikah. Model pa je mogoče uporabiti tudi za številne druge zanimive naloge umetne inteligence, navaja spletni portal The Conversation. DALL-E 2 je denimo na zgolj podlagi opisa slike, ali pisnih navodil, kako naj slika izgleda, dejansko tudi sam ustvaril dotično sliko, kot je razvidno iz spodnjega posnetka.
Temeljni modeli delujejo na podlagi t. i. 'globokih nevronskih mrež', ki se ohlapno zgledujejo po delovanju možganov. Te vključujejo zapleteno matematiko in ogromno računalniške moči, vendar se omejujejo na zelo zapleteno vrsto ujemanja vzorcev. Več kot je primerov, ki jih model 'vidi' in večji kot je model, bolj kompleksne vzorce ali povezave lahko ustvari.
Temeljni modeli so na nek način le razširitev tehnologije globokega učenja (ang. deep learning), ki je v zadnjem desetletju prevladovala v raziskavah umetne inteligence. Vendar pa se pri njih pojavlja neprogramirano ali 'nastajajoče' vedenje, ki je lahko presenetljivo in novo, pojasnjuje The Conversation.
Kaj pomeni prihod teh modelov za 'ustvarjalne' poklice?
Temeljni modeli so nepredstavljivo ogromni in za njihovo usposabljanje je potrebna ogromna količina računalniških in drugih virov. Po eni od ocen naj bi stroški usposabljanja jezikovnega modela GPT-3 podjetja OpenAI (model, ki je spisal prej omenjeni članek) znašali približno 4,6 milijona evrov. Googlov model PaLM, ki je med drugim zmožen pojasniti šale in obrazložiti odgovore na različna vprašanja, ima denimo 540 milijard parametrov, ki zahtevajo ogromno računalniške moči in prostora.
V prihodnjih letih bo izdelanih še več tovrstnih temeljnih modelov. Manjši modeli so že objavljeni v odprtokodnih oblikah, tehnološka podjetja začenjajo eksperimentirati z licenciranjem in komercializacijo teh orodij, raziskovalci umetne inteligence pa si prizadevajo, da bi tehnologija postala učinkovitejša in dostopnejša.
Modeli umetne inteligence z globokim učenjem že kažejo nadčloveško natančnost pri nalogah, kot sta pregledovanje rentgenskih slik in odkrivanje očesne degeneracije. Temeljni modeli bodo lahko kmalu zagotovili poceni in dovolj dobro ustvarjalnost na področjih, kot so oglaševanje, pisanje besedil, ustvarjanje slik na spletu ali grafično oblikovanje.
Raziskovalci, ki preučujejo učinke umetne inteligence na družbo, so na spletnem portalu The Conversation zapisali, da bodo temeljni modeli prinesli velike spremembe, vendar verjetno še ne tako kmalu. Vsekakor pa imajo različne tehnologije zdaj veliko večje možnosti, da v prihodnosti prevzamejo tudi nekatere 'ustvarjalne' poklice, verjetno pa se bomo soočili tudi z večjim številom lažnih novic in dezinformacij.
Kot pri vsaki tehnologiji, ki je ustvarjena z dobrim namenom in sama po sebi ni slaba, se bodo našli škodoželjni ljudje, ki jo bodo izkoristili za svoje namene.
Več iz rubrike
3D tisk pozitivno vpliva na gospodarstvo
Najpogosteje 3D tisk proizvaja slušne aparate, protetične pripomočke in tekaške copate.
Bomo trajnost dosegli z jedrsko fuzijo?
Znanstveniki dosegli stabilizacijo jedrskega zlivanja, kar je dober znak za prihodnost