Roboti, ki ustvarjajo slike, pripovedujejo šale in pišejo članke

Čeprav robotizacija in umetna inteligenca hitro napredujeta, je obstajalo splošno prepričanje, da ne bosta mogli nadomestiti ustvarjalnih poklicev…do zdaj.
Fotografija: Roboti, ki ustvarjajo slike, pripovedujejo šale in pišejo članke. Slika je simbolična. Foto: Shutterstock
Odpri galerijo
Roboti, ki ustvarjajo slike, pripovedujejo šale in pišejo članke. Slika je simbolična. Foto: Shutterstock

Videli smo že robote, ki tečejo in skačejo, pomagajo pri strežbi ali v proizvodnih procesih in celo komunicirajo z ljudmi v srhljivo poglobljenih pogovorih. In čeprav se počasi utrjuje zavedanje družbe, da bodo roboti v bližnji prihodnosti prevzeli kar nekaj človeških delovnih mest in nalog, je veljalo neko splošno mnenje, da bodo varni vsaj tisti poklici, ki zahtevajo ustvarjalno žilico in človeški dotik.

image_alt
Prvi robot z državljanstvom želi imeti otroke in uničiti človeštvo

Očitno pa so nas roboti, umetna inteligenca in druge tehnologije, dohitele tudi na tem področju. Raziskovalci namreč razvijajo različne modele, ki lahko zgolj iz opisa (besedila) ustvarijo realistične slike in umetnine, denimo koalo, ki igra košarko ali plišaste medvedke, ki na Luni delajo raziskave o umetni inteligenci.

Temeljni modeli

Obstaja verjetnost, da ste bili v popolni nevednosti že izpostavljeni novemu trendu na področju umetne inteligence. Morda ste videli kakšno nenavadno čudno sliko na spletu ali prebrali precej zanimiv članek, ki ga je za priznani britanski časnik spisal kar robot sam (povezava do članka). Programi umetne inteligence oziroma bolj natančno sistemi strojnega učenja, imenovani DALL-E, GPT in PaLM, navdušujejo s svojo neverjetno sposobnostjo ustvarjanja različnih kreativnih vsebin.

Ti sistemi so znani kot 'temeljni modeli' (ang. foundation models) in niso zgolj zabavni triki. Temeljni modeli delujejo tako, da se en sam velik sistem usposobi na velikih količinah splošno dostopnih podatkov, nato pa se sistem prilagodi novim problemom. Prejšnji modeli so bili nagnjeni k temu, da so za vsak nov problem začeli z ničle.

image_alt
Kaj se dogaja za zaprtimi vrati plešočih robotov Boston Dynamics

Sistem DALL-E 2 je bil denimo usposobljen za primerjanje slik (fotografija hišne mačke) z opisom ('Maček Tačko se sprošča na soncu') s pregledovanjem več sto milijonov primerov. Ko je bil ta model usposobljen, je vedel, kako so mačke, in druge stvari, videti na slikah. Model pa je mogoče uporabiti tudi za številne druge zanimive naloge umetne inteligence, navaja spletni portal The Conversation. DALL-E 2 je denimo na zgolj podlagi opisa slike, ali pisnih navodil, kako naj slika izgleda, dejansko tudi sam ustvaril dotično sliko, kot je razvidno iz spodnjega posnetka.

Temeljni modeli delujejo na podlagi t. i. 'globokih nevronskih mrež', ki se ohlapno zgledujejo po delovanju možganov. Te vključujejo zapleteno matematiko in ogromno računalniške moči, vendar se omejujejo na zelo zapleteno vrsto ujemanja vzorcev. Več kot je primerov, ki jih model 'vidi' in večji kot je model, bolj kompleksne vzorce ali povezave lahko ustvari.

Temeljni modeli so na nek način le razširitev tehnologije globokega učenja (ang. deep learning), ki je v zadnjem desetletju prevladovala v raziskavah umetne inteligence. Vendar pa se pri njih pojavlja neprogramirano ali 'nastajajoče' vedenje, ki je lahko presenetljivo in novo, pojasnjuje The Conversation.

Kaj pomeni prihod teh modelov za 'ustvarjalne' poklice?

Temeljni modeli so nepredstavljivo ogromni in za njihovo usposabljanje je potrebna ogromna količina računalniških in drugih virov. Po eni od ocen naj bi stroški usposabljanja jezikovnega modela GPT-3 podjetja OpenAI (model, ki je spisal prej omenjeni članek) znašali približno 4,6 milijona evrov. Googlov model PaLM, ki je med drugim zmožen pojasniti šale in obrazložiti odgovore na različna vprašanja, ima denimo 540 milijard parametrov, ki zahtevajo ogromno računalniške moči in prostora.

image_alt
Čip, ki posnema človeški živčni sistem in razlikuje med vonji

V prihodnjih letih bo izdelanih še več tovrstnih temeljnih modelov. Manjši modeli so že objavljeni v odprtokodnih oblikah, tehnološka podjetja začenjajo eksperimentirati z licenciranjem in komercializacijo teh orodij, raziskovalci umetne inteligence pa si prizadevajo, da bi tehnologija postala učinkovitejša in dostopnejša.

Človeška ustvarjalnost. Foto: Emmanuel Dunand / AFP
Človeška ustvarjalnost. Foto: Emmanuel Dunand / AFP

Modeli umetne inteligence z globokim učenjem že kažejo nadčloveško natančnost pri nalogah, kot sta pregledovanje rentgenskih slik in odkrivanje očesne degeneracije. Temeljni modeli bodo lahko kmalu zagotovili poceni in dovolj dobro ustvarjalnost na področjih, kot so oglaševanje, pisanje besedil, ustvarjanje slik na spletu ali grafično oblikovanje.

Raziskovalci, ki preučujejo učinke umetne inteligence na družbo, so na spletnem portalu The Conversation zapisali, da bodo temeljni modeli prinesli velike spremembe, vendar verjetno še ne tako kmalu. Vsekakor pa imajo različne tehnologije zdaj veliko večje možnosti, da v prihodnosti prevzamejo tudi nekatere 'ustvarjalne' poklice, verjetno pa se bomo soočili tudi z večjim številom lažnih novic in dezinformacij.

image_alt
Škandal: V javnost pricurljali podatki o podli igri vladnih organov

Kot pri vsaki tehnologiji, ki je ustvarjena z dobrim namenom in sama po sebi ni slaba, se bodo našli škodoželjni ljudje, ki jo bodo izkoristili za svoje namene.

Več iz rubrike