Mašine i ljudi ipak nisu ravnopravni
Tetris je bio enormno popularan u svoje vreme. A onda YouTube, Fejsbuk i Tik-Tok. Ako se, međutim, meri vreme koje je potrebno nekoj aplikaciji da stekne prvih sto miliona korisnika, sve ih je zasenio “ChatGPT” - program koji je sposoban da razume “običan jezik” i, korišćenjem veštačke inteligencije, daje odgovore na potpuno proizvoljna pitanja.
Za reč “chat” znamo da predstavlja “razgovor, ćaskanje”. Ali šta tačno znači ono “GPT” u imenu programa? U pitanju je skraćenica za rogobatnu englesku frazu “Generative Pre-Trained Transformer” koja u najkraćem opisuje suštinu ChatGPT-a. Ovaj program je, pre svega, “generativan”, sposoban da proizvede novi tekst na bazi već postojećeg. Bot je, takođe, “unapred istreniran” tako što su mu prezentovani silni terabajti teksta sa interneta uključujući i kompletnu Vikipediju, bez namere da bot postane ekspert u bilo kojoj posebnoj oblasti ljudskog znanja. Na kraju, Chat GPT je “transformer”: ova reč detaljnije opisuje arhitekturu neuronske mreže koja se krije ispod haube (vidi okvir). Transformeri su se kao koncept prvi put pojavili 2017. godine kao deo novog rešenja za mašinsko prevođenje teksta.
Ilustracije: Dall-E2 |
Nakon ovog “drila”, svi konfigurabilni parametri bivaju trajno zamrznuti i ChatGPT je konačno spreman da odgovara na vaša pitanja. Svako pitanje prolazi kroz komplikovanu semantičku analizu gde bot, korišćenjem mehanizma za “fokusiranje pažnje”, utvrđuje kojim rečima u pitanju treba da prida veću ili manju težinu. Ali kako nastaje odgovor? Verovali ili ne, isključivo “pogađanjem”! Bot nema pristup internetu i ne može da na njemu pronađe traženu informaciju kao što to čini Gugl. Umesto toga, bot počinje da “sriče” odgovor, reč po reč, neprekidno pokušavajući da za narednu reč izabere onu koja, na bazi ogromnog “iskustva” stečenog učenjem, izgleda “najlogičnije” u datom kontekstu, uz malu dozu slučajnosti, kako bi odgovori bili raznovrsniji. Uzmite, na primer, započetu rečenicu: “Danas me je posetio ____”. Mnogo je verovatnije da na mestu nepoznate reči stoji “brat” nego “zmaj”. ChatGPT zaista nije mnogo više od toga: beskrajno vešt, skupoceni “pogađač” reči koju svoju fleksibilnost crpi iz ogromnog broja parametara koji u sebi čuvaju duh i pravila govornog jezika.
Koliko je ChatGPT dobar? Probjate i sami na adresi https://chat.openai.com ili se malo poigrajte “Bingom”, Majkrosoftovom verzijom Gugla u koju je od nedavno ugrađen i ChatGPT. Utisci će prvenstveno zavisiti od dubine do koje ste spremni da idete kada je u pitanju istraživanje mogućnosti ovog “govornog automata”. Ako su pitanja jasna i jednostavna i ako se odgovor može dobiti rezimiranjem sadržaja koji već postoji na internetu, ChatGPT deluje zastrašujuće moćno: odogovori su ispolirani do perfekcije, precizno kondenzovani i nedvosmisleni. Ako mislite da ChatGPT odnekud prepisuje, to je samo donekle tačno: odgovori koje će dve osobe dobiti na identično pitanje mogu da budu potpuno različiti po formi, iako su suštinski identični. I ne pokušavajte da ChatGPT zbunite tablicom množenja ili dečijim pitanjima: “Šta je teže, kilogram vune ili kilogram olova”? ChatGPT nije vašarska igračka koja se može rasturiti jeftinim trikovima.Budimo realni: ChatGPT generiše nestvarno dobre tekstove. Tokom jednog eksperimenta, ekipa stručnjaka uspela je da u svega 52% slučajeva utvrdi da je tekst kreirao bot a ne čovek, što je jedva malo bolje od pogađanja bacanjem novčića. Kao prevodilac, ChatGPT je pretekao sve svoje rivale, uključujući i do skoro neprikosnoveni “Google Translate”. ChatGPT ne samo da odgovara na pitanja, u stanju je da piše vesti, impersonifikuje istorijske ličnosti, da odgovore daje u stihu ili u stilu antičkih filozofa. Zahvaljujući ChatGPT-u možete da “intervjuišete” Marka Aurelija, Džona Lenona, Isusa Hrista ili Džona Vejna, da uporedite stilove vladanja najvećih američkih predsednika ili vodite beskrajne diskusije o potpuno apsktraktnim stvarima. ChatGPT ume da napiše novu epizodu “Zvezdanih staza”, da napravi recept za ručak na bazi sastojaka u frižideru, da predloži rođendanski poklon, da priča viceve, da sastavi otkazno pismo ili dotera biografiju... Đaci ga već uveliko koriste za pisanje školskih sastava, a kako i ne bi kad ChatGPT ume da prepriča skoro svaku knjigu koju bi đaci, inače, morali da pročitaju. Briljantan je i kada su kompjuterski, programski jezici u pitanju: u stanju je da generiše savršeno ispravan softverski kod na bazi verbalnog opisa, možda zahvaljujući činjenici da mašinski jezici operišu relativno malim fondom reči i imaju jasno definisanu sintaksu. ChatGPT takođe ume da piše pesme, note i akrode za gitaru, da prepričava “Harija Potera” koristeći Eminemov reperski rečnik ili oponaša imaginarne junake iz stripova ili crtanih filmova. I na kraju, ChatGPT ume da objasni zašto je broj 42 odgovor na pitanje svih pitanja. Kada sve ovo saberete, ne čudi što ima dosta onih koji tvrde da je ChatGPT prvi kompjuterski program koji demonstrira istinsku “opštu inteligenciju”. Po njima, bot poseduje određenu količinu zdravog razuma, solidan nivo razumevanja i sposobnost razmišljanja.
Ipak, kad zagrebete malo dublje, postaće vam jasno da ChatGPT zapravo “pojma nema” o čemu piše i da mu logika nije jača strana. Kada mu postavite pitanje, on ne pokušava da u moru pročitanih tekstova nađe odgovor. Umesto toga, on se trudi da pronađe formulaciju koja, po duhu i formi, “liči” na tačan odgovor. Recimo, bot je do sada pročitao mnogo šahovskih knjiga i video mnogo šahovskih partija, ali i dalje ne “kapira” elementarna šahovska pravila. Manjak inteligencije naročito se vidi kada ga zatrpate pitanjima koja zahtevaju kreativno razmišljanje gde ne postoje primeri na koje bot može da se ugleda.Autor ovog teksta nije dovoljno stručan da ChatGPT napadne sofisticiranim pitanjima iz domena filozofije, lingvistike ili istorije, ali ponešto zna o matematici i fizici. Ispostavilo se da je ChatGPT lako “slomiti” relativno jednostavnim zagonetkama, čak i onim koje su nebrojeno puta ponovljene na internetu. Na pitanje koliko bi bio debeo papir koji je 50 puta presavijen na pola, bot “pametno” zaključuje da se radi o stotinama miliona kilometara (što je tačno), ali onda dodaje još jedan paragraf u kome, potpuno pogrešno, tvrdi da je to više od prečnika čitavog vidljivog kosmosa (nije ni približno). Jednostavno, bot ne razume brojeve, naročito one “malo veće”. Da bi razumeo njihove odnose, ispostavlja se da savršeno poznavanje sinatkse i semantike govornog jezika nije dovoljno. Ako bot gađate još težim pitanjima, recimo ako zatražite da dokaže da se broj “pi” (3.14) ne može napisati kao razlomak (krupan zalogaj čak i za profesionalne matematičare), ChatGPT će se upetljati kao “pile u kučine”, pokušavajući da složi priču od napabirčenih fragmenata dokaza koji se odnose na slične, ali zapravo sasvim drugačije probleme.
Internet je prepun primera u kojima ChatGPT “halucinira”, vidi stvari i događaje koji ne postoje i izvlači zaključke upitnog kvaliteta. Ispostavlja se da sistem “pogađanja” naredne reči ne može da bude zamena za kreativno razmišljanje, logiku i intuiciju. ChatGPT liči na čoveka koji je pročitao milion knjiga ali nikad nije izašao u svet, da svoju načitanost obogati iskustvom i na bazi toga razvije sopstvenu inteligenciju. Ni dete ne može da shvati svet isključivo čitanjem knjiga, neophodna je interakcija sa svetom koji ga okružuje. To iskustvo omogućava nam da informacije povežemo sa značenjem i tako steknemo osećaj realnosti. Upravo činjenica da ChatGPT nema nikakav dodir sa svojim okruženjem, da nije deo sveta koji opisuje, predstavlja ključni argument onih koji tvrde da ChatGPT, ni danas, ni u nekoj budućoj inkarnaciji, ne može da razvije sopstvenu inteligenciju.
Stvar komplikuje i činjenica da je veliki deo ljudskog znanja implicitnog karaktera: neke stvari jednostavno znamo ali ne umemo da ih objasnimo rečima i prenesemo nekom drugom. Primer je, recimo, vožnja bicikla, plivanje ili stajanje na jednoj nozi. Za ove veštine ne postoji pisani recept, najvažnije je iskustvo. Mi, jednostavno, znamo mnogo više nego što možemo da ispričamo. Zato su male šanse da će ChatGPT gutanjem bizarno velikih količina teksta ikad naučiti da vozi bicikl ili stoji na jednoj nozi, čak i u svom virtuelnom svetu.ChatGPT pritom svoju snagu bazira na tekstovima pokupljenim s interneta koji su često upitnog kvaliteta. Nije zato čudo što je, korišćenjem sugestivnih pitanja, relativno lako naterati ChatGPT da bude pristrasan ili generiše odgovor koji je mizogin, rasistički, antisemitski ili, jednostavno, zatucan. Sve je to bot negde već video i memorisao u svojim brojevima, ne znajući da li se radi o istini ili laži. Iako autori programa neprekidno rade na tome da unapred isfiltriraju toksične odgovore (i pitanja koja do njih dovode), uspeh je još uvek polovičan. Ovom botu pogotovo ne treba verovati kada su u pitanju životno osetljiva pitanja: lekarske dijagnoze, finansijske transakcije, krupne životne odluke i druga pitanja “života i smrti”.
Na kraju, postavlja se pitanje kako će ChatGPT izaći na kraj sa samim sobom. Danas se ovaj bot “hrani” tekstom s interneta. Ali šta će biti kada veliki procenat tog teksta bude mašinski generisan, upravo od strane tih istih botova? Mašina će početi da “uči” tako što će reciklirati sopstvene reči, poput pisca koji čita samo sopstvene knjige. Količina petparačkog digitalnog smeća radikalno će se povećati (kao da ga i ovako nemamo dovoljno), možda do tačke kada ni Gugl neće moći da pronađe bilo šta vredno u toj ogromnoj deponiji banalnosti. Elon Mask, jedan od osnivača kompanije “Open AI”, traži da se proglasi moratorijum na dalji razvoj inteligentnijih botova jer, u ovom trenutku, niko ne zna u kom pravcu ide sadašnji vrtoglavi razvoj (količina upotrebljenog hardvera duplira se na svaka 3-4 meseca). Italija je već privremeno zabranila ChatGPT (zbog neadekvatne zaštite privatnosti), a o sličnoj meri razmišljaju i neke druge zemlje.
I pored toga, očekuje se da će povećanje produktivnosti usled sve šire primene veštačke inteligencije uvećati globalnu ekonomiju tokom ove decenije za više od 15.000 milijardi dolara. Ljudi će, makar u proseku, postati bogatiji, ostaje samo da vidimo kako će to bogatstvo biti raspoređeno. Ako najveći deo tog novca ode u džepove malobrojnih tehnoloških mogula umesto u nova, kreativna i bolje plaćena radna mesta, može se zaista ispostaviti da je razvoj AI za veći deo čovečanstva bio korak unazad.
Promene koje se moraju prihvatiti
Postoji li opasnost da nas ChatGPT, zahvaljujući svojim neverovatnim sposobnostima, potisne na margine života? Prema nekim analizama, sve intenzivnija upotreba veštačke inteligencije (AI) dovešće do toga da oko 15-30% radnih mesta postane suvišno do kraja 2030. godine. Više nam neće biti potrebni stručnjaci, sve će ih zameniti ChatGPT ili neki njegov klon.
U sve većem broju restorana roboti polako zamenjuju konobare. Industrijske montažne trake danas su potpuno automatizovane, u mnogim halama nema nijednog radnika. Kompjuteri ugrađeni u automobile kao što je “Tesla” danas mogu u potpunosti da odmene vozača i svedu ga na nivo pasivnog putnika. U strahu za svoje radno mesto su i prevodioci, novinari, programeri, administrativni službenici, radnici u kontakt-centrima, nastavnici... sve njih je, već danas, u većoj ili manjoj meri moguće zamenti inteligentnim botovima kao što je ChatGPT. Čak ni medicinski radnici nisu sigurni: u vodećim svetskim zdravstvenim ustanovama sve više se koriste neuronske mreže za postavljanje dijagnoze na osnovu analize radioloških snimaka. Ispostavilo se da mašine uočavaju rane maligne procese efikasnije nego ljudi.
Istorija ljudskog rada je, zapravo, priča o tome kako su ljudi teške i dosadne poslove postepeno prenosili na mašine. Te mašine danas su stigle do tačke kada počinju da se bave logikom i zaključivanjem, da komuniciraju na govornom jeziku, da prepoznaju zvuk i oblike. Ovoga puta mašine preuzimaju i intelektulane a ne samo fizičke poslove. Ako se sadašnji trend nastavi, reklo bi se da će, pre ili kasnije, sve biti automatizovano i da nijedno radno mesto više nije sigurno, jer jednoga dana neće biti potrebno.Da li su ljudi i mašine zaista međusobno suprotstavljeni? Ova dilema počiva na pretpostavci da su mašine i ljudi ravnopravni. Srećom, oni to nisu i još dugo neće biti. Mašine su možda brze, hladno racionalne i tačne ali ne mogu da se pohvale intuicijom, kreativnim razmišljanjem ili emocionalnom inteligencijom. Ljudi su, uz to, sposobni da se adaptiraju na promenjene okolnosti i svoj rad prilagođavaju spoljašnjim uticajima dok su mašine blaženo nesvesne sveta oko sebe. Upravo zato što posedujemo osobine koje mašine nemaju, za ljude će (još) uvek biti mesta. Ljudski um, po svemu sudeći, još uvek nije moguće zameniti gomilom brojeva, makar ih bilo 175 milijardi.
Da li je parna mašina obesmislila ljudski rad? Nije, baš kao što ni montažna traka nije eliminsala radnika u automobilskoj industriji. Možda je prestala potreba za nekvalifikovanom radnom snagom, ali su se zato pojavila kreativnija radna mesta: umesto spajanjem delova, ljudi se danas mnogo više bave dizajnom, konstrukcijom, optimizacijom, ekološkim aspektima i istraživanjem. I pored sve automatizacije, prosečni radnik u automobilskoj industriji danas zarađuje više nego pre par decenija. I od kompjutera se nekad očekivalo da u potpunosti zamene ljude koji su računali “peške” ili se bavili tabelama iscrtanim na ogromnim papirima. Ti ljudi nisu nestali, prekvalifikovali su se u stručnjake za Excel i programiranje. Rađaju se nova, bolje plaćena zanimanja, neka stara se gase, a gubitnici će biti jedino oni koji tu promenu odbijaju da prihvate.
Kako rade neuronske mreže?
Zamislite da treba da napišete kompjuterski program koji će imati naizgled jednostavan zadatak - da na osnovu fotografije određene osobe prepozna da li je na njoj muška ili ženska osoba.
U programiranju je često korisno da, pre pisanja bilo kakvog koda, prvo razmislimo na koji način bi običan čovek izvršio zadatak koji bismo zadali računaru. Za čoveka je ovo rutinska stvar - mi smo se, jednostavno, tokom života postepeno naučili da razlikujemo muška i ženska lica. Zašto ne bismo pokušali da, kroz program koji pišemo, omogućimo računaru da uči slično nama? To bi značilo da bismo programu prvo prosledili veliki broj portreta na osnovu kojih bi kompjuter postepeno naučio da raspoznaje razlike između muških i ženskih lica. Jednom “istreniran”, kompjuter bi kasnije mogao da klasifikuje portrete prema polu koristeći ono što je naučio.
ChatGPT ne razume šah |
Bitno je napomenuti, da se na samom početku podaci moraju obraditi tako da ih neuronska mreža razume. Bilo da je u pitanju slika, zvuk ili tekst, neuronska mreža, kao i svaki kompjuterski program, ne razume ništa osim brojeva. Prilikom kretanja kroz mrežu podaci bivaju transformisani i svojim prolaskom kroz mrežu aktiviraju određene neurone koji dalje aktiviraju druge grupe neurona, sve dok mreža ne izbaci konačan rezultat (u našem slučaju to može da bude 0 ako je u pitanju portret osobe muškog pola, ili 1 ako je u pitanju portret ženske osobe).
ChatGPT u najboljem izdanju |
ChatGPT, iako značajno složeniji od prethodno opisane neuronske mreže, zapravo koristi isti princip. Kao i sve što se zasniva na neuronskim mrežama, ChatGPT-u su potrebni podaci na osnovu kojih će naučiti da obavlja sve što se od njega traži. Za ovu svrhu kompanija OpenAI je odlučila da iskoristi praktično sve što je ikada napisano na internetu (45 terabajta teksta sa oko 500 milijardi reči). Da bi se iz ovolike količine podataka izvukao smisao, ChatGPT je konstruisan kao skup neuronskih mreža koje tesno sarađuju. Upravo zato je ChatGPT u mogućnosti da radi razne stvari, od prevoda teksta na preko 100 različitih jezika do parafraziranja i proširivanja teksta koji dobije od strane korisnika. Ovakav jedan monstrum od programa zahteva ogroman broj neurona i još veći broj veza između njih. Samim tim, ChatGPT ima ogroman broj parametara koji kontrolišu njegov rad.
Čitav proces učenja odvija se na robusnom hardveru, super-računaru sastavljenom od više stotina procesora s praktično neograničenom količinom memorije. Troškovi ovako angažovanih resursa veći su od tri miliona dolara mesečno. Ni proces učenja nije ništa jeftiniji: procenjuje se da jedan višemesečni trening ChatGPT-a košta preko deset miliona dolara. Za neuronsku mrežu koja obavlja naš prost zadatak raspoznavanja polova potrebno je malo više od 100 000 parametara dok je za aktuelnu verziju ChatGPT-a taj broj oko 175 milijardi što je, složićete se, teško zamisliva cifra.
(Luka Marković)
Kratka istorija ChatGPT-a i mašinskog učenja
Počeci mašinskog učenja sežu sve do ranih pedesetih godina prošlog veka, kada su naučnici po prvi put pokušavali da ljudsko razmišljanje i sposobnost prepoznavanja obrazaca pretoče u kompjuterske algoritme. Kao rezultat takvih pokušaja nastaju prve neuronske mreže koje vrlo brzo bivaju napuštene zbog nedovoljne razvijenosti tadašnjih računara kao i male količine podataka potrebnih za treniranje neuronskih mreža.Umesto toga, naučnici se okreću jednostavnijim modelima koji se u velikoj meri baziraju isključivo na statistici. Takvo mašinsko učenje statističari su koristili još u prošlom veku kako bi na osnovu nekih podataka iz prošlosti, predvideli šta će se dešavati u budućnosti koristeći isključivo matematiku, ponekad čak i ručno izvodeći svoja izračunavnja.
Tek sa pojavom moćnih računara i razvojem interneta, naučnici su opet počeli da se bave neuronskim mrežama. Oblast mašinskog učenja koja izučava neuronske mreže i razvija modele bazirane na njima naziva se duboko učenje (eng. deep learning). Naziv u sebi odražava činjenicu da su neuronske mreže slojevite i da čak ni programeri koji su ih modelirali nisu sasvim sigurni šta se u unutrašnjim slojevima dešava.
Eksploziju veštačke intigencije u današnje vreme ispratili su svi giganti IT industrije poput Facebook-a sa svojim softverom za prepoznavanje lica, Google-a sa svojim Bardom koji bi trebalo da predstavlja pandan ChatGPT-u i Microsoft-a sa “HoloLensom”, naočarama za virtuelnu realnost. Takođe, porast popularnosti dubokog učenja i veštačke inteligencije doveo je i do rađanja mnogih novih kompanija.
Kompaniju OpenAI, kao neprofitnu organizaciju, osnovala je 2015. godina grupa tehnoloških lidera među kojima su bili Elon Mask, Sem Altman, Greg Brokman i drugi. U periodu od 2015. do 2018. godine OpenAI sarađuje s vodećim IT firmama kao i s prestižnim akademskim institucijama dajući aktivan doprinos svetskom istraživanju dubokog učenja. I pored toga, Elon Mask napušta kompaniju 2018. godine smatrajući da OpenAI nije ispunio očekivanja. Naredne godine OpenAI postaje profitna kompanija.
Sredinom 2018. godine OpenAI objavljuje GPT, svoj prvi veliki jezički model. GPT je imao značajan uticaj na razvoj različitih aplikacija koje se oslanjaju na prirodni jezik, uključujući prevođenje, odgovaranje na pitanja i automatizovano pisanje. U februaru 2019. godine, OpenAI objavljuje novu verziju svog jezičkog modela, GPT-2, koji je bio znatno veći i sposobniji od prethodne verzije. GPT-2 je postao poznat zbog impresivnog kvaliteta generisanog teksta, što je kod mnogih izazvalo zabrinutost da bi takva tehnologija mogla biti zloupotrebljena za kreiranje lažnih vesti i drugih oblika dezinformacija. Možda zbog toga OpenAI nikad nije otkrio sve detalje GPT-2 modela. Već naredne godine, nastavljajući sa velikim dostignućima, OpenAI najavljuje novi GPT-3 model i ulazi u partnerstvo sa Microsoft-om. Ovo je Majkrosoftu dalo mogućnost da, kao najveći investitor u OpenAI, može da koristi njegove modele za svoje potrebe. Godine 2021, OpenAI izbacuje i Dall-E, model koji generiše slike na osnovu opisa koji zadaje korisnik.U naredne dve godine rad OpenAI-a na veštačkoj inteligenciji kulminira: u novembru 2022. godine kompanija izbacuje ChatGPT, program optimizovan za vođenje dijaloga zasnovan na jezičkom modelu GPT-3.5 kao i Dall-E2, najnaprednijeg “robota slikara” do sad (neke od njegovih ilustracija naći ćete u ovom tekstu). I tu nije kraj: u probni rad već je puštena nova verzija jezičkog modela, GPT-4, definitivno najveća i najsnažnija do sada, sa više od hiljadu milijardi konfigurabilnih parametara.
Vrednost kompanije na berzi danas se procenjuje na čitavih 20 milijardi dolara, pri čemu samo Majkrosoftova investicija iznosi milijardu dolara. Godišnji prihod kompanije tokom 2023. godine trebalo bi da dostigne 200 miliona dolara sa tendencijom da on tokom naredne godine bude upetostručen. Odgovor konkurencije još uvek se čeka.
(Luka Marković)
Vreme #1684