POLITIKA I EKONOMIJA

"Sputnjik trenutak" za vještačku inteligenciju?

Ako lideri američke AI tehnologije i kreatori politika izvuku prave pouke iz uspjeha kompanije DeepSeek, svi bismo mogli imati koristi od toga

2062 pregleda 0 komentar(a)
Foto: Shutterstock
Foto: Shutterstock

Nakon što je prezentacija DeepSeek-R1, 20. januara, izazvala pad cijena akcija proizvođača čipova Nvidia i nagli pad vrijednosti drugih tehnoloških kompanija, neki posmatrači odmah su proglasili ovaj događaj "Sputnjik trenutkom" u kinesko-američkoj trci za prevlast u oblasti vještačke inteligencije (AI). Iako je američkoj AI industriji očigledno bilo potrebno da je nešto "protrese", ovaj događaj postavlja teška pitanja.

Američke tehnološke kompanije ulažu ogromne sume novca u vještačku inteligenciju. Prema procjenama Goldman Sachsa, "u narednim godinama megatehnološke firme, korporacije i energetske kompanije potrošiće oko 1 bilion dolara na kapitalne investicije povezane s vještačkom inteligencijom". Međutim, mnogi posmatrači (među kojima sam i ja) već dugo dovode u pitanje ispravnost pravca ulaganja i razvoja vještačke inteligencije u SAD.

Sve vodeće kompanije imaju, u suštini, istu strategiju (iako se Meta donekle izdvojila izborom modela sa djelimično otvorenim kodom), zbog čega se cijela industrija oslonila na jedan jedini pristup. Američke tehnološke firme su, bez izuzetka, opsjednute razmjerama. Pozivajući se na još nedokazani "zakon skaliranja", smatraju da je povećanje količine podataka i računarske snage u njihovim modelima ključ za otključavanje novih, ogromnih mogućnosti. Čak tvrde da je "skaliranje sve što vam je potrebno".

Do 20. januara američke kompanije nisu bile voljne da razmatraju alternative za svoje osnovne modele, koji su prethodno obučavani na ogromnim skupovima podataka kako bi predviđali sljedeću riječ u nizu. Nakon što su postavile prioritete, usredsredile su se gotovo isključivo na difuzione modele i četbotove, namijenjene obavljanju ljudskih (ili čovjekolikih) zadataka. Pristupi DeepSeeka u velikoj mjeri su slični, ali izgleda da je ova kompanija aktivnije koristila metode poput "učenja s pojačanjem", "mješavine stručnjaka" (koristeći više manjih, ali efikasnijih modela), prečišćavanja ("destilacije") i preciznijeg oblikovanja u "procesu (lancu) rasuđivanja". Ova strategija mu je, kako se navodi, omogućila razvoj konkurentnog modela po znatno nižoj cijeni.

Iako se vode rasprave oko toga da li nam je DeepSeek rekao baš sve, ovaj događaj je ogolio problem "grupnog razmišljanja" u američkoj AI industriji. Slijepo ignorisanje alternativnih, jeftinijih i perspektivnijih pristupa, u kombinaciji s medijskom pompom, upravo je ono što smo Simon Džonson i ja predvideli u knjizi Power and Progress, napisanoj neposredno prije početka ere generativne vještačke inteligencije. Sada se postavlja pitanje - postoje li u američkoj AI industriji još opasnije "slijepe tačke"? Na primjer, da li vodeće američke tehnološke kompanije propuštaju priliku da svoje modele usmjere u "humanijem" pravcu? Pretpostavljam da je odgovor "da", ali vrijeme će pokazati.

Tu je i drugo, još krupnije pitanje: da li je Kina počela da prestiže Ameriku? Ako je tako, da li to znači da autoritativne strukture upravljanja odozgo (koje smo Džejms Robinson i ja nazvali "ekstraktivnim institucijama") mogu biti jednako dobre, ili čak bolje, od aranžmana odozdo prema gore u pokretanju inovacija?

Sklon sam da vjerujem da kontrola odozgo usporava inovacije (što smo Džejms Robinson i ja argumentovali u knjizi Why Nations Fail ). Iako se čini da uspjeh DeepSeeka dovodi u pitanje ovu tvrdnju, on nije ubjedljiv dokaz da inovacije pod kontrolom ekstraktivnih institucija mogu biti jednako moćne ili dugoročne kao u sistemima sa inkluzivnim institucijama. Osim toga, DeepSeek se oslanja na godine napretka u SAD i Evropi. Sve osnovne metode prvobitno su razvijene u SAD. "Mješavina stručnjaka" i "učenje s pojačanjem" potekli su iz istraživačkih instituta prije nekoliko decenija, dok su velike američke tehnološke kompanije prve implementirale "model transformer", "lanac rasuđivanja" i "destilaciju".

Ono što je DeepSeek pokazao jeste inženjerska izvrsnost - uspio je da kombinuje iste metode efikasnije nego što su to učinile američke kompanije. Ipak, ostaje da se vidi da li će kineske firme i istraživački instituti uspjeti da naprave sljedeći korak i razviju sopstvene revolucionarne metode, proizvode i pristupe.

Pored toga, DeepSeek očigledno nije tipična kineska AI kompanija. Većina drugih kineskih firmi za vještačku inteligenciju razvija tehnologije za vladu ili uz državno finansiranje. DeepSeek, međutim, potiče iz hedž fonda i uspješno je radila ispod radara. Ali, da li će uspjeti da zadrži kreativnost i dinamičnost sada kada je u centru pažnje? Šta god da se desi, uspjeh jedne kompanije ne može se smatrati uvjerljivim dokazom da u inovacijama Kina može da pobijedi otvorenija društva.

Tu je i geopolitičko pitanje: da li slučaj DeepSeek znači da su američke mjere kontrole izvoza i druge strategije za ograničavanje kineskih AI projekata propale? Odgovor ni ovdje nije sasvim jasan. DeepSeek je obučio svoje nove modele (V3 i R1) na starijim, manje moćnim čipovima, ali za dalji napredak i skaliranje možda će mu biti potrebni najsnažniji čipovi.

Jasno je, međutim, da je američki pristup zasnovan na igri s nultom sumom ne funkcioniše. Takva strategija imala bi smisla samo ako bismo bili sigurni da se približavamo stvaranju opšte vještačke inteligencije - modeli koji mogu da pariraju ljudima u bilo kom kognitivnom zadatku - i da će onaj ko je prvi razvije imati ogromnu geopolitičku prednost. Držeći se ovih pretpostavki (od kojih nijedna nije potvrđena), SAD su odustale od plodonosne saradnje s Kinom u mnogim oblastima. Na primjer, ako jedna od zemalja razvije modele koji poboljšavaju ljudsku produktivnost ili pomažu u regulisanju energetskog sektora, takve inovacije bile bi korisne za obje zemlje, posebno ako bi se široko primjenjivale.

Kao i njegovi američki pandani, DeepSeek teži stvaranju vještačke inteligencije opšte namjene (AGI), pa samim tim razvoj modela koji je znatno jeftiniji za obuku djeluje kao prekretnica. Međutim, smanjenje troškova razvoja korišćenjem već poznatih metoda neće nas magično dovesti do pojave AGI u narednih nekoliko godina. Pitanje je da li je moguće stvoriti AGI u bliskoj budućnosti. Još je spornije - da li je to uopšte poželjno.

Iako još ne znamo sve detalje o tome kako DeepSeek razvio svoje modele, niti razumijemo značaj njegovog očiglednog uspjeha za budućnost AI industrije, jedno je jasno: zbog kineskog novajlije, opsesija razmjerama u tehnološkom sektoru sada je dovedena u pitanje, a možda će ih čak primorati da izađu iz zone komfora.

Autor je dobitnik Nobelove nagrade za ekonomiju za 2024. godinu; profesor je ekonomije na Masačusetskom institutu tehnologije (MIT)

Copyright: Project Syndicate, 2025. (prevod: N. R.)

Bonus video:

(Mišljenja i stavovi objavljeni u rubrici "Kolumne" nisu nužno i stavovi redakcije "Vijesti")