Jei kas nors 2015 metais būtų pasakęs, kad nedidelė ne pelno siekianti organizacija San Franciske, įkurta saujelės technologijų entuziastų, po mažiau nei dešimtmečio privers „Google“ paskelbti „raudonąjį pavojų“, o mokytojus visame pasaulyje – iš naujo galvoti, kaip vertinti mokinių žinias, daugelis būtų tik pasukioję pirštą prie smilkinio. Tačiau būtent tai padarė „OpenAI“. Tai nėra tiesiog dar viena Silicio slėnio sėkmės istorija. Tai pasakojimas apie ambiciją sukurti dieviškąjį intelektą, apie vidines kovas dėl žmonijos saugumo ir apie technologiją, kuri jau dabar yra tapusi neatsiejama mūsų kasdienybės dalimi.
- Nuo idealizmo iki kapitalizmo: sudėtinga pradžia
- Generatyvinė revoliucija: kas slypi po variklio dangčiu?
- Produktai, kurie sudrebino rinką
- 1. GPT serija ir „ChatGPT“
- 2. DALL-E: vaizduotės išlaisvinimas
- 3. Sora: video turinio ateitis
- 4. Whisper
- Samo Altmano nušalinimo drama: penkios dienos nežinios
- AGI paieškos ir „Q*“ paslaptis
- Lietuviškas kontekstas: kaip „OpenAI“ keičia mus?
- Tamsioji pusė: autorių teisės ir duomenų siurbimas
- Ateities vizija: kur link judame?
Šiandien „OpenAI“ vardas yra tapęs generatyvinio dirbtinio intelekto sinonimu. Tačiau už blizgančio „ChatGPT“ fasado slypi sudėtinga, kartais dramatiška ir etinių dilemų kupina struktūra. Kaip ši kompanija sugebėjo aplenkti technologijų milžines? Kokia yra tikroji jų misija ir kodėl jų kuriami modeliai kartais elgiasi taip žmogiškai nenuspėjamai?
Nuo idealizmo iki kapitalizmo: sudėtinga pradžia
„OpenAI“ istorija prasidėjo nuo baimės. 2015 m. pabaigoje Elonas Muskas, Samas Altmanas (tuometinis „Y Combinator“ prezidentas) ir kiti investuotojai susibūrė su viena idėja: dirbtinis intelektas (DI) taps galingiausia technologija žmonijos istorijoje, ir ji negali priklausyti vienai korporacijai (tuo metu didžiausią grėsmę jie matė „Google“ ir jos padalinyje „DeepMind“).

Pirminė misija buvo paprasta ir kilni – sukurti saugų bendrąjį dirbtinį intelektą (AGI), kuris būtų naudingas visai žmonijai, ir dalintis tyrimais atvirai (iš čia ir pavadinimas „Open“). Jie startavo kaip ne pelno siekianti organizacija su 1 milijardo dolerių įsipareigojimu.
Tačiau realybė greitai pakoregavo planus. Šiuolaikinio DI mokymas reikalauja neįsivaizduojamų skaičiavimo resursų. Norint apmokyti modelius, reikalingi tūkstančiai galingiausių grafinių procesorių (GPU) ir milžiniški elektros energijos kiekiai. Ne pelno siekiančio modelio rėmuose surinkti milijardus dolerių tapo neįmanoma. 2019 m. įvyko lūžis – „OpenAI“ sukūrė hibridinę struktūrą: „riboto pelno“ (capped-profit) kompaniją, kurią valdo ne pelno siekianti valdyba. Tai atvėrė duris milžiniškoms investicijoms, visų pirma iš „Microsoft“, kuri tapo pagrindiniu partneriu ir debesijos paslaugų tiekėju.
Generatyvinė revoliucija: kas slypi po variklio dangčiu?
Norint suprasti „OpenAI“ sėkmę, reikia suvokti technologinį proveržį, kurį jie išnaudojo. Jų variklis – tai didieji kalbos modeliai (LLM), pagrįsti transformerių architektūra (kurią, ironiška, 2017 m. išrado „Google“ mokslininkai).
Iki tol DI dažniausiai buvo skirtas klasifikavimui (pvz., atpažinti, ar nuotraukoje yra katė) arba rekomendacijoms. „OpenAI“ pasuko kitu keliu – generavimu. Jų modeliai (GPT – Generative Pre-trained Transformer) mokosi nuspėti kitą žodį sakinyje, remdamiesi milijardais tekstų iš interneto. Tačiau „OpenAI“ pridėjo slaptą ingredientą, kuris viską pakeitė – RLHF (Reinforcement Learning from Human Feedback).
Tai reiškia, kad modelis ne tik aklai mokėsi iš interneto duomenų (kurie gali būti toksiški ar netikslūs), bet ir buvo „auklėjamas“ žmonių. Tūkstančiai trenerių vertino modelio atsakymus, nurodydami, kuris atsakymas yra saugesnis, logiškesnis ar naudingesnis. Būtent šis žmogiškasis prisilietimas pavertė šaltą algoritmą į pašnekovą, su kuriuo norisi bendrauti.
Produktai, kurie sudrebino rinką
Nors daugelis kompaniją žino tik dėl „ChatGPT“, „OpenAI“ produktų krepšelis yra gerokai platesnis ir demonstruoja jų siekį dominuoti visose medijų formose.
1. GPT serija ir „ChatGPT“
GPT-3 buvo pirmasis signalas, kad kažkas keičiasi, tačiau tikroji bomba sprogo su GPT-3.5 ir „ChatGPT“ paleidimu 2022 m. lapkritį. Tai buvo greičiausiai augusi vartotojų bazė istorijoje. Vėliau pasirodęs GPT-4 (ir jo atmaina GPT-4o) pademonstravo gebėjimą ne tik rašyti eiles ar kodą, bet ir analizuoti vaizdus, spręsti sudėtingus loginius uždavinius bei išlaikyti teisininkų ir medikų egzaminus geriau nei dauguma studentų.
2. DALL-E: vaizduotės išlaisvinimas
DALL-E buvo vienas pirmųjų įrankių, leidusių tekstą paversti vaizdu. Dabar, su trečiąja versija, integruota į „ChatGPT“, šis įrankis leidžia bet kuriam vartotojui tapti menininku ar dizaineriu. Tai sukėlė milžinišką susižavėjimą, bet kartu ir nerimą kūrybinėse industrijose – iliustratoriai ir grafikos dizaineriai pajuto realią grėsmę savo profesijai.
3. Sora: video turinio ateitis
Vienas naujausių ir labiausiai pribloškiančių „OpenAI“ projektų. „Sora“ geba generuoti minutės trukmės, hiperrealistiškus vaizdo įrašus vien iš tekstinio aprašymo. Nors šis įrankis vis dar nėra viešai prieinamas visiems, demonstracinės versijos parodė, kad netrukus Holivudas ir reklamos industrija susidurs su tokio pat lygio pokyčiais, kokius patyrė tekstų rašytojai.
4. Whisper
Tai mažiau reklamuojamas, bet itin galingas kalbos atpažinimo modelis. Jis geba transkribuoti garso įrašus į tekstą ir versti juos į anglų kalbą neįtikėtinu tikslumu, net esant stipriam foniniam triukšmui ar akcentams.
Samo Altmano nušalinimo drama: penkios dienos nežinios
Jokia diskusija apie „OpenAI“ nebūtų pilna be 2023 m. lapkričio įvykių, kurie priminė geriausius HBO serialų scenarijus. Penktadienio popietę „OpenAI“ valdyba netikėtai atleido generalinį direktorių Samą Altmaną, motyvuodama tuo, kad jis „nebuvo nuosekliai atviras bendraudamas su valdyba“.
Tai sukėlė chaosą. Pagrindinis mokslininkas Ilja Sutskeveris (Ilya Sutskever), buvęs vienas iš steigėjų, iš pradžių palaikė perversmą, baimindamasis, kad S. Altmanas per greitai stumia komercinius produktus, aukodamas DI saugumą. Tačiau reakcija buvo žaibiška: investuotojai („Microsoft“) įsiuto, o daugiau nei 700 „OpenAI“ darbuotojų pasirašė laišką, grasindami išeiti paskui Altmaną į „Microsoft“.
Po penkių dienų intensyvių derybų Samas Altmanas grįžo į postą. Valdyba buvo beveik visiškai pakeista. Šis įvykis parodė esminį konfliktą, draskantį visą DI industriją: akseleracionistai (kurie nori vystyti technologiją kuo greičiau) prieš saugumo šalininkus (kurie bijo, kad nekontroliuojamas DI gali sunaikinti žmoniją). Panašu, kad „OpenAI“ viduje pergalę šventė komercijos ir greičio šalininkai.
AGI paieškos ir „Q*“ paslaptis
Pagrindinis „OpenAI“ tikslas išlieka AGI – dirbtinis bendrasis intelektas. Tai sistema, kuri galėtų atlikti bet kokią intelektualinę užduotį, kurią gali atlikti žmogus, tik geriau. Ar mes jau arti?
Prieš pat S. Altmano atleidimą sklandė gandai apie naują modelį, kodiniu pavadinimu „Q*“ (tariama Q-Star). Nutekinta informacija leido suprasti, kad šis modelis pademonstravo gebėjimą spręsti matematinius uždavinius, kurių nebuvo matęs savo mokymosi duomenyse. Tai didelis žingsnis. Dabartiniai modeliai veikia tikimybiniu principu (spėlioja), o matematika reikalauja griežtos logikos ir planavimo. Jei „OpenAI“ išsprendė „planavimo“ problemą, AGI gali būti arčiau, nei manome.
Lietuviškas kontekstas: kaip „OpenAI“ keičia mus?
Nors „OpenAI“ būstinė yra Kalifornijoje, jos poveikis Lietuvoje jaučiamas kiekviename žingsnyje. Lietuvių kalba, būdama morfologiškai sudėtinga ir turinti mažai duomenų internete (palyginti su anglų kalba), ilgą laiką buvo „kietas riešutėlis“ mašininiam vertimui.
Tačiau GPT-4 modeliai demonstruoja stebėtinai gerą lietuvių kalbos mokėjimą. Jie geba:
- Linksniuoti ir derinti gimines: Tai buvo didžiausia ankstesnių vertėjų problema.
- Suprasti kultūrinį kontekstą: Modelis gali paaiškinti, kas yra cepelinai ar Žalgirio mūšis, ne tik kaip faktus, bet ir jų reikšmę.
- Padėti verslui: Lietuvos įmonės masiškai integruoja API sprendimus klientų aptarnavimui, turinio kūrimui ir duomenų analizei.
Visgi, iššūkių išlieka. Švietimo sistema Lietuvoje, kaip ir visur kitur, patiria šoką. Mokiniai naudoja DI rašiniams, o universitetai skubiai peržiūri akademinio sąžiningumo taisykles. Tačiau progresyvūs pedagogai mato tai ne kaip grėsmę, o kaip galimybę personalizuotam mokymuisi – DI gali tapti asmeniniu korepetitoriumi kiekvienam Lietuvos vaikui.
Tamsioji pusė: autorių teisės ir duomenų siurbimas
„OpenAI“ sėkmė turi savo kainą. Kompanija susiduria su daugybe ieškinių. Ryškiausias jų – dienraščio „The New York Times“ ieškinys. Žiniasklaidos milžinė teigia, kad „OpenAI“ neteisėtai panaudojo milijonus jų straipsnių savo modelių mokymui, ir dabar „ChatGPT“ gali veikti kaip tiesioginis laikraščio konkurentas, pateikdamas informaciją nemokamai.
Tai kelia fundamentalų klausimą: ar DI mokymasis iš viešai prieinamų duomenų yra „sąžiningas naudojimas“ (fair use), ar tai yra vagystė? Menininkai, rašytojai ir programuotojai visame pasaulyje jaučiasi apvogti, nes jų darbai buvo panaudoti sukurti sistemai, kuri dabar gali juos pakeisti. „OpenAI“ teigia, kad be šių duomenų modelių sukurti neįmanoma, ir siūlo įvairias kompensavimo schemas, tačiau teisinis reguliavimas šioje srityje beviltiškai atsilieka nuo technologijų.
Ateities vizija: kur link judame?
„OpenAI“ neketina stoti. Jau kalbama apie GPT-5, kuris turėtų būti ženkliai galingesnis už pirmtakus. Tačiau techninė galia nėra vienintelis tikslas. Kompanija juda link „agentų“ kūrimo.
Įsivaizduokite, kad vietoj to, jog tik kalbėtumėte su „ChatGPT“, jūs duodate jam užduotį: „Suplanuok mano atostogas Graikijoje, užsakyk bilietus, surask viešbučius ir sudėliok maršrutą“. DI agentas savarankiškai naršys internete, atliks mokėjimus (su jūsų patvirtinimu) ir pateiks galutinį rezultatą. Tai pakeistų visą interneto naršymo koncepciją.
Be to, partnerystė su „Apple“ (integravimas į „Siri“ ir operacines sistemas) rodo, kad „OpenAI“ technologija taps nematoma infrastruktūra – ji bus visur, net jei mes to nepastebėsime.
Apibendrinant, „OpenAI“ yra daugiau nei kompanija. Tai reiškinys, verčiantis mus permąstyti, ką reiškia būti žmogumi, kūrėju ir mąstytoju. Ar jie yra Prometėjas, atnešęs ugnį, ar Pandoros skrynia – parodys laikas. Tačiau viena aišku: grįžti atgal jau nebeįmanoma, o ateitis rašoma nebe tik žmogaus rankomis.





