predstavme si inteligentného a vzdelaného človeka, ktorý sa na začiatku 20. storočia prevezie v jednom z prvých Fordových automobilov a na základe tejto skúsenosti začne uvažovať o budúcnosti sveta. Aj bez jediného pohľadu pod kapotu a s nulovým porozumením základným princípom „samohybu“ môže správne predpovedať niektoré aspekty budúcnosti – napríklad obrovský komerčný potenciál tohto vynálezu a dramatické zmeny v doprave, ktoré veľmi výrazne ovplyvnia mnohé ďalšie oblasti, napríklad vojenskú logistiku. Ak sa však bez pochopenia ich skutočnej konštrukcie pustí do úvah o budúcnosti samotných automobilov, vydáva sa na dosť tenký ľad.
Predstavme si ďalej, že tento človek by začal starú fordku oslovovať menom Zuzanka, tak ako to v prípade umelej inteligencie ChatGPT urobil Laco Kováč v prvom augustovom vydaní .týždňa. Alebo že by podobne ako Francis Fukuyama v článku, ktorý je súčasťou tejto témy, po niekoľkých jazdách skonštatoval, že auto sa nemôže zas až tak veľmi líšiť od jeho psa. Ako by sme vnímali ďalšie úvahy takéhoto človeka na automobilovú tému?
Na priateľskom pomenovaní auta alebo jeho porovnaní so psom nie je nič zlé. Je to celkom milé a svedčí to o sympatickom vzťahu daného človeka k autám. Ale mali by sme si byť vedomí jednoduchej skutočnosti, že takéto oslovenie alebo porovnanie so živou bytosťou môže zviesť naše úvahy pomerne nerozumným smerom. Nemusí sa to stať, ale určité nebezpečenstvo pádu do emocionálnej pasce tu existuje.
Ak sa pozrieme na automobil spredu, vidíme reflektory, ktoré nám pripadajú ako oči. Je to úplne prirodzené – časť nášho mozgu zodpovedná za rozoznávanie tvárí to ani nemôže vyhodnotiť inak. A nielen to. Náš mozog často vyhodnotí celú prednú masku auta ako tvár s nejakým konkrétnym výrazom. Aj to je úplne prirodzené a automaticky to v nás vytvára nejaký pocit, ktorý sa môže stať základom nášho vzťahu k tomu autu. Ani na tom nie je nič zlé, ale nie je veľmi rozumné zakladať na tom nejaké hlbšie úvahy o autách. Ak niečo také robíme, znamená to len toľko, že sme spadli do pasce, ktorú nám nepripravil automobil, ale len a len my sami.
V prípade umelej inteligencie je táto „samopasca“ ešte oveľa zradnejšia. Ako príklad nám môže poslúžiť ľubovoľná konverzácia s ChatGPT (v skutočnosti obidvaja autori tohto textu používajú v bežnej reči formuláciu „s Chatom GPT“, kde sa Chat chápe minimálne z gramatického hľadiska ako krstné meno a GPT ako priezvisko – čo nie je až také veľmi vzdialené od Zuzanky). Uvedomovať si pri takejto konverzácii, že sa vôbec, ale vôbec nerozprávame s inteligentnou bytosťou, vyžaduje nemalé mentálne úsilie. A nestačí si to uvedomiť, treba si to opakovať – inak skončíme v tej pasci.
No dobre, ale je to naozaj nebezpečná pasca, ktorej sa treba vyhnúť? To je zaujímavá otázka a kým sa pokúsime o odpoveď, asi nebude na škodu povedať si, ako súčasná umelá inteligencia vlastne funguje.
čo v ChatGPT znamená to G
Ak chceme porozumieť, ako pracuje súčasná umelá inteligencia, je dobré zobrať si nejaký konkrétny príklad. Väčšina ľudí má priamu skúsenosť s ChatGPT, takže rozumné asi bude zobrať si práve tento príklad. Čo v názve tejto umelej inteligencie znamenajú písmená G, P, T a čo znamená slovo Chat? Tie písmená sú skratkou slovného spojenia Generative Pre-trained Transformer, k tomu Chat sa dostaneme o chvíľu.
Písmeno G je tam za slovo Generative, čím sa myslí generovanie, čiže tvorba nejakého výstupu – v tomto prípade textového. Výstup sa generuje na základe vstupného textu, a to postupným pridávaním jednotlivých slov. ChatGPT negeneruje naraz celú súvislú odpoveď, negeneruje dokonca ani celé vety, ktoré vyjadrujú ucelené myšlienky. Pridáva postupne jednotlivé slová, pričom keď pridáva prvé, vôbec nevie, čo pridá ako druhé, keď pridáva druhé, vôbec nevie, čo pridá ako tretie, a tak ďalej.
ILUSTRÁCIA CHATGPT OPENAI 2025Ilustrácia ChatGPT k časti textu o význame písmena G (Generative). ChatGPT pridáva postupne jednotlivé slová, pričom keď pridáva prvé, vôbec nevie, čo pridá ako druhé, a tak ďalej.
Prvá dôležitá vec, ktorú stojí za to explicitne si uvedomiť a zapamätať, je toto: ChatGPT si nevytvára nejaké myšlienky, názory či postoje, ktoré by potom komunikoval prostredníctvom textu. Vytvára len ten text, slovo po slove, pričom tým slovám nerozumie. Vždy pritom pridáva slovo, ktoré považuje na základe predchádzajúceho textu za najpravdepodobnejšie (presnejšie povedané, jedno zo slov, pre ktoré mu vyšli pravdepodobnosti najvyššie, ale púšťať sa až do takých detailov nebudeme).
Čo to znamená, že pridáva najpravdepodobnejšie slovo? Skúsme príklad. Aké slovo nasleduje za slovami „aký otec, taký…“? Všetci z logiky veci vieme, že tam patrí slovo syn. Ale keby sme aj logike veci nerozumeli a mali by sme bohatú skúsenosť so slovenčinou, vedeli by sme, že najpravdepodobnejšie je slovo syn.
Aké slovo nasleduje za slovami „aká matka, taká…“? V iných jazykoch je to väčšinou slovo dcéra, v slovenčine je to slovo Katka. Prečo Katka? Nuž preto, lebo v slovenských textoch sa za danými tromi slovami oveľa častejšie ako dcéra vyskytuje Katka. Tentoraz je skúsenosť s jazykom dôležitejšia ako logika.
Ešte zaujímavejší príklad predstavujú slová „Lorem ipsum dolor…“ Nasleduje „sit“ a potom „amet“, ako asi vedia všetci používatelia textových editorov. Tento príklad je zaujímavý preto, lebo uvedené slová nič neznamenajú. Podobajú sa na latinčinu, ale nie je to latinčina. Dve slová, ktoré nasledujú za prvými tromi, sme teda vygenerovali bez porozumenia zmyslu ktoréhokoľvek z nich. A presne takto funguje ChatGPT. Negeneruje odpovede na základe porozumenia otázke. Generuje jedno po druhom ďalšie a ďalšie slová len na základe pravdepodobnosti, bez chápania ich obsahu.
Odkiaľ ChatGPT vie, aká je pravdepodobnosť jednotlivých slov? Vie to na základe toho P, ktoré je prvým písmenom slova Pre-trained, čiže predtrénovaný. To znamená, že ešte predtým, než sa pustí do konverzácie s ľuďmi, prejde určitým tréningom. Akým tréningom, čo sa pri ňom učí a ako to potom používa? To všetko je schované v písmene P.
čo v ChatGPT znamená to P
ChatGPT patrí do rodiny takzvaných neurónových sietí. Neurónové siete sú počítačové programy, ktoré na základe určitých vstupov vytvárajú výstupy, pričom v podstate jediné, čo vedia robiť medzi vstupom a výstupom, je násobiť a sčítavať čísla. Na začiatku si nejakým spôsobom prevedú vstupy (napríklad slová) na čísla, na konci prevedú čísla na výstupy (opäť to môžu byť slová) a medzitým len násobia a sčítavajú.
Inšpiráciou pre počítačové neurónové siete bol ľudský mozog, ktorý pozostáva z veľkého množstva navzájom prepojených neurónov. Každý neurón prijíma signály od iných neurónov, pričom každý signál je ovplyvnený silou (váhou) daného spojenia a všetky tieto signály sa vnútri neurónu skladajú. Ak výsledok presiahne určitý prah, neurón vyšle vlastný impulz ďalej. Čo sa týka skutočného fungovania mozgu, ide, samozrejme, o veľmi zjednodušenú predstavu. Táto predstava sa však dá celkom jednoducho implementovať do počítačov – ovplyvnenie signálu váhou spojenia modelujeme násobením intenzity signálu nejakým parametrom charakterizujúcim dané spojenie, skladanie signálov v neuróne modelujeme ich sčítavaním. Takáto počítačová implementácia zjednodušenej predstavy o mozgu sa ukázala byť mimoriadne účinná pri riešení pomerne širokého spektra úloh.
Druhá dôležitá vec, ktorú stojí za to explicitne si uvedomiť a zapamätať, je toto: Podstatná časť práce ChatGPT je násobenie a sčítavanie čísiel (matematici tomu hovoria násobenie matíc) dopredu presne stanoveným spôsobom. Týmto postupom vygeneruje pre takmer všetky slová takmer všetkých jazykov sveta pravdepodobnosť toho, že sa dané slovo vyskytne v spracovávanom texte na nasledujúcom mieste. A potom na to miesto pridá jedno zo slov, pre ktoré mu vyšli najvyššie pravdepodobnosti.
Jedným z pomerne rozšírených mýtov týkajúcich sa neurónových sietí je tvrdenie, že fungujú inak ako „klasické programy“. V skutočnosti fungujú úplne rovnako – z daného vstupu vyrobia dopredu presne definovanými výpočtami konkrétny výstup. Významný rozdiel medzi neurónovými sieťami a „klasickými programami“ nespočíva v tom, ako pracujú. Spočíva v tom, ako ich vytvárame.
ILUSTRÁCIA CHATGPT OPENAI 2025Ilustrácia ChatGPT k časti o P (Pre-trained). Inšpiráciou pre počítačové neurónové siete bol ľudský mozog.
Čím je definovaná konkrétna neurónová sieť? Počtom neurónov (čiže počtom miest, v ktorých sa signály sčítavajú), konkrétnymi prepojeniami (čiže miestami, v ktorých sa signály násobia parametrami) a hodnotami tých parametrov. Počet neurónov a konkrétne prepojenia tvoria to, čomu sa hovorí architektúra neurónovej siete – k tej sa dostaneme, keď budeme hovoriť o písmene T. Pod písmeno P patria hodnoty parametrov (čiže váh jednotlivých prepojení), ktoré sa nastavujú v procese učenia (tréningu). Toto je ten bod, v ktorom sa programovanie neurónových sietí výrazne líši od klasického programovania.
Ako sa neurónová sieť učí, respektíve trénuje? Predstavme si, že máme sieť s nejakou konkrétnou architektúrou, ktorej dávame na vstup trojicu slov a na výstupe chceme pravdepodobnosti štvrtého slova. Na začiatku tréningu sú parametre siete, čiže váhy jednotlivých prepojení, nastavené úplne náhodne. Takáto sieť nám pre vstupy „aký otec, taký“, „aká matka, taká“ a „lorem ipsum dolor“ takmer určite nedá na výstupe vysoké pravdepodobnosti slov „syn“, „Katka“ a „sit“. To, ako veľmi sa jej výstup líši od správneho výstupu, vieme charakterizovať nejakým presne definovaným číslom, ktoré nazývame chybou. Proces učenia teraz spočíva v tom, že sieť necháme postupne meniť svoje parametre tak, aby sa chyba zmenšovala.
Po každej zmene parametrov si sieť znovu vezme vstupné dáta, vypočíta nové výstupy a porovná ich so správnymi odpoveďami. Tým zistí, kde sa mýlila a o koľko, na základe čoho opäť jemne zmení parametre – tak, aby sa chyba zmenšila (poznámka: parametre sa menia minimalizáciou chyby, metódou gradient descent, detaily presahujú rámec tohto článku). Popísaný postup – prehnať dáta sieťou, zmerať chybu a mierne upraviť parametre – sa opakuje mnohokrát, vždy s trochu lepšími parametrami než predtým. Po dostatočnom počte takýchto „učení“ si sieť sama nájde také nastavenie parametrov, ktoré jej umožní robiť správne predpovede pre väčšinu prípadov, aj pre nové dáta, ktoré predtým nikdy nevidela.
Tretia dôležitá vec, ktorú stojí za to explicitne si uvedomiť a zapamätať, je toto: Pod učením alebo tréningom neurónovej siete rozumieme postupnú zmenu nejakých čísiel. Neurónovú sieť neučíme, že jablko nepadá ďaleko od stromu ani nič podobné. Len ju necháme meniť vlastné parametre.
No dobre, ale prečo to robíme takto komplikovane, keď môžeme jednoducho počítaču prikázať, aby ku každej uvedenej trojici slov priradil správne štvrté slovo? Pretože takáto jednoduchá metóda sa stáva čoraz komplikovanejšou a funguje čoraz horšie, ak zväčšujeme počet slov a používame bohatší jazyk. Neurónové siete zvládajú nárast zložitosti oveľa lepšie. A zvládajú ho dokonca až tak dobre, že na ich tréning môžeme použiť obrovské množstvo textov dostupných na internete. Práve tak sa trénuje ChatGPT.
čo v ChatGPT znamená to T
Písmeno T je prvým písmenom slova Transformer, ktoré označuje jeden špecifický typ architektúry neurónových sietí. Túto architektúru navrhlo osem ľudí pracujúcich pre Google v krátkom článku s chytľavým názvom Attention Is All You Need (Pozornosť je všetko, čo potrebuješ). Článok má 9 strán a dnes už viac než 170 000 citácií.
Google je americká firma, šesť z ôsmich autorov sa pritom nenarodilo v USA a ďalší sa tam síce narodil, ale nemeckým rodičom. Ktovie, čo na to hovoria Trump s Vanceom. Názov článku je zaujímavou slovnou hračkou. Attention v ňom totiž neznamená pozornosť v bežnom zmysle slova, ale znamená určitú konkrétnu matematickú operáciu (definovanú opäť cez súčty súčinov nejakých čísiel). Táto operácia sa používala v rámci strojového učenia už niekoľko rokov a s pozornosťou mala spoločné len toľko, že v nejakom zmysle zodpovedala sústredeniu sa na relatívnu dôležitosť jednotlivých slov či čísiel v rámci určitej ich sekvencie. Formálne definovaná attention teda do istej miery simulovala pozornosť v bežnom slova zmysle. Ale rozhodne ju netreba chápať doslovne.
ILUSTRÁCIA CHATGPT OPENAI 2025Ilustrácia ChatGPT k časti o T. Transformer označuje jeden špecifický typ architektúry neurónových sietí.
Neurónové siete vedeli generovať sofistikované texty už pred rokom 2017. Na to im stačili písmená G a P. Základnou a veľmi dôležitou prednosťou novej transformerovej architektúry, čiže písmena T, bolo rýchlejšie počítanie (poznámka pre znalcov: vďaka väčšej paralelizácii). Dôsledkom bolo oveľa rýchlejšie učenie pomocou oveľa väčších súborov dát.
Štvrtá dôležitá vec, ktorú stojí za to explicitne si uvedomiť a zapamätať, je toto: Dnešné systémy umelej inteligencie sú založené na objave z roku 2017, ktorý umožnil oveľa efektívnejšie učenie. Pričom to, čo nazývame učením, je stále len násobenie a sčítavanie čísiel.
čo v ChatGPT znamená to Chat
Jednou z vecí, na ktoré sa dala nová architektúra neurónových sietí využiť, boli práve systémy generovania neuveriteľne ľudsky pôsobiacich odpovedí na prakticky ľubovoľné otázky. Aby sa z GPT stal fantastický konverzačný nástroj ChatGPT, bolo treba pridať už len to Chat. Inými slovami, bolo treba vytvoriť GPT schopný debatovať a držať sa pritom v líniách konštruktívnej konverzácie. Toto sa vyriešilo ďalším kolom tréningu – tentokrát nie s náhodnými textami z internetu, ale so špeciálne pripravenými ukážkami prijateľnej konverzácie medzi dvoma ľuďmi. Tréning bol úspešný, a tak pribudlo k písmenám GPT anglické slovíčko chat, ktoré znamená priateľskú debatu.
To však vôbec neznamená, že ChatGPT je naozaj priateľský. Znamená to len toľko, že parametre GPT boli dodatočným tréningom mierne upravené na také hodnoty, aby pri predpovedaní ďalšieho slova v texte vychádzala vyššia pravdepodobnosť slovám znejúcim priateľsky, povzbudivo a trpezlivo.
A to ešte nebolo všetko, ChatGPT dostal aj ďalšie schopnosti. Podstatu fungovania nijako nemenili, ale výsledný dojem výrazne vylepšovali. Jedným z tých vylepšení je takzvaný system prompt. Aby bol výsledok čo najviac v súlade s tým, čo si tvorcovia predstavujú pod slušným rozhovorom, dostane ChatGPT na začiatku každej konverzácie kúsok textu, ktorému sa hovorí system prompt a ktorý užívateľ nevidí. Tento text obsahuje akýsi počiatočný kontext, mohol by začínať napríklad takto: „Si ChatGPT, jazykový model od spoločnosti OpenAI. Tvojou úlohou je odpovedať na otázky…“ Znova je však dôležité uvedomiť si, že nejde o inštrukcie pre nejakú inteligentnú bytosť. Neurónovej sieti tým nehovoríme, ako sa má správať. Je to jednoducho len text, ku ktorému sa pridá naša prvá otázka, potom sa slovo po slove pridá vygenerovaná odpoveď, potom ďalšia naša otázka a tak ďalej. Úvod slúži len nato, aby neurónová sieť prisúdila vyššiu pravdepodobnosť tým slovám, ktoré by prirodzene nasledovali po takomto úvode.
ILUSTRÁCIA CHATGPT OPENAI 2025Ilustrácia ChatGPT k časti o slove Chat. Hoci ChatGPT pôsobí ako inteligentná a extrémne schopná bytosť, stále ide len o násobenia a sčítania. Vytvára len text, slovo po slove, pričom tým slovám nerozumie.
Ďalším vylepšením je takzvaný reinforcement learning from human feedback. Ten spočíva v ďalšom kole tréningu, tentoraz s ľudskými zásahmi. Výsledkom je opäť len zmena nejakých parametrov neurónovej siete. Okrem toho je neurónová sieť GPT obohatená aj o časť určenú na rozoznávanie obrázkov. Preto s ním môžeme komunikovať nielen textovo.
Obrázky vie ChatGPT nielen rozoznávať, ale aj vytvárať. To však nerobí on sám, nato si volá nejaké iné programy. Ako si ich volá? Tak, že si do zoznamu slov na výstupe pridá nejaké špecifické slová. Keď pre daný vstup priradí neurónová sieť najvyššiu pravdepodobnosť takémuto špecifickému slovu, nepridá ho k textu, ale namiesto toho vykoná nejakú inú činnosť (v realite je to o trošku zložitejšie, ale rozdiel nie je pre nás podstatný). Napríklad zavolá program na tvorbu obrázkov. Alebo zavolá Python, ak potrebuje niečo vypočítať. Alebo sa pozrie na internet. Alebo si z pamäťového média vytiahne obsah našich predchádzajúcich konverzácií.
Práve posledná menovaná schopnosť v nás ľahko môže vyvolať pocit, že táto neurónová sieť sa učí (čiže trénuje) aj počas konverzácie. Tak to však nie je. Pri používaní ChatGPT už nedochádza k nijakým zmenám jeho parametrov. Prebiehajúca konverzácia len postupne predlžuje text, s ktorým ChatGPT pracuje, prípadne volá nejaké externé programy. Bez toho, že by sa samotný ChatGPT akokoľvek menil.
Vďaka všetkým týmto a mnohým ďalším vylepšeniam na nás ChatGPT pôsobí ako inteligentná a extrémne schopná bytosť. V skutočnosti je to však len o všelijaké dobroty obohatená neurónová sieť, ktorej základný mechanizmus fungovania sa nijako nezmenil. Stále ide len o násobenia a sčítania.
aké z toho plynie ponaučenie
Z vyššie uvedeného opisu fungovania umelej inteligencie ChatGPT vyplýva niekoľko vecí. Napríklad to, že Francis Fukuyama sa takmer určite mýli, keď tvrdí, že ChatGPT nemôže byť až tak ďaleko za jeho psom, o ktorom je presvedčený, že má vedomie a cíti niečo ako lásku. ChatGPT nemá vedomie a nepociťuje vôbec nič. Vieme to, pretože presne – krok za krokom – rozumieme tomu, ako pracuje.
Ladislav Kováč sa nedopúšťa nijakej chyby, keď hovorí tejto umelej inteligencii Zuzanka. Mýlil by sa však, ak by považoval Zuzankine odpovede za vyjadrenie jej názoru. Zuzanka nemá nijaké názory. Vieme to, pretože presne – krok za krokom – rozumieme tomu, ako Zuzanka generuje text, slovo po slove na základe násobenia a sčítavania čísiel.
Tí z nás, ktorí sa obávajú možnosti, že by dnešná umelá inteligencia mohla mať a presadzovať záujmy, ktoré nie sú v súlade so záujmami ľudstva, sa mýlia. ChatGPT a podobné systémy nemajú ako mať nejaké záujmy, jednoducho na to nemajú priestor. ChatGPT podáva úžasne pôsobivé výkony a je ľahké ho preceňovať. Ale obavy vznikajúce z takéhoto preceňovania sú zatiaľ zbytočné.
Samozrejme, môže vzniknúť otázka, či aj systém bez záujmov, pocitov, názorov a vedomia nemôže spôsobiť veľké škody, ak by ho ľudia použili nevhodne alebo mu zverili prílišnú autonómiu. Avšak takéto obavy nie sú nič nové — poznáme ich už z histórie pri jadrových či chemických zbraniach. Ani tie nekonajú samy od seba, neplánujú a nemajú ciele; nebezpečenstvo z nich plynie výlučne z ľudí, ktorí ich môžu použiť. Rovnako aj pri umelej inteligencii je rozumnejšie obávať sa nezodpovedného alebo zlomyseľného ľudského konania než „vôle“ samotného systému.
Súčasná umelá inteligencia nie je takým prevratným vynálezom, ako by sa mohlo na prvý pohľad zdať. Skutočne prevratným vynálezom boli integrované obvody a počítače, možno aj internet. Zdá sa nám však, že dnešný módny hit, akokoľvek skvelý, nedosahuje ich význam. Autá, s ktorými sme tento článok začali, sú na tom rovnako. Skutočne prevratnými vynálezmi boli koleso a voz so záprahom. Autá boli významným krokom na ceste otvorenej kolesom, ale význam kolesa môžu dosiahnuť len ťažko. Napriek tomu, že sú nesmierne užitočné, občas nebezpečné, často až smrteľne. S umelou inteligenciou to môže byť podobne. Ale nato, aby nám chcela z vlastnej vôle nejako škodiť, by sa musela v porovnaní s tou dnešnou ešte veľmi zmeniť.