technologické firmy zvyčajne vyvolávajú rozruch okolo produktov, ktoré sa chystajú uviesť na trh. Americké laboratórium umelej inteligencie Anthropic však vzbudilo nielen pozornosť, ale aj nemalé obavy okolo niečoho, čo sprístupniť neplánuje. Spoločnosť 7. apríla oznámila, že nový model umelej inteligencie s názvom Mythos nebude dostupný širokej verejnosti. Namiesto toho bude prístup k nemu prísne kontrolovaný prostredníctvom iniciatívy Project Glasswing (projekt má za cieľ zabezpečiť prísne kontrolovaný prístup k modelu Mythos s cieľom využiť jeho schopnosti výhradne na posilnenie kybernetickej bezpečnosti, pozn. red.). Medzi dvanásť zakladajúcich členov tejto iniciatívy patria aj Apple, Google a Nvidia.
Problémom nie je, že by bol Mythos chybný alebo nespoľahlivý. Údajne funguje tak dobre, že jeho uvoľnenie by ohrozilo celosvetovú digitálnu infraštruktúru. Podľa spoločnosti Anthropic tento model prekonal „všetkých okrem najskúsenejších odborníkov“, pokiaľ ide o vyhľadávanie a zneužitie bezpečnostných dier vo všetkom od populárnych operačných systémov až po kryptografický softvér, ktorý zabezpečuje elektronický obchod a finančné siete. A tieto nedostatky dokáže nájsť s minimálnou ľudskou pomocou. O pár dní neskôr aj spoločnosť OpenAI, konkurent Anthropicu, predstavila uzavretú verziu svojho vlastného modelu prispôsobeného aj na hackovanie s názvom GPT 5.4 Cyber.
Svet tzv. „vibe hackingu“, v ktorom aj amatéri môžu využívať modely umelej inteligencie na vyhľadávanie chýb v softvéroch a možno dokonca vytvárať „exploity“ (kódy či sekvencie príkazov vytvorené s cieľom zneužiť objavené bezpečnostné trhliny v softvéroch, pozn. red.) na ich znefunkčnenie, vydieranie alebo dokonca diaľkové ovládanie, pôsobí desivo. Krátko po oznámení spoločnosti Anthropic zorganizoval americký minister financií Scott Bessent stretnutie s vedením bánk, aby prediskutovali, aký vplyv by mohli mať hackerské útoky s využitím AI na ich podniky. Britské finančné regulačné orgány zorganizovali podobné stretnutie o niekoľko dní neskôr. Samotní odborníci na bezpečnosť sú však, zdá sa, mierne optimistickejší. „Myslím si, že v krátkodobom horizonte to bude chaos,“ hovorí Bruce Schneier, americký expert na počítačovú bezpečnosť. „Avšak z dlhodobého hľadiska to napokon obrane pred útokmi pomôže.“
Keďže Anthropic zverejnil o modeli Mythos len minimum informácií, je ťažké posúdiť, či ide o skutočne prelomovú technológiu alebo len o postupné vylepšenie tej starej. Testy britskej vládnej agentúry AI Security Institute ukázali, že Mythos dosahoval v relatívne jednoduchých testoch kybernetickej bezpečnosti podobné výsledky ako ostatné modely, ale výrazne viedol v náročnejších testoch, ktoré vyžadujú, aby model vykonal desiatky krokov, než úspešne prevezme kontrolu nad cieľovým zariadením (pozri graf).
Výskumníci spoločnosti Anthropic sa zamerali najmä na schopnosť Mythosu odhaľovať chyby, ktoré by hackeri mohli využiť na útok alebo na prevzatie kontroly nad inými počítačmi. Hľadali konkrétne doteraz neobjavené chyby (v odbornom žargóne známe ako „zero-day“). Nájsť ich by ukázalo, že model skutočne hľadá nové cesty a nespolieha sa len na už známe chyby, ktoré si osvojil počas svojho tréningu.
„Zero-day chyby sa skrývajú všade,“ hovorí Jeff Williams, spoluzakladateľ softvérovej firmy Contrast Security a neziskovej organizácie Open Worldwide Application Security Project Foundation, ktorá sa venuje zlepšovaniu bezpečnosti softvéru. Hoci spoločnosť Anthropic uvádza, že Mythos odhalil tisíce chýb s vysokou alebo kritickou závažnosťou, spoločnosť Anthropic väčšinu z nich drží v tajnosti, kým nebudú opravené. Spoločnosť však zverejnila podrobnosti o niektorých z nich vrátane jednej v operačnom systéme FreeBSD (operačný systém používaný v serveroch, sieťových prvkoch či úložiskách, pozn, red.), ďalšej v knižnici kódov na spracovanie videa a zvuku FFmpeg a tretej, ktorá zostáva neopravená, v softvéri, ktorý je kľúčový pre cloudové riešenia (poskytovanie výpočtových služieb, od serverov a dátových úložísk až po sieťové prvky a analytický softvér, na diaľku prostredníctvom internetu, pozn. red.).
Mnohé z chýb, ktoré Anthropic nahlásil, síce nie sú triviálne, ostávajú však logicky pochopiteľné. Ide o typy chýb, ktoré by mohol nájsť aj človek, a zdá sa, že ide o problémy, ktoré by mohli odhaliť aj iné modely umelej inteligencie. V blogu uverejnenom krátko po oznámení spoločnosti Anthropic, Stanislav Fort, zakladateľ spoločnosti AISLE, ktorá sa zameriava na kyberbezpečnosť s využitím umelej inteligencie, opísal použitie niekoľkých menších, starších modelov na nájdenie tej istej chyby v systéme FreeBSD. Fort, ktorý sa opiera o skúsenosti svojej firmy s využívaním AI pri hľadaní chýb, hovorí, že hranica v kybernetickej bezpečnosti poháňanej umelou inteligenciou je „nerovnomerná“ a žiaden model zatiaľ nemá jasne navrch.
Je nespochybniteľné, že najnovšie technológie sa vyvíjajú rýchlo. Ešte donedávna bolo vyhľadávanie podobných nedostatkov pomocou umelej inteligencie často spojené s falošnými poplachmi alebo bezvýznamnými výsledkami. „Jednou zo zmien, ktorú som si v posledných mesiacoch všimol, je, že mnohé z týchto hlásení o chybách generovaných umelou inteligenciou sú čoraz kvalitnejšie,“ hovorí pán Schneier. Januárová aktualizácia OpenSSL, ktorá pomáha zabezpečiť bezpečné pripojenia medzi webovými stránkami, opravila desiatky bezpečnostných chýb, ktoré odhalili modely umelej inteligencie používané firmou Anthtropic. V marci spoločnosť sama oznámila, že staršia verzia Clauda, ktorá predchádzala verzii Mythos, našla takmer pätinu všetkých chýb s vysokou závažnosťou, ktoré boli v roku 2025 opravené vo webovom prehliadači Firefox.
Ako rastie sila modelov umelej inteligencie, a tým aj schopnosť odhaľovať chyby, stáva sa podľa Schneiera čoraz dôležitejšou otázka, či útočníci dokážu tieto zraniteľnosti zneužiť rýchlejšie, než ich obrancovia stihnú opraviť. Tu prichádza na scénu projekt Glasswing. Spoločnosť Anthropic uvádza, že ho rozširuje o ďalších 40 organizácií z oblasti digitálnej infraštruktúry, aby mohli pomocou Mythosu posilniť bezpečnosť softvéru, na ktorom funguje internet. Spoločnosť Anthropic dúfa, že poskytnutím prístupu teraz, skôr ako sa podobne výkonné modely stanú široko dostupnými, im poskytne čas na nájdenie a opravu čo najväčšieho počtu chýb.
Výskumníci, s ktorými The Economist hovoril, sa zhodli na tom, že z dlhodobého hľadiska by hacking s využitím umelej inteligencie pravdepodobne viac pomohol defenzíve ako útočníkom, keďže by firmám umožnil dôkladnejšie otestovať svoj softvér pred jeho vydaním. V blízkej budúcnosti je však množstvo dôvodov na obavy. Testovanie pomocou umelej inteligencie totiž nie je lacné: spoločnosť Anthropic uvádza, že odhalenie jednej z chýb stálo ich laboratórium takmer 20-tisíc dolárov v podobe tokenov (V kontexte jazykových modelov predstavuje token základnú jednotku textu, teda slovo alebo jeho časť, ktorú umelá inteligencia spracúva a na základe ktorej si technologické firmy účtujú poplatky za využitie modelov, pozn. red.). Pre softvér, ako je Linux, skupinu široko používaných operačných systémov, ktoré sú aspoň čiastočne udržiavané dobrovoľníkmi, by to bola vysoká cena. A veľká časť kódu po celom svete, bežiaceho na domácich routeroch či inteligentných zariadeniach, ako sú televízory alebo chladničky, a priemyselných strojoch, nemá nikoho, kto by ho udržiaval. Takéto prípady by útočníkom otvorili dvere dokorán.

Economist.com, preložil Rado Macko, publikované na základe licencie. Originálny článok v angličtine nájdete na www.economist.com.