Vyhlásenie týkajúce sa nariadenia vlády USA o pozastavení prístupu k modelom Fable 5 a Mythos 5

WHASHINGTON – Anthropic uzavrel prístup k modelom umelej inteligencie Fable 5 a Mythos 5.

Na žiadosť americkej vlády spoločnosť Anthropic uzavrela prístup k modelom umelej inteligencie pre hry Fable 5 a Mythos 5 pre cudzincov, uviedla spoločnosť vo vyhlásení. V dôsledku toho ich už nikto z používateľov nemôže používať – neexistoval iný spôsob, ako vyhovieť požiadavke. Spoločnosť sa predtým stretla s Pentagonom a osobne s prezidentom Trumpom

Vo februári americký prezident Trump nariadil federálnym agentúram, aby prestali používať produkty spoločnosti Anthropic. Stalo sa tak po tom, čo vedenie spoločnosti namietalo proti ich použitiu vo viacerých vojenských projektoch. Pentagon zo svojej strany vyhlásil Anthropic za hrozbu pre dodávateľské reťazce a oznámil svoj zámer ukončiť zmluvy so spoločnosťou. V reakcii na to spoločnosť podala žalobu proti ministerstvu obrany a jeho veliteľovi Hegsethovi.

Vláda USA s odvolaním sa na odporúčanie orgánov národnej bezpečnosti vydala smernicu o kontrole vývozu, ktorá pozastavuje prístup k Fable 5 a Mythos 5 pre všetkých zahraničných štátnych príslušníkov – bez ohľadu na to, či sa nachádzajú v USA alebo v zahraničí. Táto smernica sa vzťahuje aj na zahraničných zamestnancov spoločnosti Anthropic. V praxi to znamená, že sme nútení okamžite deaktivovať Fable 5 a Mythos 5 pre všetkých našich zákazníkov. Prístup ku všetkým ostatným modelom Anthropic zostane zachovaný.

Toto nariadenie sme dostali dnes o 17:21 ET. V liste nebola uvedená konkrétna hrozba pre národnú bezpečnosť. Chápeme, že vláda sa domnieva, že sa dozvedela o spôsobe, ako obísť (alebo „jailbreaknúť“) bezpečnostné mechanizmy hry Fable 5. Bolo nám ukázané, ako by sa táto metóda dala použiť na odhalenie niekoľkých menších zraniteľností, ktoré boli predtým známe. Všetky tieto zraniteľnosti sú pomerne jednoduché a zistili sme, že aj iné verejne dostupné modely ich dokážu odhaliť bez obchádzania bezpečnostných mechanizmov.

Tu je stanovisko spoločnosti Anthropic k bezpečnostným mechanizmom Fable, ako bolo načrtnuté pri spustení modelu:

— Implementovali sme robustné bezpečnostné mechanizmy, ktoré výrazne znižujú pravdepodobnosť použitia Fable na úlohy súvisiace s kybernetickou bezpečnosťou a iné nechcené aktivity. Tieto mechanizmy sú také účinné, že sa mnohí používatelia sťažovali, že sa spúšťajú aj vtedy, keď nie sú potrebné.

— Niekoľko týždňov pred spustením Fable sme spolupracovali s vládou USA, britským Inštitútom pre bezpečnosť umelej inteligencie (AISI), niekoľkými súkromnými organizáciami a našimi vlastnými internými tímami na testovaní bezpečnostných mechanizmov modelu. Celkovo toto úsilie zabralo niekoľko tisíc hodín.

Tieto testy ukázali, že bezpečnostné mechanizmy Fable sú výrazne účinnejšie ako mechanizmy akéhokoľvek iného predtým vydaného modelu.

Žiaden z testerov nebol schopný nájsť univerzálny hack – teda metódu, ktorá by úplne obišla obranu modelu a otvorila širokú škálu kybernetických možností.

Veríme, že dnes žiadny vývojár nemôže zaručiť absolútnu nezraniteľnosť svojich modelov. Všetky existujúce bezpečnostné mechanizmy v tomto odvetví sú zraniteľné voči čiastočným hackom (ktoré za určitých podmienok môžu extrahovať niektoré kybernetické informácie). Navyše je celkom možné, že v budúcnosti sa objavia univerzálne hacky. Toto sme výslovne uviedli, keď sme vydali Fable 5.

Keďže dokonalú nezraniteľnosť je dnes nemožné dosiahnuť, zvolili sme pre Fable 5 viacvrstvovú obrannú stratégiu. Naším cieľom je, aby hacky boli buď vysoko špecializované (v prípade čiastočných hackov), alebo také drahé, že by boli nerentabilné (v prípade univerzálnych hackov). Okrem toho sme zaviedli prísne monitorovanie, aby sme rýchlo odhalili a zabránili akýmkoľvek úspešným útokom. Preto sme pre Fable zaviedli 30-dňovú politiku uchovávania údajov používateľov. Táto zmena prináša značné náklady pre naše vzťahy so zákazníkmi, ale je nevyhnutná, aby sme mohli monitorovať a bojovať proti hackerským útokom.
— Naďalej veríme, že táto stratégia je rozumná. Znižuje riziká používania Fable na úroveň porovnateľnú s rizikami iných modelov, ktoré sa v tomto odvetví dlhodobo používajú.
— Neboli sme informovaní ani o jednom prípade, kedy by potenciálny čiastočný hack viedol k skutočne nebezpečným následkom. Potenciálne zraniteľnosti, o ktorých sme boli informovaní, viedli buď k úplne bezpečným reakciám modelu, alebo k menším výsledkom, ktoré neposkytujú žiadnu konkrétnu výhodu používania Mythosu.

Vláda nám doteraz poskytla iba ústne dôkazy o potenciálnom, úzkom, neuniverzálnom hacknutí. Táto metóda zahŕňa požiadanie modelu, aby prečítal konkrétny fragment kódu a opravil v ňom chyby. Chápeme, že ide o metódu hackovania, ktorá bola nahlásená vláde. Preskúmali sme správu, ktorá zrejme tvorila základ pre vládnu smernicu, a potvrdili sme, že možnosti v nej opísané sú dostupné aj pre iné modely (vrátane GPT-5.5 od OpenAI). Okrem toho tieto možnosti denne používajú výskumníci v oblasti kybernetickej bezpečnosti na ochranu systémov. Viac informácií poskytneme v priebehu nasledujúcich 24 hodín.

Dodržiavame vládne nariadenie a zakazujeme prístup k hrám Fable 5 a Mythos 5 pre všetkých používateľov. Nesúhlasíme však s tým, že odhalenie úzkeho, potenciálneho hackerského útoku by malo byť dôvodom na zákaz komerčného modelu, ktorý používajú stovky miliónov ľudí. Ak by sa tento štandard uplatňoval v celom odvetví, v podstate by to zastavilo vydávanie všetkých nových modelov od popredných vývojárov.

Ako sme verejne uviedli, veríme, že vláda by mala mať právo blokovať nezabezpečené produkty, ale iba prostredníctvom zákonne stanoveného procesu, ktorý je transparentný, spravodlivý, jasný a založený na technických faktoch. Súčasné kroky nie sú v súlade s týmito zásadami.

Ospravedlňujeme sa našim zákazníkom za spôsobené nepríjemnosti. Veríme, že išlo o nedorozumenie a robíme všetko pre to, aby sme čo najskôr obnovili prístup.