Anthropic a anunțat cel mai puternic model AI construit vreodată. Apoi a spus că nu îl va lansa publicului. Claude Mythos e primul caz în istoria industriei în care un laborator de AI și-a ținut capodopera sub cheie din motive de securitate.
Pe 7 aprilie 2026, Anthropic a făcut ceva fără precedent: a prezentat lumii cel mai capabil model AI existent și a anunțat simultan că nu îl puteți folosi. Claude Mythos Preview — o versiune de previzualizare a modelului care ar urma să se numească comercial „Capybara”, un nivel complet nou deasupra actualului Opus — este, conform tuturor metricilor publice disponibile, cel mai avansat sistem de inteligență artificială documentat vreodată. Și e blocat.
Cum a ieșit la lumină
Povestea Mythos a început nu cu un comunicat de presă, ci cu o gafă. O eroare de configurare în sistemul de management al conținutului Anthropic a făcut ca aproape 3.000 de active nepublicate să devină accesibile public. Cercetătorii de securitate Roy Paz de la LayerX Security și Alexandre Pauwels de la Universitatea Cambridge au descoperit depozitul de date expus, care conținea un draft al unui post de blog ce descria modelul în detaliu.
Anthropic a confirmat că inginerii au finalizat antrenarea Claude Mythos și că îl testează cu clienți timpurii, adăugând că este „cel mai capabil model pe care l-am construit până acum.”
Ce poate face, concret
Cifrele sunt dezarmante. Claude Mythos Preview atinge 93,9% pe SWE-bench Verified, 77,8% pe SWE-bench Pro, 82% pe Terminal-Bench 2.0 și 97,6% pe USAMO 2026 — fiecare reprezentând un avans de două cifre față de Opus 4.6 și GPT-5.4.
Cifrele indică faptul că Claude Mythos Preview nu este doar o îmbunătățire incrementală, ci un salt generațional masiv în capacitatea AI de a interacționa cu lumea reală (codare, terminale de sistem și matematică de nivel olimpic).
Iată ce înseamnă fiecare dintre aceste scoruri și de ce sunt atât de importante:
1. SWE-bench (Verified & Pro) – „Inginerul Software Autonom”
Acesta este testul suprem pentru abilitățile de programare. Spre deosebire de testele simple unde AI-ul scrie o funcție scurtă, SWE-bench îi cere modelului să rezolve probleme reale de pe GitHub (bug-uri, cerințe de funcționalități noi) într-un depozit de cod întreg.
- 93,9% pe Verified: Înseamnă că aproape orice bug raportat într-un software verificat poate fi reparat de Mythos fără intervenție umană.
- 77,8% pe Pro: Varianta „Pro” include probleme mult mai complexe, care necesită înțelegerea arhitecturii întregului sistem.
- Concluzie: Mythos acționează ca un programator senior, nu doar ca un asistent de scriere a codului.
2. Terminal-Bench 2.0 – „Stăpânul Infrastructurii”
Acest test evaluează cât de bine poate un model AI să folosească linia de comandă (Bash/Terminal) pentru a naviga în fișiere, a configura servere sau a depana rețele.
- 82%: Este un scor uriaș. În contextul proiectului Glasswing, acest lucru înseamnă că Mythos poate „vedea” și manipula vulnerabilitățile invizibile din sistemele de operare, executând comenzi complexe pentru a trece de barierele de securitate sau pentru a petici găurile de siguranță.
3. USAMO 2026 – „Geniul Matematic”
USAMO (United States of America Mathematical Olympiad) este una dintre cele mai dificile competiții de matematică din lume.
- 97,6%: Acest scor sugerează o capacitate de raționament logic aproape perfectă. Matematica la acest nivel nu se rezolvă prin „memorare”, ci prin intuiție și pași logici extrem de riguroși. Acest raționament este cel care îi permite să „spargă” criptografia sau să găsească breșe logice în software.
De ce contează avansul de „două cifre”?
Când un model depășește concurența (Opus 4.6 sau GPT-5.4) cu peste 10-15% (două cifre) pe aceste benchmark-uri, înseamnă că am trecut de la un asistent care „ajută” la un sistem care „execută” independent.
Mythos nu mai este un chatbot care vorbește despre cod, ci un agent care operează codul și sistemele la un nivel care îi face pe predecesorii săi (GPT-5.4) să pară depășiți tehnologic.
Dar performanța la benchmark-uri e aproape banală față de ce a demonstrat modelul în practică. În câteva săptămâni, Mythos Preview a identificat mii de vulnerabilități zero-day, multe critice și greu de detectat, inclusiv în fiecare sistem de operare major și în fiecare browser web important. Unele dintre vulnerabilitățile descoperite existau nedetectate de ani buni — cea mai veche fiind un bug de 27 de ani în OpenBSD, un sistem de operare cunoscut tocmai pentru securitatea sa robustă.
Modelul funcționează agentic: lansează un container izolat, citește codul proiectului testat, formulează ipoteze despre vulnerabilități, rulează proiectul pentru a le confirma sau respinge, adaugă logică de debug dacă e necesar și produce în final fie un raport că nu există bug, fie un raport complet cu exploitul și pașii de reproducere.
Project Glasswing: apărare înainte de atac
Anthropic a anunțat Claude Mythos Preview ca parte a inițiativei Project Glasswing — un efort de a folosi modelul pentru a securiza cel mai critic software din lume și pentru a pregăti industria pentru practicile necesare să rămână în fața atacatorilor cibernetici.
Inițiativa le permite companiilor — printre care Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, Microsoft și Nvidia — să folosească Mythos Preview exclusiv pentru muncă defensivă de securitate și să împărtășească concluziile cu industria mai largă. Anthropic a alocat până la 100 de milioane de dolari în credite de utilizare pentru aceste eforturi.
Numele nu e ales întâmplător. Angajații Anthropic au ales denumirea Project Glasswing — o metaforă care aseamănă un fluture cu aripi transparente. Fluturele Glasswing (Greta oto) are aripi aproape complet transparente — nu vezi culoare, nu vezi suprafață, ci doar nervurile și conturul. Aripa pare solidă și funcțională din exterior, dar când o privești cu atenție, structura internă devine vizibilă. Analogia cu software-ul e asta: un program sau un sistem de operare pare compact și opac din exterior — utilizatorul vede interfața, nu codul. Dar vulnerabilitățile există în structura internă, exact ca nervurile fluturelui — sunt acolo tot timpul, doar că invizibile pentru ochiul obișnuit.
Ce face Mythos e tocmai asta: „vede prin aripă”. Acolo unde un auditor uman ar vedea o suprafață aparent solidă, modelul identifică nervurile — adică punctele structurale unde codul poate fi exploatat.
Iar numele proiectului completează metafora într-un mod elegant: Glasswing nu e fluturele atacator, ci fluturele care face vulnerabilitățile vizibile pentru apărători — înainte ca altcineva să le găsească primul.
De ce nu îl puteți folosi
Anthropic a ales să nu își vândă cel mai impresionant produs. Într-o industrie definită de cursa de a lansa capabilități cât mai repede posibil, această reținere este semnificativă.
Motivul e unul cât se poate de pragmatic. Documentul intern descria Mythos ca „cu mult înaintea oricărui alt model AI în capabilități cibernetice” și avertiza că „prevestește un val viitor de modele care pot exploata vulnerabilități într-un ritm ce depășește cu mult eforturile apărătorilor.”
Anthropic spune că nu intenționează să facă modelul disponibil publicului larg, dar că scopul este să învețe cum ar putea eventual să implementeze modele de clasa Mythos la scară, când vor exista măsuri de protecție noi.
Cutremurul bursier și întrebarea mai adâncă
Vestea existenței modelului a zdruncinat deja industria de securitate cibernetică. După raportul Fortune din martie, acțiunile CrowdStrike, Palo Alto Networks, Zscaler, SentinelOne, Okta, Netskope și Tenable au scăzut între 5% și 11%, pe fondul îngrijorărilor că modelele AI din ce în ce mai capabile ar putea submina cererea pentru produsele de securitate tradiționale.
Ironia e greu de ignorat: un model care poate sparge orice e folosit tocmai pentru a repara tot. Anthropic pariază că apărătorii vor ajunge la el înaintea atacatorilor — și că poate controla suficient de bine accesul pentru ca pariul să țină. Dacă are dreptate, Mythos ar putea fi primul AI care lasă internetul mai sigur decât l-a găsit. Dacă nu, tocmai am construit cel mai eficient instrument de hacking din istorie.
Publicitate și alte recomandări video