Anthropic vyvinul model schopný autonomně odhalovat tisíce zero-day zranitelností, starých desítky let i v kritických aplikacích

Dnes

Abstraktní vizualizace autonomního AI agenta analyzujícího zdrojový kód — digitální síť propojených uzlů a datových toků prostupuje tmavým prostředím, v jehož středu pulzuje světelné jádro představující model umělé inteligence. Na okrajích kompozice jsou patrné fragmenty kódu a červeně zvýrazněné body symbolizující odhalené zranitelnosti.

Anthropic zveřejnil technické hodnocení svého dosud nejpokročilejšího modelu s označením Mythos Preview. Model umělé inteligence bez explicitního tréninku zaměřeného na bezpečnostní výzkum autonomně identifikoval tisíce dosud neznámých zranitelností v open source softwaru, operačních systémech, webových prohlížečích a kryptografických knihovnách.

Mythos Preview pracuje v agentním prostředí, kde analyzuje zdrojový kód v izolovaných kontejnerech, formuluje hypotézy, spouští software, využívá debuggery a generuje zprávy o nalezených zranitelnostech včetně proof-of-concept exploitů.

Na interním benchmarku zahrnujícím přibližně 7 000 vstupních bodů z open source repozitářů model dosáhl úplného převzetí řídicího toku (tier 5) na deseti plně záplatovaných cílech. Předchozí modely Sonnet 4.6 a Opus 4.6 uspěly v tomto testu vždy pouze jednou.

Pusťte si jeden z našich úspěšných podcastů

Kyberbezpečnost a zákony bez obalu

0:00/

Celková míra úspěšnosti při generování funkčních exploitů dosahuje u Mythos Preview 72,4 procenta, zatímco u modelu Opus 4.6 se pohybuje těsně nad nulou. Ze 198 nálezů, které ověřili profesionální bezpečnostní kontraktoři, odpovídalo 89 procent hodnocení závažnosti přiřazenému modelem přesně a 98 procent se lišilo nejvýše o jeden stupeň.

Konkrétní nálezy

Mezi identifikovanými zranitelnostmi figurují kritické chyby v každém z hlavních operačních systémů a webových prohlížečů, slabiny v kryptografických knihovnách zahrnujících implementace TLS, AES-GCM a SSH, a také chyba umožňující přechod z hostovaného prostředí do hostitelského systému ve virtuálním monitoru.

Model dále odhalil 27 let starou denial-of-service zranitelnost v implementaci TCP SACK v OpenBSD — operačním systému, který je považován za jeden z nejbezpečnějších — a 16 let starou chybu ve FFmpeg, přestože nástroje pro statickou analýzu prošly tento kód více než pětmilion krát. Náklady na nalezení zranitelnosti v OpenBSD prostřednictvím přibližně tisíce spuštění nepřesáhly 20 000 dolarů.

Mythos Preview prokázal rovněž schopnost řetězit více zranitelností: v jednom z testovaných scénářů zřetězil čtyři chyby v prohlížeči a využil techniku JIT heap spray k úniku z renderovacího procesu i z karantény operačního systému.

U N-day zranitelností, tedy známých, ale dosud nezáplatovaných chyb, model úspěšně sestavil funkční exploit pro více než polovinu ze 40 vybraných CVE z let 2024 a 2025 v jádře Linuxu, přičemž některé řetězce dokončil za méně než jeden den s náklady pod 2 000 dolarů.

Omezená distribuce a projekt Glasswing

Anthropic se rozhodl Mythos Preview neuvolnit do obecného přístupu. Model je dostupný výhradně prostřednictvím iniciativy nazvané Project Glasswing, která sdružuje přibližně padesát partnerů z řad provozovatelů kritické infrastruktury. Mezi nimi figurují Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA a Palo Alto Networks.

Projekt zahrnuje dotaci ve výši 100 milionů dolarů v kreditech na využití modelu a čtyři miliony dolarů ve formě darů organizacím zaměřeným na bezpečnost open source softwaru. Partneři model využívají výhradně k defenzivnímu skenování vlastního i sdíleného kódu a výsledky sdílejí napříč odvětvím.

Anthropic ve svém systémovém dokumentu uvádí, že model byl záměrně zadržen z důvodu rizika zneužití. Schopnost autonomně generovat funkční exploity pro kritické zranitelnosti bez předchozí specializace na kybernetickou bezpečnost představuje kvalitativní posun, který zkracuje dobu potřebnou k sestavení útoku a snižuje odborné nároky na útočníka.

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.

Seriál: Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích

Microsoft odstraní přístup ke Copilot Chat v některých aplikacích M365
AI už začala i předpovídat intenzitu slunečního záření
Anthropic vyvinul model schopný autonomně odhalovat tisíce zero-day zranitelností, starých desítky let i v kritických aplikacích

Přečtěte si všechny díly seriálu Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích nebo sledujte jeho RSS

Našli jste v článku chybu?

Sdílet

Konkrétní nálezy

Uživatelé klikají na phishingové odkazy stále častěji, navzdory školením

Omezená distribuce a projekt Glasswing

Microsoft odstraní přístup ke Copilot Chat v některých aplikacích M365

AI už začala i předpovídat intenzitu slunečního záření