Anthropic vyvinul model schopný autonomně odhalovat tisíce zero-day zranitelností, starých desítky let i v kritických aplikacích

Sdílet

Abstraktní vizualizace autonomního AI agenta analyzujícího zdrojový kód — digitální síť propojených uzlů a datových toků prostupuje tmavým prostředím, v jehož středu pulzuje světelné jádro představující model umělé inteligence. Na okrajích kompozice jsou patrné fragmenty kódu a červeně zvýrazněné body symbolizující odhalené zranitelnosti.
Autor: Radan Dolejš s podporou AI
Anthropic zveřejnil technické hodnocení svého dosud nejpokročilejšího modelu s označením Mythos Preview. Model umělé inteligence bez explicitního tréninku zaměřeného na bezpečnostní výzkum autonomně identifikoval tisíce dosud neznámých zranitelností v open source softwaru, operačních systémech, webových prohlížečích a kryptografických knihovnách.

Mythos Preview pracuje v agentním prostředí, kde analyzuje zdrojový kód v izolovaných kontejnerech, formuluje hypotézy, spouští software, využívá debuggery a generuje zprávy o nalezených zranitelnostech včetně proof-of-concept exploitů. 

Na interním benchmarku zahrnujícím přibližně 7 000 vstupních bodů z open source repozitářů model dosáhl úplného převzetí řídicího toku (tier 5) na deseti plně záplatovaných cílech. Předchozí modely Sonnet 4.6 a Opus 4.6 uspěly v tomto testu vždy pouze jednou.

Pusťte si jeden z našich úspěšných podcastů
Kyberbezpečnost a zákony bez obalu
Kyberbezpečnost a zákony bez obalu
0:00/

Celková míra úspěšnosti při generování funkčních exploitů dosahuje u Mythos Preview 72,4 procenta, zatímco u modelu Opus 4.6 se pohybuje těsně nad nulou. Ze 198 nálezů, které ověřili profesionální bezpečnostní kontraktoři, odpovídalo 89 procent hodnocení závažnosti přiřazenému modelem přesně a 98 procent se lišilo nejvýše o jeden stupeň.

Konkrétní nálezy

Mezi identifikovanými zranitelnostmi figurují kritické chyby v každém z hlavních operačních systémů a webových prohlížečů, slabiny v kryptografických knihovnách zahrnujících implementace TLS, AES-GCM a SSH, a také chyba umožňující přechod z hostovaného prostředí do hostitelského systému ve virtuálním monitoru. 

Model dále odhalil 27 let starou denial-of-service zranitelnost v implementaci TCP SACK v OpenBSD — operačním systému, který je považován za jeden z nejbezpečnějších — a 16 let starou chybu ve FFmpeg, přestože nástroje pro statickou analýzu prošly tento kód více než pětmilion krát. Náklady na nalezení zranitelnosti v OpenBSD prostřednictvím přibližně tisíce spuštění nepřesáhly 20 000 dolarů.

Uživatelé klikají na phishingové odkazy stále častěji, navzdory školením Přečtěte si také:

Uživatelé klikají na phishingové odkazy stále častěji, navzdory školením

Mythos Preview prokázal rovněž schopnost řetězit více zranitelností: v jednom z testovaných scénářů zřetězil čtyři chyby v prohlížeči a využil techniku JIT heap spray k úniku z renderovacího procesu i z karantény operačního systému. 

U N-day zranitelností, tedy známých, ale dosud nezáplatovaných chyb, model úspěšně sestavil funkční exploit pro více než polovinu ze 40 vybraných CVE z let 2024 a 2025 v jádře Linuxu, přičemž některé řetězce dokončil za méně než jeden den s náklady pod 2 000 dolarů.

Omezená distribuce a projekt Glasswing

Anthropic se rozhodl Mythos Preview neuvolnit do obecného přístupu. Model je dostupný výhradně prostřednictvím iniciativy nazvané Project Glasswing, která sdružuje přibližně padesát partnerů z řad provozovatelů kritické infrastruktury. Mezi nimi figurují Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA a Palo Alto Networks. 

Školení Kubernetes

Projekt zahrnuje dotaci ve výši 100 milionů dolarů v kreditech na využití modelu a čtyři miliony dolarů ve formě darů organizacím zaměřeným na bezpečnost open source softwaru. Partneři model využívají výhradně k defenzivnímu skenování vlastního i sdíleného kódu a výsledky sdílejí napříč odvětvím.

Anthropic ve svém systémovém dokumentu uvádí, že model byl záměrně zadržen z důvodu rizika zneužití. Schopnost autonomně generovat funkční exploity pro kritické zranitelnosti bez předchozí specializace na kybernetickou bezpečnost představuje kvalitativní posun, který zkracuje dobu potřebnou k sestavení útoku a snižuje odborné nároky na útočníka. 

Computertrends - promo

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.