AWS re:Invent 2025: Komplexní AI platforma od čipů po produkční agenty

Sdílet

Autor: AWS
AWS na letošním re:Invent představil uzavřený AI stack, který propojuje vlastní čipy Trainium3 a Graviton5, on-premise AI Factories pro datovou suverenitu, rodinu modelů Amazon Nova 2.0 a agentní runtime AgentCore. Platforma umožňuje vývojářům budovat produkční AI agenty nad firemními daty v rámci jednotného ekosystému, řešící výkon, bezpečnost i governance – a to s až 4,4× vyšším výpočetním výkonem a 66% zlepšením přesnosti modelů.

AWS na své letošní výroční konferenci re:Invent začal skládat ucelený stack, který začíná vlastním procesorem Trainium3 a Graviton5, pokračuje přes AI Factories v datacentrech zákazníků a končí u agentního runtime AgentCore nad modely Amazon Nova.

Místo katalogu jednotlivých služeb tak vzniká konzistentní AI platforma, která má vývojářům i architektům umožnit postavit produkční agenty nad firemními daty v kratších cyklech – a zároveň řešit výkon, bezpečnost i governance v rámci jednoho ekosystému.

Na spodku celé pyramidy leží nové Trainium3 UltraServers – AI servery, kde AWS v jednom integrovaném systému kombinuje až 144 čipů Trainium3 vyrobených 3nm procesem. Podle AWS přinášejí ve srovnání s předchozí generací Trainium2 UltraServers až 4,4× vyšší výpočetní výkon a zhruba čtyřnásobnou energetickou efektivitu, což se v praxi projevuje výrazným zkrácením tréninkových oken a snížením ceny za trénink u zákazníků, kteří provozují velké jazykové nebo multimodální modely. 

Trainium3 je ale jen polovina odpovědi – AWS současně staví projekt Rainier, velké AI clustery nad těmito UltraServers, které mají poskytnout kapacitu pro náročné modely, jaké si dnes on‑prem dovolí jen minimum organizací.

V chaosu veřejných zakázek létá bilion korun, technologie to pomohou zvládnout
V chaosu veřejných zakázek létá bilion korun, technologie to pomohou zvládnout
0:00/

Paralelně se dál vyvíjí GPU větev: AWS rozšiřuje rodinu UltraServers postavených na generaci Nvidia GB300 NVL72, které míří na trénink i inference největších LLM a generativních modelů, a staví je jako protějšek Trainium3 pro zákazníky, kteří chtějí zůstat u GPU ekosystému. Nové GPU UltraServers doplňuje generace CPU Graviton5, jež cílí na „obyčejné“ workloady v EC2 s lepším poměrem cena/výkon a nižší spotřebou než x86 – architekt tak může na jedné straně konsolidovat běžné aplikace na Graviton5 a na druhé straně přesunout ušetřené prostředky do Trainium3 nebo GPU clusterů pro AI. 

Vzniká tak výpočetní pyramida, kde má každá vrstva jasnou roli: Graviton5 pro standardní aplikační park, GPU UltraServers pro špičkové AI workloady a Trainium3 s Rainierem jako nákladově efektivní workhorse pro trénink a ladění modelů.

Největší změna ale leží v tom, kde tenhle AI stack fyzicky běží. AWS AI Factories představují způsob, jak Trainium, Nvidia GPU, sítě, storage a služby jako Amazon Bedrock nebo SageMaker AI dostat přímo do datacentra zákazníka jako spravované racky, které provozuje AWS a které jsou navržené tak, aby data zůstávala v prostředí zákazníka a pomohla splnit požadavky na datovou suverenitu. Z technického pohledu jde o privátní prostředí, které se chová velmi podobně jako AWS Region, používá stejnou softwarovou vrstvu jako public cloud a připojuje se k němu přes standardní nástroje i API – architekt tedy může navrhovat agentní aplikace nad Bedrockem tak, aby fungovaly konzistentně v public AWS i v AI Factory nasazené třeba v bankovním DC.

Kyberbezpečnost a zákony bez obalu
Kyberbezpečnost a zákony bez obalu
0:00/

Nad tím běží modelová vrstva, které dominuje rodina foundation modelů Amazon Nova 2.0 a nově představený Nova Forge pro vlastní trénování. Amazon Nova přináší několik typů modelů pro různé scénáře – od výkonných LLM s dlouhým kontextem přes rychlé modely pro nízkolatenční aplikace až po multimodální varianty – a AWS je staví jako výchozí volbu pro zákazníky, kteří chtějí mít „firemní“ model v rámci jednoho ekosystému. 

Nova Forge pak přidává možnost stavět na existujících modelech v různých fázích tréninku a dotrénovat je na vlastních datech, aniž by vývojář musel od nuly budovat infrastrukturu pro distributed training – cílem je zkrátit cestu od nápadu ke specializovanému modelu a zároveň držet práci s modely v konzistentním prostředí.

Video ke kávě

Máte čas na rychlé a informativní video?

Na úrovni přizpůsobení modelů posouvá AWS Reinforcement Fine Tuning (RFT) v Amazon Bedrocku a novinky v SageMaker AI. RFT umožňuje ladit modely na základě zpětné vazby a implicitního chování uživatelů a AWS u něj popisuje výrazné zlepšení přesnosti oproti základním Nova modelům v interních benchmarkech, přičemž konkrétní hodnoty se liší podle typu úlohy a datasetu. SageMaker AI k tomu přidává serverless model customization – vývojář definuje experiment a data, což podle AWS některým zákazníkům zkrátilo experimentační cykly z týdnů na dny.

Poslední vrstvu AI stacku tvoří agentní runtime Amazon Bedrock AgentCore, který řeší to, s čím většina týmů v posledním roce zápasí: jak dostat agenty bezpečně a predikovatelně z prototypu do produkce. AgentCore přináší plně spravovanou infrastrukturu pro agentní aplikace, která primárně využívá modely dostupné přes Amazon Bedrock, ale umožňuje také integraci externích LLM a frameworků typu LangGraph nebo CrewAI přes standardizované nástroje a endpointy. 

Nová funkce Policy umožňuje popsat povolené chování agenta v přirozeném jazyce a přeložit ho do formální podoby (například Cedar), což následně AgentCore vynucuje při každém volání nástrojů, a Evaluations přidává sadu předpřipravených hodnoticích metrik pro posuzování kvality, bezpečnosti nebo latence agentů v reálném provozu.

Computertrends - promo

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.