AWS na své letošní výroční konferenci re:Invent začal skládat ucelený stack, který začíná vlastním procesorem Trainium3 a Graviton5, pokračuje přes AI Factories v datacentrech zákazníků a končí u agentního runtime AgentCore nad modely Amazon Nova.
Místo katalogu jednotlivých služeb tak vzniká konzistentní AI platforma, která má vývojářům i architektům umožnit postavit produkční agenty nad firemními daty v kratších cyklech – a zároveň řešit výkon, bezpečnost i governance v rámci jednoho ekosystému.
Na spodku celé pyramidy leží nové Trainium3 UltraServers – AI servery, kde AWS v jednom integrovaném systému kombinuje až 144 čipů Trainium3 vyrobených 3nm procesem. Podle AWS přinášejí ve srovnání s předchozí generací Trainium2 UltraServers až 4,4× vyšší výpočetní výkon a zhruba čtyřnásobnou energetickou efektivitu, což se v praxi projevuje výrazným zkrácením tréninkových oken a snížením ceny za trénink u zákazníků, kteří provozují velké jazykové nebo multimodální modely.
Trainium3 je ale jen polovina odpovědi – AWS současně staví projekt Rainier, velké AI clustery nad těmito UltraServers, které mají poskytnout kapacitu pro náročné modely, jaké si dnes on‑prem dovolí jen minimum organizací.
Paralelně se dál vyvíjí GPU větev: AWS rozšiřuje rodinu UltraServers postavených na generaci Nvidia GB300 NVL72, které míří na trénink i inference největších LLM a generativních modelů, a staví je jako protějšek Trainium3 pro zákazníky, kteří chtějí zůstat u GPU ekosystému. Nové GPU UltraServers doplňuje generace CPU Graviton5, jež cílí na „obyčejné“ workloady v EC2 s lepším poměrem cena/výkon a nižší spotřebou než x86 – architekt tak může na jedné straně konsolidovat běžné aplikace na Graviton5 a na druhé straně přesunout ušetřené prostředky do Trainium3 nebo GPU clusterů pro AI.
Vzniká tak výpočetní pyramida, kde má každá vrstva jasnou roli: Graviton5 pro standardní aplikační park, GPU UltraServers pro špičkové AI workloady a Trainium3 s Rainierem jako nákladově efektivní workhorse pro trénink a ladění modelů.
Největší změna ale leží v tom, kde tenhle AI stack fyzicky běží. AWS AI Factories představují způsob, jak Trainium, Nvidia GPU, sítě, storage a služby jako Amazon Bedrock nebo SageMaker AI dostat přímo do datacentra zákazníka jako spravované racky, které provozuje AWS a které jsou navržené tak, aby data zůstávala v prostředí zákazníka a pomohla splnit požadavky na datovou suverenitu. Z technického pohledu jde o privátní prostředí, které se chová velmi podobně jako AWS Region, používá stejnou softwarovou vrstvu jako public cloud a připojuje se k němu přes standardní nástroje i API – architekt tedy může navrhovat agentní aplikace nad Bedrockem tak, aby fungovaly konzistentně v public AWS i v AI Factory nasazené třeba v bankovním DC.
Nad tím běží modelová vrstva, které dominuje rodina foundation modelů Amazon Nova 2.0 a nově představený Nova Forge pro vlastní trénování. Amazon Nova přináší několik typů modelů pro různé scénáře – od výkonných LLM s dlouhým kontextem přes rychlé modely pro nízkolatenční aplikace až po multimodální varianty – a AWS je staví jako výchozí volbu pro zákazníky, kteří chtějí mít „firemní“ model v rámci jednoho ekosystému.
Nova Forge pak přidává možnost stavět na existujících modelech v různých fázích tréninku a dotrénovat je na vlastních datech, aniž by vývojář musel od nuly budovat infrastrukturu pro distributed training – cílem je zkrátit cestu od nápadu ke specializovanému modelu a zároveň držet práci s modely v konzistentním prostředí.
Na úrovni přizpůsobení modelů posouvá AWS Reinforcement Fine Tuning (RFT) v Amazon Bedrocku a novinky v SageMaker AI. RFT umožňuje ladit modely na základě zpětné vazby a implicitního chování uživatelů a AWS u něj popisuje výrazné zlepšení přesnosti oproti základním Nova modelům v interních benchmarkech, přičemž konkrétní hodnoty se liší podle typu úlohy a datasetu. SageMaker AI k tomu přidává serverless model customization – vývojář definuje experiment a data, což podle AWS některým zákazníkům zkrátilo experimentační cykly z týdnů na dny.
Poslední vrstvu AI stacku tvoří agentní runtime Amazon Bedrock AgentCore, který řeší to, s čím většina týmů v posledním roce zápasí: jak dostat agenty bezpečně a predikovatelně z prototypu do produkce. AgentCore přináší plně spravovanou infrastrukturu pro agentní aplikace, která primárně využívá modely dostupné přes Amazon Bedrock, ale umožňuje také integraci externích LLM a frameworků typu LangGraph nebo CrewAI přes standardizované nástroje a endpointy.
Nová funkce Policy umožňuje popsat povolené chování agenta v přirozeném jazyce a přeložit ho do formální podoby (například Cedar), což následně AgentCore vynucuje při každém volání nástrojů, a Evaluations přidává sadu předpřipravených hodnoticích metrik pro posuzování kvality, bezpečnosti nebo latence agentů v reálném provozu.

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.
Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.