AWS re:Invent 2025: Komplexní AI platforma od čipů po produkční agenty

11. 12. 2025

AWS na letošním re:Invent představil uzavřený AI stack, který propojuje vlastní čipy Trainium3 a Graviton5, on-premise AI Factories pro datovou suverenitu, rodinu modelů Amazon Nova 2.0 a agentní runtime AgentCore. Platforma umožňuje vývojářům budovat produkční AI agenty nad firemními daty v rámci jednotného ekosystému, řešící výkon, bezpečnost i governance – a to s až 4,4× vyšším výpočetním výkonem a 66% zlepšením přesnosti modelů.

AWS na své letošní výroční konferenci re:Invent začal skládat ucelený stack, který začíná vlastním procesorem Trainium3 a Graviton5, pokračuje přes AI Factories v datacentrech zákazníků a končí u agentního runtime AgentCore nad modely Amazon Nova.

Místo katalogu jednotlivých služeb tak vzniká konzistentní AI platforma, která má vývojářům i architektům umožnit postavit produkční agenty nad firemními daty v kratších cyklech – a zároveň řešit výkon, bezpečnost i governance v rámci jednoho ekosystému.

Na spodku celé pyramidy leží nové Trainium3 UltraServers – AI servery, kde AWS v jednom integrovaném systému kombinuje až 144 čipů Trainium3 vyrobených 3nm procesem. Podle AWS přinášejí ve srovnání s předchozí generací Trainium2 UltraServers až 4,4× vyšší výpočetní výkon a zhruba čtyřnásobnou energetickou efektivitu, což se v praxi projevuje výrazným zkrácením tréninkových oken a snížením ceny za trénink u zákazníků, kteří provozují velké jazykové nebo multimodální modely.

Trainium3 je ale jen polovina odpovědi – AWS současně staví projekt Rainier, velké AI clustery nad těmito UltraServers, které mají poskytnout kapacitu pro náročné modely, jaké si dnes on‑prem dovolí jen minimum organizací.

V chaosu veřejných zakázek létá bilion korun, technologie to pomohou zvládnout

0:00/

Paralelně se dál vyvíjí GPU větev: AWS rozšiřuje rodinu UltraServers postavených na generaci Nvidia GB300 NVL72, které míří na trénink i inference největších LLM a generativních modelů, a staví je jako protějšek Trainium3 pro zákazníky, kteří chtějí zůstat u GPU ekosystému. Nové GPU UltraServers doplňuje generace CPU Graviton5, jež cílí na „obyčejné“ workloady v EC2 s lepším poměrem cena/výkon a nižší spotřebou než x86 – architekt tak může na jedné straně konsolidovat běžné aplikace na Graviton5 a na druhé straně přesunout ušetřené prostředky do Trainium3 nebo GPU clusterů pro AI.

Vzniká tak výpočetní pyramida, kde má každá vrstva jasnou roli: Graviton5 pro standardní aplikační park, GPU UltraServers pro špičkové AI workloady a Trainium3 s Rainierem jako nákladově efektivní workhorse pro trénink a ladění modelů.

Největší změna ale leží v tom, kde tenhle AI stack fyzicky běží. AWS AI Factories představují způsob, jak Trainium, Nvidia GPU, sítě, storage a služby jako Amazon Bedrock nebo SageMaker AI dostat přímo do datacentra zákazníka jako spravované racky, které provozuje AWS a které jsou navržené tak, aby data zůstávala v prostředí zákazníka a pomohla splnit požadavky na datovou suverenitu. Z technického pohledu jde o privátní prostředí, které se chová velmi podobně jako AWS Region, používá stejnou softwarovou vrstvu jako public cloud a připojuje se k němu přes standardní nástroje i API – architekt tedy může navrhovat agentní aplikace nad Bedrockem tak, aby fungovaly konzistentně v public AWS i v AI Factory nasazené třeba v bankovním DC.

Kyberbezpečnost a zákony bez obalu

0:00/

Nad tím běží modelová vrstva, které dominuje rodina foundation modelů Amazon Nova 2.0 a nově představený Nova Forge pro vlastní trénování. Amazon Nova přináší několik typů modelů pro různé scénáře – od výkonných LLM s dlouhým kontextem přes rychlé modely pro nízkolatenční aplikace až po multimodální varianty – a AWS je staví jako výchozí volbu pro zákazníky, kteří chtějí mít „firemní“ model v rámci jednoho ekosystému.

Nova Forge pak přidává možnost stavět na existujících modelech v různých fázích tréninku a dotrénovat je na vlastních datech, aniž by vývojář musel od nuly budovat infrastrukturu pro distributed training – cílem je zkrátit cestu od nápadu ke specializovanému modelu a zároveň držet práci s modely v konzistentním prostředí.

Video ke kávě

Máte čas na rychlé a informativní video?

Na úrovni přizpůsobení modelů posouvá AWS Reinforcement Fine Tuning (RFT) v Amazon Bedrocku a novinky v SageMaker AI. RFT umožňuje ladit modely na základě zpětné vazby a implicitního chování uživatelů a AWS u něj popisuje výrazné zlepšení přesnosti oproti základním Nova modelům v interních benchmarkech, přičemž konkrétní hodnoty se liší podle typu úlohy a datasetu. SageMaker AI k tomu přidává serverless model customization – vývojář definuje experiment a data, což podle AWS některým zákazníkům zkrátilo experimentační cykly z týdnů na dny.

Poslední vrstvu AI stacku tvoří agentní runtime Amazon Bedrock AgentCore, který řeší to, s čím většina týmů v posledním roce zápasí: jak dostat agenty bezpečně a predikovatelně z prototypu do produkce. AgentCore přináší plně spravovanou infrastrukturu pro agentní aplikace, která primárně využívá modely dostupné přes Amazon Bedrock, ale umožňuje také integraci externích LLM a frameworků typu LangGraph nebo CrewAI přes standardizované nástroje a endpointy.

Nová funkce Policy umožňuje popsat povolené chování agenta v přirozeném jazyce a přeložit ho do formální podoby (například Cedar), což následně AgentCore vynucuje při každém volání nástrojů, a Evaluations přidává sadu předpřipravených hodnoticích metrik pro posuzování kvality, bezpečnosti nebo latence agentů v reálném provozu.

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.

Našli jste v článku chybu?

Sdílet

Video ke kávě

Autor článku

Radan Dolejš

Témata:

Mohlo by vás zajímat

Anketa

Máte ve firmě vyřešený případný výpadek elektřiny na déle než 24 hodin?

Kvíz týdne

TIP NA VIDEO

Podcast s Petrem Mackem z Caflou: jak zvládnout digitalizaci, automatizaci a AI v malé firmě

SPECIÁLNÍ PROJEKTY

Našli jsme první letošní vítěze soutěže IT produkt roku 2026

Ocenili jsme úspěšné účastníky celoroční soutěže IT produkt roku 2025

Vítězové posledního kola soutěže IT produkt roku 2025 jsou tady

Začal sběr dat pro prestižní ročenku TOP 100 ICT společností

Investice do nemovitostí v CEE vzrostly o třetinu. Česko patřilo k hlavním tahounům

Omdia: Horší, než jsme čekali. Dodávky PC letos propadnou dvouciferně

IT přestává být profesí budoucnosti. Umělá inteligence mění pravidla hry

Padesátníci na trhu práce? Potenciál, který Česko stále nevyužívá

Největší nárůst útoků hlásí zemědělství, pohostinství a cestovní ruch

V IT a podnikových službách už v Česku pracuje 200 tisíc lidí

Novým CFO Privatbanky je Tomáš Dvořák, Jiří Mizera nastupuje jako COO

Další stinná stránka AI. Do pěti let razantně zvýší spotřebu elektřiny v Evropě

AWS re:Invent 2025: Komplexní AI platforma od čipů po produkční agenty

Sdílet

Video ke kávě

Autor článku

Radan Dolejš

Témata:

Mohlo by vás zajímat

Nový model OpenAI kóduje 15krát rychleji než jeho předchůdce

Anketa

Máte ve firmě vyřešený případný výpadek elektřiny na déle než 24 hodin?

Kvíz týdne

TIP NA VIDEO

Podcast s Petrem Mackem z Caflou: jak zvládnout digitalizaci, automatizaci a AI v malé firmě

SPECIÁLNÍ PROJEKTY

Našli jsme první letošní vítěze soutěže IT produkt roku 2026

Ocenili jsme úspěšné účastníky celoroční soutěže IT produkt roku 2025

Vítězové posledního kola soutěže IT produkt roku 2025 jsou tady

Z našich webů

Začal sběr dat pro prestižní ročenku TOP 100 ICT společností

Investice do nemovitostí v CEE vzrostly o třetinu. Česko patřilo k hlavním tahounům

Omdia: Horší, než jsme čekali. Dodávky PC letos propadnou dvouciferně

IT přestává být profesí budoucnosti. Umělá inteligence mění pravidla hry

Padesátníci na trhu práce? Potenciál, který Česko stále nevyužívá

Největší nárůst útoků hlásí zemědělství, pohostinství a cestovní ruch

V IT a podnikových službách už v Česku pracuje 200 tisíc lidí

Novým CFO Privatbanky je Tomáš Dvořák, Jiří Mizera nastupuje jako COO

Další stinná stránka AI. Do pěti let razantně zvýší spotřebu elektřiny v Evropě

Dále u nás najdete

Česko se přímo podílí na evropské strategii pro čipy

Po rodičovské na pracák. V prvních měsících dostanete 19 269 Kč

Vývojáři už kód nepíší, kočírují smečky AI agentů

„Chybí mi tam 9 let, pohoda.“ Sítě plní zkušenosti s ČSSZ

Před otevřením baru přišel lockdown, teď prodává znalosti

Energetické infrastruktuře bez chytrého řízení hrozí kolaps

Budoucnost Office, digitálního pracoviště a e‑shopů

EET 2.0 bude děravá jako ústa staré ženy

Spotřeba elektřiny v Evropě prudce poroste, může za to AI

Od hrozby popravy k SMS zprávě: historie daňového přiznání

Velkým firmám nejsou lhostejní jejich klienti na Blízkém východě

Daňové slevy: Poradíme, čím si můžete snížit daň z příjmů

Zuzana svým byznysem podporuje nigerijské trhovkyně

Povinné doplňující údaje o zaměstnavateli pro účely JMHZ

Vedla knihovnu, teď pěstuje bylinky. Kosmetiku míchá s dobrou náladou

Experti nedoporučují rušit rozhlasové a TV poplatky

V IT a podnikových službách už v Česku pracuje 200 tisíc lidí

IT přestává být profesí budoucnosti. AI mění pravidla hry

Takto praktik zkontroluje játra, když budete chodit na prevenci

Přeplatek paušální daně se OSVČ vracet nebude, půjde o něj ale snížit zálohu