Google v tichosti zveřejnil ceny Veo 2, svého AI modelu pro generování videa, který společnost představila v prosinci. Uživatelé budou platit za délku vytvořeného videa, přičemž jedna vteřina bude stát 50 centů, tedy v přepočtu asi 12 korun – za minutu to tak bude 30 dolarů / 715 Kč, respektive 1800 dolarů za hodinu / 43 tisíc Kč.
Jon Barron z vývojářského týmu DeepMind dal tuto cenu do poměru s rozpočtem s filmovým komiksovým trhákem Avengers: Endgame s rozpočtem kolem 356 milionů dolarů, jehož vteřina vyšla na 32 000 dolarů, víc než třičtvrtě milionu korun.
Máme nové jméno
Po více než třech dekádách existence otvírá magazín Computerworld novou kapitolu. Tradiční průvodce světem IT, který si za 36 let existence vybudoval pověst jednoho z nejdůvěryhodnějších tuzemských zdrojů pro IT profesionály, se od nynějška jmenuje Computertrends.
Uživatelé samozřejmě nutně nevyužijí každou vteřinu videa, které s pomocí Veo 2 vytvoří, takže v praxi se skutečná cena za použitelné video bude šplhat ještě výš.
Zároveň ale ani není pravděpodobné, že by někdo chtěl s Veo 2 vytvářet tříhodinové akční eposy pro filmová plátna. Popravdě, Google v oficiálních výstupech zdůrazňuje schopnost Veo 2 vytvářet klipy o délce kolem dvou minut.
Přesto se jisté srovnání nabízí a Veo 2 z něj úplně levně nevychází. Konkurenční OpenAI si cení modelu Sora na 200 dolarů za měsíc, přičemž jeho využití nijak neomezuje. Na druhou stranu, Veo 2 slibuje oproti modelu Sora vyšší rozlišení (4096 × 2160 px) a až šestinásobnou délku vytvářeného videa.
Je však také dobré mít na mysli, že cena je skutečně jen za generování obsahu s pomocí umělé inteligence a v praxi tak do konečné sumy bude třeba započíst odměnu za lidskou práci, jakož i počítat s pokusy potřebnými k vyladění kýženého výsledku.
Oproti původnímu Veo dle vyjádření tvůrců nová verze modelu „lépe chápe fyziku i pohyby kamery“ a vytváří záběry, které jsou „čistší“, respektive ostřejší, což by měli uživatelé ocenit zejména ve scénách s hodně pohybem.
Obecně dle DeepMind Veo 2 zobrazuje pohyb realističtěji a lépe zvládá i práci se světlem, stíny a odrazy, jakož i výrazy v lidském obličeji.

„Musíme rozvíjet koherenci a konzistenci. Veo se dokáže držet zadání po dobu několika minut, ale je-li zadání složitější a má-li být výsledek delší, má problémy. Prostor pro zlepšení sledujeme taky v generování složitých detailů i rychlých a komplexních pohybů,“ přiznal při představování Veo2 Eli Collins z DeepMind s tím, že s kolegy pracují také na tom, aby výsledky byly celkově realističtější.
Na jakých videích byl model trénován, jeho tvůrci neuvádí. Avšak vzhledem k tomu, že Google vlastní YouTube, je pravděpodobné, že posloužila právě tato platforma.
Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.
Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.