AI agenti při složitých úkolech klopýtají, ukazuje studie

3. 2. 2026

Experti varují před přílišným nadšením z takzvaných AI agentů. Upozorňují, že mohou selhat, jestliže se úkoly pro ně stanou příliš složitými, a vyzývají k opatrnosti.

Agentická AI je často popisována jako software, který může samostatně jednat a rozhodovat. IBM ji definuje jako systémy, které „napodobují lidské rozhodování za účelem řešení problémů v reálném čase“ a využívají velké jazykové modely (LLM) k fungování v měnících se prostředích.

Takový koncept přitahuje pozornost, protože slibuje automatizaci všeho od žádostí o informace přes finanční transakce až po řízení průmyslových zařízení.

V chaosu veřejných zakázek létá bilion korun, technologie to pomohou zvládnout

0:00/

Nová studie nazvaná Hallucination Stations: On Some Basic Limitations of Transformer-Based Language Models však tvrdí, že existují poměrně tvrdé limity toho, co tyto systémy dokážou. Podle jejích autorů velké jazykové modely „nejsou schopny provádět výpočetní a agentické úkoly nad určitou úrovní složitosti“ a že jakmile je tato hranice překročena, produkují nesprávné odpovědi.

Pomocí matematického uvažování studie vysvětluje, že LLM může být zadán úkol, který jednoduše vyžaduje více výpočtů, než je schopen provést. V takovém případě jsou nesprávné výsledky nevyhnutelné. Trend je přitom takový, že uživatelé od AI agentů vyžadují, aby prováděli stále složitější úkoly.

Výzkumníci také zpochybňují myšlenku, že jeden AI agent může spolehlivě kontrolovat práci jiného. Tvrdí, že „ověření úkolu je často složitější než samotný úkol“, což znamená, že chyby mohou systémům projít i tehdy, je-li jich do plnění úkolů zapojeno více.

„Domníváme se, že jde o obzvlášť relevantní téma, protože jednou z nejčastějších aplikací LLM je psaní a ověřování softwaru,“ píší autoři. Jejich závěr je jasný: „Navzdory jejich zjevné síle a použitelnosti v různých oblastech je třeba postupovat s extrémní opatrností před použitím LLM na problémy nebo v případech, které vyžadují přesnost, nebo při řešení problémů netriviální složitosti.“

To prý neznamená, že by AI agenti byli k ničemu, jen je třeba být při jejich používání obezřetní. Agentická AI byla diskutována jako kybernetická hrozba na nedávném Světovém ekonomickém fóru v Davosu a společnost Gartner předpovídá, že více než 40 % takových projektů by mohlo být do konce roku 2027 zrušeno kvůli vysokým nákladům, nejasné hodnotě a slabé kontrole rizik.

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.

Seriál: Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích

Google mění podobu Gemini v Chromu
AI agenti při složitých úkolech klopýtají, ukazuje studie
Dost bylo chatování, Anthropic a OpenAI chtějí, abyste jejich boty řídili

Přečtěte si všechny díly seriálu Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích nebo sledujte jeho RSS

Našli jste v článku chybu?

Sdílet

Jsme digitálně zdraví? Vůbec, jsme čím dál víc nemocní, trpí hlavně dívky

Google mění podobu Gemini v Chromu