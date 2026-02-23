Computertrends  »  Technologie  »  AI jako soudce – zákon na prvním místě

GPT-5 aplikuje právo konzistentněji než lidští soudci, ukazuje experiment. Výzkumníci však upozorňují, že striktní dodržování pravidel nemusí vždy vést ke spravedlivým výsledkům.

Vědci z Chicagské univerzity zjišťovali, jak se chovají velké jazykové modely v roli soudce. Ve své starší práci Judge AI: A Case Study of Large Language Models in Judicial Decision-Making (Soudní AI: Případová studie velkých jazykových modelů v soudním rozhodování) otestovali model GPT-4o od OpenAI tím, že ho požádali, aby rozhodl o skutečném odvolání ve věci válečných zločinů před Mezinárodním trestním tribunálem pro bývalou Jugoslávii. 

Modelu byly předloženy fakta případu, právní podklady, příslušné právní předpisy a shrnutí předchozích rozhodnutí a poté byl dotázán, zda potvrdí nebo zruší rozhodnutí nižšího soudu.

Výsledky pak výzkumníci porovnali s tím, jak stejný případ v minulosti rozhodovali lidští soudci a studenti práv. Zatímco studenti měli tendenci být více „formalističtí“, což znamená, že se striktně drželi precedentu, soudci s praxí byli více „realističtí“ a brali v úvahu vnější faktory. A GPT-4o? Ten se choval spíš jako studenti: řídil se literou zákona a nenechal se ovlivnit tím, která strana se jevila jako sympatičtější.

Eric Posner a Shivam Saran svou starší práci rozšířili a v nové studii Silicon Formalism: Rules, Standards, and Judge AI (Křemíkový formalismus: pravidla, normy a soudní AI), tentokrát využili novější model GPT-5. Zopakovali studii, která byla původně provedena s 61 federálními soudci v USA, na základě každodenních právních otázek týkajících se toho, které státní právo by se mělo použít v případě dopravní nehody.

Podle autorů GPT-5 tyto otázky vyřešil bez halucinací a logických chyb a pokaždé aplikoval právně správné pravidlo. 

„Zjistili jsme, že LLM je naprosto formalistický a ve 100 % případů aplikuje právně správný výsledek; to bylo výrazně víc než u soudců, kteří dodržovali zákon pouze v 52 % případů,“ shrnují. 

Stejně jako lidští soudci model neupřednostňoval sympatičtější stranu. Z dalších testovaných modelů dosáhl 100 % pouze Gemini 3 Pro od Googlu. Gemini 2.5 Pro dodržoval zákon v 92 % případů, o4-mini v 79 %, Llama 4 Maverick v 75 %, Llama 4 Scout v 50 % a GPT-4.1 v 50 %.

Vědci zdůrazňují, že jejich závěry neznamenají, že by soudci byli nedbalí. Jestliže je totiž právní doktrína formulována jako standard spíš než jako přísné pravidlo, soudci mají ve svém rozhodování určitou volnost. V takových případech může to, co vypadá jako nekonzistentnost, odrážet záměrné úsilí vyhnout se rozsudkům, které se jeví jako morálně nebo sociálně nesprávné.

Přestože se nástroje umělé inteligence v právní praxi používají stále častěji, vyvstává otázka, zda by jim mělo být vůbec povoleno přijímat závazná rozhodnutí. Simulovaný soudní proces s podporou umělé inteligence, který se konal loni na Právnické fakultě Univerzity Severní Karolíny, ukazuje, že akademický svět se touto myšlenkou už zabývá. 

Experimenty s GPT-4o i GPT-5 zase dokládají, že AI modely dodržují zákony přísněji než lidé. Jak uvádějí Posner a Saran, „zdánlivá slabost lidských soudců je ve skutečnosti silnou stránkou“, protože lidé se mohou odchýlit od přísných pravidel, pokud by tato pravidla vedla ke špatným rozhodnutím.

