ChatGPT je už přesvědčivější než 4 z 5 lidí

21. 2. 2025

OpenAI testuje přesvědčivost svých modelů ve srovnání s uživateli na Redditu. Obává se jejich zneužití například v politických kampaních.

Společnost OpenAI provádí rozsáhlé testování přesvědčovacích schopností svých modelů umělé inteligence na nečekaném zkušebním poli: na fóru r/ChangeMyView na Redditu. Testovací iniciativa provázející vydání modelu o3-mini poskytuje vhled do stále lepších schopností jazykových AI modelů při formulování přesvědčivých argumentů.

A komunita r/ChangeMyView se svými 3,8 milionu členů slouží jako ideální testovací prostředí. Uživatelé v ní zveřejňují názory, o kterých uznávají, že mohou být chybné, a hledají alternativní pohledy. Když odpověď úspěšně změní něčí názor, udělí jí tzv. deltu, čímž vytvoří cenný soubor dat o účinných přesvědčovacích argumentech.

Máme nové jméno

Po více než třech dekádách existence otvírá magazín Computerworld novou kapitolu. Tradiční průvodce světem IT, který si za 36 let existence vybudoval pověst jednoho z nejdůvěryhodnějších tuzemských zdrojů pro IT profesionály, se od nynějška jmenuje Computertrends.

Metodika OpenAI zahrnuje porovnávání odpovědí generovaných umělou inteligencí s náhodně vybranými uživatelskými odpověďmi z fóra. Lidští hodnotitelé pak hodnotí argumenty generované umělou inteligencí i lidmi na pětibodové stupnici v rámci 3 000 různých testů, přičemž výsledný percentil udává pravděpodobnost, že odpověď generovaná umělou inteligencí bude hodnocena jako přesvědčivější než odpověď člověka.

Výsledky poukazují na výrazný pokrok v přesvědčivosti AI. Zatímco model ChatGPT-3.5 z roku 2022 dosáhl 38 % úspěšnosti, tj. byl přesvědčivější než zhruba třetina lidí, model o1-mini už se mohl pochlubit 77 % a nejnovější model o3-mini dokonce 82 %. Za zmínku stojí, že OpenAI si definovala i „jasný nadlidský výkon“, tedy 95 %, k nimž dosud žádný z jejích modelů nedosáhl.

Jak je na tom kybernetická bezpečnost v České republice? Jak bezpečné jsou české digitální sítě?

0:00/

Vývojáři však přesvědčovací schopnosti o3-mini už tak označují za „střední riziko“ (jsou dle nich srovnatelné s obvyklým obsahem psaným člověkem) a upozorňují, že by mohly potenciálně ovlivnit oblasti jako je neobjektivní žurnalistika, politické kampaně nebo být zneužity při nejrůznějších sofistikovaných podvodech.

Ke zmírňování těchto rizik OpenAI zavádí několik strategií. Patří mezi ně lepší monitorování a detekce pokusů o přesvědčování s využitím AI, cílené vyšetřování potenciálního zneužití a naprogramování tak, aby například odmítaly žádosti o politickou argumentaci.

Zatímco totiž vytvoření přesvědčivých argumentů člověkem si žádá značné úsilí i zdroje, AI systémy to dokážou prakticky bez nákladů a mohou tak být masivně zneužívány třeba právě v rámci politické agitace.

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.

Seriál: Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích

Přečtěte si všechny díly seriálu Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích nebo sledujte jeho RSS

Našli jste v článku chybu?

Sdílet

Máme nové jméno

Microsoft opouští OpenAI, Claude proniká do M365

Meta bude využívat vaše konverzace s AI k cílení reklam

Google rozšiřuje AI ve vyhledávání, zabíjí své životodárné zdroje

Autor článku

Václav Tesař

Témata:

Komerční sdělení

Budoucnost práce s dokumenty

Mohlo by vás zajímat

Anketa

Máte ve firmě vyřešený případný výpadek elektřiny na déle než 24 hodin?

Kvíz týdne

TIP NA VIDEO

Coffee break: Bezpečnost s velkým srdcem, říká Pavel Černý ze společnosti Eurosecure

SPECIÁLNÍ PROJEKTY

Našli jsme první letošní vítěze soutěže IT produkt roku 2026

Ocenili jsme úspěšné účastníky celoroční soutěže IT produkt roku 2025

Vítězové posledního kola soutěže IT produkt roku 2025 jsou tady

Miliardy z EU, strach z hackerů a marný boj s tabulkovými platy (2.)

Jiří Brabec posiluje advokátní kancelář Rowan Legal

Obrazem: Strategie Red Hatu v kulisách Národního technického muzea

Začal sběr dat pro prestižní ročenku TOP 100 ICT společností

Nejčastější chyby v DPPO: převodní ceny

Češi berou mobily pragmaticky, polovina někdy vlastnila model z druhé ruky

IT přestává být profesí budoucnosti. Umělá inteligence mění pravidla hry

Význam obranného průmyslu poroste, vstoupit do něj chce každá sedmá firma

Psaní rychlých zpráv české uživatele baví, zabezpečení aplikací už méně

ChatGPT je už přesvědčivější než 4 z 5 lidí

Sdílet

Máme nové jméno

Microsoft opouští OpenAI, Claude proniká do M365

Meta bude využívat vaše konverzace s AI k cílení reklam

Google rozšiřuje AI ve vyhledávání, zabíjí své životodárné zdroje

Autor článku

Václav Tesař

Témata:

Komerční sdělení

Budoucnost práce s dokumenty

Mohlo by vás zajímat

Segment počítačů pod 500 dolarů do dvou let zcela zmizí, varují experti

V Česku nejvíc frčí WhatsApp. A co dál?

Kyberútoky na českou infrastrukturu pocházejí primárně ze zahraničí. Nejčastějším cílem je narušit nebo zcela vyřadit fungování napadených služeb

Anketa

Máte ve firmě vyřešený případný výpadek elektřiny na déle než 24 hodin?

Kvíz týdne

TIP NA VIDEO

Coffee break: Bezpečnost s velkým srdcem, říká Pavel Černý ze společnosti Eurosecure

SPECIÁLNÍ PROJEKTY

Našli jsme první letošní vítěze soutěže IT produkt roku 2026

Ocenili jsme úspěšné účastníky celoroční soutěže IT produkt roku 2025

Vítězové posledního kola soutěže IT produkt roku 2025 jsou tady

Z našich webů

Miliardy z EU, strach z hackerů a marný boj s tabulkovými platy (2.)

Jiří Brabec posiluje advokátní kancelář Rowan Legal

Obrazem: Strategie Red Hatu v kulisách Národního technického muzea

Začal sběr dat pro prestižní ročenku TOP 100 ICT společností

Nejčastější chyby v DPPO: převodní ceny

Češi berou mobily pragmaticky, polovina někdy vlastnila model z druhé ruky

IT přestává být profesí budoucnosti. Umělá inteligence mění pravidla hry

Význam obranného průmyslu poroste, vstoupit do něj chce každá sedmá firma

Psaní rychlých zpráv české uživatele baví, zabezpečení aplikací už méně

Dále u nás najdete

Vrácení kauce s úroky může být sporné. Pomůže jasná smlouva

Nová zelená úsporám, nebo lobby bank? Sítě vřou kvůli úvěrům

Medicína na míru s AI pomalu vstupuje do zdravotnictví

Amazon chce rozvíjet OpenAI, nalije do něj až 50 miliard dolarů

Vedla knihovnu, teď pěstuje bylinky. Kosmetiku míchá s dobrou náladou

Nejlepší telefony všech dob dostanou pořádného nástupce

AI v marketingu: Technologie bez strategie a citu nestačí

Příznaky rakoviny střeva: krev ve stolici i bolest v zádech

Medvědí česnek už roste. Víme, kde i proč je nejlepší ho zamrazit

Pokuta 80 tisíc za švarcsystém programátorů platí, potvrdil soud

Google Mapy se dočkaly vylepšení, na pomoc dostanete AI

Dánsko-český dokument Pan Nikdo proti Putinovi má Oscara

Při návštěvní službě zubaři chrup zrentgenují i zaplombují

Vzniká vakcína proti tuberkulóze, která nenenchá jizvičku na paži

Úskalí zaměstnaneckých benefitů v roce 2026

Qualcomm chce Nvidii konkurovat v provozu AI

„Limituje nás už prakticky jen rychlost světla“

Segment počítačů pod 500 dolarů do dvou let zcela zmizí

V Česku nejvíc frčí WhatsApp. A co dál?

Mzdy ovlivní několik novinek. Měly by pomoci hlavně ženám