OpenAI mění přístup AI modelů ke kontroverzním tématům

18. 2. 2025

Na základě nových standardů bude ChatGPT lépe zvládat kontroverzní témata či obsah pro dospělé.

Společnost OpenAI zveřejnila výrazně rozšířenou verzi své definice toho, jak by se měly modely umělé inteligence chovat. Z 10 stran se rozrostla na 63. Dokument, který je volně k dispozici, se objevuje v době, kdy generální ředitel OpenAI Sam Altman oznámil vydání modelu GPT-4.5 s kódovým označením Orion.

Nová specifikace klade důraz na tři základní principy: přizpůsobitelnost, transparentnost a „intelektuální svobodu“ – možnost zkoumat nápady a diskutovat o tématech prakticky bez jakýchkoliv omezení. Zabývá se také různými kontroverzními tématy a poskytuje podrobné pokyny pro reakce umělé inteligence v náročných situacích.

Máte ve firmě vyřešený případný výpadek elektřiny na déle než 24 hodin?

„Nemůžeme vytvořit jeden model s pevně daným souborem standardů chování, který si všichni na světě zamilují,“ přiznala nicméně Joanne Jangová z týmu OpenAI pro chování modelu v rozhovoru pro The Verge. Poznamenala, že zatímco některé bezpečnostní bariéry zůstávají pevné, uživatelé a vývojáři si mohou mnoho aspektů chování modelu přizpůsobit.

Aktualizované pokyny však zavádějí významné změny v přístupu ke kontroverzním tématům. Namísto defaultní extrémní opatrnosti standardy vybízí modely, aby „hledaly pravdu společně“ s uživateli a zároveň zachovávaly jasné morální postoje k otázkám, jako jsou dezinformace.

Dokument se také zabývá způsoby, jak ve vhodných kontextech povolit určitý druh „obsahu pro dospělé“ (např. erotického) a zároveň přísně dbát na zákaz škodlivého obsahu typu deepfake videí.

Máme nové jméno

Po více než třech dekádách existence otvírá magazín Computerworld novou kapitolu. Tradiční průvodce světem IT, který si za 36 let existence vybudoval pověst jednoho z nejdůvěryhodnějších tuzemských zdrojů pro IT profesionály, se od nynějška jmenuje Computertrends.

Jedním z klíčových témat je také řešení „pochlebování umělé inteligence“ neboli její tendence být vůči uživateli až příliš vlídná. Dle nových pokynů by ChatGPT měl poskytovat konzistentní a věcné odpovědi bez ohledu na to, jak jsou otázky formulovány, nebát se kritiky a nabízet upřímnou zpětnou vazbu namísto prázdné chvály.

Nová specifikace stanovuje i jasnou hierarchii pokynů: Přednost mají pravidla na úrovni platformy od OpenAI, následují vývojářská guidelines a až nakonec preference uživatelů.

Nový dokument OpenAI byl vydán pod licencí Creative Commons Zero a je tak veřejně dostupný, což umožňuje dalším společnostem a výzkumníkům v oblasti umělé inteligence tyto pokyny volně přebírat nebo upravovat. OpenAI nadto aktivně hledá veřejnou zpětnou vazbu ke specifikaci prostřednictvím svých webových stránek.

Video ke kávě

Máte čas na rychlé a informativní video?

„Chceme tyto interní diskuse přenést na veřejnost,“ uvedla Laurentia Romaniuková, další členka týmu pro chování modelu.

Nové pokyny sice bezprostředně nezmění způsob fungování ChatGPT nebo jiných produktů OpenAI, představují však pokračující úsilí společnosti o vytvoření konzistentních zásad chování umělé inteligence v období intenzivní debaty o její bezpečnosti a etice.

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.

Seriál: Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích

Přečtěte si všechny díly seriálu Vše, co potřebujete vědět o nasazení umělé inteligence (AI) v podnicích nebo sledujte jeho RSS

Našli jste v článku chybu?

Sdílet

Máte ve firmě vyřešený případný výpadek elektřiny na déle než 24 hodin?

Máme nové jméno

Video ke kávě

Microsoft opouští OpenAI, Claude proniká do M365

Meta bude využívat vaše konverzace s AI k cílení reklam

Google rozšiřuje AI ve vyhledávání, zabíjí své životodárné zdroje

Autor článku

Václav Tesař

Témata:

Komerční sdělení

Budoucnost práce s dokumenty

Mohlo by vás zajímat

Anketa

Máte ve firmě vyřešený případný výpadek elektřiny na déle než 24 hodin?

Kvíz týdne

TIP NA VIDEO

Podcast s Petrem Mackem z Caflou: jak zvládnout digitalizaci, automatizaci a AI v malé firmě

SPECIÁLNÍ PROJEKTY

Našli jsme první letošní vítěze soutěže IT produkt roku 2026

Ocenili jsme úspěšné účastníky celoroční soutěže IT produkt roku 2025

Vítězové posledního kola soutěže IT produkt roku 2025 jsou tady

Miliardy z EU, strach z hackerů a marný boj s tabulkovými platy (2.)

Jiří Brabec posiluje advokátní kancelář Rowan Legal

Obrazem: Strategie Red Hatu v kulisách Národního technického muzea

Začal sběr dat pro prestižní ročenku TOP 100 ICT společností

Nejčastější chyby v DPPO: převodní ceny

Češi berou mobily pragmaticky, polovina někdy vlastnila model z druhé ruky

IT přestává být profesí budoucnosti. Umělá inteligence mění pravidla hry

Význam obranného průmyslu poroste, vstoupit do něj chce každá sedmá firma

Psaní rychlých zpráv české uživatele baví, zabezpečení aplikací už méně

OpenAI mění přístup AI modelů ke kontroverzním tématům

Sdílet

Máte ve firmě vyřešený případný výpadek elektřiny na déle než 24 hodin?

Máme nové jméno

Video ke kávě

Microsoft opouští OpenAI, Claude proniká do M365

Meta bude využívat vaše konverzace s AI k cílení reklam

Google rozšiřuje AI ve vyhledávání, zabíjí své životodárné zdroje

Autor článku

Václav Tesař

Témata:

Komerční sdělení

Budoucnost práce s dokumenty

Mohlo by vás zajímat

V Česku nejvíc frčí WhatsApp. A co dál?

Segment počítačů pod 500 dolarů do dvou let zcela zmizí, varují experti

Kyberútoky na českou infrastrukturu pocházejí primárně ze zahraničí. Nejčastějším cílem je narušit nebo zcela vyřadit fungování napadených služeb

Anketa

Máte ve firmě vyřešený případný výpadek elektřiny na déle než 24 hodin?

Kvíz týdne

TIP NA VIDEO

Podcast s Petrem Mackem z Caflou: jak zvládnout digitalizaci, automatizaci a AI v malé firmě

SPECIÁLNÍ PROJEKTY

Našli jsme první letošní vítěze soutěže IT produkt roku 2026

Ocenili jsme úspěšné účastníky celoroční soutěže IT produkt roku 2025

Vítězové posledního kola soutěže IT produkt roku 2025 jsou tady

Z našich webů

Miliardy z EU, strach z hackerů a marný boj s tabulkovými platy (2.)

Jiří Brabec posiluje advokátní kancelář Rowan Legal

Obrazem: Strategie Red Hatu v kulisách Národního technického muzea

Začal sběr dat pro prestižní ročenku TOP 100 ICT společností

Nejčastější chyby v DPPO: převodní ceny

Češi berou mobily pragmaticky, polovina někdy vlastnila model z druhé ruky

IT přestává být profesí budoucnosti. Umělá inteligence mění pravidla hry

Význam obranného průmyslu poroste, vstoupit do něj chce každá sedmá firma

Psaní rychlých zpráv české uživatele baví, zabezpečení aplikací už méně

Dále u nás najdete

Lékaři zdarma vyšetří ledviny. Test trvá jen pár minut

V IT a podnikových službách už v Česku pracuje 200 tisíc lidí

Experti nedoporučují rušit rozhlasové a TV poplatky

Nová zelená úsporám, nebo lobby bank? Sítě vřou kvůli úvěrům

Firmy se vyhnou auditu, účetní závěrku 2025 ale ještě ověřit musí

Zdeněk se cítil zdravý, pak ve spánku dostal mrtvici

Vedla knihovnu, teď pěstuje bylinky. Kosmetiku míchá s dobrou náladou

Qualcomm chce Nvidii konkurovat v provozu AI

Takto praktik zkontroluje játra, když budete chodit na prevenci

Přeplatek paušální daně se OSVČ vracet nebude

Vlnařský „punk“ z Beskyd: Když se z dětského snu stane řemeslo

Miliardy z EU, strach z hackerů a marný boj s tabulkovými platy (2.)

AI v marketingu: Technologie bez strategie a citu nestačí

Zaměstnanci musejí do hlášení doplnit údaje o zaměstnancích

Úskalí zaměstnaneckých benefitů v roce 2026

Kdo by to byl před pár lety řekl: IT přestává být profesí budoucnosti

Pokuta 80 tisíc za švarcsystém programátorů platí, potvrdil soud

„Limituje nás už prakticky jen rychlost světla“

Mzdy ovlivní několik novinek. Měly by pomoci hlavně ženám

V Česku nejvíc frčí WhatsApp. A co dál?