Společnost OpenAI zveřejnila výrazně rozšířenou verzi své definice toho, jak by se měly modely umělé inteligence chovat. Z 10 stran se rozrostla na 63. Dokument, který je volně k dispozici, se objevuje v době, kdy generální ředitel OpenAI Sam Altman oznámil vydání modelu GPT-4.5 s kódovým označením Orion.
Nová specifikace klade důraz na tři základní principy: přizpůsobitelnost, transparentnost a „intelektuální svobodu“ – možnost zkoumat nápady a diskutovat o tématech prakticky bez jakýchkoliv omezení. Zabývá se také různými kontroverzními tématy a poskytuje podrobné pokyny pro reakce umělé inteligence v náročných situacích.
Plánujete ve firmě v brzké době nasadit Wi-Fi 7?
„Nemůžeme vytvořit jeden model s pevně daným souborem standardů chování, který si všichni na světě zamilují,“ přiznala nicméně Joanne Jangová z týmu OpenAI pro chování modelu v rozhovoru pro The Verge. Poznamenala, že zatímco některé bezpečnostní bariéry zůstávají pevné, uživatelé a vývojáři si mohou mnoho aspektů chování modelu přizpůsobit.
Aktualizované pokyny však zavádějí významné změny v přístupu ke kontroverzním tématům. Namísto defaultní extrémní opatrnosti standardy vybízí modely, aby „hledaly pravdu společně“ s uživateli a zároveň zachovávaly jasné morální postoje k otázkám, jako jsou dezinformace.
Dokument se také zabývá způsoby, jak ve vhodných kontextech povolit určitý druh „obsahu pro dospělé“ (např. erotického) a zároveň přísně dbát na zákaz škodlivého obsahu typu deepfake videí.
Máme nové jméno
Po více než třech dekádách existence otvírá magazín Computerworld novou kapitolu. Tradiční průvodce světem IT, který si za 36 let existence vybudoval pověst jednoho z nejdůvěryhodnějších tuzemských zdrojů pro IT profesionály, se od nynějška jmenuje Computertrends.
Jedním z klíčových témat je také řešení „pochlebování umělé inteligence“ neboli její tendence být vůči uživateli až příliš vlídná. Dle nových pokynů by ChatGPT měl poskytovat konzistentní a věcné odpovědi bez ohledu na to, jak jsou otázky formulovány, nebát se kritiky a nabízet upřímnou zpětnou vazbu namísto prázdné chvály.
Nová specifikace stanovuje i jasnou hierarchii pokynů: Přednost mají pravidla na úrovni platformy od OpenAI, následují vývojářská guidelines a až nakonec preference uživatelů.
Nový dokument OpenAI byl vydán pod licencí Creative Commons Zero a je tak veřejně dostupný, což umožňuje dalším společnostem a výzkumníkům v oblasti umělé inteligence tyto pokyny volně přebírat nebo upravovat. OpenAI nadto aktivně hledá veřejnou zpětnou vazbu ke specifikaci prostřednictvím svých webových stránek.
„Chceme tyto interní diskuse přenést na veřejnost,“ uvedla Laurentia Romaniuková, další členka týmu pro chování modelu.
Nové pokyny sice bezprostředně nezmění způsob fungování ChatGPT nebo jiných produktů OpenAI, představují však pokračující úsilí společnosti o vytvoření konzistentních zásad chování umělé inteligence v období intenzivní debaty o její bezpečnosti a etice.
Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.
Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.