Vzhledem k tomu, že společnostem zabývajícím se umělou inteligencí docházejí kvalitní data pro trénování svých modelů, stále častěji se obracejí k potenciálně citlivým informacím o uživatelích, které najdou na internetu.
Google Research však vytvořila řešení, které by mohlo pomoci vaše soukromí ochránit právě tehdy, když se vaše data dostanou do tréninku umělé inteligence.
Problém s ochranou soukromí
Modely umělé inteligence, jako je ChatGPT, mají někdy nepříjemný zvyk: mohou náhodně vypustit části svých tréninkových dat doslova slovo od slova. Pokud taková data obsahují osobní údaje, čísla kreditních karet nebo obsah chráněný autorskými právy, představuje to závažný problém s ochranou soukromí s potenciální právními konsekvencemi.

Vývojáři z Google Research teď představili nový přístup zvaný diferenciální soukromí, který během procesu trénování AI přidává pečlivě vypočítaný „šum“, aby se tomuto problému s potenciálním reprodukováním tréninkových dat zabránilo.
Představte si to jako přidání šumu do rádiového signálu – díky tomu je méně pravděpodobné, že si model dokonale vybaví konkrétní tréninkové příklady, přičemž si zachová své celkové schopnosti.
První AI model postavený od základu s touto ochranou soukromí je vybudovaný na základním modelu Gemma 2 a je čerstvě venku pod názvem VaulGemma.
Chcete dostávat do mailu týdenní přehled článků z Computertrends? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.
Nalezení správné rovnováhy
Hlavní výzvou pro vývojáře bylo určit, kolik „šumu“ přidat, aniž by se zhoršil výkon modelu. Příliš málo šumu znamenalo nedostatečnou ochranu, příliš mnoho zase vedlo k tomu, že AI byla nepoužitelná. Vývojáři tak přišli se „zákony škálování“, které mají pomoct najít optimální poměr šumu k tréninkové dávce dat.
Přesto VaultGemma představuje spíš experiment než průlom. S pouhou 1 miliardou parametrů je ve srovnání s nejvýkonnějšími modely relativně malý a podle vývojářů „funguje podobně jako neveřejné modely podobné velikosti“. Výzkum naznačuje, že diferenciální soukromí funguje líp u menších specializovaných modelů – těch, které mohou pohánět konkrétní funkce AI, spíš než u chatbotů pro všeobecné použití.
V současnosti je VaultGemma ke stažení, byť ne jako klasický open source – Google povoluje jeho úpravy a distribuci, uživatelé však musí souhlasit mimo jiné s tím, že jej nepoužijí k nekalým účelům.

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.
Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.