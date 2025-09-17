Computertrends  »  Technologie  »  Google vyvíjí nový AI model chránící vaše osobní údaje

Google vyvíjí nový AI model chránící vaše osobní údaje

Václav Tesař
Dnes

obrázek s AI a zámkem
Autor: Radan Dolejš s podporou AI
Google přišel s AI modelem, který do tréninkových dat přidává „šum“ za účelem zabránit modelu jejich přesné reprodukci.

Vzhledem k tomu, že společnostem zabývajícím se umělou inteligencí docházejí kvalitní data pro trénování svých modelů, stále častěji se obracejí k potenciálně citlivým informacím o uživatelích, které najdou na internetu. 

Google Research však vytvořila řešení, které by mohlo pomoci vaše soukromí ochránit právě tehdy, když se vaše data dostanou do tréninku umělé inteligence.

Problém s ochranou soukromí

Modely umělé inteligence, jako je ChatGPT, mají někdy nepříjemný zvyk: mohou náhodně vypustit části svých tréninkových dat doslova slovo od slova. Pokud taková data obsahují osobní údaje, čísla kreditních karet nebo obsah chráněný autorskými právy, představuje to závažný problém s ochranou soukromí s potenciální právními konsekvencemi.

Praktický pohled do světa SIEM, SOAR a SOC - podcast ze série Kyberbezpečnost s Computertrends
Praktický pohled do světa SIEM, SOAR a SOC - podcast ze série Kyberbezpečnost s Computertrends
0:00/

Vývojáři z Google Research teď představili nový přístup zvaný diferenciální soukromí, který během procesu trénování AI přidává pečlivě vypočítaný „šum“, aby se tomuto problému s potenciálním reprodukováním tréninkových dat zabránilo. 

Představte si to jako přidání šumu do rádiového signálu – díky tomu je méně pravděpodobné, že si model dokonale vybaví konkrétní tréninkové příklady, přičemž si zachová své celkové schopnosti. 

První AI model postavený od základu s touto ochranou soukromí je vybudovaný na základním modelu Gemma 2 a je čerstvě venku pod názvem VaulGemma.

Nalezení správné rovnováhy

Hlavní výzvou pro vývojáře bylo určit, kolik „šumu“ přidat, aniž by se zhoršil výkon modelu. Příliš málo šumu znamenalo nedostatečnou ochranu, příliš mnoho zase vedlo k tomu, že AI byla nepoužitelná. Vývojáři tak přišli se „zákony škálování“, které mají pomoct najít optimální poměr šumu k tréninkové dávce dat.

Přesto VaultGemma představuje spíš experiment než průlom. S pouhou 1 miliardou parametrů je ve srovnání s nejvýkonnějšími modely relativně malý a podle vývojářů „funguje podobně jako neveřejné modely podobné velikosti“. Výzkum naznačuje, že diferenciální soukromí funguje líp u menších specializovaných modelů – těch, které mohou pohánět konkrétní funkce AI, spíš než u chatbotů pro všeobecné použití. 

V současnosti je VaultGemma ke stažení, byť ne jako klasický open source – Google povoluje jeho úpravy a distribuci, uživatelé však musí souhlasit mimo jiné s tím, že jej nepoužijí k nekalým účelům.

Autor článku

Václav Tesař

