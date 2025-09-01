Computertrends  »  Technologie  »  Microsoft ukazuje vlastní AI sílu: nové modely MAI-Voice-1 a MAI-1 Preview

Microsoft ukazuje vlastní AI sílu: nové modely MAI-Voice-1 a MAI-1 Preview

Radan Dolejš
Dnes

Ilustrace humanoidního robota sledujícího notebook se zdrojovým kódem, kolem něj vlnové grafy a barevné bloky připomínající Microsoft.
Autor: Radan Dolejš s podporou AI
Microsoft představil své první interně vyvinuté AI modely – hlasový MAI-Voice-1 a jazykový MAI-1 Preview. Přinášejí extrémní rychlost, nízké nároky na hardware a otevírají cestu k větší technologické nezávislosti firmy.

Microsoft nedávno představil své první plně interně vyvinuté AI modely MAI-Voice-1 a MAI-1 Preview, které přinášejí konkrétní technologické inovace v oblasti syntézy hlasu a zpracování přirozeného jazyka. Tyto modely významně rozšiřují možnosti využití AI v reálných aplikacích.

Model MAI-Voice-1 dokáže vygenerovat minutu přirozeně znějícího hlasového záznamu za méně než jednu sekundu běhu na jediném GPU, což je rychlost, která výrazně převyšuje standardy současných hlasových AI systémů. 

Kromě rychlosti je schopný pracovat s více mluvčími současně a reagovat na kontext tak, aby zvukový výstup byl expresivní a adekvátní dané situaci. Trénován byl na rozsáhlém vícejazyčném datasetu a jeho výpočetní nároky jsou natolik nízké, že může být nasazen nejen na serverech, ale i na běžných koncových zařízeních. 

Microsoft jej už implementuje například v aplikaci Copilot Daily, kde pomáhá uživatelům hlasově zpracovávat informace, nebo v nových funkcích určených pro podcasting.

Druhý model MAI-1 Preview je jazykový model vyšší generace, který byl vycvičen na síti přes 15 000 GPU Nvidia H100. Tento model využívá architekturu mixture-of-experts, která ho činí efektivnějším a schopnějším sledovat uživatelské pokyny a reagovat na ně relevantněji než tradiční velké jazykové modely. 

MAI-1 Preview je zaměřený zejména na běžné konverzační scénáře, nikoliv výhradně na složité podnikové aplikace. Microsoft tento model nasazuje selektivně v rámci svých produktů Copilot a sbírá zpětnou vazbu pro další vylepšení. Vývoj probíhal na vlastní infrastruktuře, která zahrnuje speciální GPU cluster GB200, což umožňuje lepší kontrolu nad výkonem a optimalizacemi.

Současně tím Microsoft postupně snižuje svou závislost na technologiích OpenAI. Navzdory pokračující spolupráci má firma za cíl snížit závislost na externích dodavatelích a získat větší kontrolu nad vývojem a provozem vlastních AI modelů. 

Napětí mezi Microsoftem a OpenAI v posledních měsících narostlo kvůli rozdílným názorům na vlastnictví technologií a obchodní podmínky, což vedlo k strategickému rozhodnutí Microsoftu posílit vlastní výzkum a vývoj AI. 

Díky vlastní infrastruktuře a novým modelům jako MAI-Voice-1 a MAI-1 Preview má Microsoft nyní lepší pozici pro rychlé inovace a přizpůsobení AI technologií specifickým potřebám svých produktů.

Technicky jsou tyto modely zajímavé tím, že kombinují výkonnost, nízké hardwarové nároky a schopnost operovat v různorodých scénářích. MAI-Voice-1 zvládá komplexní hlasové interakce s vysokou věrohodností a expresivitou a MAI-1 Preview zase dokáže přesně interpretovat a vyřizovat uživatelské požadavky na textu založeném rozhraní. 

Autor článku

Radan Dolejš

