Microsoft nedávno představil své první plně interně vyvinuté AI modely MAI-Voice-1 a MAI-1 Preview, které přinášejí konkrétní technologické inovace v oblasti syntézy hlasu a zpracování přirozeného jazyka. Tyto modely významně rozšiřují možnosti využití AI v reálných aplikacích.
Model MAI-Voice-1 dokáže vygenerovat minutu přirozeně znějícího hlasového záznamu za méně než jednu sekundu běhu na jediném GPU, což je rychlost, která výrazně převyšuje standardy současných hlasových AI systémů.

Kromě rychlosti je schopný pracovat s více mluvčími současně a reagovat na kontext tak, aby zvukový výstup byl expresivní a adekvátní dané situaci. Trénován byl na rozsáhlém vícejazyčném datasetu a jeho výpočetní nároky jsou natolik nízké, že může být nasazen nejen na serverech, ale i na běžných koncových zařízeních.
Microsoft jej už implementuje například v aplikaci Copilot Daily, kde pomáhá uživatelům hlasově zpracovávat informace, nebo v nových funkcích určených pro podcasting.
Druhý model MAI-1 Preview je jazykový model vyšší generace, který byl vycvičen na síti přes 15 000 GPU Nvidia H100. Tento model využívá architekturu mixture-of-experts, která ho činí efektivnějším a schopnějším sledovat uživatelské pokyny a reagovat na ně relevantněji než tradiční velké jazykové modely.
Chcete dostávat do mailu týdenní přehled článků z Computertrends? Objednejte si náš mailový servis a žádná důležitá informace vám neuteče. Objednat si lze také newsletter To hlavní, páteční souhrn nejdůležitějších článků ze všech našich serverů. Newslettery si můžete objednat na této stránce.
MAI-1 Preview je zaměřený zejména na běžné konverzační scénáře, nikoliv výhradně na složité podnikové aplikace. Microsoft tento model nasazuje selektivně v rámci svých produktů Copilot a sbírá zpětnou vazbu pro další vylepšení. Vývoj probíhal na vlastní infrastruktuře, která zahrnuje speciální GPU cluster GB200, což umožňuje lepší kontrolu nad výkonem a optimalizacemi.
Současně tím Microsoft postupně snižuje svou závislost na technologiích OpenAI. Navzdory pokračující spolupráci má firma za cíl snížit závislost na externích dodavatelích a získat větší kontrolu nad vývojem a provozem vlastních AI modelů.
Napětí mezi Microsoftem a OpenAI v posledních měsících narostlo kvůli rozdílným názorům na vlastnictví technologií a obchodní podmínky, což vedlo k strategickému rozhodnutí Microsoftu posílit vlastní výzkum a vývoj AI.
Díky vlastní infrastruktuře a novým modelům jako MAI-Voice-1 a MAI-1 Preview má Microsoft nyní lepší pozici pro rychlé inovace a přizpůsobení AI technologií specifickým potřebám svých produktů.
Technicky jsou tyto modely zajímavé tím, že kombinují výkonnost, nízké hardwarové nároky a schopnost operovat v různorodých scénářích. MAI-Voice-1 zvládá komplexní hlasové interakce s vysokou věrohodností a expresivitou a MAI-1 Preview zase dokáže přesně interpretovat a vyřizovat uživatelské požadavky na textu založeném rozhraní.

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.
Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.