Nový AI agent od Microsoftu dokáže ovládat software i mechanické roboty

28. 2. 2025

Sdílet

Autor: PCWorld s využitím DALL-E
Microsoft dosahuje úspěchu ve vývoji agentní umělé inteligence schopné porozumět svému prostředí.

Společnost Microsoft Research oznámila průlom v oblasti umělé inteligence díky novému integrovanému AI modelu Magma. Ten by mohl změnit způsob, jakým stroje komunikují s digitálními rozhraními i fyzickými objekty. Systém představuje významný pokrok při vývoji umělé inteligence, která dokáže porozumět svému prostředí a jednat v něm.

Magma se odlišuje tím, že dokáže nejen zpracovávat různé typy vstupů – jako je text, obrázky a video – ale také na základě těchto informací jednat, ať už jde o klikání v softwarových rozhraních nebo manipulaci s objekty pomocí robotických paží. Tento univerzální přístup se liší od předchozích systémů, které obvykle vyžadovaly samostatné modely pro vnímání a jednání.

Máme nové jméno

Po více než třech dekádách existence otvírá magazín Computerworld novou kapitolu. Tradiční průvodce světem IT, který si za 36 let existence vybudoval pověst jednoho z nejdůvěryhodnějších tuzemských zdrojů pro IT profesionály, se od nynějška jmenuje Computertrends.

Cílem projektu, který vznikl ve spolupráci společnosti Microsoft a několika prestižních univerzit, je vytvořit to, co výzkumníci nazývají „agentní umělá inteligence“ – systémy, které mohou samostatně plánovat a provádět vícekrokové úkoly na základě lidských pokynů.

Na technické úrovni přináší Magma dvě klíčové inovace. První z nich, nazvaná „Set-of-Mark“, pomáhá umělé inteligenci identifikovat interaktivní prvky v prostředí, jako jsou klikatelná tlačítka nebo předměty, které lze zvednout. Druhá, „Trace-of-Mark“, umožňuje systému učit se pohybové vzory z videodat. Tyto funkce společně umožňují systému Magma navigovat v rozhraních a ovládat robotické systémy.

Video ke kávě

Máte čas na rychlé a informativní video?

Microsoft není jediný, kdo se o tento typ technologie snaží. Na podobných projektech pracují jak OpenAI, tak Google, přičemž OpenAI vyvíjí agenty zaměřené na uživatelské rozhraní a Google zkoumá různé aplikace prostřednictvím svého systému Gemini 2.0. Microsoft však tvrdí, že integrovaný přístup k vnímání a jednání Magmu od konkurence odlišuje a první výsledky testování se jeví slibně. 

I přesto se Magma stále potýká s problémy, zejména při řešení složitých úkolů, které vyžadují více postupných rozhodnutí. Microsoft tato omezení uznává a tvrdí, že probíhá výzkum, jehož cílem je tyto schopnosti zlepšit.

Jako krok směrem k transparentnosti a společnému vývoji plánuje Microsoft zveřejnit tréninkový a inferenční kód systému Magma na serveru GitHub, což umožní výzkumným pracovníkům z celého světa prozkoumat jejich práci a navázat na ni. 

zabbix_tip

Jak je na tom kybernetická bezpečnost v České republice? Jak bezpečné jsou české digitální sítě?
Jak je na tom kybernetická bezpečnost v České republice? Jak bezpečné jsou české digitální sítě?
0:00/

Toto uvolnění by mohlo urychlit pokrok ve vývoji systémů umělé inteligence, které mohou efektivně fungovat v digitálním i fyzickém prostoru.

Vývoj systému Magma také odráží měnící se přístup k AI agentům. Zatímco koncept autonomních systémů AI kdysi vyvolával všeobecné obavy, nyní se stal standardním předmětem hlavního proudu výzkumu AI, což naznačuje rostoucí akceptaci potenciálních přínosů této technologie, pokud je správně vyvinuta a kontrolována.

 

Computertrends si můžete objednat i jako klasický časopis. Je jediným odborným magazínem na českém a slovenském trhu zaměreným na profesionály v oblasti informačních a komunikačních technologií (ICT). Díky silnému zázemí přináší aktuální zpravodajství, analýzy, komentáře a přehledy nejnovejších technologií dříve a na vyšší odborné úrovni, než ostatní periodika na tuzemském trhu.

Obsah Computertrends je určen odborníkům a manažerům z firem a institucí, kteří se podílejí na rozhodovacím procesu při nákupu ICT technologií. Jednotlivá čísla si můžete objednat i v digitální podobě.