Google představil nový model Gemini 3.1 Pro a zpřístupnil ho v preview verzi. Slibuje zlepšení schopností zejména v oblasti uvažování a řešení problémů, přičemž tato tvrzení jako vždy opírá hlavně o benchmarky.
V testu Humanity´s Last Exam, který měří pokročilé znalosti v dané oblasti, dosáhl Gemini 3.1 Pro skóre 44,4 %, což je nárůst oproti 37,5 % u Gemini 3 a více než 34,5 %, kterých dosáhl konkurenční GPT-5.2 od OpenAI.
Ještě výraznější náskok a progres Gemini 3.1 Pro zaznamenal v benchmarku ARC-AGI-2, postaveném na nových logických problémech. Zatímco Gemini 3 v něm dříve dosáhl 31,1 %, což bylo podstatně méně než konkurence pohybující se v rozmezí 50–60 %, Gemini 3.1 Pro tento výsledek více než zdvojnásobil a dosáhl 77,1 %.
Kde naopak zaostává, je hodnocení Arena.ai, méně kvalitativní, více ovlivněné přímo zkušeností uživatelů. V generování textu na této platformě vede Claude Opus 4.6 před Gemini 3.1 Pro o čtyři body, navíc googlovský model překonává (stejně jako Opus 4.5 a GPT-5.2 High) v kódování. Google argumentuje právě povahou Arena.ai, kde je hodnocení založeno na preferencích uživatelů, kteří mohou upřednostňovat výstupy, které působí přesvědčivě, spíš než objektivně správné.
Aby Google předvedl přednosti svého nového modelu, zdůraznil schopnost Gemini 3.1 Pro generovat grafiku a simulace, včetně propracovanějších výstupů SVG. Ačkoli ukázky vypadají slibně, skutečný dopad bude pravděpodobně záviset na konkrétních případech použití. Uživatelé, kteří kladou složité, abstraktní otázky, mohou vidět nuancovanější odpovědi, naopak vývojáři, kteří vytvářejí agentické pracovní postupy, by z toho mohli těžit – Gemini 3.1 Pro téměř zdvojnásobil své skóre v benchmarku APEX-Agents.
Model je nyní k dispozici v preview verzi prostřednictvím AI Studio a Antigravity IDE, s podnikovým přístupem prostřednictvím Vertex AI a Gemini Enterprise. Uživatelé jej mohou používat v aplikaci Gemini a NotebookLM. Cena zůstává nezměněna na 2 USD za milion vstupních tokenů a 12 USD za milion výstupních tokenů, s kontextovým oknem pro vstup 1 milion tokenů a limitem výstupu 64 000 tokenů.
