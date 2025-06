O víkendu v polovině května se sešla tajná matematická konkláve. Třicet nejrenomovanějších matematiků světa se sjelo do kalifornského Berkeley, někteří dokonce z tak vzdálených míst, jako je Velká Británie. Členové skupiny se utkali v souboji s „uvažujícím“ AI chatbotem, jehož úkolem bylo řešit problémy, které vymysleli, aby otestovali jeho matematické schopnosti. Dva dny kladli chabotovi otázky na úrovni profesorů a byli ohromeni, když zjistili, že je schopen odpovědět na některé z nejtěžších řešitelných problémů na světě. „Mám kolegy, kteří doslova řekli, že tyto modely se blíží matematickému géniovi,“ říká Ken Ono, matematik z University of Virginia a vedoucí a porotce na setkání.

AI Chatbot, o kterém je řeč, je poháněn o4-mini, takzvaným velkým jazykovým modelem (LLM) pro uvažování. Byl vyvinut společností OpenAI tak, aby byl schopen provádět velmi složité dedukce. Podobné schopnosti má i ekvivalent od Googlu, Gemini 2.5 Flash. Stejně jako LLM, které poháněly dřívější verze ChatGPT, se i o4-mini učí předvídat další slovo v sekvenci. Ve srovnání s dřívějšími LLM jsou však o4-mini a jeho ekvivalenty lehčí a agilnější modely, které se učí na specializovaných datových sadách s větší podporou ze strany lidí. Tento přístup vede k AI chatbotu, který je schopen se ponořit mnohem hlouběji do složitých matematických problémů než tradiční LLM.

Aby bylo možné sledovat pokrok o4-mini, OpenAI dříve pověřilo Epoch AI, neziskovou organizaci, která provádí benchmarking LLM, aby vytvořila 300 matematických otázek, jejichž řešení dosud nebyla zveřejněna. I tradiční LLM dokážou správně odpovědět na mnoho složitých matematických otázek. Když však Epoch AI položila několika takovým modelům tyto otázky, které se lišily od těch, na kterých byly trénovány, nejúspěšnější z nich dokázaly vyřešit méně než 2 %, což ukázalo, že těmto LLM chybí schopnost uvažovat. Model o4-mini se ukázal jako zcela odlišný.

Epoch AI najala Elliota Glazera, který nedávno dokončil doktorát z matematiky, aby se v září 2024 připojil k nové spolupráci na benchmarku s názvem FrontierMath. Projekt shromáždil nové otázky různých úrovní obtížnosti, přičemž první tři úrovně pokrývaly úkoly na úrovni bakalářského, magisterského a výzkumného studia. Do dubna 2025 Glazer zjistil, že o4-mini dokáže vyřešit přibližně 20 procent otázek. Poté přešel ke čtvrté úrovni: sadě otázek, které by byly náročné i pro akademického matematika. Pouze malá skupina lidí na světě by byla schopna takové otázky vytvořit, natož na ně odpovědět. Matematici, kteří se projektu účastnili, museli podepsat dohodu o mlčenlivosti, která jim ukládala komunikovat výhradně prostřednictvím aplikace Signal. Jiné formy kontaktu, jako je tradiční e-mail, by mohly být potenciálně naskenovány LLM a nechtěně jej trénovat, čímž by došlo ke kontaminaci datového souboru.

Za každý problém, který o4-mini nedokázal vyřešit, získal matematik, který jej vymyslel, odměnu 7 500 dolarů. Skupina postupovala v hledání otázek pomalu, ale jistě. Glazer však chtěl věci urychlit, a tak společnost Epoch AI uspořádala osobní setkání v sobotu 17. května a v neděli 18. května. Účastníci tam měli dokončit poslední sadu otázek. Třicet účastníků bylo rozděleno do skupin po šesti. Dva dny akademici soutěžili mezi sebou, aby vymysleli problémy, které by oni sami dokázali vyřešit, ale které by AI bota s logickým uvažováním zmátly.

Na konci sobotního večera byl Ken Ono frustrován botem, jehož nečekané matematické schopnosti brzdily pokrok skupiny. „Vymyslel jsem problém, který by odborníci v mém oboru uznali jako otevřenou otázku v teorii čísel – dobrý problém na úrovni doktorátu,“ říká. Požádal o4-mini, aby otázku vyřešil. Během následujících 10 minut Ono v ohromeném tichu sledoval, jak bot v reálném čase rozvíjí řešení a ukazuje svůj proces uvažování. Bot strávil první dvě minuty hledáním a osvojováním si související literatury v daném oboru. Poté na obrazovku napsal, že se nejprve chce naučit řešit jednodušší „hračičkovou“ verzi otázky. O několik minut později napsal, že je konečně připraven vyřešit složitější problém. O pět minut později o4-mini představil správné, ale drzé řešení. „Začínalo to být opravdu drzé,“ říká Ono, který je také nezávislým matematickým konzultantem pro Epoch AI. „A na konci napsal: „Citace není nutná, protože tajemné číslo jsem vypočítal já!“

Porazený Ono v neděli brzy ráno skočil na Signal a upozornil ostatní účastníky. „Nebyl jsem připravený na souboj s takovým LLM,“ říká. „Takové uvažování jsem u modelů nikdy neviděl. To dělají vědci. Je to děsivé.“

Ačkoli se skupině nakonec podařilo najít 10 otázek, které bota zaskočily, výzkumníci byli ohromeni tím, jak daleko se AI za jeden rok dostala. Ono to přirovnal k práci s „silným spolupracovníkem“. Yang Hui He, matematik z London Institute for Mathematical Sciences a jeden z prvních průkopníků využití AI v matematice, říká: „To je to, co by dělal velmi, velmi dobrý postgraduální student – vlastně ještě víc.“

Bot byl také mnohem rychlejší než profesionální matematik, protože mu trvalo jen několik minut to, co by lidskému odborníkovi zabralo týdny nebo měsíce.

Sparring s o4-mini byl sice vzrušující, ale jeho pokrok byl také alarmující. Ono a He vyjadřují obavy, že výsledky o4-mini by mohly být příliš důvěryhodné. „Existuje důkaz indukcí, důkaz kontradikcí a pak důkaz zastrašováním,“ říká He. „Když něco řeknete s dostatečnou autoritou, lidé se prostě bojí. Myslím, že o4-mini zvládl důkaz zastrašováním; všechno říká s takovou sebejistotou.“

Na konci setkání se skupina začala zamýšlet nad tím, jaká by mohla být budoucnost matematiků. Diskuse se stočila k nevyhnutelnému „pátému stupni“ – otázkám, které nedokážou vyřešit ani ti nejlepší matematici. Pokud AI dosáhne této úrovně, role matematiků se výrazně změní. Matematici se například mohou přesunout k pouhému kladení otázek a interakci s rozumovými roboty, aby jim pomohli objevovat nové matematické pravdy, podobně jako to dělá profesor s postgraduálními studenty. Ono proto předpovídá, že klíčem k zachování matematiky pro budoucí generace bude podpora kreativity ve vysokoškolském vzdělávání.

„Říkám svým kolegům, že je velkou chybou tvrdit, že obecná umělá inteligence nikdy nepřijde, že je to jen počítač,“ říká Ono. „Nechci přispívat k hysterii, ale v některých ohledech tyto velké jazykové modely již překonávají většinu našich nejlepších postgraduálních studentů na světě.

Autorka: Lyndie Chiou je vědkyně, autorka vědeckých článků a zakladatelka webové stránky věnované vědeckým konferencí ZeroDivZero. Její články byly také publikovány v časopise Sky & Telescope. Text vychází z článku Scientific American.



Související odkazy:

Epoch AI je multidisciplinární výzkumný institut, který zkoumá trajektorii umělé inteligence (AI). Zkoumáme hnací síly AI a předpovídáme její důsledky pro ekonomiku a společnost. Institut odhaduje, že celkovou zásobu veřejných textů generovaných lidmi (přibližně 300 bilionů tokenů), jazykové modely plně využijí mezi lety 2026 a 2032. Nebo dokonce dříve, pokud budou intenzivně přetrénovány. [1] https://epoch.ai/blog/openai-and-frontiermathm



Tváře na obrázku neodpovídají reálným osobám. Byly vygenerovány umělou inteligencí a nejsou kopií ani rekonstrukcí žádné existující osoby. Obrázek je čistě ilustrační a fiktivní. Podobnost s žijícími osobami je čistě náhodná.