時間:2025-07-28 | 欄目:業界 | 點擊:次
在2025年國際數學奧林匹克競賽(IMO)官方 的特別邀請下,小藝AI競賽Agent亮相本屆全球頂尖的數學賽事。經過三天的激烈角逐,小藝AI競賽Agent成功攻克6道難題中的5道 ,以34分 的優異成績摘得銀牌,距離金牌分數線(35分)僅1分之差。這一歷史性的突破,標志著華為AI的邏輯推理能力達到了一個新的高度。
IMO主席Gregor Dolinar教授對華為AI的表現給予了高度評價:“華為AI提交的答卷獲得了34分(滿分42分),這是一個了不起的成就。(The Huawei AI scripts received a grade of 34 out of 42, which is a remarkable result.)”
不止于答題: 小藝 AI競賽Agent展現 專家 級解題藝術
與傳統模型追求解題套路不同,小藝AI競賽Agent在解題過程中展現了接近頂尖解題方式的創造力和嚴密性:
專家 級推理能力 :小藝AI競賽Agent完美攻克第1至第4題,均獲滿分(7分)。其論證過程嚴謹、邏輯自洽、可讀性強,此外在第3題中還靈活運用了“升冪定理”等技巧,展現了深厚的數學知識儲備。值得說明的是第5題,評審組確認,盡管Agent因對平局情況的表述存在細微瑕疵被扣1分,但其核心思維過程已完整包含了對該情況的嚴謹證明。這表明,它實際上已具備了解答該題所需的全部數學能力。
閃耀的解題靈感 : 在第2題的證明中,小藝AI競賽Agent精準預測并添加了唯一一個輔助點 ,便完成了整個復雜證明的生成。其解法之高效、思路之凝練,顯著優于已知的公開解法。
接近完美的思考深度: 第1題的解答思路流程完整,清晰簡潔,對于n=3的情況討論充分,歸納過程嚴謹;同時在第4題的解答中對所有情況討論完備,證明的結構層級分明,易于理解。
> 對IMO競賽感興趣的開發者,可以前往GitHub了解小藝AI競賽Agent完整的賽題解答,鏈接://github.com/Huawei-xiaoyi/IMO2025-solutions
技術揭秘:驅動巔峰表現的“雙腦”協同架構
小藝AI競賽Agent的卓越表現,源于其創新的“自然語言大模型 + 形式化證明 ”協同架構。這套系統如同一個擁有“左右腦”的數字大腦,將人類的直覺創造與機
器的嚴謹驗證無縫融合。
1、 思維風暴與“AI同行評審”:孕育創造性解法
面對難題,小藝AI競賽Agent首先通過并行采樣生成海量、多樣化的解題思路,如同進行一場“思維風暴”。隨后,啟動獨特的“AI同行評審”機制 ,讓不同的AI模型互相審閱、辯論、評分,從而篩選出最優的思路路徑。這一過程還會融合形式化證明的反饋,指導AI模型進行多輪自我修復與迭代優化,極大提升了模型攻克精英級難題的創造力。
2 、 迭代式多層級證明:構建嚴密的邏輯閉環
為克服高復雜度數學證明嚴謹性的挑戰,華為小藝團隊設計了迭代式多層級并行證明系統。該系統首先將復雜的證明目標分解為樹狀的多層級子問題,然后由形式化證明模型自下而上地對每個子節點進行大規模并行驗證。一旦某個環節證明失敗,具備反思和自我修正能力的模型將立刻啟動修復流程,直至整個邏輯鏈條完美閉環。
里程碑與新起點:共探AI與 教育 的未來
此次賽事的成果,不僅是華為AI發展的重要里程碑,更充分地證明了基于大語言模型(LLM)的多Agent協同系統在解決高階數學問題上的強大潛力。
與此同時華為小藝團隊也意識到,當前系統在面對極高復雜度的數學問題時(如本屆IMO第6題)仍有局限,未來將會繼續提升小藝的抽象推理與問題建模能力,持續向高階數學推理探索。
據悉,小藝AI競賽Agent的核心能力,未來將逐步賦能于小藝教育Agent 。華為小藝團隊或將以白名單機制,優先向數學及AI領域的專業研究者開放,旨在共同推動智能解題方法論的創新,讓頂級的思維能力普惠每一位學習者。