Python Solving Mathematics

GPT-5争议、开源追赶、能力飞跃：Epoch AI年终报告揭示AI能力加速

顶尖国际模型如GPT、Gemini在专家级数学难题FrontierMath上表现优异，但在真正高难度问题面前仍未满分，显示出推理能力仍有提升空间。与此同时，AI推理能力和强化学习的进步让增长速度几乎翻倍，成本大幅下降，许多模型已能在消费级硬件上运行。

一些您可能无法访问的结果已被隐去。