数据不会撒谎,在 SWE-bench-Verified 和 Terminal Bench 2.0 这两个公认最难的编程榜单中,GLM-5 分别拿下了 77.8 和 56.2 的高分,在真实编程场景的体感上,已经无限逼近 Claude Opus 4.5。
几周前,开源社区曾流传一个名为Pony Alpha的模型。它能进行长程交互、拆解复杂任务、在多轮对话中保持稳定上下文,一度引发广泛猜测。如今答案揭晓,Pony Alpha正是GLM-5的匿名测试版本。
19 小时on MSN
Wix website builder review 2026
With this simple, all-in-one solution you can create a stunning site with no technical know-how, but could Wix be a bit too simple for you?
几周前,开源社区曾流传一个名为Pony Alpha的模型。它能进行长程交互、拆解复杂任务、在多轮对话中保持稳定上下文,一度引发广泛猜测。如今答案揭晓,Pony Alpha正是GLM-5的匿名测试版本。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果