数据不会撒谎,在 SWE-bench-Verified 和 Terminal Bench 2.0 这两个公认最难的编程榜单中,GLM-5 分别拿下了 77.8 和 56.2 的高分,在真实编程场景的体感上,已经无限逼近 Claude Opus 4.5。
香港 - Media OutReach Newswire - 2026年2月11日 - 香港生产力促进局旗下的先进能源及智慧交通中心(APAS)首次参与于 2 月 4 至 6 日在新加坡举行的亚洲领先光电技术创新平台 - 亚洲光电博览会(Asia Photonics Expo, APE ...
Claude ...
几周前,开源社区曾流传一个名为Pony Alpha的模型。它能进行长程交互、拆解复杂任务、在多轮对话中保持稳定上下文,一度引发广泛猜测。如今答案揭晓,Pony Alpha正是GLM-5的匿名测试版本。
今天,谷歌Chrome团队投下了一枚深水炸弹: WebMCP(Web模型上下文协议)正式登场。 这相当于给Agent加上了「超能力」, 从此不用再「装得像个人一样」 ,去看网页、找按钮,或是点链接。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果