智谱GLM-5技术全公开!完全适配华为等国产芯片,美国网友酸了

GLM-5是怎么炼成的?

现在,它背后的论文终于完全公开了。

论文的名字也很直接:告别Vibe Coding,迈入智能体工程(Agentic Engineering)。

也正如我们之前实测的那般,它可以自己连续跑代码超过24小时、700次工具调用、800次上下文切换,从零直接手搓一个Game Boy Advance(GBA)模拟器。

一言蔽之,GLM-5把开源AI拽进了长任务时代。

外国网友直呼“GLM-5是最好的开源模型”,

并且还认为“极大拉小了和Claude Opus 4.6之间的距离”,

除此之外,资本市场的表现也是可以从侧面印证一家大模型公司的实力。

毕竟春节期间,智谱股价飙升的程度,毋庸置疑,大家有目共睹。

现如今,这份长达40页的论文,彻底揭开了它背后的一切技术秘密。亮点如下:

架构方面:在上一代经过验证的ARC(智能体、推理与编程)能力和MoE之上,引入DeepSeek同款稀疏注意力(DSA);成本大幅打下来了的同时,长上下文能力却一点没丢。

后训练方面:全新构建的异步强化学习基础设施,把生成和训练解耦,加上独创的异步智能体RL算法,让效率大幅提升。

芯片适配方面:GLM-5完成了与华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、沐曦以及燧原等国产芯片的全栈适配。请输入图片描述


评论栏

评论已关闭