2月10日消息,此前我们曾提及春节期间国产AI领域将有几款重要产品发布,其中除了备受瞩目的DeepSeek V4外,智谱的新一代大模型GLM-5也即将上线,这一消息推动该公司股价近期大幅上涨200%。
前几日,全球模型服务平台OpenRouter推出了一款代号为“Pony Alpha”的匿名模型,该模型凭借出色的表现引发了全球范围内的关注,特别是在代码编写领域,其能力被认为可与Claude Opus相媲美。
Pony Alpha到底是哪家的模型一度引发网友热烈讨论,目前几乎可以确定是智谱的GLM-5了,一方面是系统的提示词显示它说自己是GLM,另一方面网友验证了一个GLM大模型家族的特色bug,那就是输入 “锅内倒入植物油烧热” 得到的答案是乱七八糟的,Pony Alpha也符合这个特点。
随着更多信息的挖掘出来,GLM-5的技术架构也差不多明确了,它采用了与DeepSeek-V3/V3.2相同的技术路线——DeepSeek稀疏注意力,简称DSA,总参数量达745B,是上一代GLM-4.7的2倍。
除了DSA之外,GLM-5另一大技术特色是多Token预测(Multi-Token Prediction,MTP),有78层隐藏层,256个专家,每次激活8个,激活参数约44B,稀疏度5.9%,上下文窗口最高支持202K token。
复用DS架构的好处有很多,可以直接受益于vLLM、SGLang等主流推理框架的现有优化,部署门槛将大幅降低。
不过值得关注的是GLM-5的多模态能力,因为DS此前还是文本大模型,不支持视频的,而多模态能力在2026年是新一代大模型不应该缺少的能力。
随着GLM大模型在国内外市场收获广泛关注与认可,智谱公司的股价近期呈现持续攀升态势,其总市值目前已达到约1500亿港币,较数月前IPO上市时的市值增长了两倍。
获得万元圆梦金的美团外卖小哥,转头就给老婆购置了iPhone 17 Pro
15岁男孩天生拥有惊人力量:徒手轻松掰开苹果,更能掰断80公斤的臂力棒
绝了!悉尼妹一袭73年复古礼服 神还原玛丽莲·梦露经典造型
关于小米超级大压铸使用的材料,雷军介绍称是小米自研的小米泰坦合金
《铁拳8》新增旗袍装扮
杨奇发文谈《黑神话:钟馗》首个实机!钟馗吃鬼改烹鬼更好发挥
Tt带来SWAFAN 120 EX INFINITY ARGB系列风扇新品:具备双重无限镜灯效
65岁黄子华坦言“到死都不会用老年卡” 调侃担忧遭遇吴镇宇同款尴尬场面