百灵Ling-2.6-flash正式发布:104B参数实现SOTA级Agent 仅需1/10 Token消耗
1 天前

2026年4月22日,蚂蚁百灵大模型正式发布Ling-2.6-flash,这是一款总参数量104B、激活参数7.4B的Instruct模型,主打“Token效率”。该模型在多个Agent相关基准测试中达到同尺寸最优水平,在Artificial Analysis评测中,仅消耗15M tokens完成任务,约为其他模型的1/10。Ling-2.6-flash的API定价为输入每百万tokens 0.1美元,输出0.3美元,现已开放使用,并提供一周免费试用。此前,其匿名测试版本“Elephant Alpha”在OpenRouter平台日均调用量达100B级别。