引发猜测的“Elephant”被认领了:以十分之一消耗实现SOTA级Agent能力
3 小时前

4月22日,蚂蚁百灵大模型正式发布Ling-2.6-flash,这是一款总参数量104B、激活参数7.4B的Instruct模型。该模型主打“Token效率”,在保持智能水平的同时,推理速度更快、成本更低,更适合大规模真实应用。据Artificial Analysis评测,Ling-2.6-flash以15M tokens完成任务,消耗量约为其他模型的1/10。在BFCL-V4、TAU2-bench等Agent相关基准测试中,该模型达到同尺寸SOTA水平。目前,Ling-2.6-flash的API已正式开放,定价为输入每百万tokens 0.1美元,输出0.3美元,并提供一周限时免费试用。