美团发布LongCat-Flash-Lite模型
17 小时前

2月6日消息,美团发布了LongCat-Flash-Lite模型。该模型拥有685亿参数,但每次推理仅激活29亿至45亿参数,是一款轻量化MoE模型。通过将超300亿参数高效应用于嵌入层,LongCat-Flash-Lite不仅超越了参数量相当的MoE基线模型,在与同规模模型对比中也展现出卓越竞争力,尤其在智能体和代码领域表现优异。此外,依托YARN技术,该模型支持最长256K上下文,可高效处理长文档和大规模代码分析等任务。