阶跃星辰开源Step 3.5 Flash,推理速度可达每秒350个token
4 小时前 / 阅读约2分钟
来源:凤凰网
阶跃星辰发布并开源基座大模型Step 3.5 Flash,采用稀疏混合专家架构,总参数量1960亿,优化了推理能力与运行效率,支持主流个人工作站本地部署,已在多平台上线。

凤凰网科技讯 2月2日,人工智能公司阶跃星辰正式发布并开源其最新的基座大模型Step 3.5 Flash。该模型旨在为开发者构建智能体(Agent)提供底层支持,并针对规模化应用下的稳定性与响应速度进行了优化。

据官方介绍,Step 3.5 Flash采用了稀疏混合专家(MoE)架构,总参数量达到1960亿。通过技术设计,每个Token实际激活的参数约为110亿,以实现推理能力与运行效率的平衡。在官方公布的测试中,该模型在LiveCodeBench V6代码挑战、AIME 2025数学竞赛等多项评测中展现了竞争力,单请求代码任务下最高推理速度可达每秒350个token。

在应用层面,该模型被设计用于处理需要多步推理、复杂逻辑求解及长时间运行的任务。官方表示,模型支持在NVIDIA DGX Spark、Apple M3/M4 Max以及AMD AI Max+ 395等主流个人工作站上进行本地部署,以满足数据隐私和本地算力应用的需求。

目前,Step 3.5 Flash已在OpenRouter、GitHub及阶跃星辰官方应用平台上线,面向开发者提供。与此同时,阶跃星辰宣布其下一代模型Step 4的训练工作已经启动。