中国大模型创业公司阶跃星辰在开源Step 3.5 Flash模型后,再次开源了其Agent基座模型的预训练权重、中训练权重及配套的Steptron训练框架。据悉,Step 3.5 Flash模型采用稀疏MoE架构,拥有1960亿参数,但推理时仅激活约110亿参数,在单请求代码任务下,其推理速度最高可达350TPS。