微博正式发布首个自研开源大模型Vibe Thinker
1 天前

11月18日,微博正式发布首个自研开源大模型VibeThinker。这个仅拥有15亿参数的轻量级模型,在国际顶级数学竞赛基准测试中击败了参数量高达6710亿的DeepSeek R1模型,且单次后训练成本仅7800美元,较DeepSeek-R1和MiniMax-M1等模型成本降低了几十倍。目前,VibeThinker尚处于实验性版本,研发重点在于强化小模型在复杂数学与竞赛编程方面的能力,暂不适合作为日常聊天工具,更适用于数学和代码等高智能应用场景。