杭州大模型DeepSeek训练仅花4000万元 美国AI大佬全炸出来了
2024-12-28

DeepSeek V3一经发布即宣布开源,延续其一贯的性价比优势。同时,还发布了53页论文,详细分享了训练过程。论文中的关键细节备受关注:DeepSeek使用仅十分之一的算力,便成功构建了与GPT-4o和Claude-3.5-Sonnet性能相当的模型,实现了高效低成本训练。