DeepSeek甩出了一张“王炸” - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

DeepSeek甩出了一张“王炸”

2024-12-28

12月26日，国产大模型DeepSeek发布了其新一代语言模型DeepSeek-V3，这是一款强大的混合专家（Mixture-of-Experts，MoE）语言模型。其技术亮点在于拥有671B的MoE和37B的激活参数，并在14.8万亿个高质量token上进行了预训练。这一创新在AI圈内引起了轰动，被誉为“圣诞节真的来了”的里程碑事件。

上一篇：杭州大模型DeepSeek训练仅花4000万元美国AI大佬全炸出来了

下一篇：AI大事件汇总（12月28日）

返回列表

热文阅读

2 天前

虎牙用AI畅想“无限游戏”

1 天前

“现在读AI博士已经太晚了”

1 天前

传英伟达正在研发新款中国特供AI芯片比H20先进但远不如旗舰产品

2 天前

美国电网面临数据中心热潮压力