英伟达适配DeepSeek-V4 AI模型，开箱性能超150 tokens/sec/user - AI - JQman

Just Quick Just Quality

热门话题

白天

搜索

/

/

资讯

/

/

英伟达适配DeepSeek-V4 AI模型，开箱性能超150 tokens/sec/user

4 小时前

4月25日，英伟达发布博文称，NVIDIA Blackwell平台现已支持DeepSeek-V4-Pro与DeepSeek-V4-Flash两款模型。其中，DeepSeek-V4-Pro总参数量达1.6T，激活参数为49B，专为高级推理任务设计；DeepSeek-V4-Flash总参数量为284B，激活参数13B，主打高速高效应用场景。两款模型均支持100万Token上下文窗口及最高38.4万Token输出长度，并采用MIT开源协议。性能方面，DeepSeek-V4-Pro在NVIDIA GB200 NVL72上开箱即用性能超过150 tokens/sec/user，若通过vLLM在Blackwell B300上部署，性能有望进一步提升。开发者可通过NVIDIA NIM微服务下载部署，或利用SGLang与vLLM框架进行定制化推理。

上一篇：DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠，活动持续至 5 月 6 日前

下一篇：没有更多了

2 天前

Mobileye发布2026财年第一季度财报，上调全年业绩展望，并宣布2.5亿美元股票回购计划

1 天前

【专利】蔚来换电技术惹争议，2.5亿美元索赔遭否认

2 天前

OpenAI 发布 ChatGPT 团队工作流 AI 智能体：7*24 小时在线，自动化处理长周期复杂任务

2 天前

OpenAI 当前已锁定 8GW 算力，到 2030 年将达 30GW

2 天前

特斯拉首座大规模人形机器人的工厂来了：年产能100万台

2 天前

字节跳动发布 3D 生成大模型 Seed3D 2.0，在几何 / 纹理材质生成上取得 SOTA

2 天前

姚顺雨交出首张答卷，腾讯AI有了一个新底座

2 天前

Google 推新芯片两款 TPU 分别主攻训练、专攻推理

2 天前

OpenAI发布工作流Agent，GPTs进入倒计时

2 天前

年薪1.6亿捐2亿，中国“最贵CEO”撒钱，盖不住联想AI焦虑？

上一篇：DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠，活动持续至 5 月 6 日前

下一篇：没有更多了

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们