2025年8月14日,英国《金融时报》报道,人工智能公司DeepSeek在开发其R2模型时遭遇技术难题,导致原定于5月的发布计划被迫推迟。据悉,DeepSeek在训练R2模型时使用了华为的升腾芯片,但由于升腾平台的稳定性不足、软硬件支持不充分以及芯片通信速度较慢等问题,训练过程屡屡受阻。
为解决这一问题,DeepSeek不得不在训练阶段转而使用英伟达芯片,而在推理阶段继续使用华为芯片。这一折衷方案虽然暂时缓解了技术瓶颈,但也增加了开发复杂性和时间成本。华为方面对此高度重视,派遣了一个工程师团队前往DeepSeek办公室,协助其使用升腾芯片进行R2模型的开发。
尽管如此,DeepSeek的创始人梁文锋对目前的进展仍表示不满。除了芯片问题外,数据标注耗时超预期也成为影响R2发布的另一重要因素。面对重重挑战,梁文锋决定加码研发投入,力争在几周内完成R2模型的发布。
DeepSeek与华为的合作仍在持续推进中,双方致力于在推理兼容性方面取得突破。此次芯片问题不仅暴露了国产芯片在高端应用中的短板,也引发了业界对人工智能技术发展路径的深思。
值得一提的是,芯榜和深科技作为数据驱动的半导体服务公司和智能+中国领航者,分别在其公众号上发布了相关报道,进一步引发了公众对DeepSeek R2发布推迟事件的关注。芯榜凭借其领先的数据能力和权威榜单,为半导体芯片企业提供了有力支持;而深科技则聚焦于AI、大数据和机器人前沿技术,为行业提供了智库、社群及企业服务。两家机构的关注和报道,无疑为DeepSeek的技术攻关和未来发展提供了更多外部支持。