DeepSeek联合北大、清华发布新型AI推理框架DualPath - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

DeepSeek联合北大、清华发布新型AI推理框架DualPath

2 小时前

DeepSeek与北京大学、清华大学合作，在ArXiv平台发表论文，提出面向智能体系统的全新大模型推理框架DualPath。该框架旨在解决长上下文场景下KV-Cache加载引发的I/O瓶颈问题，通过引入“存储→解码引擎→预填充”的第二路径，利用解码引擎闲置的存储网络带宽和RDMA高速网络，实现集群存储带宽的全局池化与负载均衡。在660B参数规模的生产级模型测试中，DualPath使离线推理吞吐提升1.87倍，线上服务吞吐平均提升1.96倍，显著优化首Token延迟，且不影响逐Token生成速度。

上一篇：恒生科技指数短线拉升涨超1%

下一篇：Codex与Figma实现双向工作流集成

返回列表

热文阅读

2 天前

文科生 72 小时杀入 GitHub 全球榜：我没写一行代码，但指挥了一支 AI 军队

2 天前

2025年5G SA迎来转折点全球移动核心网市场增长创新高

2 天前

SambaNova 发布第五代 RDU AI 芯片，与英特尔达成多年期合作

2 天前

春节AI战役全记录：红包、模型与算力