DeepSeek联合清北发布论文：发力智能体底层基建，突破Agent推理I/O瓶颈 - AI - JQman

Just Quick Just Quality

热门话题

白天

搜索

/

/

资讯

/

/

DeepSeek联合清北发布论文：发力智能体底层基建，突破Agent推理I/O瓶颈

3 小时前

DeepSeek联合北京大学、清华大学在ArXiv发布论文，提出智能体推理新框架DualPath。该框架旨在解决Agent长文本推理的I/O瓶颈问题，通过引入“存储至解码”路径，改变传统单路径加载模式，实现集群存储带宽的全局池化与动态负载均衡。在660B规模模型的实测中，DualPath使离线推理吞吐量提升1.87倍，在线服务吞吐量平均提升1.96倍，同时优化了首字延迟且不影响Token生成速度。DualPath构建了双路径模型，由推理引擎、流量管理器和中央调度器组成，并提供了以计算网卡为中心的流量管理和自适应请求调度器两套优化方案。实验结果表明，DualPath能有效突破大模型推理的I/O限制，提升智能体LLM推理系统的效率。论文第一作者为北京大学博士生吴永彤，专注于系统软件与大模型基础设施研究。

上一篇：Codex与Figma实现双向工作流集成

下一篇：演员王劲松称有微信视频号使用 AI 盗用其形象：完全看不出来真假

2 天前

文科生 72 小时杀入 GitHub 全球榜：我没写一行代码，但指挥了一支 AI 军队

2 天前

SambaNova 发布第五代 RDU AI 芯片，与英特尔达成多年期合作

2 天前

春节AI战役全记录：红包、模型与算力

2 天前

存储巨头的“复仇”

2 天前

特斯拉Robotaxi马斯克定价20万，比毛豆3还便宜

2 天前

广汽昊铂 A800 轿车将于 3 月 4 日上市，搭华为乾崑智驾 ADS V4.1

1 天前

中汽协： 1 月 SUV 销量前十强，占比达到 63.9%

2 天前

代码显示特斯拉中国 / 欧洲 Model 3 汽车将引入 2026 款 Model Y 同款 16 英寸 2K 中控屏

2 天前

InterDigital将在MWC26展示依托无线通信和AI技术的新服务和沉浸式体验

1 天前

马斯克给大一学生发offer，开发Robotaxi

上一篇：Codex与Figma实现双向工作流集成

下一篇：演员王劲松称有微信视频号使用 AI 盗用其形象：完全看不出来真假

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们