清华大学章明星：大模型推理和优化部署技术开源实现

Just Quick Just Quality

热门话题

白天

搜索

资讯

清华大学章明星：大模型推理和优化部署技术开源实现 | 2025全球工程前沿

2026-05-05

大语言模型和多模态基础模型在自然语言处理、计算机视觉、代码生成等领域应用广泛，但其推理效率和部署可扩展性成为产业化落地的关键瓶颈。为此，开源社区和产业界正加速推进大模型在推理加速、内存压缩、异构硬件适配和分布式部署等方面的优化技术研究，并提供可复用、可扩展的开源实现。

上一篇：谷歌母公司重返欧元债券市场完成最新人工智能巨型债券发行

下一篇：苹果制造学院在密歇根举办首届春季论坛用AI解决方案强化美国供应链

返回列表

热文阅读

2 天前

广州一高校“禁止小米汽车进入校园”引热议，保卫处回应称“规定已执行一年、其他品牌车辆备案后可进入”

2 天前

省钱，我只服梁文锋

2 天前

比亚迪王传福与地平线 CEO 余凯会面，双方有望在智驾领域深度合作

1 天前

苹果代工厂塔塔电子被黑之际，iPhone 18 Pro Max 跌落测试视频流出

1 天前

OpenAI 成立“应急小组”，调查用户 Codex 额度消耗速度过快问题

2 天前

消息称 vivo X300 系列手机销量超 300 万台，Ultra 机型破 20 万

2 天前

搭载 L4 级自动驾驶系统，特斯拉 Cybercab 官方救援指南披露海量重磅信息

1 天前

收购仅一年即“决裂”，创始人贾扬清出走英伟达：黄仁勋不满运营效果，20 亿美金的 AI Infra 突围为何折戟？

2 天前

广州一民办高校深夜再回应禁止小米汽车入校：校园车辆管理一视同仁，与品牌无关

1 天前

多收170万，AI账单黑箱曝光，Anthropic退钱不认账

上一篇：谷歌母公司重返欧元债券市场完成最新人工智能巨型债券发行

下一篇：苹果制造学院在密歇根举办首届春季论坛用AI解决方案强化美国供应链

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们