MIT携手英伟达开发TLT技术，推理大模型训练效率最高提速210% - AI - JQman

Just Quick Just Quality

热门话题

白天

搜索

/

/

资讯

/

/

MIT携手英伟达开发TLT技术，推理大模型训练效率最高提速210%

3 小时前

麻省理工学院联合英伟达等机构发布了“驯服长尾”（TLT）技术，该技术可显著提升推理大语言模型（LLM）的训练效率。在强化学习训练中，推理大模型算力与能耗消耗大，其中“推演”阶段就占据了85%的训练时间，且不同处理器完成任务的时间差异形成了效率瓶颈。TLT方案采用“投机解码”技术，通过训练“草稿模型”来预测大模型的输出，再由大模型进行批量验证。TLT系统还引入了“自适应草稿训练器”和“自适应推演引擎”，确保草稿模型与大模型同步，且不会增加算力开销。测试结果显示，TLT技术在保持准确率的同时，将多个推理大语言模型的训练速度提升了70%到210%。训练得到的草稿模型可用于后期高效部署。未来，研究团队计划将该技术融入更多框架，以降低AI开发成本并提高能源利用率。

上一篇：Google与OpenAI员工发表公开信支持Anthropic在五角大楼事件中的立场

下一篇：王兴兴呼吁建立机器人评价体系否则将“各说各好”

2 天前

马斯克给大一学生发offer，开发Robotaxi

2 天前

中汽协： 1 月 SUV 销量前十强，占比达到 63.9%

2 天前

OpenAI大佬爆料：本科生靠一篇博客杀进OpenAI，没博士，0篇论文

2 天前

清华数学系大神跳槽OpenAI，曾主导SAM与Llama开发，Sora负责人：欢迎加入

1 天前

英特尔发布 8531 Game On 显卡驱动，支持《生化危机：安魂曲》等游戏

2 天前

特斯拉，不想当“车企”了

2 天前

特斯拉陶琳谈燃油车发动机与特斯拉电驱零部件数量差异，称结构越简单故障概率越小

2 天前

英特尔与SambaNova达成多年战略合作，携手基于至强处理器打造AI推理解决方案

2 天前

特斯拉 Model S/X 本季度末停产，美国官网部分专属车漆已不支持单独选配

1 天前

“最怕”AI失控的人，放弃了？

上一篇：Google与OpenAI员工发表公开信支持Anthropic在五角大楼事件中的立场

下一篇：王兴兴呼吁建立机器人评价体系否则将“各说各好”

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们