富士通介绍 PHOTON 框架：1.2B 模型多查询性能 475 倍于 Transformer - 云计算

Just Quick Just Quality

热门话题

白天

搜索

资讯

富士通介绍 PHOTON 框架：1.2B 模型多查询性能 475 倍于 Transformer

4 小时前 / 阅读约2分钟

来源：IT之家

富士通介绍了其开发的PHOTON架构，宣称在多查询场景下性能至高可达主流Transformer架构的475倍，能降低GPU成本，在参数规模较小的模型中可实现更高迭代吞吐量和更低内存占用。

IT之家 6 月 25 日消息，富士通 (Fujitsu) 日本当地时间昨日介绍了其开发的 PHOTON（自上而下网络并行分层计算）架构，宣称其在多查询_{（生成多个备选结果并在此基础上给出最终答案）}场景下性能至高可达主流 Transformer 架构的 475 倍。

富士通表示，Transformer 架构的一大弊病是其在长上下文输入或多线程同步处理的场景下会执行大量访存操作来保留历史信息，这往往会导致处理速度下降。PHOTON 能高效率低开销地处理智能体系统等多 I/O 流程，从而降低 GPU 成本。

▲ 左：语义分层；右：并行计算

PHOTON 架构在语义层面上进行分层处理，相较 Transformer 的词元级分割可降低计算复杂度并提供了更好的并行性。而在多查询最后的决策环节，PHOTON 则采用了多数决定或选择最佳的方式，仅需一次推理。

测试结果表明，PHOTON 在 600M、900M、1.2B 等参数规模相对较小的模型中可实现更高的迭代吞吐量和更低的内存占用，其中 1.2B 模型上实现了 475 倍性能和略低的质量。此外，由于 PHOTON 架构每次迭代所需的 KV Cache 更少，还能提升最大迭代次数。

上一篇：机构：英伟达800V Power Rack成Vera Rubin选用方案预估至Rubin Ultr...

下一篇：GSMA迎来新成员China Tower，携手推进AI就绪移动基础设施

返回列表

热文阅读

2 天前

「AI几小时攻破NSA」刷屏，真相竟是一场红队演习？

2 天前

成立不到90天，阿里前高管创立的昆仑行机器人获数十亿元融资

2 天前

中国团队拿下ICRA'26最佳论文：Agentic Coding驱动工业制造通往自主通用智能

2 天前

被骂了一年的Codex，怎么突然爆了？

1 天前

“新能源汽车第一省”，又多了一个挑战者

2 天前

两万一套房的鹤壁，连夜给英伟达供货

2 天前

大模型“倒爷”微软：GPT带到东方，DeepSeek卖给西方

1 天前

一颗芯片调产，纳斯达克“连夜闪崩”

1 天前

奥特曼私人提款机曝光，OpenAI埋6650亿暗雷

2 天前

“全球最先进机器人”：特斯拉推进 Optimus 3 量产，供应链开始备货

上一篇：机构：英伟达800V Power Rack成Vera Rubin选用方案预估至Rubin Ultr...

下一篇：GSMA迎来新成员China Tower，携手推进AI就绪移动基础设施

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们