Deepseek关联公司公布大语言模型部署方法专利
2 天前

8月1日,天眼查App显示,杭州深度求索人工智能基础技术研究有限公司,即deepseek关联公司,近日公布了一项名为“一种大语言模型的部署方法及系统”的专利。该专利涉及人工智能领域,旨在通过将预填充阶段和解码阶段分别部署在高性能、大内存的机器上,优化负载任务,最大化硬件利用率,减少闲置算力,降低延迟,提高吞吐量,并增强系统的扩展性和容错性。