从无到有的“声”意经:智能语音芯片十年“平民化”演进丨AI成都
13 小时前 / 阅读约8分钟
来源:36kr
对话「启英泰伦」创始人、董事长何云鹏。

“智能家电”是如何听懂语音指令的?无论是“开灯”还是“空调调低两度”,便捷体验背后有人工智能充当“传令官”。

实现语音交互主要有两种路径:云端处理与端侧处理。

云端方案依赖网络将语音数据上传至远程服务器解析,虽算力强大,却存在响应延迟、依赖网络、隐私顾虑等短板。而端侧AI则将关键的处理能力“内置”于设备本身的芯片中,如同在设备上装了一个即时响应的“大脑”。它能在本地毫秒级完成语音识别与指令理解,无需联网、响应更快、隐私更安全,为智能家电提供更可靠、更自主的“耳朵”和“嘴巴”。

早早锚定端侧AI语音芯片产品,入局家居家电领域,成都启英泰伦科技有限公司(以下简称“启英泰伦”)创业十年,历经3次大迭代,5次小迭代,共计推出20多款型号的智能语音芯片,将端侧AI语音芯片的价格从40元降至4元,并且集成度更高,体积成倍数缩小;推出芯片和算法一体化设计为客户缩短产品开发周期,凝聚了稳固的核心竞争力。「启英泰伦」创始人、董事长何云鹏告诉36氪四川,目前公司已经发布了具身智能新战略,应战万亿级智能物联市场的新挑战。

「启英泰伦」AI语音芯片

多轮迭代:语音功能成为家电标配

空调、油烟机、微波炉、电风扇、茶吧机、取暖器、夜灯、开关、闹钟、插座……「启英泰伦」的展厅排布了数十款各类拥有智能语音功能的大小家电。“这只是一小部分,我们购买了搭载我司AI语音芯片的标志性产品用来展示,如果摆出所有产品,整层楼都要变成展厅。”

「启英泰伦」展厅(部分)

在2015、2016年时段,语音识别的通用方式是利用网络进行云端处理。而创业伊始的「启英泰伦」团队想到,要把语音识别放在芯片端来实现,并在业界首度提出支持AI模型的具备高效指令集和高性能架构的脑神经网络处理器(BNPU)。

“语音交互,智联万物”,从技术上来讲,语音识别是不分赛道不分领域的。作为一家创业公司,若想选择真正能造福大众的赛道,目光自然会投向智能家居家电领域——这里不仅品类丰富,更凭借庞大的市场销量,印证了其与大众生活的深度绑定,也意味着改善空间广阔。

智能家居家电场景示例

每一批家电的生产规模均以万为单位,而每一台家电里,都少不了一颗AI语音芯片——它如同“听觉中枢”,时刻待命接收主人的语音指令,并精准驱动设备完成操作。

然而,彼时语音识别只是个用来“看新鲜”的黑科技。是否刚需?有待商榷。「启英泰伦」的第一代芯片产品应用方案,芯片本体附带外围器件,单价40元以上,能否成为厂商的选择?

“美的当时出品了一款微波炉,可利用面板空间小,制约了产品功能的增加。语音识别恰好能够解决这个痛点,1句话是1个功能,50句话是50个功能,不需要大幅增加微波炉操作面板的面积,不需要增加太多按键,产品仍然能实现功能的大幅增加。”何云鹏回忆道,“当时我们成立不到三年,尚未达到美的的供应商标准,但我们凭借卓越的AI语音芯片能有效解决他们的痛点,所以在2017年就拿下了美的订单。美的微波炉凭借语音交互这一核心智能特性,从同类普通微波炉中崭露头角,上市时售价突破2000元,一举跻身高端产品阵营。”

成功斩获知名厂商的订单后,团队的下一目标是在保持技术优势的前提下,进一步实现成本优化与单价下调。「启英泰伦」第二代芯片将整个模组单价控制在15元以内,这一突破让众多对价格敏感的家用电器也得以搭载语音识别功能。而随着芯片价格逐步降至个位数,其性能还在持续升级——识别准确率不断提升,误唤醒率大幅降低,降噪能力亦显著增强。技术与成本的双重优化,推动搭载「启英泰伦」AI语音芯片的家电产品快速普及。

目前,「启英泰伦」的端侧AI语音芯片实现了命令词自学习、解决方言问题;支持远场降噪、人声分离、定向噪声抑制;首推端侧NLP技术,突破传统语音芯片词条限制,实现端侧十万数量级自由说法,推动端侧语音交互向自然化升级;首推端侧多意图技术,实现在端侧一句话识别多个指令。

全栈式服务:便捷实现设想,激发无限创新可能

何云鹏向36氪四川展示了展厅内一款得力智能交互地球仪:只需对着它口头提问,地球仪内部便会即时亮起灯光,精准指引使用者找到目标地理位置,随后自动播报该地的相关知识。这种直观的语音交互方式,让小朋友能通过轻松提问,自然而然地掌握基础地理知识。

随后,何云鹏拿起一台肩颈按摩仪进一步说明:用户在按摩时,转头查看屏显、抬手操作按键往往十分不便,遥控器也容易遗失。若搭载语音操控功能,用户甚至无需睁眼,就能轻松完成操作。

“我们能想到的,那些常见的家电产品已经将智能语音控制定为标配,但需要智能语音识别的场景其实无穷无尽。我们从2018年开始考虑,客户如此之多,大部分人不熟悉AI语音芯片技术,如果全部采用一对一的现场支持,只会耽误彼此的宝贵时间。”

与其他同类型企业有很大的区别,「启英泰伦」不仅拥有语音芯片设计的核心技术,同时自研AI算法模型,坚持芯片和AI模型一体化开发。“这为我们的Turnkey全栈式服务提供了基础,语音芯片、语音算法、应用方案、开发平台构建完整闭环,极大缩短了客户产品的开发周期。”

「启英泰伦」全栈技术服务

在「启英泰伦」的零代码开发平台上,客户能够直接在线开发固件;快速生成语言模型并完成优化;进行播报音合成等,快速实现设想。“从智能交互地球仪到肩颈按摩仪,诸多曾看似天马行空的创意设计,正是沿着这条技术路径落地成真。”

目前「启英泰伦」芯片已经匹配1万款以上产品、300多个领域方案。据介绍,「启英泰伦」离线语音家电市场覆盖率已经达到了80%,客户包括美的、海尔、格力、公牛、松下、飞利浦、好太太、长虹、苏泊尔等千余家。值得注意的是,「启英泰伦」还合作了300多家方案商,携手拓展端侧智能语音业务,培育富有生机的客群生态。

在国内市场持续快速拓展的当下,何云鹏透露,公司已着手规划海外订单的拓展。事实上,中国的端侧AI语音技术在全球处于领先地位,而海外市场仍存在广阔的空白空间,「启英泰伦」团队期待能带着这份中国技术优势,进一步走向世界舞台。

迎接新挑战:大模型+具身智能

今年3月,「启英泰伦」联合合作伙伴正式推出高性能离在线语音对话大模型方案。通过端-云协同设计,将唤醒、深度降噪、语音压缩等任务在本地完成,将自然语言理解、内容生成等复杂任务交由云端处理,实现低延迟、高准确率的交互体验。

离在线语音对话大模型方案已实现对豆包、DeepSeek、通义千问、文心一言、ChatGPT等国内外主流大模型平台的兼容支持,能为企业及开发者提供高效便捷的大模型选型服务。该方案适用场景广泛,可深度覆盖家电、文创、玩具、机器人等多个领域,具备广阔的应用前景。

离在线语音大模型方案应用架构

赶得上大模型的浪潮,也会抓住具身智能的未来空间。何云鹏2015年创业时的梦想是让陪伴机器人成为现实,当下就是实现梦想的契机。

「启英泰伦」具身智能新战略

解决语音交互入口、解决更广入口、解决机器人大脑,“三个解决”,完成端侧AI芯片的三步跃迁。「启英泰伦」在今年6月的路演活动中发布具身智能新战略,其中,关于“更广入口”的端侧超低功耗AI芯片已经获得四川省科技厅立项。据介绍,「启英泰伦」端侧超低功耗AI芯片在语音识别典型场景下运行功耗小于10mW,安静时待机功耗小于0.5mW,未来不仅能应用于具身智能机器人领域,还可以为手机、平板、可穿戴、助听器等个人消费电子设备提供高性能、超低功耗的语音入口。

「启英泰伦」荣誉墙

2025年,从智能家居拓展至大模型、具身智能机器人,从单模态语音发展到多模态交互,同时,今年将完成流片的端侧超低功耗AI芯片值得各行业期待,「启英泰伦」正启动新一轮融资。何云鹏表示:“我们期待与更多伙伴携手,以端侧AI芯片为支点,撬动万亿级智能物联市场。”