凤凰网科技讯 12月3日 在国际残疾人日之际,杭州瞳行科技正式发布了国内首款基于多模态大模型的AI助盲眼镜。该产品接入了通义千问Qwen-VL及OCR系列模型,旨在通过“视觉模型+硬件”的组合,解决视障群体在出行导航中经常面临的“最后十米”寻址难题。
该助盲眼镜硬件端配备了121度超广角双摄像头,整体套件由眼镜主体、手机、遥控指环及盲杖四部分构成。在核心的算力与算法层面,技术团队针对不同使用场景进行了模型调优:在移动避障场景下,系统可实现300ms的超低延迟,即用户每迈出一步,眼镜即可完成一次环境分析与道路提示,仅对路牌、车辆等关键障碍物进行简要概括;而在阅读菜单或寻找店铺等场景中,大模型则会切换策略,对文本和环境细节进行详细总结与播报。
据统计,我国现有视障人士超1700万,由于缺乏除盲杖以外的高效辅助工具,出行高度依赖人工,导致许多视障者选择“少出行”。杭州瞳行科技市场及技术总监陈刚表示,大模型技术为行业带来了转机,算力成本已降至此前的十分之一。通过“基模复用+微调优化”的技术路径,企业能以更低的门槛快速实现包括语音助手、一键求助亲友在内的复杂功能。目前,该款AI助盲眼镜已正式面市。
