Cohere推出开源语音转写模型Transcribe 主打轻量自托管场景
3 小时前

企业级AI公司Cohere于本周四发布首个开源语音模型Transcribe,该自动语音识别(ASR)模型参数规模约20亿,定位为轻量级方案,可在消费级GPU运行,支持14种语言,每分钟可处理525分钟音频,适用于语音转文字记录及内容分析场景,尤其满足企业自托管需求。在Hugging Face Open ASR榜单中,其平均词错误率(WER)为5.42%,优于Zoom Scribe v1、IBM Granite 4.0 1B等竞品。Cohere计划将Transcribe集成至North平台,提供转写后工作流支持,如自动归档、智能摘要等企业服务。