阿里千问开源语音识别系列模型Qwen3-ASR - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

阿里千问开源语音识别系列模型Qwen3-ASR

1 周前

2026年1月29日，阿里千问团队正式开源Qwen3-ASR系列语音识别模型，包括Qwen3-ASR-1.7B、Qwen3-ASR-0.6B两个语音识别模型，以及Qwen3-ForcedAligner-0.6B语音强制对齐模型。该系列模型支持52个语种与方言的识别。其中，1.7B模型在中文、英文、中文口音及歌唱识别等场景下达到SOTA水平，0.6B模型则在性能与效率间取得平衡，128并发异步服务推理吞吐量达2000倍，10秒可处理5小时音频。强制对齐模型支持11个语种的高精度时间戳预测，精度超越传统模型。此次开源还包括模型结构、权重及推理框架。

上一篇：OpenAI加速推进2026年Q4 IPO，与Anthropic展开上市竞速

下一篇：库克回应「苹果和谷歌合作影响隐私」担忧：隐私红线不动摇、苹果 AI 架构不变

返回列表

热文阅读

2 天前

市值蒸发2850亿美元背后，软件的“溢价”不存在了

2 天前

看一眼代码就中毒？Clawdbot惊现隐形越狱，AI工具变黑客

2 天前

曾断言特斯拉存在安全隐患智己联席CEO刘涛公开致歉

2 天前

第一批用Clawdbot赚钱的人类出现，一晚上狂赚300万，全球金融变天了？