DeepSeek 多模态研究员 Xiaokang Chen 宣布,DeepSeek 的识图模式已在网页和 App 端正式推出。经IT之家测试,目前 DeepSeek 的 App 端识图模式仍显示“图片理解功能内测中”,而网页端则无此提示。识图模式与快速模式、专家模式并列,用户开启后可直接上传图片,让 DeepSeek 进行图像理解,其功能远超简单的文字提取。此外,DeepSeek 今年 4 月还公开了识图模式背后的多模态模型技术细节,介绍了一种名为“以视觉原语思考”的核心框架。