1月27日,DeepSeek团队发表了《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源了DeepSeek-OCR 2模型。该模型采用创新的DeepEncoder V2编码器结构,能根据图像语义动态调整视觉信息处理顺序,使模型在文字识别前对视觉内容进行智能排序。这一技术突破源于对传统视觉语言模型处理方式的重新审视,旨在让机器更接近人类视觉阅读逻辑。