飞桨发布PaddleOCR-VL-1.5,精准解析异形文档
5 天前

2026年1月29日,百度发布并开源新一代文档解析模型PaddleOCR-VL-1.5,该模型以0.9B轻量架构,在OmniDocBench V1.5评测中获全球综合性能第一,精度达94.5%。PaddleOCR-VL-1.5首次实现OCR模型的“异形框定位”能力,可精准识别倾斜、弯折、拍照畸变等不规则文档,解决传统OCR在真实场景中因文档形变导致的识别失败问题,适用于金融票据处理、档案数字化、政务文档流转等领域。此外,该模型在表格结构理解、阅读顺序预测等关键指标上领先,新增印章识别、多语种支持等功能,支持跨页表格合并与段落标题识别。目前,PaddleOCR-VL-1.5已开源,可通过GitHub、HuggingFace获取,并支持在线体验和API调用。