IBM 发布轻量级视觉语言 AI 模型 Granite-Docling-258M：用于文件转换、支持中文 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

IBM 发布轻量级视觉语言 AI 模型 Granite-Docling-258M：用于文件转换、支持中文

2025-09-20 / 阅读约2分钟

来源：IT之家

IBM发布小型视觉语言模型Granite-Docling-258M，专为文档表格设计，支持多语言，输出保留结构，准确性高于传统OCR，核心为DocTags标记语言。

IT之家 9 月 20 日消息，IBM 现已正式发布了小型视觉语言模型 Granite-Docling-258M，定位于端到端文件转换场景用途，相应模型采用 Apache 2.0 开源协议，目前已在 Hugging Face 上线（点此访问）。

IT之家获悉，该模型参数量为 2.58 亿，号称是一款专为文档表格设计的轻量级模型，输出结果能够完整保留版面、表格、数学公式、列表和代码块等结构，同时准确度相比传统 OCR 软件识别准确性更高。

IBM 透露，Granite-Docling 的核心在于 DocTags，这是由 IBM Research 设计的一套通用文件结构标记语言，能够精确描述页面元素的类型、坐标、阅读顺序及跨元素关系，同时可将内容与版面结构分离，实现“先识别元素范围再执行 OCR 识别”，在完成转换后，DocTags 还能够直接将内容导出为 Markdown、JSON、HTML 等格式，也可以进一步进入 Docling 库进行处理。

目前，Granite-Docling 支持中文、阿拉伯语和日语等语言，不过尚未达到“企业级”水准，IBM 称未来开发人员将逐步扩展语言覆盖范围并提升模型可靠性。同时还将进一步增强 DocTags 与 IBM watsonx.ai 模型的兼容性，并计划把 DocTags 词汇表纳入 Granite 分词器和训练流程。

上一篇：OpenAI 多款硬件首次曝光，疯狂挖角苹果硬件骨干，最快明年发布

下一篇：德国癌症研究中心等机构开发新型 AI 工具，可预测超 1000 种疾病风险

返回列表

热文阅读

2 天前

欧洲遭史上最热高温，美的“卡bug”空调被抢爆了，二手溢价一度达原价2-3倍

2 天前

比亚迪亮相 2026 釜山车展，首次在韩展示 DM-i 混动技术

2 天前

英伟达年度“最危险”论文！AI自繁衍代码，无限刷级进化

2 天前

内存大涨价，玩家用 DDR1 平台成功运行 Win11 系统