谷歌 AI 破译古籍新巅峰：错误率仅 0.56%，准确率媲美人类专家 - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

谷歌 AI 破译古籍新巅峰：错误率仅 0.56%，准确率媲美人类专家

2025-11-16 / 阅读约2分钟

来源：IT之家

谷歌通过AI Studio平台测试一款未命名AI模型，在破译历史手稿方面接近人类专家水平，字符错误率低，且展现出复杂推理能力，能反向计算推断出缺失信息。

IT之家 11 月 16 日消息，科技媒体 golem 昨日（11 月 15 日）发布博文，报道称谷歌通过其 AI Studio 平台，正测试一款尚未命名的 AI 模型，在破译难以辨认的历史手稿方面已接近人类专家的水平。

IT之家援引博文介绍，历史学家 Mark Humphries 使用一套专门开发的基准数据集，系统性地测试了该模型的性能。结果表明，在处理五份高难度历史手稿时，该模型的整体字符错误率约为 1.7%，其中大部分错误涉及标点符号和大小写，而非单词本身。

Humphries 的评估进一步指出，如果排除模糊的标点符号和大小写错误，该 AI 模型的字符错误率将骤降至约 0.56%，相当于每转写 200 个字符才出现一个错误。

根据新发现的未知 Gemini 型号转录的奥尔巴尼账簿页面

这一惊人的准确度，让其性能足以与从事历史文献转写的专业人类工作者相提并论。此次测试的文档涵盖了 18 至 19 世纪的多种手写风格，其中不乏字迹潦草、拼写错误和语法不一致的复杂样本，进一步凸显了该模型的强大能力。

该模型最令人意外的表现，是其超越了简单的文字转写，展现出复杂的推理能力。在处理一份 18 世纪商人的日记时，原文中有一条关于购买糖的记录，仅标记了数字“145”，并未注明计量单位。

谷歌的 AI 模型并未直接转写为“145”，而是输出了“14 磅 5 盎司”。研究人员发现，AI 是通过反向计算账本中记录的总价，并结合当时英国的货币（磅、先令、便士）与重量单位关系，才成功推断出这一结果。

尽管初步结果令人振奋，但 Humphries 也强调了当前评估的局限性。由于该模型通过 A/B 测试形式零星出现，系统性地进行大规模测试存在困难，目前仅评估了基准数据集中约 10% 的样本。

上一篇：中国县城的打工人，快被AI培训班包围了

下一篇：机器人手语交流员“上岗”，适配不同自由度灵巧手

返回列表

热文阅读

2 天前

成立不到90天，阿里前高管创立的昆仑行机器人获数十亿元融资

2 天前

中国团队拿下ICRA'26最佳论文：Agentic Coding驱动工业制造通往自主通用智能

2 天前

被骂了一年的Codex，怎么突然爆了？

1 天前

奥特曼私人提款机曝光，OpenAI埋6650亿暗雷

2 天前

“新能源汽车第一省”，又多了一个挑战者

2 天前

一颗芯片调产，纳斯达克“连夜闪崩”

2 天前

Valve：采购内存毫无议价空间，只能接受每月报价

1 天前

OpenAI 发布首款芯片，只花了九个月

1 天前

臻宝科技上市首日暴涨1200%，80后销售工程师从卖玻璃钢到身家290亿 | 风眼观察

1 天前

Open AI突然官宣，全量下放，剧烈战略转向后，GPT 5.5 Instant明日全民免费

上一篇：中国县城的打工人，快被AI培训班包围了

下一篇：机器人手语交流员“上岗”，适配不同自由度灵巧手

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们