baidu/Unlimited-OCR 模型介绍：长文档 OCR 的新选择

Joy — Tue, 30 Jun 2026 13:35:00 +0800

最近百度开源了一个新的 OCR 模型：baidu/Unlimited-OCR。

它不是传统意义上「识别一张图片里的文字」的轻量 OCR 工具，而是更偏向 长文档解析：把论文、报告、书籍、扫描 PDF 这类多页文档，尽量完整地转成可读、可编辑、可继续处理的文本或 Markdown。

如果你关心的是 PDF 转 Markdown、长文档 OCR、本地私有化文档解析，那么这个模型值得放进候选列表。

它解决的不是单页 OCR，而是长文档解析

传统 OCR 很多时候处理的是单张图片：截图、证件、发票、表单、票据。

但真实文档解析经常更麻烦：

这就是 baidu/Unlimited-OCR 更擅长的方向。它更像一个「文档转写模型」，目标不是只把字识别出来，而是尽量保留文档的阅读顺序和结构。