Skip to main content

开源PDF解析工具olmOCR:百万页处理成本直降32倍,精准提取复杂内容  Ai2推出的开源工具olmOCR基于Qwen2-VL-7B-Instruct模型训练,专为PDF解析设计,可高效提取文本、表格、公式等结构化数据,并以Markdown格式输出

  1. 开源PDF解析工具olmOCR:百万页处理成本直降32倍,精准提取复杂内容 

    Ai2推出的开源工具olmOCR基于Qwen2-VL-7B-Instruct模型训练,专为PDF解析设计,可高效提取文本、表格、公式等结构化数据,并以Markdown格式输出。通过25万页多样化数据集微调,其“文档锚定”技术精准处理多栏排版、手写内容及数学公式,处理百万页成本仅190美元(为GPT-4o的1/32)。支持在线使用与本地部署(需英伟达显卡),性能评估显示其Elo评分1800+,用户优选比例超竞品(对比MinerU达71.4%)。开源代码与模型权重,适合学术、法律等场景的高效文档处理。

    GitHub | 在线Web

    📮投稿☘️频道🌸聊天🗞️𝕏

    via 科技圈🎗在花频道📮 - Telegram Channel
👀 open eyes to see the world. 丨 site views: -