Skip to main content

🤖 DeepSeek-AI 发布开源模型 DeepSeek-OCRDeepSeek-AI 近日发布了开源模型 DeepSeek-OCR,这是一款 3B 参数的上下文光学压缩模型,旨在通过模态压缩实现文本的高效处理

  1. 🤖 DeepSeek-AI 发布开源模型 DeepSeek-OCR

    DeepSeek-AI 近日发布了开源模型 DeepSeek-OCR,这是一款 3B 参数的上下文光学压缩模型,旨在通过模态压缩实现文本的高效处理。该模型由 DeepEncoder 和 DeepSeek3B-MoE-A570M 组成,其中 DeepEncoder 专注于高分辨率图像下的文本标注和高压缩率,可将文本 token 压缩到图像 token 的 10 倍以上。

    DeepSeek-OCR 在 10 倍压缩率下能保持 97% 的 OCR 精度,即使在 20 倍压缩率下,精度仍可达 60%。它在 OmniDocBench 和 MinerU2.0 等评测中表现出色,并在 A100-40G 上实现了每秒处理 20 页文档训练数据的能力。该项目已在 GitHub 和 Hugging Face 上开源。

    GitHubHugging Face

    🍀在花频道 🍵茶馆 📮投稿

    via 科技圈🎗在花频道📮 - Telegram Channel
👀 open eyes to see the world. 丨 site views: -