跳转至

概览

信创级开源 OCR - 为世界内容安全贡献力量
 
Open in Colab PyPI SemVer2.0

📝 简介

RapidOCR 是一款完全开源免费、支持离线快速部署的多平台多语言 OCR 工具,以极致的速度与广泛的兼容性为核心优势。

支持语言: 默认支持中英文识别。其他支持的语言,参见文档:模型列表

项目缘起: 鉴于 PaddleOCR 在工程化方面仍有优化空间,为简化并加速 OCR 模型在各类终端设备上的推理部署,我们创新性地将 PaddleOCR 中的模型转换为高度兼容的 ONNX 格式,并基于 Python, C++, Java, C# 等多种编程语言,实现了跨平台的无缝移植,让开发者能够轻松上手、高效集成。

名称寓意: RapidOCR 这一名称承载着我们对产品的核心期待——轻快(操作简便、响应迅速)、好省(资源占用低、成本效益高)且智能(依托深度学习技术,实现精准高效的识别)。我们专注于发挥人工智能的优势,打造小巧而强大的模型,始终将速度作为不懈追求,同时确保卓越的识别效果。

使用指南:

  • 直接部署:若本仓库提供的模型已满足您的需求,只需参考 快速开始 即可快速完成 RapidOCR 的部署与使用。
  • 定制化微调:若现有模型无法满足特定场景需求,您可在 PaddleOCR 基础上,利用自有数据进行微调,再将优化后的模型应用于 RapidOCR 的部署流程,实现个性化定制。

如果您觉得本项目对您的工作或学习有所帮助,恳请您不吝赐予一颗 ⭐ Star,给予我们宝贵的支持与鼓励!

整体框架

---
config:
  fontFamily: "LXGW WenKai Screen"
---
flowchart LR
    subgraph Step
    direction TB
    C(Text Det) --> D(Text Cls) --> E(Text Rec)
    end

    A[/OurSelf Dataset/] --> B(PaddleOCR) --Train--> Step --> F(PaddleOCRModelConverter)
    F --ONNX--> G{RapidOCR Deploy\n<b>Python/C++/Java/C#</b>}
    G --> H(Windows x86/x64) & I(Linux) & J(Android) & K(Web) & L(Raspberry Pi)

    click B "https://github.com/PaddlePaddle/PaddleOCR" _blank
    click F "https://github.com/RapidAI/PaddleOCRModelConverter" _blank

🎥 效果展示

Demo

👥 谁在使用?(更多)

更多使用 RapidOCR 的项目,欢迎在 登记地址 登记,登记仅仅为了产品推广。

🎖 贡献者

📜 引用

如果您发现该项目对您的研究有用,请考虑引用:

@misc{RapidOCR 2021,
    title={{Rapid OCR}: OCR Toolbox},
    author={RapidAI Team},
    howpublished = {\url{https://github.com/RapidAI/RapidOCR}},
    year={2021}
}

⭐️ Star history

Stargazers over time

⚖️ 开源许可证

OCR 模型版权归百度所有,其他工程代码版权归本仓库所有者所有。

该项目采用 Apache 2.0 license 开源许可证。

评论