PyPI

简介

rapidocr_paddle系列包是基于PaddlePaddle框架作为推理引擎的,支持CPU和GPU上推理。值得说明的是,这个包和PaddleOCR相比,代码基本都是一样的,只不过这个库将里面核心推理代码抽了出来,更加精简而已。

推荐GPU上用这个,CPU端还是以rapidocr_onnxruntimerapidocr_openvino为主。毕竟PaddlePaddle的CPU端还是比较重的。

封装这个包的原因是为了弥补GPU端推理的空缺。因为面对成千上万的图像需要提取文字时,CPU端上推理速度还是较慢,不能满足需求。

安装

  1. 根据自己需求,先安装PaddlePaddle框架(CPU/GPU),并验证,参见: 官方教程,注意验证是否安装成功:
      import paddle
    
    print(paddle.utils.run_check())
    # 如果出现PaddlePaddle is installed successfully!,说明您已成功安装。
      
  2. 安装rapidocr_paddle
      pip install rapidocr_paddle
      

使用

其他使用详情,同rapidocor_onnxruntime系列,参见: link

推理速度比较

经过初步粗略估计,同一张图像,推理10次,耗时情况见下表:

推理库 平均耗时(s/img) 运行环境
rapidocr_onnxruntime 1.6505 CPU 2 Cores RAM 16GB
rapidocr_paddle[GPU] 0.0508 CPU 2 Cores RAM 16GB
GPU Tesla V100 16G

Last updated 12 May 2024, 15:24 +0800 . history