引言

rapidocr系列库中默认打包了轻量版的中英文检测和识别模型,这种配置可以覆盖到大部分场景。但是也总会有一些其他场景,要用到其他检测和识别模型。

这一点在设计接口时,已经做了考虑,留出了接口,这个博客就是以如何更换rapidocr_onnxruntime的识别模型为英文和数字的识别模型为例做讲解。其他模型同理。

1. 安装rapidocr_onnxruntime

请先根据教程,装好rapidocr_onnxruntime库,具体可参考:link

2. 获得英文和数字的ONNX识别模型

模型地址: https://paddleocr.bj.bcebos.com/PP-OCRv4/english/en_PP-OCRv4_rec_infer.tar

字典地址: https://raw.githubusercontent.com/PaddlePaddle/PaddleOCR/release/2.7/ppocr/utils/en_dict.txt

基于PaddleOCRModelConvert工具在线转换,得到en_PP-OCRv4_rec_infer.onnx模型

3. 使用该模型

  from rapidocr_onnxruntime import RapidOCR

model = RapidOCR(rec_model_path="en_PP-OCRv4_rec_infer.onnx")

img_path = "1.png"
result, elapse = model(img_path)
print(result)
print(elapse)
  

Last updated 24 Apr 2024, 09:27 +0800 . history