模型列表

引言¶

针对PaddleOCR已经发布的常用模型，我们这里已经做了统一转换和汇总，包括PP-OCRv4和PP-OCRv5系列的PaddlePaddle格式、ONNX格式和PyTorch格式。

所有模型目前托管在魔搭社区上。

rapidocr v3 版本已经集成了托管的所有模型，通过下面参数指定可以自动下载。对应的配置文件：default_model.yaml

当然，小伙伴们也可以自己去上述链接自己下载。

配置文件字段对应¶

文本检测模型¶

语种类型	engine_type	lang_type	model_type	ocr_version
简体中文、中文拼音、繁体中文、英文、日文	`onnxruntime` `openvino` `paddle` `torch`(`rapidocr>=3.3.0`)	`ch`	`mobile` `server`	`PP-OCRv5`
中英	`onnxruntime` `openvino` `paddle` `torch`	`ch`	`mobile` `server`	`PP-OCRv4`
英语和拉丁语	`onnxruntime` `openvino` `paddle` `torch`	`en`	`mobile` `server`	`PP-OCRv4`
多语种	`onnxruntime` `openvino` `paddle` `torch`	`multi`	`mobile` ❎`server`	`PP-OCRv4`

对应使用方法：

Note

lang_type字段对应Det模块下的LangDet

from rapidocr import EngineType, LangDet, ModelType, OCRVersion, RapidOCR

engine = RapidOCR(
    params={
        "Det.engine_type": EngineType.TORCH,
        "Det.lang_type": LangDet.CH,
        "Det.model_type": ModelType.MOBILE,
        "Det.ocr_version": OCRVersion.PPOCRV5
    }
)

文本识别模型¶

Note

lang_type字段对应Det模块下的LangRec

语种类型	engine_type	lang_type	model_type	ocr_version
英文	`rapidocr>=3.4.0支持` `onnxruntime` `openvino` `paddle` ❎`torch`	`en`	`mobile` ❎`server`	`PP-OCRv5`
泰文、英文	`rapidocr>=3.4.0支持` `onnxruntime` `openvino` `paddle` ❎`torch`	`th`	`mobile` ❎`server`	`PP-OCRv5`
希腊文、英文	`rapidocr>=3.4.0支持` `onnxruntime` `openvino` `paddle` ❎`torch`	`el`	`mobile` ❎`server`	`PP-OCRv5`
拉丁语种混合¹	`rapidocr>=3.3.0支持` `onnxruntime` `openvino` `paddle` ❎`torch`	`latin`	`mobile` ❎`server`	`PP-OCRv5`
俄罗斯文、白俄罗斯文、乌克兰文	`rapidocr>=3.3.0支持` `onnxruntime` `openvino` `paddle` ❎`torch`	`eslav`	`mobile` `server`	`PP-OCRv5`
中英日混合²	`onnxruntime` `openvino` `paddle` `torch`(`rapidocr>=3.3.0`)	`ch`	`mobile` `server`	`PP-OCRv5`
韩文v5	`rapidocr>=3.3.0支持` `onnxruntime` `openvino` `paddle` ❎`torch`	`korean`	`mobile` ❎`server`	`PP-OCRv5`

韩文v4	`onnxruntime` `openvino` `paddle` `torch`	`korean`	`mobile` ❎`server`	`PP-OCRv4`
中文文档	`onnxruntime` `openvino` `paddle` ❎`torch`	`ch_doc`	❎`mobile` `server`	`PP-OCRv4`
中文	`onnxruntime` `openvino` `paddle` `torch`	`ch`	`mobile` `server`	`PP-OCRv4`
中文繁体	`onnxruntime` `openvino` `paddle` `torch`	`chinese_cht`	`mobile` `server`	`PP-OCRv4`
英文	`onnxruntime` `openvino` `paddle` `torch`	`en`	`mobile` ❎`server`	`PP-OCRv4`
阿拉伯文	`onnxruntime` `openvino` `paddle` `torch`	`ar`	`mobile` ❎`server`	`PP-OCRv4`
塞尔维亚文	`onnxruntime` `openvino` `paddle` `torch`	`cyrillic`	`mobile` ❎`server`	`PP-OCRv4`
梵文	`onnxruntime` `openvino` `paddle` `torch`	`devanagari`	`mobile` ❎`server`	`PP-OCRv4`
日文	`onnxruntime` `openvino` `paddle` `torch`	`japan`	`mobile` ❎`server`	`PP-OCRv4`
卡纳达语	`onnxruntime` `openvino` `paddle` `torch`	`ka`	`mobile` ❎`server`	`PP-OCRv4`
拉丁文	`onnxruntime` `openvino` `paddle` `torch`	`latin`	`mobile` ❎`server`	`PP-OCRv4`
泰米尔文	`onnxruntime` `openvino` `paddle` `torch`	`ta`	`mobile` ❎`server`	`PP-OCRv4`
泰卢固文	`onnxruntime` `openvino` `paddle` `torch`	`te`	`mobile` ❎`server`	`PP-OCRv4`

使用方式¶

以上模型可直接通过字段指定，程序会自动下载使用。

from rapidocr import EngineType, LangDet, ModelType, OCRVersion, RapidOCR

engine = RapidOCR(
    params={
        "Rec.ocr_version": OCRVersion.PPOCRV5,
        "Rec.engine_type": EngineType.PADDLE,
        "Rec.model_type": ModelType.MOBILE,
    }
)

img_url = "https://github.com/RapidAI/RapidOCR/blob/main/python/tests/test_files/ch_en_num.jpg?raw=true"
result = engine(img_url)
print(result)

result.vis("vis_result.jpg")

英文、法文、德文、南非荷兰文、意大利文、西班牙文、波斯尼亚文、葡萄牙文、捷克文、威尔士文、丹麦文、爱沙尼亚文、爱尔兰文、克罗地亚文、乌兹别克文、匈牙利文、塞尔维亚文（latin）、印度尼西亚文、欧西坦文、冰岛文、立陶宛文、毛利文、马来文、荷兰文、挪威文、波兰文、斯洛伐克文、斯洛文尼亚文、阿尔巴尼亚文、瑞典文、西瓦希里文、塔加洛文、土耳其文、拉丁文 ↩
简体中文、中文拼音、繁体中文、英文、日文 ↩

模型列表

引言¶

配置文件字段对应¶

文本检测模型¶

文本识别模型¶

使用方式¶

评论