跳转至

v3.4.0

新增功能

支持 PaddleOCR 在 v3.2.0 中发布的 PP-OCRv5 英文 / 泰文 / 希腊文三个文本识别模型 (issue [#530](https://github.com/RapidAI/RapidOCR/pull/530))

这三个语种默认对应 LangRec.EN, LangRec.THLangRec.EL。具体可参见官方文档中 模型列表 一节。

下面给出希腊文识别示例:

from rapidocr import LangRec, ModelType, OCRVersion, RapidOCR

engine = RapidOCR(
    params={
        "Rec.lang_type": LangRec.EL,
        "Rec.model_type": ModelType.MOBILE,
        "Rec.ocr_version": OCRVersion.PPOCRV5,
    }
)
img_url = "https://github.com/RapidAI/RapidOCR/blob/main/python/tests/test_files/el_rec.jpg?raw=true"
result = engine(img_url, use_det=False, use_cls=False, use_rec=True)
print(result)

result.vis("vis_result.jpg")

改进优化

统一 det, cls 和 rec 各个阶段统计运行时间的范围 (issue [#544](https://github.com/RapidAI/RapidOCR/pull/544))

都统一改为从前处理、模型推理和后处理都算上。

重构单元测试部分

主要是拆分原有的 test_main.py 文件,利于后续维护

添加日志打印开关 (issue [#531](https://github.com/RapidAI/RapidOCR/pull/531))

from rapidocr import RapidOCR

engine = RapidOCR(params={"Global.log_level": "critical"})  # 注意这里改为critical,就不会打印日志了

img_url = "https://img1.baidu.com/it/u=3619974146,1266987475&fm=253&fmt=auto&app=138&f=JPEG?w=500&h=516"
result = engine(img_url)
print(result)

result.vis("vis_result.jpg")
print(result.to_markdown())

Bug 修复

修复保存中文路径乱码问题 (issue [#528](https://github.com/RapidAI/RapidOCR/pull/528))

修复 PyTorch>=2.6 时,加载模型权重问题 (issue [#527](https://github.com/RapidAI/RapidOCR/pull/527))

评论