跳转至

更新日志

rapidocr_openvino

2024-11-21 v1.4.0 update

2024-10-18 v1.3.26 update

2024-07-11 v1.3.23 update

  • 取消Shapely版本限制,对应 issue #202

2024-06-28 v1.3.22 update

2024-05-18 v1.3.19 update

对应rapidocr_onnxruntime==1.3.20


rapidocr_onnxruntime

Note

2024-05-18 通知

后续rapidocr_onnxruntime>1.3.20的更新日志不在此更新,只在Github Release处更新

🛠️2024-05-15 v1.3.19 update

  • 因为DirectML受支持设备限制,因此将DirectML作为一个选项写入配置文件,选择性调用
  • 在Windows平台仍然恢复到v1.3.18前,默认安装onnxruntime库。如DirectML可用,且显式指定时,需要手动安装。
  • 相关讨论:PR #178 Discussion #175

🧚🏻‍♀️2024-05-12 v1.3.18 update

🔥2024-04-19 v1.3.17 update

📘2024-04-07 v1.3.16 update

修复issue #161

🍿2024-03-07 v1.3.15 update

  • 修复 issue #158
  • 增加三个推理引擎(onnxruntime、openvino,paddlepaddle)初始化RapidOCR类,指定线程数的参数

🎂2024-03-05 v1.3.14 update

添加可使用的CPU核心数,包括三个推理引擎,onnxruntime/OpenVINO/PaddlePaddle

🔖2024-02-28 v1.3.13 update

  • 优化LoadImage类,添加对输入PIL.Image.Image的支持
  • 修复不同输入类型下,图像通道顺序不同的问题

🍉2024-02-27 v1.3.12 update

可视化函数适配Pillow v9和v10两个版本,自动根据各个版本情况,来选择相应获得char大小的函数

♥️2024-02-04 v1.3.11 update

Merge PR #151 by LWQ2EDU

  • 添加自动padding策略:当传入图像小于min_height或者>width_height_ratio时,会触发自动padding图像,后续再进入检测。
  • ⚠️注意:padding值多少?当前值是一个权衡设置,大家可根据具体使用场景,自定设置合适值。

🌈2024-01-30 v1.3.10 update

🥰2023-12-28 v1.3.9 update

😜2023-10-25 v1.3.8 update

📡2023-09-21 v1.3.7 update

  • 完善VisRes类在终端情况下的使用
  • 修复auto_text_det的条件错误

🧸2023-09-20 v1.3.6 update

  • 添加VisRes类,便于快速可视化结果。详情参见demo.py用法

😀2023-09-20 v1.3.5 update

⏰2023-09-18 v1.3.4 update

  • 优化更新参数部分的函数实现

🧸2023-09-06 v1.3.2 update

⭐2023-08-29 v1.3.1 update

🎉2023-08-26 v1.3.0 update

  • 将PaddleOCR v4版对应的文本检测和文本识别轻量模型转换为onnx,并打包到whl中。
  • 接口与v1.2.x一致,直接使用即可。

😉2023-07-12 v1.2.12 update

  • rapidocr_onnxruntime初始化时,添加det_use_cudacls_use_cudarec_use_cuda参数
  • 兼容配置文件方式传入RapidOCR类中
  • rapidocr_openvino同理

🎮2023-03-11 v1.2.2 update

  • 修复实例化python中RapidOCR类传入参数错误

🧢2023-03-07 v1.2.1 update

  • rapidocr系列包更新到v1.2.0
  • 优化python下rapidocr系列包的接口传入参数,支持实例化类时,动态给定各个参数,更加灵活。
  • 如果不指定,则用config.yaml下的默认参数。
  • 具体可参见:传入参数

⛸2023-02-16 update

  • 优化ocrweb部分代码,可直接pip安装,快速使用,详情参见README
  • 优化python中各个部分的推理代码,更加紧凑,同时易于维护。

🎉2023-01-21 update

  • [python] 添加含有文字的图像方向分类模块,具体参见Rapid Orientation

⚽2022-12-19 update

  • [python] 添加表格结构还原模块,具体参见Rapid Table

🤖2022-12-14 update

  • [python] 将配置参数和模型移到模块里面,同时将模型打到whl包内,可以直接pip安装使用,更加方便快捷。
  • 详情参见:README

🧻2022-11-20 update

  • [python] 添加版面分析部分,支持中文、英文和表格三种版面的检测分析。详情参见:Rapid Structure部分。

🎃2022-11-01 update

  • 添加Hugging Face Demo, 增加可以调节超参数的功能,详情可访问Hugging Face Demo

🚩2022-10-01 udpate

🛴2022-09-01 update

  • 由于openvino发布了2022.2.0.dev20220829版本,该版本解决了cls部分模型推理的问题。至此,基于openvino的rapidocr完成了统一,全部由openvino推理引擎完成。
  • 详细使用方法参见:python/README

🧸2022-08-17 update

  • python/ocrweb部分 v1.1.0发布,详情参见v1.1.0

🕶2022-08-14 update

  • ocrweb部分增加以API方式部署调用的功能,可以通过发送POST请求,来获得OCR识别结果。
  • 详情参见:API方式调用

✨2022-07-07 update

  • 修复python版中v3 rec推理bug,并将v3 rec与v2 rec合并为同一套推理代码,更加简洁和方便
  • 添加python模块下的单元测试
  • 该页面添加致谢模块,感谢为这个项目作出贡献的小伙伴。

😁2022-07-05 update

  • 添加对单行文本的处理能力,对于单行文本,可自行设定阈值,不过检测模块,直接识别即可。详情参见README
  • 优化python部分代码逻辑,更优雅简洁。

🏝2022-06-30 update

  • python推理部分,增加参数选择使用GPU推理的配置选项,在正确安装onnxruntime-gpu版本前提下,可以一键使用(Fix issue#30
  • 具体基于GPU的推理情况,需要等我后续整理一下,再更新出来
  • 详情参见:onnxruntime-gpu版推理配置

📌2022-06-25 update

  • 重新整理python部分推理代码,将常用调节参数全部放到yaml文件中,便于调节,更加容易使用
  • 详情参见:README

🍿2022-05-15 udpate

  • 增加PaddleOCR v3 rec模型转换后的ONNX模型,直接去网盘下载替换即可。(百度网盘 | Google Drive)
  • 增加文本识别模型各个版本效果对比表格,详情点击各个版本ONNX模型效果对比。v3的文本识别模型从自己构建测试集上的指标来看不如之前的好。

😀2022-05-12 upadte

  • 增加PaddleOCR v3 det模型转换的ONNX模型,直接去网盘下载,替换即可。(百度网盘 | Google Drive)
  • 增加各个版本文本检测模型效果对比表格,详情点击各个版本ONNX模型效果对比。v3的文本检测模型从指标来看是好于之前的v2的,推荐使用。

🎧2022-04-04 udpate

  • 增加python下的基于OpenVINO推理引擎的支持
  • 给出OpenVINO和ONNXRuntime的性能对比表格
  • 详情参见:python/README

2022-02-24 udpate

2021-12-18 udpate

2021-11-28 udpate

  • 更新ocrweb部分
    • 添加显示各个阶段处理时间
    • 更新说明文档
    • 更换文本检测模型为ch_PP-OCRv2_det_infer.onnx,推理更快,更准

2021-11-13 udpate

  • 添加python版本中文本检测和识别可调节的超参数,主要有box_thresh|unclip_ratio|text_score,详情见参数调节
  • 将文本识别中字典位置以参数方式给出,便于灵活配置,详情见keys_path

2021-10-27 udpate

  • 添加使用onnxruntime-gpu版推理的代码(不过gpu版本的onnxruntime不太好用,按照官方教程配置,感觉没有调用起来GPU)
  • 具体使用步骤参见: onnxruntime-gpu推理配置

2021-09-13 udpate

  • 添加基于python的whl文件,便于使用,详情参见release/python_sdk

2021-09-11 udpate

  • 添加PP-OCRv2新增模型onnx版本
    • 使用方法推理代码不变,直接替换对应模型即可。
  • 经过在自有测试集上评测:
    • PP-OCRv2检测模型效果有大幅度提升,模型大小没变。
    • PP-OCRv2识别模型效果无明显提升,模型大小增加了3.58M。
  • 模型上传到百度网盘 提取码:30jv

2021-08-07 udpate

  • PP-Structure 表格结构和cell坐标预测 正在整理中
  • 之前做的,未完成的,欢迎提PR
    • 打Dokcer镜像
    • 尝试onnxruntime-gpu推理

2021-07-17 udpate

  • 完善README文档
  • 增加英文、数字识别onnx模型,具体参见python/en_number_ppocr_mobile_v2_rec,用法同其他
  • 整理一下模型转onnx

2021-07-04 udpate

  • 目前仓库下的python程序已经可以在树莓派4B上,成功运行,详细信息请进群,询问群主
  • 更新整体结构图,添加树莓派的支持

2021-06-20 udpate

  • 优化ocrweb中识别结果显示,同时添加识别动图演示
  • 更新datasets目录,添加一些常用数据库链接(搬运一下-)
  • 更新FAQ

2021-06-10 udpate

2021-06-08 udpate

  • 整理仓库,统一模型下载路径
  • 完善相关说明文档

2021-03-24 udpate

  • 新模型已经完全兼容ONNXRuntime 1.7 或更高版本。 特别感谢:@Channingss
  • 新版onnxruntime比1.6.0 性能提升40%以上。

评论