引言

Cycle-CenterNet算法来自论文Parsing Table Structure in the Wild,是阿里的一篇工作。

该工作主要解决拍照和截屏场景下有线结构识别问题。

基本原理

本模型是以自底向上的方式:

1)基于单元格中心点回归出到4个顶点的距离,解码出单元格bbox;同时基于单元格顶点,回归出到共用该顶点的单元格的中心点距离,解码出gbox。

2)基于gbox(group box),将离散的bbox拼接起来得到精准完整的电子表格;

3)第二步的拼接将单元格从“离散”变为“连续”,因此用后处理算法获得单元格的行列信息。

参考资料

Last updated 22 Nov 2023, 22:20 +0800 . history