On this page
Cycle-CenterNet: 有线表格结构识别算法
引言
Cycle-CenterNet算法来自论文Parsing Table Structure in the Wild,是阿里的一篇工作。
该工作主要解决拍照和截屏场景下有线结构识别问题。
基本原理
本模型是以自底向上的方式:
1)基于单元格中心点回归出到4个顶点的距离,解码出单元格bbox;同时基于单元格顶点,回归出到共用该顶点的单元格的中心点距离,解码出gbox。
2)基于gbox(group box),将离散的bbox拼接起来得到精准完整的电子表格;
3)第二步的拼接将单元格从“离散”变为“连续”,因此用后处理算法获得单元格的行列信息。
参考资料
Last updated 22 Nov 2023, 22:20 +0800 .