On this page
LORE: 无线表格结构识别算法
引言
LORE算法来自论文LORE: Logical Location Regression Network for Table Structure Recognition,是阿里的一篇工作。
该工作主要解决无线表格结构识别问题,具体包括文档中涉及到一些三线表之类表格结构识别。对于有线的表格支持较差。
基本原理
主要原理为:
1)基于无线单元格中心点回归出到4个顶点的距离,解码出单元格bbox;
2)结合视觉特征与单元格bbox信息,采用两个级联回归器兼顾全局与局部注意力,直接对单元格的逻辑坐标进行回归;
3)模型训练时显式利用单元格间与单元格内逻辑约束对模型进行优化。
参考资料
Last updated 22 Nov 2023, 09:09 +0800 .