On this page
wired_table_rec
简介
wired_table_rec
库源于阿里读光-表格结构识别-有线表格。
在这里,我们做的工作主要包括以下两点:
- 将模型转换为ONNX格式,便于部署
- 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容
该库仅提供推理代码,如有训练模型需求,需要参考modelscope中相关代码,该算法没有提供单独仓库。
安装
pip install wired_table_rec
使用
查看效果
识别结果(点击展开)
<html>
<body>
<table>
<tr>
<td rowspan="2">名称</td>
<td rowspan="2">产量(吨)</td>
<td colspan="2">环比</td>
</tr>
<tr>
<td>增长量(吨)</td>
<td>增长率(%)</td>
</tr>
<tr>
<td>荔枝</td>
<td>11</td>
<td></td>
<td>10</td>
</tr>
<tr>
<td>芒果</td>
<td></td>
<td></td>
<td>-10</td>
</tr>
<tr>
<td>香蕉</td>
<td></td>
<td></td>
<td>20</td>
</tr>
</table>
</body>
</html>
Last updated 22 Nov 2023, 21:53 +0800 .