PyPI

简介

wired_table_rec库源于阿里读光-表格结构识别-有线表格

在这里,我们做的工作主要包括以下两点:

  1. 将模型转换为ONNX格式,便于部署
  2. 完善后处理代码,与OCR识别模型整合,可以保证输出结果为完整的表格和对应的内容

安装

  pip install wired_table_rec
  

使用

查看效果

识别结果(点击展开)
  <html>

<body>
    <table>
        <tr>
            <td rowspan="2">名称</td>
            <td rowspan="2">产量(吨)</td>
            <td colspan="2">环比</td>
        </tr>
        <tr>
            <td>增长量(吨)</td>
            <td>增长率(%)</td>
        </tr>
        <tr>
            <td>荔枝</td>
            <td>11</td>
            <td></td>
            <td>10</td>
        </tr>
        <tr>
            <td>芒果</td>
            <td></td>
            <td></td>
            <td>-10</td>
        </tr>
        <tr>
            <td>香蕉</td>
            <td></td>
            <td></td>
            <td>20</td>
        </tr>
    </table>
</body>

</html>
  

Last updated 22 Nov 2023, 21:53 +0800 . history