pzx521521 / Invoice2Excel

提取PDF电子发票内容内容保存到Excel

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Invoice2Excel

摘要:这篇文章介绍如何把发票内容提取出来保存到Excel中。


程序功能

程序会把发票中的内容提取出来然后写入Excel中,一个示例的发票内容如下:

发票示例

提取结果如下:

提取结果

程序使用

  • 方式一:网页版使用(按量付费使用,可免费试用10份。注意:网页版的代码支持更多类型的发票识别提取):点击这里

  • 方式二:下载代码

    git clone https://github.com/yooongchun/PDF_Invoice2Excel.git
  • 安装依赖包:

    python -m pip install -r requirements.txt
    # 或者
    pip install -r requirements.txt
  • 准备数据

    准备好PDF文件,放置到一个目录下

  • 运行程序

     # 注意:这里data指你的pdf文件放置的文件夹, -p data也可以替换为--path=data
    python Invoice2Excel.py -p data

更多

  • 运行测试,可以通过以下命令运行测试

    python Invoice2Excel.py
  • 指定输出文件位置

    # 注意:这里data.xlsx指你的pdf结果保存文件, -s data.xlsx也可以替换为--save=data.xlsx
    python Invoice2Excel.py -s data.xlsx
    # 也可以同时指定两个参数
    python Invoice2Excel.py -s data.xlsx -path=data

获取帮助

联系作者获取帮助:

About

提取PDF电子发票内容内容保存到Excel


Languages

Language:Python 100.0%