English | 中文
个人职场报销用的 Windows 发票助手 / 发票管家:连接 QQ 邮箱 / 163 邮箱 → 自动下载 PDF/OFD/XML 电子发票和百望云发票链接 → AI OCR 识别 → 本地分类归档 → 生成 Excel 报销汇总
适合这些搜索和需求:发票助手、发票管家、报销助手、电子发票归档、发票报销、QQ邮箱发票自动下载、163邮箱电子发票归档、OFD发票下载、百望云发票下载、Windows发票管理。
邮件和发票文件在本地处理。启用 GLM OCR / 视觉识别时,发票图片会发送到你配置的模型服务商用于提取。
intro-video.mp4
| 特性 | 说明 | |
|---|---|---|
| 🔒 | 一键运行,开箱即用 | 解压即可运行,无需安装 Python 或任何依赖 |
| 🤖 | 双引擎 AI 识别 | Track A(OCR精确流)+ Track B(视觉降级流),自动切换,无需手动操作 |
| 🔍 | 四层智能漏斗 | 白名单域名 → 主题关键字 → 正文检测 → 二维码扫描,精准过滤非发票邮件 |
| 📄 | 链接发票自动恢复 | Playwright 自动打开百望云、税务平台链接,下载正式 PDF 存档 |
| 🗂️ | 自然语言分类规则 | 支持"滴滴大于100元放进大额"这样的自定义规则 |
| 📊 | 一键 Excel 报表 | 自动生成 summary_report.xlsx,发票清单、金额汇总全覆盖 |
flowchart LR
A["📧 QQ / 163\n邮箱 IMAP"] --> B["📥 邮件抓取\nEmailFetcher"]
B --> C{"🔍 四层\n智能漏斗"}
C -->|"通过"| D["📎 附件提取\nZIP 递归解包"]
C -->|"丢弃"| X["🗑️ 非发票邮件"]
D --> E{"附件类型?"}
E -->|"PDF/OFD/XML"| F["🤖 AI 提取引擎"]
E -->|"URL 链接"| G["🌐 PDF 恢复\nPlaywright"]
G --> F
F --> H{"提取\n成功?"}
H -->|"✅"| I["📂 智能分类\n规则重命名"]
H -->|"❌"| J["📁 Manual_Check"]
I --> K["🗂️ 本地归档"]
K --> L["📊 Excel 报表"]
系统采用 Track A + Track B + Local Fallback 三层防线,任何一层成功即采用结果,确保极高的识别成功率。
为什么这样设计?
- Track A(OCR + LLM):精度最高,先提取文字结构再理解
- Track B(glm-4.5V 视觉):直接"看图",适合复杂排版或图片类发票
- Local Fallback:本地正则规则,断网可用,零 API 消耗
系统不会对每封邮件都调用 AI,而是先经过四层漏斗精准判断,大幅降低误识别率和 API 费用。
筛选通过后,附件还会经过 三级决策:
| 层级 | 触发条件 | 处理方式 |
|---|---|---|
| 🗑️ A 层(丢弃) | Tracking pixel、Logo、装饰图(≤32px) | 直接跳过 |
| 📦 B 层(暂存) | 附件 >5MB、ZIP 解包失败 | 保留但不处理 |
| ✅ C 层(归档) | 正常 PDF/OFD/XML | 进入 AI 提取流程 |
许多发票邮件只有"点击下载"的链接,系统自动识别平台并选择最优方案:
flowchart TD
Link(["🔗 邮件中的发票链接"]) --> Detect{"识别链接平台"}
Detect -->|"百望云"| BW["🏢 Playwright 自动化\n登录 → 点击下载 → 捕获文件\n字段匹配验证"]
Detect -->|"国税·诺诺·航信"| DI["📥 HTTP 直接下载\n识别发票族群\n本地字段校验"]
Detect -->|"未知网页"| Generic["🌐 网页转 PDF\n检测登录/验证码\nA4 格式渲染"]
BW & DI & Generic --> Final(["📄 本地 PDF"])
Final --> AI(["🤖 AI 提取流程"])
首次使用只需配置一次,之后每次扫描直接点击运行。
📖 点击展开 163 邮箱详细步骤
服务器参数
| 参数 | 值 |
|---|---|
| IMAP 服务器 | imap.163.com |
| 端口 | 993(SSL/TLS) |
开启步骤
- 登录 mail.163.com,点击右上角「设置」
- 在下拉菜单中选择「POP3/SMTP/IMAP」
- 找到「IMAP/SMTP 服务」,点击右侧「开启」按钮
- 弹出「账号安全验证」窗口:
- 扫码方式(推荐):手机扫描二维码,自动发送验证短信
- 手动方式:按提示手动发送短信到指定号码
- 短信发送后点击「我已发送」
- 系统生成 16 位授权码(字母组合,仅显示一次,务必立即复制保存)
⚠️ 授权码不是邮箱登录密码,是专用于第三方客户端的独立密码,大小写敏感。
📖 点击展开 QQ 邮箱详细步骤
服务器参数
| 参数 | 值 |
|---|---|
| IMAP 服务器 | imap.qq.com |
| 端口 | 993(SSL/TLS) |
开启步骤
- 登录 mail.qq.com,点击右上角「设置」图标
- 选择「账户」选项卡
- 找到「POP3/IMAP/SMTP/Exchange/CardDAV/CalDAV 服务」
- 点击「管理服务」→「开启服务」
- 点击「生成授权码」,进行身份验证:
- 扫码方式(推荐):手机扫码后自动发送验证短信
- 手动方式:用 QQ 绑定手机发送「配置邮件客户端」到 1069070069
- 点击「我已发送」,验证后授权码即时生成(请立即保存)
⚠️ 修改 QQ 密码后授权码自动失效,需重新生成。
📖 点击展开 GLM API 配置步骤
系统使用 GLM-4.5V(多模态视觉)和 GLM-OCR 识别发票内容。
步骤
- 访问 open.bigmodel.cn,注册账号
- 进入控制台 → API Keys → 创建 API Key
- 复制并保存 Key(格式:
xxxxxxxx.xxxxxxxxxxxxxxxx)
费用参考
| 情况 | 说明 |
|---|---|
| 🎁 新用户福利 | 赠送 500 万 GLM-4 tokens(30 天有效) |
| 💰 推荐充值 | 5 元以内,按量计费 |
| 📊 使用估算 | 每张发票约消耗 1,000–3,000 tokens;每月 200 张,5 元可用约 12 个月 |
Step 1 解压软件包到普通文件夹(避免云盘同步目录)
保持 _internal 文件夹与 InvoiceFlowAI.exe 同级
↓
Step 2 双击运行 InvoiceFlowAI.exe
首次启动自动弹出设置界面
↓
Step 3 填入配置并保存:
· 邮箱地址 + 授权码(QQ 或 163)
· GLM API Key
↓
点击「开始扫描」→ 等待完成
发票自动归档到桌面「发票整理」文件夹 ✅
发票整理/
├── 火车票/
│ └── 20260315-北京-上海-火车票.pdf
├── 机票/
│ └── 20260301_机票_1280.00_中国国际航空.pdf
├── 住宿/
│ └── 20260310_住宿_888.00_北京希尔顿.pdf
├── 打车/
│ └── 20260312_打车_45.50_滴滴出行.pdf
├── 餐饮/
├── Manual_Check/ ← AI 无法识别,需人工处理
└── summary_report.xlsx
Q:软件启动后白屏或无响应?
- 确认已将整个压缩包解压,
_internal文件夹须与InvoiceFlowAI.exe在同一目录 - 避免将软件放在含有中文路径或空格的目录下
Q:扫描完发票数量很少?
- 在软件的时间范围设置中,将起始日期往前调整至 180 天以上
- 部分邮箱默认只拉取近30天邮件,需要在邮箱 IMAP 设置里选择「收取全部邮件」
Q:授权码填写后提示认证失败?
- QQ 邮箱:须从「管理服务 → 生成授权码」流程中获取,不是 QQ 密码
- 163 邮箱:须从「开启 IMAP 服务」弹窗中生成,不是邮箱登录密码,注意大小写
- QQ 修改密码后需重新生成授权码
Q:GLM API 报错余额不足?
登录 open.bigmodel.cn → 费用中心 → 充值。推荐充值 5 元,按量计费。
Q:部分发票进入 Manual_Check 文件夹?
正常现象。当 AI 识别置信度不足时,系统自动放入 Manual_Check 队列,需人工确认。通常由图片模糊、非标准票据或加密 PDF 导致。
- 所有邮件、发票文件均在本地处理,不上传任何服务器
- 邮箱凭据通过 Windows DPAPI 加密存储,只有当前 Windows 账户可解密
- GLM API 仅接收发票图片(Base64)用于文字识别,不发送邮件原文内容
使用本软件即表示您已理解并接受以下内容。
合规使用 · 本软件通过 IMAP 只读访问邮箱,不发送、删除或修改任何邮件。用户须确保对所处理邮箱拥有合法授权。
用途 · 本软件仅用于发票邮件下载、识别、分类、归档等自动化辅助。
准确性与合规性 · 作者不保证发票数据或生成结果的准确性、完整性、合法性、税务合规性、财务合规性或会计合规性。用户必须自行核验所有发票、报销、税务、会计和合规结果后再使用。
数据 · 调用 GLM API 时,发票图片会发送至智谱 AI 服务器进行识别,受 智谱 AI 隐私政策 约束;邮件原文不会发送。
责任限制 · 作者不对使用本软件造成的损失、遗漏、错误、报销失败、税务风险、合规问题或数据丢失承担责任。
第三方服务
| 服务 | 用途 | 服务方 |
|---|---|---|
| 智谱 GLM API | 发票 OCR 与视觉识别 | 北京智谱华章科技有限公司 |
| QQ 邮箱 IMAP | 邮件读取 | 腾讯科技(深圳)有限公司 |
| 163 邮箱 IMAP | 邮件读取 | 网易(杭州)网络有限公司 |
本项目基于 Apache License 2.0 授权。允许商业使用、修改、分发和闭源集成,但再分发时必须保留 copyright notice、license notice,以及 NOTICE 中的作者署名。