839120 / alfred-ocr

OCR & Translate using multiple interfaces for Alfred Workflow

Home Page:https://gitee.com/rabbitlu/alfred-ocr

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Alfred - OCR and Translation

语言

简体中文 | English

下载地址

国内直链 | Github-Release

OCR Demo

Demo_OCR

Translate Demo

Demo_Trans

版本

4.7

  • 紧急修复批量文件识别报错的问题

4.6

  • 更改 CNOCR 的触发方式,现与其余 OCR 一致;
  • CNOCR 上游更新至 V1.1.1 (查看详情)。

4.5

能力

  • 离线 OCR (CNOCR)
  • 通用 OCR (百度 | 腾讯优图 | Google)
  • 二维码识别 (百度 | ZXing)
  • 表格文字识别 (百度)
  • 多文件识别 (百度)
  • 文本翻译 (彩云小译)

使用(必看!!)

  1. 不是一个开箱即用的产品!
  2. 您至少要拥有 macOS Alfred 3 及以上版本并激活 Powerpack。
  3. 您需要安装 Python 3 及相应的依赖模块,并将 Python 3 路径填写在PYTHON_PATH处。
  4. 您需要申请并将对应接口的配置填入环境变量,部分接口附带我自己的 Key,但严禁滥用。
  5. 具体配置方法请移步 安装方式

截图权限

第一次使用时,请先用 oo 触发 CNOCR(无论你是否安装/需要 CNOCR 模块),此时 Alfred 会向系统请求屏幕录制权限,授权后,方可正常通过 ctrl+v 触发截屏。

依赖

通用 OCR

pip install requests

CNOCR (离线 OCR)

pip install cnocr

ZXing (离线二维码识别)

pip install zxing

接口

触发

  • 截图至剪贴板后使用关键词 oo 触发。

说明

  • 一切安装方法请依据该项目 README

触发

  1. 通用 OCR:快捷键 ctrl+v 触发截图选框,或截图至剪贴板后使用关键词 oob (baidu) 触发;
  2. 二维码识别:截图后使用关键词 ooqb (qr baidu) 触发;
  3. 表格文字识别:截图后使用关键词 ooe (excel) 触发,识别后可直接复制至 Excel;
  4. 多文件识别:finder 中选中需要识别的图片并使用关键词 oof (file) 触发。

File_OCR

说明

  1. 具备中英文识别,标点符号将被替换为对应语言下的符号;
  2. 二维码识别支持同时识别多个;
  3. 自带一个测试 Token,不保证可用性,需要稳定可自行申请;
  4. 最大支持单个 4MB 的图片。

自定义语种

目前仅支持通用 OCR 选择语

语种选择逻辑:

  1. ctrl+v 触发时,将选择环境变量中的 baidu_language_type 来定义语种,如果该值为空,则定义为默认值 CHN_ENG,即中英文混合识别;
  2. 当使用 oob 直接触发时,同上;
  3. 当使用 oob 调出选择菜单,并按住 command 触发时,将使用第二语言识别。

第一语言选择位置:

First_Lang_Select

第二语言选择位置:

Second_Lang_Select

支持的全部语种及其语种代码如下所示:
- CHN_ENG:中英文混合
- ENG:英文
- JAP:日语
- KOR:韩语
- FRE:法语
- SPA:西班牙语
- POR:葡萄牙语
- GER:德语
- ITA:意大利语
- RUS:俄语

触发

  • 通用 OCR:截图至剪贴板后使用关键词 oot (tencent) 触发。

说明

  1. 自带一个测试 Token,不保证可用性,需要稳定可自行申请;
  2. 最大支持 1MB 的图片,过大图片会自动交由百度处理(当然百度最大也只支持 4MB)。

触发

  • 通用 OCR:截图至剪贴板后使用关键词 oog (google) 触发。

环境变量

变量名 字段说明
google_access_token 授权密钥
google_post_referer HTTP 请求时的 Referer 参数,默认为空
google_http_proxy HTTP 代理,默认为空,填写方式如 127.0.0.1:1234

说明

  • Google OCR 为收费业务,需绑定信用卡,故本项目不带测试 Token,需要自行申请。

触发

  • 截图至剪贴板后使用关键词 ooq 触发。

说明

  1. 一切安装方法请依据该项目 README;
  2. 仅支持单个二维码识别。

触发

  • 文本翻译:使用关键词 tc (translate caiyun) + 需要翻译的内容 来触发;输出结果可通过 command + v 复制。

说明

  1. 自带一个测试 Token,不保证可用性,需要稳定可自行申请;
  2. 支持中译英,及 X 译中(X 为彩云小译已经支持的语言类别)。

TODO

  • 段落优化
  • 截图翻译

致谢

  1. breezedeus/cnocr
  2. dlenski/python-zxing
  3. ginfuru/alfred-screen-capture
  4. oott123/alfred-clipboard-ocr

测试员

  1. Elvis Cai
  2. LucasZhan

About

OCR & Translate using multiple interfaces for Alfred Workflow

https://gitee.com/rabbitlu/alfred-ocr

License:GNU Affero General Public License v3.0


Languages

Language:Python 100.0%