Umi-OCR 插件库

这里是存放开源软件 Umi-OCR 的插件的仓库。

Umi-OCR (v2 以上) 支持以插件的形式导入 OCR 引擎等组件，只需将插件文件放置于软件指定目录即可。

如何开发插件？

如何安装插件

在 Releases 中下载插件压缩包。 不要直接下载仓库的源代码！
在 Releases 中下载插件压缩包。 不要直接下载仓库的源代码！！
在 Releases 中下载插件压缩包。 不要直接下载仓库的源代码！！！

（重要的事情说三遍）

将下载的文件解压，放置于：UmiOCR-data/plugins

OCR 文字识别插件

win7_x64_PaddleOCR-json

性能和准确率优秀的开源离线 OCR 组件。支持 mkldnn 数学库加速，能充分榨干 CPU 的潜力。适合高配置电脑使用。

源仓库	PaddleOCR-json
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	CPU 须带 AVX 指令集（不支持凌动 Atom，安腾 Itanium，赛扬 Celeron，奔腾 Pentium）
附带语言库	`简, 繁, 英, 日, 韩, 俄`

win7_x64_RapidOCR-json

轻量、高兼容性的开源离线 OCR 组件。内存与 CPU 占用低。速度相对慢一点。适合低配置老电脑使用。

源仓库	RapidOCR-json
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	无特殊要求
附带语言库	`简, 繁, 英, 日, 韩, 俄`

win7_x64_Pix2Text

支持中英文/数学公式/混合排版。插件体积大，加载速度较慢，识别速度快。

源仓库	Pix2Text
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	无特殊要求
附带语言库	`中文/英文/数学公式`

chineseocr_umi_plugin

支持中英文识别，ChineseOCR 的轻量级模型，仍在接入适配中。

源仓库	ChineseOCR
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	无特殊要求
附带语言库	中英文

tesseractOCR_umi_plugin

老牌开源模型，支持多国语言。速度较快，英文准确率优秀，中文准确率稍差。
带有额外的排版识别库，能识别复杂的文档排版，比Umi自带的排版解析工具准确率更好。如果使用此插件，请在Umi的标签页设置中将“排版解析方案”设为“不做处理”。

源仓库	TesseractOCR
下载	Releases
计算方式	本地，CPU
平台兼容	win7 以上，64 位
硬件兼容	无特殊要求
附带语言库	`简, 繁, 英, 日，数学公式` （另支持自行下载其他语言模型

插件开发

请见插件开发文档及 demo。

Umi-OCR 项目结构

各仓库：

工程结构：

** 后缀表示本仓库(插件库)包含的内容。

Umi-OCR
├─ Umi-OCR.exe
└─ UmiOCR-data
   ├─ main.py
   ├─ version.py
   ├─ site-packages
   │  └─ python包
   ├─ runtime
   │  └─ python解释器
   ├─ qt_res
   │  └─ 项目qt资源，包括图标和qml源码
   ├─ py_src
   │  └─ 项目python源码
   ├─ plugins **
   │  └─ 插件
   └─ i18n
      └─ 翻译文件

625833348 / Umi-OCR_plugins

Umi-OCR 插件库

如何安装插件

OCR 文字识别插件

win7_x64_PaddleOCR-json

win7_x64_RapidOCR-json

win7_x64_Pix2Text

chineseocr_umi_plugin

tesseractOCR_umi_plugin

插件开发

Umi-OCR 项目结构

各仓库：

工程结构：

About

Languages

Umi-OCR 插件库

如何安装插件

OCR 文字识别 插件

win7_x64_PaddleOCR-json

win7_x64_RapidOCR-json

win7_x64_Pix2Text

chineseocr_umi_plugin

tesseractOCR_umi_plugin

插件开发

Umi-OCR 项目结构

各仓库：

工程结构：

About

Languages

OCR 文字识别插件