hiroi-sora / PaddleOCR-json

OCR离线图片文字识别命令行windows程序,以JSON字符串形式输出结果,方便别的程序调用。提供各种语言API。由 PaddleOCR C++ 编译。

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

段落文字如何识别

KennyLv opened this issue · comments

d

对于上图这种的识别结果是两行哦,有什么好的方式或是模型,让他们输出成一个结果么?

{
"code": 100,
"data": [{
"box": [[84, 35],[393, 35],[393, 53],[84, 54]],
"score": 0.9679305553436279,
"text": "Driving in areas where salt or other"
}, {
"box": [[84, 66],[331, 66],[331, 84],[84, 84]],
"score": 0.9162040948867798,
"text": "corrosive materials are used"
}]
}

谢谢

如果你是使用 Python API ,那么有丰富的 文本后处理 模块可供选择,

如果你是使用其他语言API或者自己编写,那么暂未提供相关模块。你可以参考上述文本后处理模块的 源码 ,用自己的语言重写。