kouxichao / vision

ncnn vision project

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

this is a VISION project for hisi3559a.

编译成静态库:

cd $VISION
mkdir build
cd build
cmake ..
make -j$(nproc)
$VISION/lib 目录下生成libvision.a静态库
注:编译默认只编译crnn相关函数,facerecognization相关函数可添加编译选项-DNOT_ONLY_CRNN编译(相关函数未标准化)。

crnn

使用说明:

提供三个接口函数:

// 说明:根据识别出的文本框对里面的文字进行识别
// 初始化,用以加载ncnn lstm文字识别模型
void DKBoxTextRecognizationInit();

// 运行ncnn lstm文字识别,输出识别字符串
char* DKBoxTextRecognizationProcess(const char* imgfilename, int iHeight, int iWidth, DKSBox box, DKSBoxTextRecognizationParam param)

// 释放ncnn文字识别结构资源
void DKBoxTextRecognizationEnd();

结构体定义:

typedef struct
{
    //左上角开始顺时针点坐标
    int x1;
    int y1;
    int x2;
    int y2;
    int x3;
    int y3;
    int x4;
    int y4;
}DKSBox;

typedef struct
{
        //等待添加
   const char* lexicon;//此选项未实现

}DKSBoxTextRecognizationParam;

执行与测试:

  bin文件目录下生成可执行文件demo_crnn,把models目录下的模型文件crnn.bin,crnn.param放入bin目录下,执行测试程序。

使用生成的库文件编译可执行程序示例:

  https://github.com/kouxichao/crnn

About

ncnn vision project


Languages

Language:C++ 56.7%Language:C 34.1%Language:Makefile 4.5%Language:Shell 3.0%Language:CMake 0.7%Language:M4 0.6%Language:Cuda 0.3%Language:Roff 0.0%Language:C# 0.0%Language:Java 0.0%Language:Batchfile 0.0%Language:MATLAB 0.0%