MicroInfer

一种适用于微处理器的深度学习推理框架，为多种不同算力的微处理器（目前规划为cortex-m4 、cortex-m7、cortex-a等）提供一键式深度学习模型部署方案，让算法工程师在不深入底层的情况下，可以无差异化的验证模型的运行情况。

此框架使用独立的静态内存管理机制，可与XidianOS操作系统配合使用，自动生成定制化的Microinfer插件，目前仅适用于MCU，暂不支持MMU功能。

XidianOS操作系统是应用于微处理器上的一个小巧玲珑的操作系统，它可以根据具体的应用场景以去定制化功能，具有较强的可拓展性和可移植性。同时具有一套面向AI模型的标准化框架，可对接多种AI后端推理方案，为用户提供统一的接口。 https://github.com/Derekduke/XidianOS

windows 本地调试方法

windows10 安装make

参考： https://www.cnblogs.com/jixiaohua/p/11724218.html

编译运行

cmd中输入“make”，生成bin.exe，输入“bin”运行

代码分析

基本要素：

通用层描述符

专用层描述符（包含通用层描述符）

tensor（用于描述某个内存中，存放数据的特征，比如CHW）通用层所拥有的IO（IN或OUT两种）通用层所拥有的BUF（其中包含用于中间计算的block和block的size） IO所拥有的hook（用来指向下层的输入IO或上层的输出IO） IO所拥有的block（用来存放IO中tensor描述的真实内存数据的指针）

运行逻辑：

1.创建各个层，主要工作是根据层的输入属性（如卷积核数量、大小等），初始化对应层的描述符和已经可确定的tensor 2.执行model_compile，主要工作是从头到位逐层遍历模型，确认每一层的输入、输出、计算，包括这三者所需要的tensor、内存块以及tensor和内存块的对应关系。 3.进行model_run

功能点推进：

创新点

1.简约高效的独立内存管理机制（已实现）

仅固定可使用内存块的数量，但按照尽可能多的复用“老”内存块的原则，根据长板效应对内存块的大小做动态调整，类似于贪心策略获得相对较优的内存分配方案。同时按照先计算后分配的原则，做到内存块在物理设备上的紧密相连，减少内存碎片化。

2.可支持一键式部署的模型部署框架（作为XidianOS的一个中间件实现）

XidianOS中的AI Framework中间件，为多种后端推理框架提供无差异的API接口，Microinfer可一键式生成XidianOS的后端插件，包括模型权重、推理核心代码、静态内存自动分配。

3.多平台算子调优（部分实现）

已经在我的 tencentos-tiny-with-tflitemicro-and-iot 仓库中：https://github.com/Derekduke/tencentos-tiny-with-tflitemicro-and-iot 实现应用Cortex-m4/m7的DSP资源（实际上是替换CMSIS-NN算子）实现行人识别，暂未将实例整合进来；在Cortex-a上利用NEON指令做加速的Arm Compute Library库移植还有点问题，主要是C++和C的混编链接；还有针对普通算子的调优，如近似卷积算法、循环矩阵乘法等还未实现。

4.模型功能创新（待考虑）

基于这套推理框架做一些有创新型的模型或应用（先测试简单的已有模型）

参考开源项目

RT-Thread RTAK套件、华为MindSpore lite的codegen生成器

Keras API手册

NNOM框架、Caffe框架、Tensorflow Lite Micro框架

About

Languages

Language:C 94.5%Language:Python 5.5%Language:Makefile 0.0%