jinfagang / AI-Infer-Engine-From-Zero

关于自建AI推理引擎的手册,从0开始你需要知道的所有事情

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

从零构建AI推理引擎系列

引言: 现在有很多开源推理引擎,也有很多同学做模型部署相关工作,但大部分仅仅停留在“用工具”的层面。假如你想掌握技术的本源,停留在用工具层面是远远不够的。

我将最近业余玩耍的自建AI推理引擎相关博客文章整理成一个索引,里面记录了一些我在建造过程中踩过的坑,以及一些关于 C++语言、框架架构、算子推理设计、用户体验设计 的一些实践和思考,希望对大家有用。

AI已经到了一个非常成熟的阶段,我们要做的,不仅仅是 python train.py,我们要做的是更进一步的将AI推延到工业领域,而这离不开一个好用的推理引擎。但仅停留在用开源的工具未免有些浅显,比如 有社区同学就问我MNN编译的库体积较大如何解决?有人问题我为什么某些框架的layernorm很慢等等,如果你深入知道它背后的实现原理,这些问题自然就知道答案了。

这个仓库持续更新中,如果你对 AI部署落地,AI算法应用感兴趣,可以搜索微信公众号关注一波: 神力人工智能 。不定期分享一些技术干货。

动态

本系列一直在更新中,一直没有停更,简单动态记录:

2022.09.08 : 忙于模型优化,暂时停了一段时间,下次将使wnnx能够推理自研的YOLO系列目标检测模型;

索引

1. 基础进阶

2. 花式玩法

3. 骨灰级

4. 外延(产品经理用)

版权

All rights reserved by Lucas Jin @ 2022.

About

关于自建AI推理引擎的手册,从0开始你需要知道的所有事情