CUDA_Learnning

Tensort简介

功能	介绍
运行时环境	对象生命期管理，内存显存管理，异常处理
序列化，反序列化	推理引擎保存为文件，或从文件中加载

构建期
- 建立Logger(日志)
- 建立Builder(网络元数据)和BuilderConfig(网络元数据的选项)
- 创建Network网络
- 生成SerializedNetwork序列化网络
运行期
- 建立engine和content
- Buffer相关准备(申请和拷贝)
- 执行推理
- 善后工作(资源释放)

- 同时准备CPU端内存和GPU端内存
- 开始计算时把数据从内存拷贝到显存
- 计算过程中的输入输出均在GPU端读写
- 计算完成后把结果拷贝到内存才能使用

转换到的目标格式

根据NMS(非极大值抑制)，进一步处理检测结果

输出检测结果，如置信度，检测框坐标，时间戳，类别标签等。

Language:C++ 73.1%Language:C 14.4%Language:Cuda 9.6%Language:CMake 2.9%