Radish

Radish可以让你的模型从训练到部署都使用相同C++代码库，借助libtorch, 让你专注实现模型及对应数据处理。

如何构建

安装bazel 0.28+
C++17 特性支持的编译器 (7.3.2, 8.3.0已验证)
运行构建比如： bazel build bert:train_albert_main

为什么造这个轮子

AI真正的落地需要很好的工程化
模型太多了，训练，预处理等也需要很好工程化
实时训练场景如有些RL需要真正多线程支持，而不是Python
训练与推理相同代码库，缩小落地Gap

如果你碰到以上问题，Radish值得尝试!

如何使用

派生自radish::LlbModel类，实现对应forward过程，以及计算loss的逻辑
决定你的样本特征，以及对应target
实现radish::data::ExampleParser , 根据需要实现对应解析方法
借助radish:: train ::LlbTrainer 指定对应模板参数，函数参数训练模型
....

可参考bert目录下spanbert以及albert示例。

数据载入

你可以使用2种数据格式，一种是基于leveldb, 另一种基于纯文本（一行一个样本) 基于leveldb的支持完全随机访问，基于txt的支持多文件输入，每次随机从某文件读入数据

关于ALBERT

样本格式： TXT格式，一行一个样本，把换行换成\t或者空格

运行训练（示例）：

LD_LIBRARY_PATH=/data/chenyw/libtorch_gpu/lib ./train_albert_main --train_data_path /data/chenyw/albert/data/part0,/data/chenyw/albert/data/part1  --test_data_path /data/chenyw/albert/data/valid0  --warmup_steps 10000 --parser_conf_path parser_conf.json --eval_every 5000 -learning_rate 0.0003 --batch_size 460

更多参数可运行加--help参数打印出来参考

论文给出的实验报告，可以看出主要是hidden size在起作用，共享参数反而使得效果打折扣。所以本示例实现没有加入参数共享。可自行更改对应代码，也欢迎pull request.

参考

About

C++ model train&inference framework

Apache License 2.0

Languages

Language:C++ 86.7%Language:Python 13.0%Language:C 0.3%