HaroldMua / bdc-aicloud

Repository from Github https://github.comHaroldMua/bdc-aicloudRepository from Github https://github.comHaroldMua/bdc-aicloud

aicould平台深度学学习环境资源管理

该仓库包括三部分内容:

  1. 制作深度学习框架环境(GPU/CPU两个版本)镜像的Dockerfile文件;
  2. 创建和删除深度学习环境的脚本文件;
  3. 创建和删除用户数据存储目录的脚本问价;

TO-DO list

  1. 升级集群工作节点的Nvidia GPU CUDA版本和深度学习框架版本;
  2. 优化K8S集群的深度学习环境的调度;
  3. 监控用户深度环境中的进程,若长时间无进程运行,则删除用户环境,释放资源;
  4. 支持深度学习分布式训练。

About


Languages

Language:JavaScript 66.9%Language:Python 14.9%Language:HTML 6.6%Language:C 3.7%Language:CSS 1.6%Language:Ruby 1.4%Language:Shell 1.2%Language:Clojure 0.8%Language:Dockerfile 0.6%Language:Roff 0.6%Language:Jinja 0.6%Language:Vue 0.6%Language:Makefile 0.3%Language:C# 0.3%Language:Perl 0.0%