文字课程内容正在一节节补充更新,尽可能抽空继续更新正在 AISys ,希望您多多鼓励和参与进来!!!
文字课程开源在 AISys,系列视频托管B 站和油管,PPT 开源在github,欢迎取用!!!
这个开源课程英文名字叫做 Deep Learning System 或者 AI System(AISys),中文名字叫做 深度学习系统 或者 AI 系统。
本开源课程主要是跟大家一起探讨和学习人工智能、深度学习的系统设计,而整个系统是围绕着 ZOMI 在工作当中所积累、梳理、构建 AI 系统全栈的内容。希望跟所有关注 AI 开源课程的好朋友一起探讨研究,共同促进学习讨论。
课程主要包括以下六大模块:
第一部分,AI 基础知识和 AI 系统的全栈概述的AI 系统概述,以及深度学习系统的系统性设计和方法论,主要是整体了解 AI 训练和推理全栈的体系结构内容。
第二部分,硬核篇介绍AI 芯片概况,这里就很硬核了,从芯片基础到 AI 芯片的范围都会涉及,芯片设计需要考虑上面 AI 框架的前端、后端编译,而不是停留在天天喊着吊打英伟达,被现实打趴。
第三部分,进阶篇介绍AI 编译器原理,将站在系统设计的角度,思考在设计现代机器学习系统中需要考虑的编译器问题,特别是中间表达乃至后端优化。
第四部分,实际应用推理系统与引擎,讲了太多原理身体太虚容易消化不良,还是得回归到业务本质,让行业、企业能够真正应用起来,而推理系统涉及一些核心算法和注意的事情也分享下。
第五部分,介绍AI 框架核心技术,首先介绍任何一个 AI 框架都离不开的自动微分,通过自动微分功能后就会产生表示神经网络的图和算子,然后介绍 AI 框架前端的优化,还有最近很火的大模型分布式训练在 AI 框架中的关键技术。
第六部分,汇总篇介绍大模型与 AI 系统,大模型是基于 AI 集群的全栈软硬件性能优化,通过最小的每一块 AI 芯片组成的 AI 集群,编译器使能到上层的 AI 框架,训练过程需要分布式并行、集群通信等算法支持,而且在大模型领域最近持续演进如智能体等新技术。
本课程主要为本科生高年级、硕博研究生、AI 系统从业者设计,帮助大家:
-
完整了解 AI 的计算机系统架构,并通过实际问题和案例,来了解 AI 完整生命周期下的系统设计。
-
介绍前沿系统架构和 AI 相结合的研究工作,了解主流框架、平台和工具来了解 AI 系统。
先修课程: C++/Python,计算机体系结构,人工智能基础
编号 | 名称 | 具体内容 |
---|---|---|
1 | AI 系统 | 算法、框架、体系结构的结合,形成 AI 系统 |
编号 | 名称 | 具体内容 |
---|---|---|
1 | AI 计算体系 | 神经网络等 AI 技术的计算模式和计算体系架构 |
2 | AI 芯片基础 | CPU、GPU、NPU 等芯片体系架构基础原理 |
3 | 图形处理器 GPU | GPU 的基本原理,英伟达 GPU 的架构发展 |
4 | 英伟达 GPU 详解 | 英伟达 GPU 的 Tensor Core、NVLink 深度剖析 |
5 | 国外 AI 处理器 | 谷歌、特斯拉等专用 AI 处理器核心原理 |
6 | 国内 AI 处理器 | 寒武纪、燧原科技等专用 AI 处理器核心原理 |
7 | AI 芯片黄金 10 年 | 对 AI 芯片的编程模式和发展进行总结 |
编号 | 名称 | 具体内容 |
---|---|---|
1 | 传统编译器 | 传统编译器 GCC 与 LLVM,LLVM 详细架构 |
2 | AI 编译器 | AI 编译器发展与架构定义,未来挑战与思考 |
3 | 前端优化 | AI 编译器的前端优化(算子融合、内存优化等) |
4 | 后端优化 | AI 编译器的后端优化(Kernel 优化、AutoTuning) |
5 | 多面体 | 待更 ing... |
6 | PyTorch2.0 | PyTorch2.0 最重要的新特性:编译技术栈 |
编号 | 名称 | 具体内容 |
---|---|---|
1 | 推理系统 | 推理系统整体介绍,推理引擎架构梳理 |
2 | 轻量网络 | 轻量化主干网络,MobileNet 等 SOTA 模型介绍 |
3 | 模型压缩 | 模型压缩 4 件套,量化、蒸馏、剪枝和二值化 |
4 | 转换&优化 | AI 框架训练后模型进行转换,并对计算图优化 |
5 | Kernel 优化 | Kernel 层、算子层优化,对算子、内存、调度优化 |
编号 | 名称 | 具体内容 |
---|---|---|
1 | AI 框架基础 | AI 框架的作用、发展、编程范式 |
2 | 自动微分 | 自动微分的实现方式和原理 |
3 | 计算图 | 计算图的概念,图优化、图执行、控制流表达 |
编号 | 名称 | 具体内容 |
---|---|---|
1 | 大模型全流程 | 大模型整体架构和大模型全流程介绍 |
2 | AI 集群简介 | AI 集群服务器整体组成相关技术初体验 |
3 | AI 集群存储 | 数据存储在 AI 集群中,具体的存储优化方案 |
4 | AI 集群通信 | 更新中 |
5 | 数据处理 | 更新中 |
6 | 大模型算法 | 更新中 |
7 | 大模型训练 | 更新中 |
8 | 分布式并行 | 更新中 |
9 | 大模型微调 | 更新中 |
10 | 大模型验证 | 更新中 |
11 | 大模型推理 | 更新中 |
12 | AI Agent | AI Agent 智能体,通过大模型走向 GAI |
这个仓已经到达疯狂的 10G 啦(ZOMI 把所有制作过程、高清图片都原封不动提供),如果你要 git clone 会非常的慢,因此建议优先到 Releases · chenzomi12/AISystem 来下载你需要的内容
非常希望您也参与到这个开源课程中,B 站给 ZOMI 留言哦!
欢迎大家使用的过程中发现 bug 或者勘误直接提交代码 PR 到开源社区哦!
欢迎大家使用的过程中发现 bug 或者勘误直接提交 PR 到开源社区哦!
请大家尊重开源和 ZOMI 的努力,引用 PPT 的内容请规范转载标明出处哦!