日期 | 主题 | 视频 | 成员 |
---|---|---|---|
9.22 | 超标量处理器系列1 cache | https://www.bilibili.com/video/BV1z94y1p7kc | 段震伟 |
9.22 | tilelink入门 | https://www.bilibili.com/video/BV11N411J7Ty | 丁庆辰 |
9.22 | cva6乱序执行原理 | https://www.bilibili.com/video/BV1SK4y1F76t | 李子龙 |
10.8 | cva6架构剖析 | https://www.bilibili.com/video/BV1vG411m7Ft | 唐德宇 |
10.8 | asim cache解读 | https://www.bilibili.com/video/BV1xG411m75R | 朱子谦 |
10.8 | 简单流水线冒险的处理 | 王京 | |
10.8 | 香山南湖架构前端解读 | https://www.bilibili.com/video/BV1PN411b7od | 蒋晓天 |
10.20 | 微处理器性能分析与优化 上 | https://www.bilibili.com/video/BV1RN411x7MF | 段震伟 |
10.20 | RocketChip DCache分析 | https://www.bilibili.com/video/BV1HH4y197jt | 丁庆辰 |
1.29 | 乱序发射相关基础 | https://www.bilibili.com/video/BV1m2421w7tm | 刘汉章 |
WIP | 超标量处理器设计剩余内容 | 段震伟 |
注:时长为通过ysyx B线之后所需时间,每周约40-50h+
- 微架构 : RV64GC (IMACFA) + MSU + AXI4(burst) + TLB + Cache(un blocked) + BPU (Tournament)
- 性能 : Coremark 跑分优化 (hint: 硬件计数器)性能要求:coremark IPC 0.6+ , Freq 100M+
- 外设 : CLINT + PLIC + UART
- 对齐 : Function model + Perf model
- 软件测试 : riscv-tests + cpu-tests + coremark + dhrystone + microbench + RT-thread + nommu-Linux + Linux
- 测试流程 : verilator + vcs + dc + FPGA
注:可以调用rocket-chip api减少工作量,参考框架
软件基础强化
- quardStar tutorial [2 week]
- 运行xv6-riscv
- 移植和运行Linux
顺序多发 + 性能分析 + 模拟器(not gem5) + 分析后端 + Fpga
参考架构 ridecore,有中文文档
Lab2 + 多核
Lab3 (Fork Yanqihu) , 可联系 dzwduan@163.com 报名,名额有限
Lab4 + PPA (低功耗RTL Fork E203, 模拟器 Cacti/sparta)
Lab0
-
cpu设计实战 + openla500
- 18-740
- 南京大学乱序讲义
- brief into ooo
- nop-processor
- 现代处理器设计-超标量处理器基础 + rsd-core + ridecore
- 超标量处理设计 + zhengliu + la32r-pipeline + Bergamot
- NaxRiscv
- boom
- xiangshan + 香山源代码剖析
- vRoom
- openc910