记录一下学习过程中的demo, 不一定能跑, 最终目标可能是一个周期精确的npu simulator, 测试基本靠AI随缘生成
2025.3.2: 本打算手写一个简单的cycle accurate建模框架,搜了一下有一大把,还是先做功能性的建模,找到的py hdl , 从解决问题的角度而言, 我只需要挑选最快实现的方式,而非性能最好的。
- sync fifo
- async fifo
- ping pong fifo
- conflict-free fifo
- buffets fifo
- Weight Stationary
- Output Stationary