Aklice-new / CUDA_Lab

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

简单记录一下学习CUDA过程中的一些探索性的问题

1.cuda vec type

测试比较了load float, float2, float4这三种类型的性能,测试结果如下:

实验记录

2. sgemm 单精度矩阵通用乘法

参考深入浅出链接 进行了学习。

实验记录

About


Languages

Language:Cuda 75.8%Language:C++ 22.9%Language:CMake 1.3%