RuntimeError: CUDA error
Jzli03 opened this issue · comments
RuntimeError: CUDA error: device-side assert triggered
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.
代码中错误定位在trainer.training(epoch)和writer.add_scalar('train_loss', train_loss.avg, curr_iter)请问应该如何更改
我也遇见了相同的问题,请问您解决了吗
我解决了这个问题,换用CPU之后可以发现是越界,然后找到是vis2gray.py中将一些点设置为16导致越界了。改为0就可以。
mask[mask >= num_class] = ignore_label
mask[mask <= 0] = ignore_label
dataset里面加这个就可以了
谁能给一份完整的训练代码和文件阿,这个缺各种文件,config.json 权重等等
xd你缺啥了,我记得可以自己训练的啊,没缺文件吧,需要自己从头开始训练的。我的放到服务器上了,你看你缺啥文件我发你。
谁能给一份完整的训练代码和文件阿,这个缺各种文件,config.json 权重等等
xd你缺啥了,我记得可以自己训练的啊,没缺文件吧,需要自己从头开始训练的。我的放到服务器上了,你看你缺啥文件我发你。
太感谢了兄弟 能加个q详聊吗,比如训练时候这个jpg他是如何生成的
训练里面没有生成jpg呀,loss是用tensorboardX 保存的,这几行:
推理的时候就是把预测结果保存下来的:
@drucelee723 你新开一个issue说清楚就好了吧 你描述的问题我都没怎么看懂
谁能给一份完整的训练代码和文件阿,这个缺各种文件,config.json 权重等等
xd你缺啥了,我记得可以自己训练的啊,没缺文件吧,需要自己从头开始训练的。我的放到服务器上了,你看你缺啥文件我发你。
请问一下,config.json这个文件是什么
谁能给一份完整的训练代码和文件阿,这个缺各种文件,config.json 权重等等
xd你缺啥了,我记得可以自己训练的啊,没缺文件吧,需要自己从头开始训练的。我的放到服务器上了,你看你缺啥文件我发你。
me too. 这个代码bug不断,好多地方续不上,兄弟share一下吧。