关于FNN
aa147138 opened this issue · comments
您好,跑FNN的时候出现这个错误是什么情况?
RuntimeError: cuda runtime error (8) : invalid device function at /pytorch/aten/src/THC/generated/../generic/THCTensorMathReduce.cu:18
https://github.com/nzc/dnn_ctr/blob/master/model/FNN.py
这个里面536行的这句with torch.cuda.device(2):
中的2改成0试一下。
已经改过了,在Quadro K4200上跑就会出现这个错误,在Tesla P100上跑就没问题。是计算能力的问题还是显存大小的问题?
这样的话有可能是显卡驱动的情况,也有可能是pytorch需要重新安装。建议如果方便的话重新安装一下pytorch。
我有试过torch.cuda.is_available()这个操作,返回的事true,显卡驱动应该是没问题的吧?我的pytorch也是才装的,之前没用这个环境。用conda装的
另外,那个错误的定位是在这个地方
fm_first_order_emb_arr = [(torch.sum(emb(Xi[:,i,:]),1).t()*Xv[:,i]).t() for i, emb in enumerate(self.fm_first_order_embeddings)]