nzc / dnn_ctr

The framework to deal with ctr problem。The project contains FNN,PNN,DEEPFM, NFM etc

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

关于FNN

aa147138 opened this issue · comments

您好,跑FNN的时候出现这个错误是什么情况?
RuntimeError: cuda runtime error (8) : invalid device function at /pytorch/aten/src/THC/generated/../generic/THCTensorMathReduce.cu:18

https://github.com/nzc/dnn_ctr/blob/master/model/FNN.py
这个里面536行的这句with torch.cuda.device(2):中的2改成0试一下。

已经改过了,在Quadro K4200上跑就会出现这个错误,在Tesla P100上跑就没问题。是计算能力的问题还是显存大小的问题?

这样的话有可能是显卡驱动的情况,也有可能是pytorch需要重新安装。建议如果方便的话重新安装一下pytorch。

我有试过torch.cuda.is_available()这个操作,返回的事true,显卡驱动应该是没问题的吧?我的pytorch也是才装的,之前没用这个环境。用conda装的
另外,那个错误的定位是在这个地方
fm_first_order_emb_arr = [(torch.sum(emb(Xi[:,i,:]),1).t()*Xv[:,i]).t() for i, emb in enumerate(self.fm_first_order_embeddings)]