变量属性cpu or cuda的问题
1615070057 opened this issue · comments
大佬,我用你这个重新训练的时候,不论我怎么修改,都出现这个错误 RuntimeError: Expected object of device type cuda but got device type cpu for argument #3 'index' in call to _th_index_select,我调试了下发现是input的cuda问题,但是不管怎么修改,都不行。能否指导下
请问这个问解决了吗
没有,不知道啥问题
应该是哪里没有to(device),还没看代码
搞好了,在这里说下,老哥
没用过pytorch,难说
你的环境是pytorch吗,
当然,不然怎么跑这个
train.py 284行,input_ids 换成input_ids.to(device)就可以了。
我一直以为是我环境的问题,环境该成和作者一样的一直也是那个问题,读读代码,才看到他那行不正确,他写在上面281行了,打印看一下没生效,改下就可以了
train.py 348行也要修改 input_ids= input_ids改成 input_ids=input_ids.to(device)
可以了,谢老哥。忽略了这样操作,头疼
预测的时候还有个问题,在调试中,也是torch的问题,哎,没用过torch
是测试的问题吗,如果是自己训练的模型,好像会有问题,可以修改参数解决,我忘了啥问题,问题好像是我输出的文本太长的问题,具体内在的问题,没看他的代码,不清楚,我现在不弄这个代码了
训练的时候,上面两个地方修改完没问题了。
我用的自己的数据,按照他的形式改动的。
最新代码还是有这个问题
input_ids = input_ids.to(device) 这样改才行