qingkongzhiqian / GPT2-Summary

基于GPT2的中文摘要生成模型

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

变量属性cpu or cuda的问题

1615070057 opened this issue · comments

大佬,我用你这个重新训练的时候,不论我怎么修改,都出现这个错误 RuntimeError: Expected object of device type cuda but got device type cpu for argument #3 'index' in call to _th_index_select,我调试了下发现是input的cuda问题,但是不管怎么修改,都不行。能否指导下

请问这个问解决了吗

没有,不知道啥问题

应该是哪里没有to(device),还没看代码

搞好了,在这里说下,老哥

没用过pytorch,难说

你的环境是pytorch吗,

当然,不然怎么跑这个

train.py 284行,input_ids 换成input_ids.to(device)就可以了。

我一直以为是我环境的问题,环境该成和作者一样的一直也是那个问题,读读代码,才看到他那行不正确,他写在上面281行了,打印看一下没生效,改下就可以了

train.py 348行也要修改 input_ids= input_ids改成 input_ids=input_ids.to(device)

可以了,谢老哥。忽略了这样操作,头疼

预测的时候还有个问题,在调试中,也是torch的问题,哎,没用过torch

是测试的问题吗,如果是自己训练的模型,好像会有问题,可以修改参数解决,我忘了啥问题,问题好像是我输出的文本太长的问题,具体内在的问题,没看他的代码,不清楚,我现在不弄这个代码了

训练的时候,上面两个地方修改完没问题了。

我用的自己的数据,按照他的形式改动的。

最新代码还是有这个问题

input_ids = input_ids.to(device) 这样改才行