LSTM反向传播

Question

LSTM反向传播

xinbai240524 opened this issue a year ago · comments

你好，我想问一下就是最后求权重梯度的。

1.我的各个门的输出变量的维度是（batchsize,hiddensize）,输入变量x的维度是（batchsize,inputsize），因为我有batchsize嘛，所以想batchsize中的每个样本单独计算，但是现在的维度并不一致。δ(t)C⊙C(t−1)⊙f(t)⊙(1−f(t))计算完的维度是（hiddensize），然而，h(t−1)的维度也是（hiddensize），(h(t−1))T转置之后的维度是（1,hiddensize），这样进行矩阵乘法后，计算出来的维度是1,但我的Wfh的维度是（hiddensize,hiddensize）啊，后来对于这个问题，我用δ(t)C⊙C(t−1)⊙f(t)⊙(1−f(t)) * h(t−1).unsqueeze(dim=1)，这样维度对了，请问这样可以嘛？

2.当为计算Wfx的维度的时候，δ(t)C⊙C(t−1)⊙f(t)⊙(1−f(t))计算完的维度是（hiddensize），然而，x(t)的维度是（inputsize），两者又出现不一致的情况，我又将矩阵乘法改成了δ(t)C⊙C(t−1)⊙f(t)⊙(1−f(t)).unsqueeze(dim=1) * x(t).unsqueeze(dim=0)，不知道这样写严不严谨？

希望能得到您的帮助

gengyp · Answer 1 · Wed May 31 2023 16:55:38 GMT+0800 (China Standard Time)

你的邮件已收到，谢谢！

wangzhongqing · Answer 2 · Wed May 31 2023 16:55:39 GMT+0800 (China Standard Time)

这是来自QQ邮箱的假期自动回复邮件。王中情：您好，已收到您的邮件，我会尽快给您回复。谢谢您的邮件！祝您生活愉快！

K-fall · Answer 3 · Wed May 31 2023 16:55:41 GMT+0800 (China Standard Time)

您好，我已收到您的邮件，尽快给您回复。高欢