AI4Finance-Foundation / RLSolver

this line in env.reset(), should be self.K * self.N, instead of self.K * self.K

RLSolver/rlsolver/rlsolver_mimo_beamforming/mimo_16/env_mimo.py

Lines 60 to 62 in aba7394

    
           vec_W = th.randn((self.mat_H.shape[0], self.K* self.K), dtype=th.cfloat, device=self.device) 
        
           vec_W = vec_W / th.norm(vec_W, dim=1, keepdim=True) 
        
           self.mat_W = vec_W.reshape(-1, self.K, self.N)

	vec_W = th.randn((self.mat_H.shape[0], self.K* self.K), dtype=th.cfloat, device=self.device)
	vec_W = vec_W / th.norm(vec_W, dim=1, keepdim=True)
	self.mat_W = vec_W.reshape(-1, self.K, self.N)

🐛 may be it is a bug