El controlador puede modificar la velocidad de un rotor para aumentarla o reducirla en un valor prefijado. El estado del sistema viene dado por la posición del quadrotor y por la posición del objetivo
Se añade la rotación a las observaciones.
Se modifican los parámetros parametrizando el tiempo que se ejecuta la simulación y el valor con el que se modifica la velocidad de los rotores
Se modifica el control para que cada acción modifique los valores de pitch, yaw, roll y throttle.
Se cambia el agente de CEM a DQN
Se añade la estabilización mediante un nuevo objeto y el control PID original del quadrotor
Se modifica el espacio de observación para limitarlo al espacio real posible
La distancia, que en teoría la RNA podría "aprender" a verla, se añade como observación
Se descompone la distancia en X,Y,Z y se deja con signo. De esta forma se espera que sea capaz de deducir la dirección y el sentido que debe tomar.