Обучите манипулятор попадать в цель с помощью ML Agents Toolkit.
В заготовке реализована модель манипулятора, управляемая с клавиатуры. Дополните скрипт ManipulatorAgent.cs
кодом для оценки действия агента, подберите подходящий вектор наблюдений и обучите модель с помощью конфига MLConfigs/Manipulator.yaml
. Конфиг можно менять.
Для ускорения обучения разместите на сцене множество агентов или запустите несколько экземпляров Unity, а для оценки скорости и качества обучения используйте TensorBoard.