reinforcement Casos de uso de algoritmos value-based / policy-gradient para el curso de Modelado de Icertidumbre en IA