feyzaakyurek / rl4f

Code for RL4F: Generating Natural Language Feedback with Reinforcement Learning for Repairing Model Outputs. ACL 2023.

feyzaakyurek/rl4f Issues

parallel support
Closed 9 months ago1
Scripts for Topic-Based Summarization and Interscript
Closed 9 months ago1
Checkpoint broken
Closed a year ago1