Contents

Alignment Method (RLHF)

11.13, 11.20

Instructor: Yaodong Yang

Topics Covered

Human Preference Collection
Preference Modeling
Bradley-terry Model
Reinforcement Learning from Human Feedback
Direct Preference Optimization

Last updated on Aug 25, 2024