基于人类反馈的强化学习(Reinforcement Learning with Human Feedback, RLHF)是大语言模型(Large Language Models, LLMs)的典型训练方法,在对大量数据进行训练时,人类的直接反馈被用来优化模型的性能。这样看,RLHF其实也是一种实现“人在回路”的技术手段,并且已在LLMs训练中得到广泛应用。回顾计算机视觉领域相关研究,尤其是文本到图像(Text-to-Image, T2I)的生成任务,虽然技术上取得了显著进步,但生成的图像仍然存在诸多问题,如伪影、与文本描述不一致以及审美质量低下。这些问题凸显了现有自动评估指标的局限性,同时也表明了在图像生成过程中引入人类反馈的必要性。