Motivation for Multi-Agent Deep ReinforcementLearning". Proceedings of the 35th International Conference on Machine Learning. arXiv:1810.08647. Lazaridou
درحوزه یادگیری ماشین، یادگیری تقویتی از بازخورد انسانی (انگلیسی: Reinforcementlearning from human feedback) (اختصاری RLHF) تکنیکی برای همسو کردن یک عامل
learning)، یادگیری با ناظر (Supervised learning) و یادگیری تقویتی (Reinforcementlearning) نیز میتواند مفید باشد. ایده بنیادی شبکههای مولد رقابتی بر پایه