？とは？キッズ

RLHF（人間のフィードバックによる強化学習）とは？

あーるえるえいちえふ

IT・テクノロジー #AI・機械学習

人間の評価をAI学習に活かす手法だよ。

「AIの答えを人間が採点して良かった答えを学習させることで AIを賢くする方法」だよ。

つかいかた・れいぶん

RLHFで AIは人間が喜ぶ答え方を学んでいくよ。

このことばをシェア

𝕏 でポスト LINE

さいごのこうしん: 2026年6月25日

こんなことばも