強化学習を理解する

強化学習

  • 答えの代わりにエージェント環境を与える
  • エージェントが環境に対して行動をし、その結果に対して環境がエージェントに報酬を与える
  • 与えられた報酬に基づいて、エージェントが良かった、悪かったを判断し、次の行動を決定する

Aidemyの機械学習概論コースで勉強中です
https://aidemy.net/