2018-06-30 強化学習を理解する 強化学習は 答えの代わりにエージェントと環境を与える エージェントが環境に対して行動をし、その結果に対して環境がエージェントに報酬を与える 与えられた報酬に基づいて、エージェントが良かった、悪かったを判断し、次の行動を決定する 最近ではディープラーニングと組み合わせて用いられ、囲碁や将棋のAIや、ロボットの操作制御などで用いられている Aidemyの機械学習概論コースで勉強中です https://aidemy.net/