2018-06-30から1日間の記事一覧

強化学習を理解する

強化学習は 答えの代わりにエージェントと環境を与える エージェントが環境に対して行動をし、その結果に対して環境がエージェントに報酬を与える 与えられた報酬に基づいて、エージェントが良かった、悪かったを判断し、次の行動を決定する 最近ではディー…

2018年06月30日のツイート

@ochi_tw: URL #Aidemynote2018-06-30 22:44:01 via Twitter Web Client @ochi_tw: RT @kskgroup2017: メディアの皆さんポーランド戦前にスタメンを公表してたけど、練習は非公開やったわけで。。。真実の追求するポイントがいつもズレてるよ。選手達も普段…