学習ログ
学習ログとして残していく。
教師あり学習
教師あり学習(Supervised Learning)
回帰問題(Regression Problem)・・・連続値(価格、重さ、時間、etc)を返す問題の答えを予測する
例えば、アパート賃料の予測といったようなもの。
分類問題(Classification Problem)・・・ラベル(Yes, No, type1, type2, type3…)を返す問題の答えを予測する
例えば、工場が正常に稼働しているかの予測といったようなもの。
教師なし学習
教師なし学習(Unsupervised Learning)
データに正常会場化の情報「正しい答え」が与えられていない
ラベリングされていないデートセットからどのような構造を見つけうるのか?
3つのクラスラーに分けうると結論するアルゴリズムもあるだろう
正しい答えなしに答えを予測していくことが教師なし学習
クラスタリング・アルゴリズム
教師なし学習の応用例
異常検知→正常なログインなのか異常なログインなのかを予測したい
教師なし学習の場合、データの構造を比較して、いつもと違う場合異常、データセットと類似している場合は正常
ソーシャルネットワーク分析・マーケットセグメンテーション
画像圧縮も教師なし学習
画像の中からどのデータが必要でどのデータが不要かはラベル付けされているわけではない
強化学習
正しい答え、ラベルは与えられない
AgentとEnvironment、AgentがActionを起こす、EnvironmentがState Rewardを返す。
ActionとState Rewardを繰り返し、より良いActionを取れるようにすることが強化学習と呼ばれる
強化学習の応用例
自律的に運転するヘリコプター
例えば、プロペラの回転数を変更すると、高さ、傾きを検知する
安定性を最大限化するために、Actionを調整するのがヘリコプター
AlphaGo
プロ同士の対戦を学習させ、その後に強化学習を繰り返す
OpenAIGym
ゲームのルールも自分で学習してプレイ
まとめ
教師あり学習
入力に対する最適な出力が予め与えられ、その正しい答えに近づくようにする
教師なし学習
入力だけ与えられる
そのデータが保つ構造を分析する
強化学習
とりあえず何かを出力する(Action)
環境(Environment)からその出力の良さ(State Reward)を与えられる
その良さをできるだけ大きくするように、自らデータを収集・生成・分析し最適な出力を探す