学問 機械学習

回帰問題とは?1変数の線形回帰問題

1変数の線形回帰

教師あり学習の第一歩

アパート賃料の予測の問題
横軸が部屋の大きさを表す
縦軸は物件の賃料を表す

今予測したいのはどれくらいの広さの物件がいくらぐらいなのか?

皇居から半径50km以内のアパートの広さ
10畳の物件の賃料はいくらか?を当てたい

教師あり学習は正しい答えが与えられている
これは回帰問題である
連続値(価格)を返す問題の答えを予測している

12畳の部屋の広さの賃料は15万円
6畳の部屋の広さの賃料は6万円ぐらいになっています。こういったようにデータが与えられているのです。

学習するために与えられたデータを、データ集合あるいは訓練集合といいます。

・・・となっているのは多くのデータが有り、これからも続くという意味を示しています。

訓練霊の数の子と、m個と表します。
広さの部分をxと書いていますが、広さのように入力の特量を表すものをxと書くこととします。

そしてyと書くものは出力変数の目標変数のことを指します。
この問題の場合は賃料のことを指します。

教師あり学習だと、yが正しい答えとなるわけです。
あるいは予測するときは、予測したい問題になるわけです。

xとyをセットsにしなければいけないということです。
x二なにか値を入れたい時にyの値が出てくる。

xとyをセットにするとは、集合という意味ではなくペアという意味になります。
それはつまり、1つの訓練例を表すということになります。

しかし、m個と訓練例がたくさんある中で何番目の訓練霊を用いるのかを明示的に書きたい時があるかもしれません。

その時のために右上にi、括弧でiを書いて、何番目の訓練霊ということを刺すことにします。
こういった添字表記は、都度意味が若干違う場合があります。

この入力変数の右上に括弧付きのiの値が書いてあるときは、訓練霊の何番目ということを指します。

これ以外の場合は、また別の意味になっていることがあります。
こういった霊のように添え字がたくさん出てきます。

グラフの上に線を引いたわけですが、この直線が今後機械学習を行っていく中で非常に大切になってきます。
この直線のことを仮設といいます。

仮設は英語表記でhypothesisなので、イニシャルを取って、hの式で表します。

xとyの写像があるわけですが、この写像を決めれば後はこの直線に従って予測していけばいいのです。
つまり、直線は予測に置いて決定的な意味を持ってしまいます。

この直線は学習アルゴリズムによって、決定されます。
線形回帰の場合は、このような直線を学習で決めることであると覚えればいいです。

まず学習アルゴリズムがあります。学習アルゴリズムは訓練集合x,yです。
学習アルゴリズムが動くと仮設を出力します。
学習アルゴリズムが出してくれた直線を元に、アパートの畳数を仮設hに入れると出力である目標変数が出てくる。つまり賃料の相場が出てくるのです。
このx側のことを特徴といい、yを目標変数といいます。

こういった形で回帰問題は進めていきます。

Pythonプログラミングを独学で学ぶなら

  • この記事を書いた人
  • 最新記事

AsK

当たり前の仕組みを、すべての人へ ■ KustomApe合同会社 - CEO ■ 経営者 / カリスマ講師 / エンジニア ■ 車 / ドリフト / カスタム車 ■ C35ローレル乗り

おすすめ記事

-学問, 機械学習
-,

© 2021 AsK