知的学習システム 其の二 20180416
はじめに
今回は数理的準備について一通りという感じでした.最後に少しだけガウス分布について出てきましたが,学部2年の「確率論」「統計学」の範疇です.端的に書いていきますのでよろしくお願いいたします.
あと,提供されている資料は拡張子なしpdfファイルとしてダウンロードされるので,拡張子つけて閲覧してねということも連絡事項.自分はこれにはまって悶々としてしまっていた.最終的に連絡して解決.今に至るというわけです.
確立
わかりにくかったら2次元マトリックスにしてみろ
条件付確率・周辺化など,ぱっと見では理解しにくいようなもの,特に多次元になったときにはもうお手上げ...なんて物もとりあえずマトリックスに落とし込んで理解しろとのこと.確率の基本的な原理は「数え上げ」なので,とりあえず2次元で考えていきましょうとのことでした.
例えば,次のような確率変数からなる場合を考えてみる.
これをマトリックスに落とし込んでいくと,次のような形になる.
合計回施行した結果をとる回数をとしたとき,同時確立と周辺確立を考えていく.次のように表すことができる.
周辺確率に関しては,点じゃなくて面でみるといった感じですかね.あくまでイメージですけど.
条件付確率については,母数をではなく,確定値をとりうる状態数にすることで分かりやすくなります.つまり,
こんな感じですね.いわゆる乗法定理と呼ばれるものです.
では,いったいなぜこんな条件付確率が必要なのか.データの性質を最も直接的に理解できる方法は散布図を見ることです.しかし,多変量になればなるほど多次元空間を把握しなければならないため散布図で理解することは困難になります.そこで条件付確率を使い,多変数の分布をみることによりデータの特徴が把握できるというわけです.
ベイズの定理
データから結論を導くために,結論から得られたデータを使う...説明が難しいですね.「原因→結果」の関係を求める際に「結果→原因」の関係を使うことができる,そんな関係式.導出自体はとても簡単で.
したがって,
みたいな感じ.
事前確率・事後確率・尤度
結果が分かる前段階で得られる確率のことを「事前確率」.結果が得られた後の原因の選択確立のことを「事後確率」と呼んでいる.例えば箱から果物をとるといった場合,箱の選択確率が事前確率で,果物が確定した後から箱の選択確率を計算したものは事後確率になる.また,箱が確定したうえで果物の選択確率のことを「尤度」と呼ぶ.尤度は,得られたデータの確からしさを示す値で,確率のようにふるまうが実質確率ではないらしい.