確率と確率分布

確率とは何か

確率とは、事象の起こりやすさを定量的に示したもの。 例えば、P(1) = 0.4というのは、なんらかの事象が1の値をとる確率が40%であるということ。

実際には、確率の公理を満たすものを確率と呼ぶ。

確率分布とは

確率変数Xが取りうる値についての確率をまとめたもの。確率変数Xがどの値をどのくらいの確率でとるのかをまとめたもの。

確率分布の種類

機械学習のための確率と統計」に従うと、確率分布は次のようなものがある。

  1. 離散型確率分布(確率変数Xが離散値をとるもの)
  2. 連続型確率分布(確率変数Xが連続値をとるもの)
  3. 多次元確率分布(2つ以上の確率変数の分布を考えたもの)

確率分布というものを考えることで、すべてのサンプルが得られない状況(つまり、ほとんどすべての場合)で、確率変数をよく表す分布を考えることが出来る。