【R】ポワソン分布(Poisson distribution)とは何か?

スポンサーリンク

ポワソン分布は以下のように説明されます。

ポアソン分布 (Poisson distribution)とは、数学者シメオン・ドニ・ポアソンが1838年に確率論とともに発表した、所与の時間間隔で発生する離散的な事象を数える特定の確率変数 X を持つ離散確率分布のこと。

ポアソン分布 – Wikipedia

ポアソン分布は一定の長さの時間,一定の大きさの空間においてごくまれに起こる事象を表現するときに用います.

第4回 二項分布・ポアソン分布・正規分布

以上をまとめるとポワソン分布は、一定の期間、空間内でまれに起こるカウントデータの分布です。

ポワソン分布に従う例は

  • 馬に蹴られて死んでしまう兵士の数の分布
  • ある交差点で起こる交通事故数の分布

などがあります。

さっそくRで計算してみましょう。

確率を計算

あるコンビニでガリガリ君を買い続けたところ毎年平均で100本に1回くらいの割合(1%)で当たりが出たとします。

ちょっと確率低すぎですが、この当たりの本数がポワソン分布に従うと仮定しましょう。

来年0~2本当たりが出る確率を考えてみましょう。

ポワソン分布に当てはめるにはdpois関数を使います。

> # 来年当たりが出ない確率
> dpois(0,1)
[1] 0.3678794

> # 来年1本当たりが出る確率
> dpois(1,1)
[1] 0.3678794

> # 来年2本当たりが出る確率
> dpois(2,1)
[1] 0.1839397

当たりが出ない確率、1本当たる確率が共に37%位だということがわかりました。

また2本当たる確率も18%程あることがわかります。

視覚化

1から10までの確率を一覧できる棒グラフを作成したいと思います。

#範囲の定義
x <- 0:10

# ggplot2インストール
library(ggplot2)

# ggplot用にデータフレーム作成
df <- data.frame(x, dpois(x,1))
p <- ggplot(df, aes(x=x, y=dpois.x..1.))
p <- p + geom_bar(stat='identity')
p <- p + scale_x_discrete(limits=seq(0, 10))
p <- p + labs(x="当たりの回数", y="Probability")
plot(p)

P0

こちらがポワソン分布(λ=1)となります。

同様に当たる割合(λ)を変えたグラフは以下のようになります。

p

ポワソン分布の特徴は平均と分散の値が等しいことです。

データXがポワソン分布に従う時は以下のように書きます。

$X \sim\ \text{Poisson} (λ)$

参考:

スポンサーリンク

スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です