【ふわっとアウトプット】ベイズ主義と頻度主義

この記事では営業に役立つようなことは1mmもでてきません。
題名の通り頻度主義とベイズ主義について個人的な考えを改めて整理するだけの記事です。

頻度主義 vs ベイズ主義

統計を勉強していると「頻度主義 対 ベイズ主義」という話がよく出てくる。
しかし個人的にあまりこの本当の意味を理解できていないのが実情。

頻度主義的な仮説検定主義と、ベイズの定理による事後確率主義の考え方は理解しているし、この本でも理解が深まったと思っている。
=======================
科学と証拠―統計の哲学 入門
エリオット・ソーバー
http://amzn.asia/6D3LvcM
=======================

※この本は結構有名なようで、哲学的な議論のちょっとした指標になっているみたい。
ただ僕のようなアカデミックではない独学者はおそらく読むのがけっこうきついと思う。
僕も3日かけてちょっとづつ読み進めながら理解したが、以下の書評記事が理解に非常に役立った。ありがたい限りです。
*******************
shorebird 進化心理学中心の書評など
http://d.hatena.ne.jp/shorebird/20130811
*******************

上記の本の中では全体としてベイズ主義の方に”よし”としているし(もちろん一概に言えない)、また分厚いが有名なこの本の中でもベイズ主義の方が将来的に”よし”という態度をとっていると思う。
=======================
シグナル&ノイズ 天才データアナリストの「予測学」
ネイト・シルバー
http://amzn.asia/719QVBz
=======================

なんとなく頻度主義の否定として「仮説検定」で意思決定するのは、
・実はいろんな仮定の元で成り立っている”不安定なもの”
・解釈がしづらく、現実的に有益な情報が得にくい
・データが多くなった最近では、小さな差でも有意になるので仮設を検定する意味がなく立ってきている(場合もある)
・いろいろな仮設があるときの比較ができない

こういった理由でベイズ主義の方がいいよねってだんだんなってきているって話だと思っている。

なんとなくベイズの方が有利っぽいけど結局議論ってなに?

上で書いたように「仮説検定」がなんとなく斜陽なのはわかった。

「仮説検定」はちゃんと意味を理解して意味ある使い方しないといけないよ。
でもそれって理解するのめんどくさいからベイズ的に考え方改めようよってことなんだと思うけど、結局「頻度主義 対 ベイズ主義」の議論はこんな意思決定時の手法的な話なのだろうか?ここが個人的な疑問点だ。

いろんな記事や本を見ても、僕が理解できる範囲のものはベイズの定理を書いているだけ、や、だいたいガンの具体例でこの手法の違いを語っているようにしか見えない。。

しかしながら「頻度主義 対 ベイズ主義」の議論が巻き起こっているであろう?学会や専門家同士の熱い議論の場に同席できるわけでもない。(というかそんなものが起こっているとしてどこで?)ということで自分なりの今の理解を書いてみたい。

結局はどちらの世界を”真”として考えるか

2つの主張の違いとしてわかりやすいのは以下の構図だと思う。
O:現象
H:仮設

・ベイズ主義:P(H|O)を求めたい。
・頻度主義:P(O|H)を求めたい。

これを乗法定理を使って考えてみると、
・ベイズ主義:P(H|O)=P(O∧H)/P(O)
・頻度主義:P(O|H)=P(H∧O)/P(H)

どちらの分子も同時確率になって、違うのは分母だけになる。式をみれば分かるが、ベイズ主義は今得られた現象を真としてとらえ、その現実世界を確立1として考える。
それに対し頻度主義は仮設Hが正しい=真のはずだとしてその世界を1として考える。つまり時間軸として考え方のベクトルが逆になっている。

これは頻度主義の考え方に無理くりベイズの定理で見方を揃えているので、本質的な主義の違いの議論としてはおかしな構図だと思っている。

しかしこの視点の違いを主義の違いと考えれば、上で述べた仮設に対する選択手法の違いや有用性を理解できるのでは無いだろうか。

またこの方のブログで以下の内容を見つけた。
”頻度主義では不確かさの定量化はランダム性にのみ基づくのに対し、ベイズ主義では情報が不足していることにも基づくとし、不確かさの定量化を広く考える。”
***************************
引用:デジタル・デザイン・ラボラトリーな日々
http://yaju3d.hatenablog.jp/entry/2016/08/31/231924
***************************

頻度主義では仮設Hを真としているため、そのばらつきは確率的なばらつき(主に正規分布に従う)で表され、ベイズでは事前確率・尤度などその事柄が起こる確率を勘定して計算されるということだ。

まとめると、かなり個人の理解の為に表現の偏りがあることを前提に、
・ベイズ主義はいろいろな世界の分岐を仮定して、それぞれの世界の確率を計算する。
・頻度主義は、真の世界(過去・原因)は一つであるという前提に立ち、今(現象・観測)がその延長線上なのか判断する。

だと思う。

この内容はこれから勉強して追記・修正するかもしれないし、間違いや本当の議論というものを教えて欲しいと思っています。
有識者の方はコメントなどでご指摘いただけるとありがたいです。

 

###

ふと最近読んでいた漫画で時間の話があって。なんとなくベイズ的な考えも当てはまるのかな〜とか思っていた。統計の世界で面白いのは時間てきな4次元を超え、いとも簡単に100次元とか表現することだ。

スプライト

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です