間違っているのはモデル

ちょっと読み直したかったので、なか見検索で読み直しました。(本が見当たらない・・・・。)

 

 

It is a common mistake to say 'the data were fitted to the model' as if the data were something flexible and we had a clear picture of the structure of the model. On the contrary, what we are looking for is the minimal adequate model to describe the data. The model is fitted to the data, not the other way around. The best model is the model that produces the least unexplained variation (the minimal residual deviance), subject to the constraint that all the parameters in the model should be statistically significant. (p.4)

 

 

 

よくある間違いは、「このデータはモデルにフィットしている」と考えてしまうことだ。単にデータがフレキシブルで、我々が極めてはっきりとしたモデルをもっている、だけかもしれないのに(訳注: モデルに都合の良いデータをあてはめてしまっている、と言う意味だと思う。)。そうではなく、我々が探しているのは、データを説明する最小のモデルである。モデルをデータにフィットさせる。それ以外の方法はない。最良のモデルとは、説明できないような多様性がもっとも少ないモデルである(minimal residual deviance 最小残留自差)。その際、すべてのパラメータは統計的に有意でなければならない。

 

 

これって、統計の説明だけど、「科学」の宣言だと思います。勝手に感動してます。

 

Statistics: An Introduction Using R
Michael J. Crawley
John Wiley & Sons Inc (2005/04/28)
売り上げランキング: 240017
 
2018/09/10 追記
第2版が出てました。Amazon.com の eTextbook 形式だと kindle で読めます。
Statistics: An Introduction Using R

Statistics: An Introduction Using R