実験を行う際のサンプルサイズ(サンプル数、実験回数、n数…)どのように決めていますか?
パターンAとBの差があるかどうかを確認したいけど、
結果が結構バラつくから何回か測定しないとダメなんだよなぁ…
統計とかよくわからないけど、オススメの方法があれば知りたい!
という方に向けた記事です。
目次
サンプルサイズの計算式
必要なサンプルサイズは以下の式で求められます。
パラメータを決めて代入するだけ!
パラメータは実験条件と数回の予備実験から設定することができます。
ただし…
- | パラメータ
- 母分散が未知である場合を仮定
- 有意水準、検出力
としています。
【必読】パラメータの設定方法
上の式からわかるように、サンプルサイズを決めるためには
以下の式で表されるパラメータを設定する必要があります。
ここで更に記号について説明しますね。
|検出したい差
今回実施する実験で示したい「差」とはどの程度でしょうか?
例えば物の長さの場合…0.1 mmの違いを差があるとするのか、はたまた0.01 mmの違いを差があるとするのか、それぞれの状況によって異なるかと思います。
ご自身の実験条件から考えて、どの程度の違いを差があるとみなすのか
考えてみてくださいね。
|標本標準偏差(バラつき)
今回実施する実験の測定値はどの程度バラつくのでしょうか。
それを把握するために、事前に全く同じ条件で3回程度実験を実施しましょう。
その実験結果の標準偏差を計算し、に代入すればOKです。
これでパラメータを設定する準備が整いました!
最初の式に代入することで、必要なサンプルサイズを算出してみてくださいね。
ここから先は応用編と練習問題です。
【応用】「母分散が未知である場合を仮定」していいのか?
基本的に仮定して問題ないと考えています。
実験を行う際には母集団の情報が得られていない場合が大多数ですので。
(母集団の情報を知りたいから実験してデータを得るわけですしね)
【応用】式の中の1.96と1.28ってどこからきたの?
有意水準とすることで1.96が、
検出力とすることで1.28の値が設定されています。
一般的に有意水準と検出力は上記の値に設定されることがほとんどです。
有意水準と検出力を別の値に変更したい場合はこれらの値を変更することとなります。
練習問題
有意水準、検出力なので、そのまま上の式が使えますね。
①〜③の場合におけるはそれぞれ…
であるから、必要なサンプルサイズは
となります。
バラツキに対する検出したい差の大きさによって
必要なサンプルサイズが変化することがわかりますね。
参考文献
永田靖「サンプルサイズの決め方」