できたぬき。

理系の学生・研究者向けの情報を発信していきます

サンプルサイズの決め方

実験を行う際のサンプルサイズ(サンプル数、実験回数、n数…)どのように決めていますか?

パターンAとBの差があるかどうかを確認したいけど、

結果が結構バラつくから何回か測定しないとダメなんだよなぁ…

統計とかよくわからないけど、オススメの方法があれば知りたい!

という方に向けた記事です。

 

目次

サンプルサイズの計算式

必要なサンプルサイズnは以下の式で求められます。

パラメータ\Deltaを決めて代入するだけ!

パラメータ\Deltaは実験条件と数回の予備実験から設定することができます。

 n = \left( \dfrac{1.96+1.28}{\Delta} \right)^2 + \dfrac{1.96^2}{2}

ただし…

  •  \Delta| パラメータ
  • 母分散が未知である場合を仮定
  • 有意水準 \alpha=0.05、検出力 1-\beta=0.90

としています。

【必読】パラメータ \Deltaの設定方法

上の式からわかるように、サンプルサイズを決めるためには

以下の式で表されるパラメータ\Deltaを設定する必要があります。

 \Delta=\dfrac{|\mu-\mu_0|}{\sigma}

ここで更に記号について説明しますね。

 |\mu-\mu_0||検出したい差

今回実施する実験で示したい「差」とはどの程度でしょうか?

例えば物の長さの場合…0.1 mmの違いを差があるとするのか、はたまた0.01 mmの違いを差があるとするのか、それぞれの状況によって異なるかと思います。

ご自身の実験条件から考えて、どの程度の違いを差があるとみなすのか

考えてみてくださいね。

 \sigma|標本標準偏差(バラつき)

今回実施する実験の測定値はどの程度バラつくのでしょうか。

それを把握するために、事前に全く同じ条件で3回程度実験を実施しましょう。

その実験結果の標準偏差を計算し、 \sigmaに代入すればOKです。

 

これでパラメータ\Deltaを設定する準備が整いました!

最初の式に代入することで、必要なサンプルサイズを算出してみてくださいね。

 

ここから先は応用編と練習問題です。

【応用】「母分散が未知である場合を仮定」していいのか?

基本的に仮定して問題ないと考えています。

実験を行う際には母集団の情報が得られていない場合が大多数ですので。

(母集団の情報を知りたいから実験してデータを得るわけですしね)

【応用】式の中の1.96と1.28ってどこからきたの?

有意水準 \alpha=0.05とすることで1.96が、

検出力 1-\beta=0.90とすることで1.28の値が設定されています。

一般的に有意水準と検出力は上記の値に設定されることがほとんどです。

有意水準と検出力を別の値に変更したい場合はこれらの値を変更することとなります。

練習問題

製品Aの特性Xについて、標本標準偏差 \sigma =2.0のとき、 新規グレードBの特性Xが製品Aと比較し、①1.0、②2.0、③4.0以上となる場合に有意水準 \alpha=0.05、検出力 1-\beta=0.90で検定するために必要なサンプルサイズをそれぞれ求めよ。

有意水準\alpha=0.05、検出力1-\beta=0.90なので、そのまま上の式が使えますね。

①〜③の場合における\Deltaはそれぞれ…

\Delta=\dfrac{|\mu-\mu_0|}{\sigma}=0.5, 1.0, 2.0

であるから、必要なサンプルサイズは

 \left(\dfrac{1.96+1.28}{\Delta}\right)^2=42, 11, 3

となります。

バラツキ\sigmaに対する検出したい差|\mu-\mu_0|の大きさによって

必要なサンプルサイズが変化することがわかりますね。

参考文献

永田靖「サンプルサイズの決め方」