多水準法

多水準法・・・2水準系直行配列表←4水準の因子割り付ける方法

擬水準法・・・2水準系直行配列表←3水準の因子割り付ける方法。多水準法によって割り付けたのち、4水準中の2水準分を3水準因子の1水準とする。

4水準の因子は自由度3なので、割り付けには3列必要です。

これは、互いに主効果と交互作用にある3列を選ばないといけません。

例えば、4水準因子Aを2水準系である L_{16}に割り付ける場合、[1][2][3]にA因子を割り付けられます。

これは、[1][2][3]の成分がそれぞれ順に、a, b, abであり、[1][2]の交互作用が[3]となっているからです。

計算は基本的に今までと同じですが、平方和と自由度は因子や交互作用ごとに合計しないといけません。

例えばAであれば、

 S_{A}=S_{[1}+S_{[2]}+S_{[3]}]

 \phi_{A}=\phi_{[1}+\phi_{[2]}+S\phi_{[3]}]

ある水準中のデータ数について、

要因Aのある水準のデータ数は4ですが、要因A×Bのある水準のデータ数は2となります。

その理由は、要因Aの特定の水準と要因Bの特定の水準の組み合わせは、それぞれ2回ずつ現れるからです。具体的には、要因Aのある水準と要因Bの第1水準の組み合わせが2回、要因Aのある水準と要因Bの第2水準の組み合わせも2回となります。

直行配列表実験

直行配列表実験は少し難しい概念かもしれませんが、具体的な例を使って説明してみます。

直行配列表実験の目的は、複数の要因がある場合に、それぞれの要因が結果にどれだけ影響するかを効率よく調べることです。この方法を使うと、少ない回数の実験で多くの情報を得ることができます。

具体例: ケーキのおいしさを調べる

想像してみてください、あなたがケーキを焼く方法を調べていて、どの材料が一番おいしいケーキを作るかを知りたいとします。考える要素(因子)がいくつかあります。

  1. 小麦粉の種類: 通常の小麦粉、全粒粉、アーモンド粉
  2. 砂糖の量: 少ない、普通、多い
  3. 焼く時間: 短い、普通、長い

これらの全ての組み合わせを一つひとつ試すと、3(小麦粉)× 3(砂糖)× 3(時間)= 27回もケーキを焼かなければなりません。とても時間と材料がかかりますよね。

でも、直行配列表実験を使うと、これらの全ての組み合わせを試さなくても、どの要素が一番重要かを調べることができます。直行配列を使えば、たとえば9回の実験だけで、これらの要素の主要な影響を調べることができるかもしれません。

まとめ

直行配列表実験は、複雑な実験を簡単に、そして効率よく行うための方法です。要素がたくさんあっても、少ない回数の実験で多くのことを学べます。ケーキを焼く例のように、あらゆる場面で使える便利な方法です。

分散分析の用語

実験を行う際、特性値はたくさんの要因に影響を受けますよね。例えば加圧圧力、気温などです。

これらの要因のことを因子と呼びます。

  1. 因子: 分散分析において、全体の要因を表すもので、母数因子と変量因子の二つに分類されます。
    1. 母数因子: この因子の下での要因効果は一定であり、水準を技術的に指定することが可能です。つまり、実験設計の中でコントロールできる要素です。
      • 制御因子: 母数因子の一部で、実験において特定の目的のために調整される因子。最適な条件を選ぶために使われるものです。
      • 標示因子: 母数因子の一部で、実験において最適な条件を選ぶ目的はなく、他の変数との関係を識別するために使用されるものです。
    2. 変量因子: この因子は確率変数と見なされ、要因効果が確率分布に従います。変量因子の分散成分の推定が主目的で、水準を技術的に指定することには意味がありません。
  2. 水準数(Levels): 因子が取り得る異なる値の数です。例えば、肥料の種類という因子が3種類の肥料から選ぶ場合、水準数は3になります。
  3. 繰返し(Replications): 同じ条件下での実験の反復回数です。繰り返しを多くすると、結果の信頼性が向上します。
  4. 主効果(Main Effects): 各因子が従属変数に単独で及ぼす平均的な影響です。例えば、肥料の種類と水の量の2つの因子がある場合、肥料の種類が植物の成長にどれだけ影響するか、水の量がどれだけ影響するか、それぞれの主効果を見ます。
  5. 交互作用(Interactions): 二つ以上の因子が組み合わさって従属変数に与える影響です。この影響は、単独の因子の影響の単純な合算では説明できない場合があります。例えば、特定の肥料と水の量の組み合わせが、それぞれ単独での効果よりも強い効果を持つ場合などです。
  6. 誤差(Error): 測定や実験の際に生じるランダムな変動です。誤差は、観測値と真の値の差として表されることが多く、このランダムな変動は分析において重要な役割を果たします。誤差の扱いが適切でないと、結果の解釈に誤りが生じる可能性があります。

統計的方法の基礎 - 期待値・分散の公式

<期待値の公式>

 X, Yは確率変数、 a, bは定数として

 E(a)=a

 E(aX)=aE(X)

 E(X+Y)=E(X)+E(Y)

 E(X\cdot Y)=E(X)E(Y) ※ X Yが独立(無相関)の場合のみ。

 

<分散、共分散の公式>

 V(a)=0

 V(aX)=a^2V(X)

 V(X+a)=V(X)

 V(X+Y)=V(X)+V(Y)+2Cov(X,Y)

 V(X-Y)=V(X)+V(Y)-2Cov(X,Y)

 V(X\pm{}Y)=V(X)+V(Y)  ※ X Yが独立(無相関)の場合のみ。

 V(aX+bY)=a^2V(X)+b^2V(Y)+2abCov(X,Y)

 

<期待値、分散、相関係数の公式>

 V(X)=E\left\{X-E(X)\right\}^2

     =E(X\cdot Y)-E(X)E(Y)

 Cov(X,Y)=E(X\cdot Y)-E(X)E(Y)

 Cov(X,Y)=\rho{(X,Y)}\rho{(X)}\rho{(Y)}  ※\rho{(X,Y)}=\frac{Cov(X,Y)}{\sqrt{V(X)\cdot V(Y)}}相関係数

 Cov(aX,bY)=abCov(X,Y)

データの取りまとめ方

 

N個からn個ランダムに抜き取ったサンプルの平均 \overline{x}

 V\left( \overline{x}\right) =\dfrac{N -1}{N-1}\dfrac{\sigma ^{2}}{n}

 

2段サンプリングの平均 \overline{\overline{x}}

 V(\overline{\overline{x}})=\frac{M-m}{M-1}\frac{\sigma_{b}^2}{m}+\frac{N-n}{N-1}\frac{\sigma_{w}^2}{mn}

( m:1次サンプリング数、n:2次サンプリング数)

 

 \frac{M-m}{M-1}および \frac{N-n}{N-1}は有限修正と呼ぶ。

 

層別サンプリングは2段サンプリングの M=mとして、

 V(\overline{\overline{x}})=\frac{N-n}{N-1}\frac{\sigma_{w}^2}{Mn}

 

集落サンプリングは2段サンプリングの N=nとして、

 V(\overline{\overline{x}})=\frac{M-m}{M-1}\frac{\sigma_{b}^2}{m}

 

単純ランダムサンプリングでは、サンプル全数が mn個なので、

 V(\overline{\overline{x}})=\frac{\sigma_{w}^2}{Mn}

ただし、 \sigma^2=\sigma_{b}^2+\sigma_{w}^2

 

この公式で解くことができる問題:

 平成31年度 問1