いかおくら自習室のブログ

普段の学習内容などのアウトプット用のブログです

学習day7

昨日の「なぜ平均平方は「平方和÷自由度」なのか?」の続き

 

そもそも自由度とは何か?から。

自由度とは、自由に決めることができる値の数のことを指す。

x + y + z = 10 の場合、合計が10になるように好きに入れられる数は2つのみ。

仮にxとyに好きな数字を入れたら、残りのzは10になるように辻褄を合わせないといけない。

なのでサンプル数-1の2になる。

 

平方和=分散 × サンプル数

しかし、、、、そもそもなぜ分散分析をするときに平方和を使う必要があるのか全く理解できない。

平方和は分散かけるサンプル数。標本集団の全てのズレを足し上げたもの。

 

あーーでもそもそも分散自体が最後にサンプル数で割ったもの、

つまり標本の「各データと平均までのズレ」の平均になる。

だから標本全てのズレを求めるときは平方和としてサンプル数でかける必要がある。

 

もうちょっと明日は調べて腹落ちさせる。