いかおくら自習室のブログ

普段の学習内容などのアウトプット用のブログです

共分散と相関係数

まず前提として、相関係数を求めるには共分散を求める必要がある。

 

共分散:2組の対応するデータの関係を表す値

相関係数:共分散を各変数の標準偏差で割ったもの

 

Cov(X,Y) = E[(X - μx)(Y - μy)]

XとYのズレを1個ずつ採用したのが共分散となる。

 

仮に、X=Yとすると、

 

E[(X - μx)^2] = V(X)

分散になる。

つまり共分散は2組のデータのばらつきを表す。(書いたまんま・・)

 

 

また、共分散の公式は

 

共分散 = 積の平均 - 平均の積

Cov(X,Y) = E(XY) - E(X)E(Y)

でも求められる。

 


相関係数の求め方は、

r = Sxy / SxSy 

Sxyが xyの共分散

SxSyが xの標準偏差 × yの標準偏差