まず前提として、相関係数を求めるには共分散を求める必要がある。
共分散:2組の対応するデータの関係を表す値
相関係数:共分散を各変数の標準偏差で割ったもの
Cov(X,Y) = E[(X - μx)(Y - μy)]
XとYのズレを1個ずつ採用したのが共分散となる。
仮に、X=Yとすると、
E[(X - μx)^2] = V(X)
分散になる。
つまり共分散は2組のデータのばらつきを表す。(書いたまんま・・)
また、共分散の公式は
共分散 = 積の平均 - 平均の積
Cov(X,Y) = E(XY) - E(X)E(Y)
でも求められる。
相関係数の求め方は、
r = Sxy / SxSy
Sxyが xyの共分散
SxSyが xの標準偏差 × yの標準偏差