いかおくら自習室のブログ

普段の学習内容などのアウトプット用のブログです

学習day9

データの可視化について

 

近似直線は、スプレッドシートの「トレンドライン」にあたる。

さらにカスタマイズの「決定係数を表示する」を入れればR^2の値が表示される。

これは「この直線の、データに対する当てはまりのよさは約◯%である」という数字。

 

なお、近似直線の式である「y = ax + b」の計算式は以下で算出できる。

a = 「傾き」 = SLOPE関数 

b = 「切片」 = INTERCEPT関数

それぞれ範囲は2項目の範囲を設定する。

 

相関係数

相関がある=通常はデータが直線状に並んでいることを指す。

相関係数が-1、または+1に近づいていくほど「相関が高い」

相関係数が0に近いと「相関が低い」

関数は CORREL関数

±0.5付近で相関が少々あり、±0.7を超えると相関が高い。という傾向はあるが業種や職種によって基準は変わる。

 

※なお、エクセルのデータ分析で「相関行列」が作れるが、スプレッドシートにはなさそうなので自力で作るしかなさそう。