学習day9
データの可視化について
近似直線は、スプレッドシートの「トレンドライン」にあたる。
さらにカスタマイズの「決定係数を表示する」を入れればR^2の値が表示される。
これは「この直線の、データに対する当てはまりのよさは約◯%である」という数字。
なお、近似直線の式である「y = ax + b」の計算式は以下で算出できる。
a = 「傾き」 = SLOPE関数
b = 「切片」 = INTERCEPT関数
それぞれ範囲は2項目の範囲を設定する。
相関がある=通常はデータが直線状に並んでいることを指す。
・相関係数が-1、または+1に近づいていくほど「相関が高い」
・相関係数が0に近いと「相関が低い」
関数は CORREL関数
±0.5付近で相関が少々あり、±0.7を超えると相関が高い。という傾向はあるが業種や職種によって基準は変わる。
※なお、エクセルのデータ分析で「相関行列」が作れるが、スプレッドシートにはなさそうなので自力で作るしかなさそう。