いかおくら自習室のブログ

普段の学習内容などのアウトプット用のブログです

2022-01-01から1ヶ月間の記事一覧

学習day19

本だと中々イメージが湧かないので、ドットインストールで基礎を一通り行うことにした。 ・help()で知りたいことが出てくる ・ls()で定義した変数を見れる ・rm()で変数を削除する ・文字列の連結はpaste()で合わせられる ・sep=で各文字列の間に何を入れる…

学習day18

環境に関して勉強していたが、まっっっっっっったく意味不明だった。。。。 動画や他のサイト探してみよう。。。。。。。 ◎NULLとNAの違い NAはベクトルの要素となり得るが、NULLはベクトルの要素にはならない。 リストの概念も配列とどう異なるのか混同して…

学習day18

Pythonの練習 ◎繰り返し処理を使ってリスト、2次元リストの作り方 n = [1 for i in range(10)] print(n) print(len(n)) [1, 1, 1, 1, 1, 1, 1, 1, 1, 1] n2 = [[1 for i in range(3)] for j in range(4)] print(n2) [[1, 1, 1] , [1, 1, 1] , [1, 1, 1] , [1…

学習day17

Rの続き。 (一旦属性やクラス、ファクターは置いておく) ◎head関数 「head(オブジェクト)」で書く。 オブジェクトの箇所は指定がなければデフォで6個表示させる。 head(data, n = 20) のように指定をすればn個の数が表示できる。 ◎sample関数 学習し始めの…

学習day17

スクール2日目。 コードを書く・・・というより生のデータを見てどう感じるかディスカッションがメインだった。 分析をする際には、 ・データを誰でも同じ解釈をすることができることが大事 ・一部の切り取った情報だけではなく、時間軸で傾向を見る必要があ…

学習day16

改めてRのオブジェクトの確認 ◎アトミックベクトル 「c()」を使って生成される。数字のベクトルと同じ概念である。※ベクトルとは、要素を1列に並べたもの。 アトミックベクトルは、1つの同じ型のデータしか格納できない。型の基本種類は6つ。 ・double ・int…

学習day16

全然pythonやってなかった。 久しぶりにpaizaのCランクやろうかなーと思って触ったら全然できなかった。 ちまちま復習して感覚取り戻す。 rstrip関数:rstrip()の引数に書いた文字が消去される。空欄の場合はスペースが消去される。 split関数:引数で受け取…

学習day15

昨日先生に質問した分散分析のおさらい。 だが、、、やはり平均平方が全然理解できない。。。 ・平均平方の定義が分からない ・なぜ平均平方を求める時に平方和を自由度で割ると求められるのかが分からない 平方和は、各値と平均との差を2乗し、サンプル数で…

学習day14

疑問を先生に投げた。 (とりあえずのメモなので、正しい表現ではないかもしれない。。。。) ・分散分析はなぜ群間だけのズレで見ないのか? →群間のズレだけでは足りない。郡内のズレ、つまり各群のバラつきも見ないと正しく評価できない。 実はt検定も標…

学習day13

◎重回帰分析 今見ている教材はエクセルの分析ツールを使っている。 しかし自分はスプレッドシートを使っているので分析ツールはない。 そこで、XLMiner Analysis ToolPakというツールを使って分析してみる。 ただ、、、うまくいかない。反映がされない。。。…

学習day12

データフレーム(エクセルのような行列のイメージ)から値を抽出する方法を学んだ。 基本的に[ , ]の左の空欄が行、右のウクラんが列の値を返す。 いくつか記法があるが、今日は力尽きたので続きはまた明日。

学習day12

今日は回帰分析をやろう。 ◎回帰式の出し方 散布図を作成し、系列のトレンドラインを表示。 ラベルで「方程式を使用」を選択すれば「y = ax + b」のような方程式が表示される。 しかし、、回帰分析のP値の求め方が全然分からない。。。。 ◎決定係数 回帰分析…

学習day11

昨日の続き。 R言語のクラスやファクタの箇所を復習。 ◎クラス(class) オブジェクトを特徴づける属性のこと。 何かしらのオブジェクトには、何かしたらのクラスがある。 ちょっとまだあまりイメージできていないが、深入りするとドツボにハマりそうなので…

学習day10

学習が止まっていたR言語を学習 ◎クラス そのオブジェクトが持つ属性のこと。クラス属性を持たないオブジェクトは、モード型か基本型がクラスとなる。 (よく分からない) 一旦飛ばす。 ◎ファクタ 民族、性別や目の色のようなカテゴリ情報を格納するための手…

学習day10

スクール初日終了。 今日はどちらかというとデータサイエンスにおける上流の考え方を学んだ。 解決したい課題 ↓↑ 問い ↓↑ 分析 分析手法に入るまで、上記の工程のサイクルを回す。 いわゆる分析はあくまでも手法なので、本当に解決したい課題は何なのか? と…

学習day9

データの可視化について 近似直線は、スプレッドシートの「トレンドライン」にあたる。 さらにカスタマイズの「決定係数を表示する」を入れればR^2の値が表示される。 これは「この直線の、データに対する当てはまりのよさは約◯%である」という数字。 なお、…

学習day8

改めてエクセル(スプレッドシート)で使う統計に関わる関数を勉強 分散:平均を中心にどのくらいデータがばらついているかを表す統計量 分散の値を直接使うことはあまりないらしい。 =VAR.P:母集団が全て分かっているとき =VAR.S:母集団から標本を抽出し…

学習day8

分散分析の証明方法において・・・ 3つの群があったとして、なぜ群間のズレだけで評価しないのか? なぜ群間と郡内を比べて、群間の方がズレが大きければ「差はない」、郡内の方がズレが大きければ「差がある」と評価できるのかがいまいち分かってない。 3つ…

学習day7

昨日の「なぜ平均平方は「平方和÷自由度」なのか?」の続き そもそも自由度とは何か?から。 自由度とは、自由に決めることができる値の数のことを指す。 x + y + z = 10 の場合、合計が10になるように好きに入れられる数は2つのみ。 仮にxとyに好きな数字を…

学習day6

分散分析 2つの標本間の平均の差を調べるときはt検定を使う。 3つ以上になるとt検定は使えない。その場合は分散分析を行う。 群間のズレ:全体の平均から、どのくらい各群がどのくらいズレているのか? 郡内のズレ:各群の平均から、個々のデータはどのくら…

学習day6

アトミックベクトル アトミックベクトルは、単純なデータのベクトル。前に作ったdieオブジェクトがそれにあたる。 アトミックベクトルは1個の値から作ることもできる。 アトミックベクトルは6種類のデータ型を認識する。 ①double(倍精度不動小数点数) doub…

学習day5

R言語のパッケージインストール方法などを学んだ。 肌感はrubyと似ている。が、、、 関数をどう使うか試行錯誤するとき、都度RStudioでヘルプページ出しながらコードを書くと思うが 英語に対しての慣れを徐々に作らないとしんどそうだなーーという印象。

学習day5

t =(標本平均の差)÷(標本平均の差の標準誤差) 自由度=(Aのサンプルサイズ-1)+(Bのサンプルサイズ−1) 対応ありのt検定の場合、サンプルAとサンプルBの差は同じ対象者から取ってきている。 なのでサンプルAとサンプルBの異なる母集団から標本を取ら…

学習day4

R言語を学習し始める。 Rコマンドの中には処理が重く、実行に時間がかかるものがある。 その場合は[Ctrl]+[C]を入力する。 数列は[:]で記入する。 例えば、1:6は[1 2 3 4 5 6]の数列を表す。 変数は[<-]で代入する。 オブジェクトが作られた際は、RStudioの…

学習day4

今日は平均の差の信頼区間を学習した。 その前に、標準偏差と標準誤差の違いが良くわからなくなった 統計の解説はここのサイトが分かりやすい https://best-biostatistics.com/summary/fuhen-bunsan-n1.html https://best-biostatistics.com/summary/sd-se-c…

学習day3

昨日の信頼区間の復習。 信頼区間=標本平均 ± t × 標準誤差 ・標本平均は、名前の通り取ってきたデータ(=標本)の平均を指す。 ・標準誤差は、標本平均の標準偏差を指す。 求め方は、不偏分散 ÷ サンプルサイズ(取ってきたデータの数) にルートをつける ・不…

学習day2

信頼区間を今日は学習。 信頼区間とは、母集団の平均を知りたいが、数が多すぎて全て計算できないとき、 標本として抽出したサンプルから取り出したデータが95%(98%)の確率で含まれていそう。という幅を持たせた推測を指す。 計算式を記載。 ・標本平均=…

学習day1

統計学の学習のために、初歩的なところからスタート http://kogolab.chillout.jp/elearn/hamburger/index.html 今日は平均と分散の学習をおこなった。 平均は言わずもがなだが、分散の求め方を学習した。 ①各データの値から平均を引く ② ①の結果を2乗する(^…