いかおくら自習室のブログ

普段の学習内容などのアウトプット用のブログです

G検定学習記録_機械学習の手法

thumpx3.hatenablog.jp

この次の章です。

強化学習

ex.掃除ロボット

  • 環境 or 状態:部屋の状況
  • エージェント:掃除ロボット
  • 行動:掃除ロボットがとる行動
  • 報酬 or 収益:掃除ロボットが行動することにより得られる評価値
  • 方策:ある状態のとき、どの行動を取るべきかを示す関数 掃除ロボットは「報酬」が最大になるように「行動」を選択する。

教師あり学習

教師あり学習教師なし学習を組み合わせたもの。 学習データ全てにラベルがついていなくても学習できる手法。 「正解データ」を作る(ラベルを付与する)作業をアノテーションと呼ぶ。

メタ学習

「学習の仕方」を学習する手法。 特定の教師データが少ない場合に、事前に類似した教師データを使ってモデルを作成できる。

マルチモーダル学習

画像、音声、テキストなど複数のデータ使って学習する手法。テキスト入れて画像を出力できるMidjourneyなど。