G検定学習記録_機械学習の手法
この次の章です。
強化学習
ex.掃除ロボット
- 環境 or 状態:部屋の状況
- エージェント:掃除ロボット
- 行動:掃除ロボットがとる行動
- 報酬 or 収益:掃除ロボットが行動することにより得られる評価値
- 方策:ある状態のとき、どの行動を取るべきかを示す関数 掃除ロボットは「報酬」が最大になるように「行動」を選択する。
半教師あり学習
教師あり学習と教師なし学習を組み合わせたもの。 学習データ全てにラベルがついていなくても学習できる手法。 「正解データ」を作る(ラベルを付与する)作業をアノテーションと呼ぶ。
メタ学習
「学習の仕方」を学習する手法。 特定の教師データが少ない場合に、事前に類似した教師データを使ってモデルを作成できる。
マルチモーダル学習
画像、音声、テキストなど複数のデータ使って学習する手法。テキスト入れて画像を出力できるMidjourneyなど。