いかおくら自習室のブログ

普段の学習内容などのアウトプット用のブログです

2023-03-01から1ヶ月間の記事一覧

SQLにおける文字列の不等号

達人に学ぶSQL徹底指南書 第2版 初級者で終わりたくないあなたへを学んでいる最中、挙動が分からなくなった箇所があった。 自己結合の使い方、演習問題の箇所。 文字列はどういう基準で比較されるのか簡単にまとめておく。 準備データ CREATE TABLE meibo ( …

混同行列の見方

分類で出てくる「再現率」「適合率」 どっちが何だったかこんがらがる時があるので自分用にメモ。 適合率 機械学習モデルが「Positive」と予想した中で(=分母)、実際にPositiveだった数(=分子)の割合。 適合率を優先したい場合、分母である機械学習モ…

G検定学習記録_AIと社会

続き。 AI-Readyな企業レベル*1 AI-Readyな企業に向け、経営層、専門家、従業員、システム・データに関して、5段階のレベル分けを提示 レベル 定義 概要 レベル1 AI-Ready化着手前 AIの方法論の議論が先行し、AI×データを活用した事業運営・刷新・創造は未着…

G検定学習記録_生成モデル

thumpx3.hatenablog.jp 続き。 今までの回帰や分類を行うモデルは識別モデルと呼ばれる。 今回のは生成モデルといい、学習したデータを元にして新たなデータを生み出すモデル。 ディープラーニングを用いた生成モデルを深層生成モデルと呼ばれる。 用語 解説…

G検定学習記録_強化学習

thumpx3.hatenablog.jp 続き。 強化学習における用語 用語 解説 エージェント 学習者 環境 エージェントの外側にあるもの全て 状態 現在の環境 報酬 状態が推移する時、同時に得られる結果 行動 エージェントがとりうる選択肢 方策 状態から行動を決める際の…

G検定学習記録_音声処理

thumpx3.hatenablog.jp 続き。 音声データのデジタル形式で一般的な変換方法をパルス符号変調(PCM)と呼ぶ。 PCMのプロセス 用語 解説 サンプリング サンプルを集める技術。44.1kHz = 44,100個のサンプル。 量子化 過剰なビットを減らして値を圧縮、計算しや…

G検定学習記録_自然言語処理

thumpx3.hatenablog.jp 続き。 自然言語処理の前処理 用語 解説 形態素解析 文章を形態素(文章の最小単位)に分割し、それぞれの品詞と活用体系を決定する処理。MeCAb,kuromojiのツールがある。 ストップワードの除去 情報の少ない冠詞、前置詞、代名詞、接…