#111
データの大きさをバイト単位で表した際の単位は以下がある。
ペタバイト(PB) 10の15乗
エクサバイト(EB) 10の18乗
ゼッタバイト(ZB) 10の21乗
ヨタバイト(YB) 10の24乗
#112
メールや議事録、あるいはアンケートなどのビジネスデータの分析では、文書から有用な情報を抽出する必要がある。一般にこれらは複数の文から成る文章であり、文単体ではなく文章全体の意味を考慮することが重要な意味を持つ場合も多い。
それに関して「照応解析」とは、”代名詞などの表現がさす対象を推定する技術”、「談話構造解析」それに関して「照応解析」とは、”代名詞などの表現がさす対象を推定する技術”、「談話構造解析」では、”文と文との間の意味的な関係性を推定する技術”である。
#113
強化学習における”行動価値関数Qとは、行動と価値を引数としてそのときの効用値を返す関数である”。
#114
単語埋め込みモデルは、”単語埋め込みモデルは自動翻訳への応用は難しい”
#115
”N-gram”は、文章として与えられた文字列にn文字の窓を設定し、1文字ずつずらしながら単語を生成する方法である。
#116
自然言語処理分野において、「構文解析」とは、”文章の句構造や係り受け構造を捉える”ことである。
#117
自然言語処理分野においてもディープラーニングは成果を上げている。「分散表現」とは、”語彙の大きさよりも少ない次元数の実数ベクトルで表現する”ことである。
#118
画像認識やその周辺の用語
キャプション生成 | 入力画像を説明する自然言語文を出力する |
物体検出 | 自動運転において、車載カメラから歩行者や対向車の位置を矩形領域で特定する |
セマンティックセグメンテーション | 画素単位でクラス識別を行う |
OCR | 文書に書かれている手書き文字などを読み取る |
#119
ディープラーニングで頻用される事前学習の手法について、映像から物体検出を行う課題を解くことを考える。映像から物体検出を行う課題を一から学習するのは困難なので、パラメータの一部として事前に”画像認識”課題を学習させた訓練済みモデルの結合係数を用いることが考えられる。
#120
活性化関数とは、ニューロンの出力に何らかの非線形な変換を加える関数である。誤差逆伝播における勾配消失を防ぐ役割を持ち、ニューラルネットワークの多層化に貢献した活性化関数を”ReLU関数”という。
コメント