#101
セマンティックセグメンテーションの代表的な手法であるU-Netはエンコーダ・デコーダ構造を採用し、エンコーダとデコーダの間をつなぐ処理がある。この処理では、”エンコーダ側の特徴マップを一定サイズに切り出して、対となるデコーダの特徴マップに連結する”。
#102(検証中)
物体検出タスクにおいて、エンコーダ・デコーダ構造を採用し、デコーダ側の各層から物体検出を行う手法。エンコーダ側の特徴マップサイズは小さく、デコーダ側の特徴マップは大きくなるように処理をする手法である。
候補:
- Feature Pyramid Network(FPN)
- Single Shot Multi-box Detector(SSD)
- Faster R-CNN
- You Look Only Once(YOLO)
#103(検証中)
強化学習におけるアクタークリティック(Actor-Critic)法では、記録されたアクター行動から、クリティックが最適な方策を解析的に求める。
#104
BERT(Bidirectional Encorder Representations from Transformers)はマスク言語モデル(Masked Language Model、MLM)と呼ばれ、”文章の一部を隠して入力し、前後の文脈から隠された文章を推定すること”を学習する。同時に、次文予測(Next Sentence Prediiction、NSP)タスクとして”2つの文章を入力し、元データの中で連続して出現した文章かどうかを推定すること”を学習する。
#105
完全結合ネットワーク(FCN)のネットワーク構造と処理の説明
- 畳み込みニューラルネットワーク(CNN)と
変わらず全結合層と異なり、畳み込み層で構成される。 - 空間ボリュームが保たれたまま出力まで処理する。
- 最後に空間サイズを拡大し、入力サイズと同じ大きさまで出力できる。
- 逆畳み込み演算という演算で拡大処理を行っている。
#106
物体検出手法であるSSD(Single Shot Multi-box Detector)の特徴としてえ、”あらかじめ画像全体をグリッド分割しておき、各領域ごと検出する”ことが挙げられる。
#107
画像中に特定の物体がうつる矩形領域を判定するタスクを物体検出と呼ぶ。物体検出を解くモデルとして、”R-CNN”, ”YOLOv3”, ”SSD Lite”などが提案されている。
#108
画像におけるセグメンテーション(領域分割)において、以下1から3のタスク名として最も適切な選択肢を1つ選べ。
- インスタンスセグメンテーション
- 画像上全てのピクセルに対してクラスラベルは振られないが、画像上の物体の認識をピクセルレベルで実施する。
- パノプティックセグメンテーション
- 画像上全てのピクセルに対してクラスラベルが振られ、その中で数えることができると判断されたクラスは物体として認識される。
- セマンティックセグメンテーション
- 画像上全てのピクセルに対してクラスラベルが振られるが、物体の認識は行われない。
#109(検証中)
モデルに依存しないメタ学習であるMAML(Model-Agnostic Meta-Learning)に関する説明
- MAMLとは、勾配降下法を用いて、モデルのパラメータの最適な初期値を探索するアルゴリズムである。
- MAMLは、回帰問題、分類問題、強化学習など、さまざまなタスクに対して有効である。
- MAMLは、学習規則に関する新たなパラメータを導入することで、モデルの学習を早める。
- MAMLは、少ないデータ数でもモデルに学習させることができる、メタ学習の一種である。
#110(検証中)
シュミットフーバーらによって提案されたLSTM(Long Short-Term Memory)で1つの基本ユニットに含まれるゲート数は”2つ”である。ただし、現在よく用いられているのはオリジナルのLSTMに忘却ゲートを追加した2000年のモデルである。
コメント