#41
(エポック)はパラメータ更新にかかわる単位のうち、訓練データ全体を何回繰り返したかを示す語句である。
#42
畳み込みニューラルネットワーク(CNN)を用いた画像認識のモデルに関する説明。
- AlexNetは畳み込み層・プーリング層・全結合層を組み合わせたモデルである。
- GoogLeNetは、複数の畳み込み層やプーリング層から構成されるインセプションモジュールと呼ばれるネットワークを積み重ねた構造をしている。
- ResNetは、畳み込み層のみを積み重ねた構造をしている。
#43
画像のデータセットであるImageNetは、(10クラスもしくは100クラスの飛行機や車などさまざまな種類の画像を数万枚集めたデータセットである。)
#44
音声認識においてメル尺度の考えが重要である理由は、人間が知覚する音声の周波数は実際の周波数とは比例関係ではないため。
#45
以下はバイト単位で表現したデータの大きさである。小さい順に単位を並べた。
1PB(ペタバイト)、1EB(エクサバイト)、1ZB(ゼッタバイト)、1YB(ヨタバイト)
#46
自然言語処理で文章をベクトル表現したあとに使われるコサイン類似度の性質は、ベクトル間の類似度を求めるものであり、-1~1の値を取る。
#47
ニューラルネットワークで構成するディープラーニングにおけるマックスプーリングの特徴は、適用したカーネル内のピクセル値の最大値を代表値として出力する。
#48
音声認識における特徴量の1つとして広く知られるMFCC(メル周波数ケプストラム係数)は、人間の聴覚特性に着目した特徴量である。
#49
ディープラーニングで頻用される事前学習の手法について、映像から物体検出を行う課題を解くことを考える。映像から物体検出を行う課題を一から学習するのは困難なので、パラメータの一部として事前に(画像認識)課題を学習させた訓練済みモデルの結合係数を用いることが考えられる。
#50
ニューラルネットワークの最適化処理のうち、モーメンタムの考え方を適用した手法としては、Adamが挙げられる。
#51
次元圧縮や高次元データの可視化を目的としたアルゴリズムとして、主成分分析(PCA)、多次元尺度構成法、tSNEなどがある。
#51
教師なし学習の手法の中で、入力データの構造や特徴をつかむためにクラスタごとに重心を求め、各データを最も近いクラスタに紐づける作業を繰り返しあらかじめ決められた数のクラスタにデータを分類する手法はK-平均法(k-means法)という。
#52
欧州委員会が2019年4月8日に発表した「人工知能(AI)に関する倫理ガイドライン」では、信頼できるAIは合法的で倫理的、堅固であるべきとし、その条件として7つの要件を挙げている。この要件には下記のものが含まれる。
- 人間の活動(human agency)と監視(AIは、人間の活動と基本的人権を支援することで公平な社会を可能とすべきで、人間の主体性を低下させたり、限定・誤導したりすべきではない)
- 多様性・非差別・公平性(AIは、人間の能力・技能・要求の全分野を考慮し、アクセスしやすいものとすべき)
- 説明責任(AIとAIにより得られる結果について、責任と説明責任を果たすための仕組みを導入すべき)
#53
AIの精度が向上する一方で、AIをだます技術も向上してきている。人間では認識できないが、AIが認識を誤るような情報をデータに加えることでAIを騙すことができる。このような学習済みのモデルを騙すように作られたデータのことを( Adversarial Examples )と呼ぶ。
#54
多層パーセプトロンにおいて、(学習率)はハイパーパラメータに該当する。
#55
2018年5月に適用開始されたEU一般データ保護規則(GDPR)において、GDPRは個人情報として個人の名前や住所、クレジットカード情報、メールアドレスを含めるだけでなく、位置情報やCookie情報も個人情報とみなしている。
#56
HOG(Histograms of Oriented Gradients)特徴量を用いた画像認識では、局所的な輝度の勾配方向の強度分布により、画像を判別する。
#57
過去の状態推定値と誤差のある現在の観測値を元に状態空間を推定するカルマンフィルターが用いられている技術の例として、カーナビゲーションがあげられる。
#58
U-Netとは、FCN(fully convolution network)の1つであり、2015年に発表された対照的な構造を持つ画像セグメンテーションに特化したネットワークである。
#59
単語埋め込みモデルとして、以下のようなものがある。
- Word2vec
- fastText
- ELMo