1
A社が保有する個人情報において、個人情報の保護に関する法律(個人情報保護法)に照らすと以下がいえる。
- A社は、個人情報の利用目的を変更する場合には、変更前の利用目的と関連性を有すると合理的に認められる範囲を超えて行うことができない。
- 公衆衛生の向上のために特に必要がある場合であって、本人の同意を得ることが困難であるときは、A社は、その保有する個人情報を利用目的の達成に必要な範囲を超えて取り扱うことができる。
- A社は、利用目的の達成に必要な範囲内であったとしても、個人情報を正確かつ最新の内容に保つ義務は負っていない。
2
深層強化学習は、強化学習の関数にディープニューラルネットワーク(DNN)を用いた手法である。
3
ディープラーニングは音声認識の逆過程である音声合成においても利用されている。 従来、音声合成、あるいは音声認識の分野においては多数のコーパスを用いる統計的な手法が用いられてきた。そのような統計的な音声合成手法の一つとして、隠れマルコフモデル(HMM)がある。
4
自然言語を特徴量のテーブルにする手法として BoW(Bag-of-Words) があるが、TF-IDFでは、より一般的な単語の重みを低くし特定の文書に特有な単語を重要視する手法。単語の文書内での出現頻度とその単語が存在する文書の割合の逆数の対数の積で定義される。
5
U-Net の構造においては、全結合層を持たない。
6
- DEEP Fake は主に敵対的生成ネットワーク (GAN) を用いて生成され、近年その精巧さが高まっていることから問題視されている。
- ディープフェイクはポルノの生成や詐欺に利用されるだけでなく、選挙などで特定の候補者に関する虚偽の風説の流布などにも利用され得ることから、民主主義上の脅威になると考えられている。
- ディープフェイクに対してはフェイスブック社などの企業が検出ツールの開発を支援しているほか、中国をはじめとした各国で法整備が進められている。
7
「キャプション生成」とは、入力画像を説明する自然言語文を出力するタスクのことである。
8
第二次 AI ブームでは、いかにして機械に知識を与えるかが大きなテーマになった。例えば、自然言語処理の研究では言葉同士の意味関係を定義する手法が提案された。しかし、仮に言葉同士の意味関係がわかったとしても現実の概念と結びつけられるかどうかという問題が待ち受けている。この問題のことを一般に「シンボルグラウンディング問題」という。
9
文章中に書かれている話題テーマを抽出するための手法としてトピックモデルが利用されている。代表的なトピックモデルの手法のうち、テキストデータに特異値分解を適用した手法としてLSIがある。
10
確率的勾配降下法とは、学習データごとに勾配を求めて修正量を出し、逐次更新する手法である。
11
LSTM(Long Short-Term Memory) は内部にゲート構造を設けることにより、単純なリカレントニューラルネットワーク(RNN)の持つ(長い系列を遡るにつれて学習が困難になる)問題点を解決した。
12
相関係数は、-1より大きく1未満の値をとる。
13
近年、説明可能な AI(Explainable Artificial Intelligence:XAI) に関するワークショップやシンポジウムが開催される国際会議がある。 代表的なものに以下のようなものがある。
- NeurIPS
- ICML(International Conference on Machine Learning)
- IJCAI(国際人工知能会議:International Joint Conference on Artificial Intelligence)
14
言語モデルや音響モデルの置換が可能なことから高い汎用性を実現しているオープンソースの音声認識エンジンとして、Juliusがある。
15
バッチ正規化(batch normalization)の説明。
- 正則化としても役割も果たすと言われている。
- 学習で使用するミニバッチのデータに対して正規化を行う。
- 平均を0、標準偏差を1にスケール化するためのハイパーパラメータが存在しない。
16
敵対的生成ネットワーク(GAN)は、二つのニューラルネットワークで構成される。一つは(Generator)であり、(ランダムノイズ) を入力することで所望のデータに近づけるようにマッピングする。もう一つは (Discriminator) であり、(Generator)が生成した偽物のデータと本物のデータが与えられ、その真偽を判定する。この二つのネットワークを交互に競合させ、学習を進めることで(Generator)は本物のデータに近い偽物データを生成できるようになる。こうした「いたちごっこ」が繰り返され、最終的には本物に近い画像が生成されるようになる。
17
検証データにデータリーケージがあった場合、検証時には精度が良かったが、実際に導入すると精度が悪くなる。
18
AI 研究には過去に2度のブームが起こり、現実的な進展が周囲の過剰な期待に追いつかず、それらのブームは終焉を迎えた。エキスパートシステムは、第二次 AI ブームで登場し、第一次 AI ブームの時代に比べて適用範囲は広がったものの、知識を明示的な形で記述することの難しさがネックとなってしまった。
19
6面体のサイコロの出る目の確率が以下の式に従う場合のxの期待値は3.5となる。
20
畳み込みニューラルネットワーク(CNN) において畳み込み層の処理を行う前に、入力データの周囲に0など固定のデータを埋める処理をパディングという。