#41
第三者の著作物を学習用データとして取り扱う場合に、現在の日本の法律においては、著作権法の規定をクリアしていても不正競争防止法の観点から営業秘密に当たるデータの利用などは制約がかかる可能性がある。
#42
AI技術の社会実装によって生じる倫理的・法的・社会的な課題に対処するために企業が留意しなければならないこととして、下記が挙げられる。
- 社内でAI倫理委員会を組織する際には、実効性のない名ばかりの委員会による「エシカル・ウォッシュ」に陥らないよう設置者が委員会の人選や権限に留意する必要がある。
- 個人情報などのを扱う企業においては、単に社内で法令やコンプライアンスを遵守するだけでなく、ユーザに対してプライバシーやセキュリティ対策をどのように実施しているのかを公開し、透明性を高めることが望ましい。
- 企業は自社の製品やサービスによって発生した倫理的・法的・社会的課題に対処するため、クライシスの種類と緊急レベルに応じた危機管理マニュアルを整備しておくことが望ましい。
- 個人情報の自動化された処理に基づいてユーザの行動特性を評価するプロファイリングは、ユーザの強い不安を引き起こすことが予測されるため、本人にプロファイリングを行う旨を
通知しないように留意する通知する必要がある。
#43
ディープフェイクに関する事項として以下のようなものがある。
- ディープフェイクは主に敵対的生成ネットワーク(GAN)を用いて生成され、近年その精巧さが高まっていることから問題視されている。
- ディープフェイクはポルノの生成や詐欺に利用されるだけでなく、選挙などで特定の候補者に関する虚偽の風説の流布などにも利用され得ることから民主主義上の脅威になると考えられている。
- ディープフェイクに対してはFacebookなどの企業が検出ツールの開発を支援しているほか、中国をはじめとした各国で法整備が進められている。
#44
ECサイトなどでは顧客の購買を促すために、機械学習によってその顧客が好みそうな商品を特定し、推薦する手法が利用されている。ユーザの行動履歴から推薦を行う手法として、”協調フィルタリング”、商品の特徴から推薦を行う手法として、”内容ベースフィルタリング”がある。
#45
自然言語で書かれたテキストの前処理として、形態素解析やクレンジングがある。形態素解析による処理では、”意味を持つ最小単位に切り分ける”。
#46
テキストマイニングでは、形態素解析でテキストを単語などの最小単位に切り分けた後、BoW(Bag-of-Words)などの手法を用いる。BoWによる処理では、”テキストをベクトルの形式に変換する”。
#47
自然言語処理においてトークンをより低次元の空間における実数ベクトルとして表現するために用いられる手法として”Word2Vec”がある。
#48
物体認識において、画像にわずかな摂動を加えることで、人が見た際に大きな変化がないにも関わらず正しく認識できない画像を生成できてしまうことがある。この方法で生成したサンプルを”Adversarial example”という。
#49
自然言語処理で文章をベクトル表現した後に使われるコサイン類似度の性質として、”ベクトル間の類似度を求めるものであり、-1~1の値をとる”ことが挙げられる。
#50
機械学習における検証手法のひとつであるk-分割交差検証は、”データセットに含まれるデータの件数が少ないとき”に用いると効果的である。
コメント