今話題の機械学習の正体とは?

機械学習の正体とは?

今日、私たちの周囲にはAI(人口知能)が至る所で活躍しています。Strategy Analyticsの調査によると、Amazon AlexaやGoogle Assistantなどのスマートスピーカーは、2020年には世界の販売台数が1億5,000万台を超えており、米国ではインターネットユーザーの1/4以上がすでに利用しているとのこと。

この他に、スマートフォンはもちろんですが、献立を提案し周辺スーパーの特売情報を教えてくれる冷蔵庫、洗剤の種類・布質・汚れの量などに合わせて洗い方や時間を調整する洗濯機、行き先を伝えるだけで目的地まで運んでくれる自動運転車、医師でも見逃す可能性のある腫瘍を発見する医療画像分析システムなどAIを導入している商品・デバイスは数え上げるとキリがありません。

これらのAIが能力を発揮するためには、目的に合わせてコンピューターのための学習=「機械学習」をさせる必要があります。そこで今回は、AIの能力を向上させ、さまざまなタスクを実行可能にする「機械学習」についてわかりやすく解説します。

AI(人口知能)

AI(Artificial Intelligence)は、人間の脳の働きを模倣・再現したコンピュータシステムのことで、主要な機能には次の6種類があります。

  1. 学習:サンプルや経験などから知識を得る
  2. 認識:対象物を認識する
  3. 言語理解及び応答:言語(音声・文字)を理解し、その言語に対し応答する
  4. 推論:学習・認識・言語などの情報を基に思考する
  5. 結論:推論により合理的な判断、問題の解決方法などを導き出す
  6. 実行/処理:結論に従いロボットや機械に指示を与え実行する

機械学習(Machine Learning)とは

以前はコンピュータに仕事をさせる場合には人間が全てプログラムしていましたが、「機械学習」という手法を使うと、AIは大量のデータを学習し自分で問題解決の方法や手順(アルゴリズム)を構築することが可能となります。

機械学習の種類

機械学習には、大別すると「教師あり学習」「教師なし学習」「強化学習」の3種類があります。

  1. 教師あり学習:注釈アリのデータで行う学習
  2. 教師なし学習:注釈ナシの生データで行う学習
  3. 強化学習:AIが出す結果の価値を最大化する学習
  4. 結論:推論により合理的な判断、問題の解決方法などを導き出す

機械学習の手順

機械学習の基本的な流れは次の4つのプロセスから成っています。

目標の設定
「何を」「どれくらいの精度」で行いたいのかゴールを明確にする。

データ収集
目標の達成に必要な質の良いデータを収集。

機械学習の「手法」「アルゴリズム」の選択
機械学習の手法を選択し、目標達成に必要な機械学習アルゴリズムを決定。

トレーニング
機械学習によりAI自身が最良の結果を導き出せるようにトレーニング。

機械学習アルゴリズム

AIが大量のデータから自分で学習できるようにするためには、機械学習の方法や手順「機械学習アルゴリズム」に基づくプログラミングが必要です。

機械学習アルゴリズムにはさまざまなタイプがありますが、大きく分けると3つのカテゴリーに分類することができます。

【 分類アルゴリズム 】

大量のデータを学習し、データが持っている特徴やさまざまな情報に応じて分類するアルゴリズム。「自動車」や「飛行機」などの乗り物に関する画像データを学習させると、新たな乗り物の画像データを与えた時に分類することができるようになります。

【 回帰アルゴリズム 】

過去に学習したデータに基づいて、未来の数値を予測するアルゴリズム。商品の売上予測、株価の予測、天気予報などにも使うことができます。

【 クラスタリング アルゴリズム 】

大量のデータを学習し、データ間の類似性に基づいてグループ(クラスター)分けするアルゴリズム。例えば、ネットの購買情報や顧客情報などから「属性」「好み」「ライフスタイル」などが類似する顧客グループに分けることにより、興味がありそうな商品を提案することが可能になります。

アルゴリズムは単純な作業の場合には1つだけの時もありますが、複雑な判断が必要な時や精度を高める時には複数のアルゴリズムを組み合わせることもあります。

目的は「学習済みモデル(Learned Model)」を完成させること

機械学習アルゴリズムは結果を求めるための基本的な数式・理論によって構成されていますが、機械学習によって構成した「最適な結果を導き出すための計算式・計算方法」のことを「機械学習モデル」と呼びます。

例えば、機械学習アルゴリズムの計算式を仮に「 y = ax2 + b 」とすると、機械学習モデルは「 y = 5x2 + 20 」のように明確な答えが得られるように具体化した式になります。

このように機械学習は、機械学習アルゴリズムで大量のデータを学習させ、「学習済みモデル」を構築する作業ということができます。

AI、機械学習、ニューラルネットワーク、ディープラーニング

機械学習をさらに進化させたものが「ニューラルネットワーク」「ディープラーニング」と呼ばれる手法です。AI、機械学習、ニューラルネットワーク、ディープラーニングの関係は次の図で表すことができます。

ニューラル・ネットワークとディープラーニング

ニューラルネットワークは機械学習の一部で、人間の脳にある神経細胞(ニューロン)の働きをモデルにして作られたアルゴリズムで、IBMのサイトではニューラルネットワークを次のように図形化し説明しています。

出典:IBM Cloud Learn Hub

AIにおけるニューロンは「ノード(Node)」と呼ばれ複数のレイヤーを構成します。ノードはInput layerからデータ(数値)が入力されるとそれを処理し、一定の値を超えると次のレイヤーにデータを送ります。

このようにニューラルネットワークは複数のレイヤーでデータを処理することから「深層学習アルゴリズム」の中心的な存在です。

上の図で「Multiple hidden layers」が多数あるものを「ディープラーニング(深層学習)」と呼び、複雑なタスクを行う場合に活用されています。

機械学習に関わる知的財産

「機械学習用データ」「学習済みモデル」「機械学習アルゴリズム」などは著作物として著作権法上の保護を受ける、あるいは発明として特許法上の保護を受けることが可能ですが、AIが生み出した「AI生成物」の知的財産権の取扱はどのようになるのでしょうか。

ここで「AI生成物」の知的財産に関する内閣の知的財産戦略本部の見解をご紹介します。

  • AIを活用した創作について、「AI生成物」を生み出す過程において具体的な出力である「AI生成物」を得るための人間の創作的寄与があれば「道具」としてAIを使用したものと考えられ、当該 AI生成物には著作物性が認められる。
  • 人間の創作的寄与がなければ、当該「AI生成物」は AIが自律的に生成した「AI 創作物」であると整理され、現行の著作権法上は著作物と認められない
  • 発明においては、創作は「課題の設定」「解決手段候補選択」「実効性評価」の3ステップからなり、これらいずれかの創作的寄与を人間が行うか否かという観点や、特許法における「発明をした者」が自然人に限られるとの解釈から人が着想したか否かという観点も考慮すべき事項であるとの指摘もある。
  • 具体的にどのような人間の関与が創作的寄与に当たるのかについては、AI 技術の進展を注視しながら、事例に即して引き続き検討することが求められる。

(出典:「知的財産推進計画2017(13P)」知的財産戦略本部)

上記の考え方を整理すると次のようになります。

・人間がAIを道具として使用し生み出したものは人間の著作物/発明。この場合、「人間の創作的寄与」の割合が問題となる。
現在の法律では、AIが自律的に生成したものは著作物/発明とは認められない。

機械学習によってAIの能力が進化し人間の関与がなくても「生成物」を生み出せるようになってきた現状を考えると、知的財産法の見直しは避けられないでしょう。

今話題の機械学習の正体とは?/まとめ

AI、機械学習、機械学習アルゴリズム、ニューラルネットワーク、ディープラーニング、機械学習に関わる知的財産権について解説してきました。

機械学習をしたからといってAIが常に最高のパフォーマンスをするとは限りません。「優れた機械学習アルゴリズム」や「質の高い学習データ」が提供されて初めてAIの能力を発揮させることができるのです。

中でも機械学習の最先端技術「ディープラーニング」は、自動走行車の安全を担保する「周囲の状況に対する高い認識精度」や人間の命に関わる「がん細胞の自動検出」など、さまざまな分野で応用研究が進められています。 また、「機械学習に関わる知的財産」ではAIを取り巻く重要課題の一つである「AI生成物」の知的財産問題について紹介しました。AIと共存する社会を実現するためには、技術開発とともに法的な環境整備も急がなくてはならないでしょう

事例はこちら