- HOME
- 法人様向けお役立ちコンテンツ
- 機械学習と深層学習の違いとは?アルゴリズムの種類や活用シーンも解説
機械学習と深層学習の違いとは?アルゴリズムの種類や活用シーンも解説
昨今、ビジネスにおいては機械学習が多くの場面で用いられるようになってきました。同時に深層学習を使ったサービスや製品も多く世に出始めています。うまく活用すれば事業活動を豊かにできる可能性を秘めている機械学習と深層学習ですが、この2つの学習方法の違いをよくわかっていないという方も多いのではないでしょうか。
本記事では、機械学習と深層学習(ディープラーニング)の違いについて、アルゴリズムの種類や活用シーンも踏まえながらご紹介していきます。
目次
機械学習と深層学習の違いとは
説明に入る前に、まずは機械学習と深層学習(ディープラーニング)の違いについて解説します。
深層学習(ディープラーニング)は、機械学習の手法の1つです。機械学習は、人間がデータの特徴を判断します。どのような学習をしていくかについては構築者が決定し学習と分析の効率化を図っていくため、深層学習よりは学習に時間がかからないことが特徴です。
対して深層学習は、機械がデータの特徴を判断します。何を学ぶべきなのかも機械が判断するため、人間にとって抽象的な問題の解決を効率化していけます。ただし学習には大量のデータが必要で、学習を効率よく進めるには高い処理能力を持つコンピュータが必要不可欠です。
機械学習は大きく「教師あり学習」「教師なし学習」「強化学習」の3つに分けられ、深層学習はこの「教師あり学習」「教師なし学習」「強化学習」すべての学習に適用できます。
機械学習については「機械学習とは?3種類の機械学習手法について解説!」、ディープラーニングについては「ディープラーニングとは?注目を集めている理由について紹介」の記事をご参照ください。
機械学習におけるアルゴリズムの種類
機械学習にはさまざまなアルゴリズムがあるため、状況に応じてアルゴリズムを使い分けていくことになります。
ここでは各アルゴリズムの種類の特徴と、「教師あり」「教師なし」「強化学習」のどれに属するのかをみていきましょう。
教師あり学習
まずは教師あり学習に属するアルゴリズムについてみていきます。
線形回帰
2次元空間に分布したデータを要約して直線を当てはめる手法が線形回帰です。店舗の売り上げ予測や賃貸物件の賃料予測など多くの分野に適用できます。
ロジスティック回帰
いくつかの要因から2値の結果が起こる確率を求めるのがロジスティック回帰です。2値とは、テストの合格・不合格のように答えが2つしかない値のことを指します。勉強時間、部活入部の有無、スマホ操作時間からのテスト合格率算出や、各種生活習慣からがんの罹患率算出などに応用されます。
サポートベクターマシン(SVM)
あるデータの集まりを2つに分類しておき、入力されたデータがどちらのグループに属するかを判別するのがサポートベクターマシンです。ある製品が不良品かどうかの判別や、株価予測などに利用されます。
決定木
物事の判別や意思決定などのための木構造データや図のことが決定木です。根(ルート)から枝分かれする形で分岐が伸びていき、末端には結果や結論が用意されています。
特に事柄の分類をしたい場合は「分類木」と呼ばれ、値の予測をする時は「回帰木」と呼ばれます。経路決定や顧客の料金設定など、さまざまな物事に適用できることが特徴です。
ランダムフォレスト
あるデータの集合からいくつかのデータを選択してデータグループを複数作り、そのデータグループをもとにグループごとの決定木を作って予測結果の平均を取り、予測を実施するのがランダムフォレストです。各データグループの内容はそれぞれ異なるように選択するため、グループごとに異なる決定木が生成されます。人間が書いた数字の認識や人間の態勢認識などに利用されています。
ナイーブベイズ
あるデータがどのカテゴリに属するかを確率的に求めるアルゴリズムです。電車の混雑状況や、津波・地震などの災害予測、レコメンド、スパムメール判断などに利用されます。
教師なし学習
続いて、教師なし学習に属するアルゴリズムをみていきます。
k-means/k-means++
最初にデータが散らばっている2次元の座標上で、ランダムに点をいくつか(k個)配置し、各データから最も近い点でデータをグルーピングします。続いて点を各グループの中心(各データの座標の平均)になるように再設定し、グルーピングと中心再設定を結果が変わらなくなるまで繰り返すという手法がk-meansです。主にECサイトにおいて特定の顧客属性に対する製品レコメンドに利用されています。k-means++ は最初の各点の距離がそれぞれ最も遠くなるようにデータの中から点を選ぶことでk-meansの分類精度を上げた手法です。
GAN
GANは、Generative Adversarial Networkの略で、敵対的生成ネットワークと訳します。その名の通り生成者と判定者の敵対的な判別を混合させることで学習が進められます。例えば画像認識にあたっては、生成者が生成した画像か、それとも訓練データかを判定者が判定することによって画像認識の学習が進められます。最終的には生成者が生成した画像が本物と見分けがつかなくなるレベルまで学習を進めます。自動着色アプリや画像の自動生成APIなどはGANによって構築されています。
深層学習
すでに説明した3つの学習すべてに適用できる手法として、深層学習があります。深層学習のアルゴリズムもみていきましょう。
単純パーセプトロン
単純パーセプトロンは、2つの値を入力すると0か1を出力します。2つの値をそれぞれ重み付けして入力し、「バイアス」と呼ばれる1の出力度合調整値を適用して出力します。最近では広く使われるようになったニューラルネットワークの元となるアルゴリズムです。
Deep Neural Network( DNN)
先ほど説明した単純パーセプトロンを並列に並べて層とし、その層を何重にも重ねたアルゴリズムがDNNです。その層は学習内容によって何百、何千にも及ぶことがあり、層を重ねるほど複雑な情報に対応できるようになっていきます。
Convolutional Neural Network(CNN)
画像から特徴量と呼ばれる画像の特徴を示す値を算出し、それを「畳み込む(Convolution)」ことによって計算量を圧縮し、さらに画像を判別する精度を上げたアルゴリズムがCNNです。画像認識の分野において広く用いられています。
Recurrent Neural Network(RNN)
DNNを拡張して時系列データにも対応できるようにしたのがRNNです。データのトレンドや周期を分析して予測に適用していけます。音声認識や自然言語処理などに使用されています。
アンサンブル学習
特殊な例として、複数のアルゴリズムを組み合わせる「アンサンブル学習」と呼ばれる形態もあります。
Boosting
学習したAIモデルがうまく予測をできなかった際に、学習データに重みをつけてモデルを再学習する手法です。AIモデルをブーストしていくイメージから名前が付けられました。
決定木とBoostingの考え方を併用したXGBoostや、誤分類したデータに大きな重みを与えるAdaBoostなどの種類があります
アンサンブル学習
- Boosting
- Adaboost
複数のアルゴリズムを組み合わせて1つのAIを構築するアルゴリズムです。
使用されるアルゴリズムの組み合わせによって、さまざまな事例に応用されています。
深層学習では、ニューラルネットのCNNがよく用いられます。
深層学習の活用例
ここからは、深層学習の活用例についてみていきましょう。
病院やクリニックなどでの診察補助
深層学習を利用して過去の患者のデータから病状を把握します。また多数のレントゲン写真を学習させ、異常な部分の発見に活用します。
その他ではカメラの画像から異常個所を発見するなど、医師の診断をさまざまな点から補助できるのです。
防犯
指名手配犯の顔写真を学習させることで、防犯カメラの無数の映像から犯人と疑わしき人物を特定できます。さらに犯罪を実施しようとしている人間の動作を学習させ、動作が怪しい人物を防犯カメラで検知してアラームを発報できます。
農業の作物栽培
ビニールハウス内の気温や湿度など多数の情報をセンサーで収集し、収穫時期予測や病害虫発生原因の推定、収量予測精度の向上に寄与します。
機械学習用PCを選ぶ際に注意すべきポイント
自分で機械学習を勉強・ 実践するためであれば、市販の20万円程度のPCでも問題ないでしょう。反面、業務で機械学習を実施し、膨大なデータからAIを構築したいということであればハイエンドなPCが必要になってきます。
また同価格帯のノートPCとデスクトップPCでは、デスクトップPCを選択した方がよいでしょう。ノートPCは小型化するために費用がかかっているため、同価格帯であればデスクトップPCの方が性能は優れています。
機械学習用PCのスペックについては「機械学習に最適なPCとは?必要なスペックやおすすめPCについても紹介」の記事をご参照ください。
まとめ
深層学習(ディープラーニング)は、機械学習の手法の1つです。深層学習はデータから学習する内容をAIが判断してくれるため、問題解決を効率化していけます。一方その他の機械学習は、学習目的や内容について人間が手を加えるため、深層学習と比較して学習に時間がかからないことが特徴です。
機械学習と深層学習は目的や手段によって使い分け、効果的な学習をしていきましょう。