「教師あり学習、教師なし学習、強化学習ってよく聞くけど、実際にどう使われるの?」私は最初に機械学習を学んだとき、AI、機械学習、ディープラーニングと混ざってしまい、混乱した記憶があります。
機械学習には、データの扱い方や学習方法の違いによって、「教師あり学習」「教師なし学習」「強化学習」という3つの主要なアプローチがあります。それぞれの手法には得意な場面があり、適用される分野が異なります。
本記事では、まず機械学習における3つの学習手法を整理し、それぞれの特徴と使われる場面を解説します。その上で、ディープラーニングにおける学習手法について触れ、実際には教師あり学習が最も多く使われていることを説明します。そして、このブログでは、実用上非常に重要な教師あり学習を中心に扱うことにした理由についても触れていきます。
機械学習の3つの学習手法
機械学習の手法は、データの与え方や学習の仕組みによって、大きく3つのタイプに分類されます。混乱しやすいところなので図を再掲しますが、「機械学習」はディープラーニングを含む、具体的なアルゴリズムの手法の集合体です。今回紹介する3つの学習手法は、それぞれのアルゴリズムがデータをどのように学習するかの違いによる、大枠の分類です。アルゴリズムによってはある学習手法に特化していたり、ディープラーニングのようにいろんな学習手法を使えたりします。

1. 教師あり学習(Supervised Learning)
教師あり学習は、学習データに 「正解ラベル」 が与えられている場合の学習方法です。例えば、猫の画像には「猫」、犬の画像には「犬」というラベルが付けられており、与えられた画像をもとに「猫」、「犬」と判断できるようにモデルが学習をします。
代表的な用途
- スパムメールの分類:「スパム」か「スパムでないか」のラベル付きデータを学習
- 手書き数字の認識:「0〜9」の正解ラベルを持つデータで学習
- 医療画像処理:ノイズの多い元画像ときれいな正解画像で学習
教師あり学習の最大の特徴は、「このデータの入力に対して正解はこれ」という明確な指標があるため、精度の高いモデルを作りやすい ことです。そのため、実際の機械学習の応用の多くは教師あり学習に基づいています。
2. 教師なし学習(Unsupervised Learning)
教師なし学習は、データに正解ラベルがない場合に使われる学習方法です。モデルがデータのパターンや構造を自ら見つけ出し、グループ化や特徴抽出を行います。
代表的な用途
- クラスタリング(グループ分け):顧客の購買履歴から似た傾向のグループを見つける
- 異常検知:クレジットカードの不正利用検知(通常の取引と異なるパターンを識別)
- 次元削減:高次元のデータを圧縮し、特徴を抽出する(例:PCA)
教師なし学習の強みは、大量のデータがあるがラベルを付けるのが難しい場合でも、パターンを自動で見つけ出せること です。ただし、教師あり学習ほど直接的に使いやすい結果を得るのが難しいことが多いです。
3. 強化学習(Reinforcement Learning)
強化学習は、「報酬を最大化する」 ことを目指して試行錯誤を繰り返しながら学習する方法です。ゲームをプレイするときのように、良い行動には報酬が与えられ、悪い行動にはペナルティが与えられる仕組みを利用します。要するに、ある入力に対して最終的に好ましい結果を定義できる場合に使える手法と言えます。逆にいうと、こういう場合、わざわざ私達が正解データを用意する必要がありません。
代表的な用途
- ゲームAI(AlphaGo, チェスAI):「勝つ」ことを報酬とし、最適な手を学習
- ロボット制御:「目的地に到達する」ことを報酬とし、動作を最適化
- 自動運転:安全に走行するためのルートや加減速を学習
強化学習の特徴は、人間が用意した「最適な答え」を学習するのではなく、「好ましい方向へ進むための戦略」を学習すること にあります。
ディープラーニングにおける学習手法
ディープラーニングは、教師あり学習・教師なし学習・強化学習のどの枠組みでも利用されることがあります。しかし、実際の応用では、以下の理由から教師あり学習が非常に多く使われていると考えられます。
- データの取り扱いが容易:正解ラベルが明確なため、モデルの訓練と評価を体系的に行いやすい
- 実際の産業応用で適したタスクが多い:画像(物体)認識、(医療)画像処理、自然言語処理(LLM)
- 実社会での課題は「入力に対して正解がある」ものが多い:診断AI(CT画像 → 病名)、翻訳システム(英語文 → 日本語文)
本ブログで教師あり学習を中心に扱う理由
機械学習を学び始めると、教師あり・教師なし・強化学習とさまざまな手法があり、すべてを理解しようとすると混乱してしまいます。しかし、実用上、最も重要なのは教師あり学習であることが多いです。
また、いずれにせよ一つをを理解すると、他の学習方法などの考え方も比較的簡単に理解できるようになります。大きな幹の部分については共通の部分が多いためです。
したがって、このブログでは まず教師あり学習をしっかり理解することを優先し、それを軸にディープラーニングの基礎を解説 していきます。
2025年1月にDeepSeekが発表され、強化学習を含んだ戦略により従来(OpenAIのChatGPT)よりもほぼ2桁小さいコストで開発ができたと話題になりました。しかしそれでも、上の理由から、教師ありのディープラーニングから学ぶのが多くの人にとってはベストだと考えます。
まとめ
- 機械学習には「教師あり学習」「教師なし学習」「強化学習」がある
- ディープラーニングでは教師あり学習が広く使われている
- 教師あり学習を理解すると、強化学習なども後で比較的簡単に理解できる
- このブログでは、教師あり学習を中心にディープラーニングの技術を解説していく
コメント