メインコンテンツへスキップ
レッスン 2 / 8|10分で読めます

教師あり学習の基礎

分類と回帰の違い、訓練・検証・テストデータの分割、過学習と汎化、そして医療で重要な評価指標を理解します

このレッスンで学ぶこと

このレッスンを完了すると、分類と回帰の違い、訓練データとテストデータの役割、過学習と汎化の概念、そして精度・再現率・F値などの評価指標を理解できるようになります。


セクション1: 分類と回帰

教師あり学習のタスクは、大きく「分類」と「回帰」の2種類に分かれます。

分類(Classification)

分類は、データをあらかじめ定められたカテゴリに分けるタスクです。

医療現場での分類の例:

  • 疾患の判定:患者の症状と検査結果から、疾患の有無を予測
  • 画像診断:胸部X線画像を「正常」「肺炎」「肺がん疑い」に分類
  • リスク分類:患者を「低リスク」「中リスク」「高リスク」に分類

二値分類と多クラス分類

分類タスクには、2つのカテゴリに分ける二値分類(例:悪性/良性)と、3つ以上のカテゴリに分ける多クラス分類(例:がんのステージI〜IV)があります。医療では二値分類が多く使われますが、実際の臨床では多クラス分類が必要な場面も多くあります。

回帰(Regression)

回帰は、連続的な数値を予測するタスクです。

医療現場での回帰の例:

  • 生存期間の予測:患者データから生存期間(日数)を予測
  • 検査値の予測:現在のデータから将来の検査値(HbA1c等)を予測
  • 治療効果の定量化:治療前後の改善度合いを数値で予測

セクション2: 訓練データとテストデータ

データの分割

機械学習では、手持ちのデータを複数の部分に分割して使います。これは、モデルの「カンニング」を防ぐためです。

基本的な分割(2分割):

  • 訓練データ(Training Data):モデルを学習させるためのデータ(70〜80%)
  • テストデータ(Test Data):最終的な性能評価に使うデータ(20〜30%)

検証データの役割

実務では3分割がよく使われます:

  • 訓練データ:モデルの学習に使用
  • 検証データ(Validation Data):モデルの調整(ハイパーパラメータチューニング等)に使用
  • テストデータ:最終評価にのみ使用(調整中は一切触れない)

データリーケージに注意

テストデータの情報が訓練過程に漏れることを「データリーケージ」と呼びます。医療データでは、同一患者のデータが訓練とテストに分かれてしまう、時系列の未来のデータで過去を予測してしまう、といった形でリーケージが発生しやすいため、分割方法には特に注意が必要です。


セクション3: 過学習と汎化

過学習(Overfitting)

過学習は、モデルが訓練データに過度に適合し、新しいデータに対して性能が低下する現象です。

過学習の兆候:

  • 訓練データでの精度は非常に高い(99%以上など)
  • テストデータでの精度が大幅に低下する
  • モデルが訓練データの「ノイズ」まで覚えてしまっている

過学習を防ぐ手法:

  • 正則化:モデルの複雑さにペナルティを課す
  • 早期停止:検証データの性能が悪化し始めたら学習を止める
  • データ拡張:訓練データの量を増やす
  • ドロップアウト:学習時にランダムにニューロンを無効化する

汎化(Generalization)

汎化とは、学習したモデルが未知の新しいデータに対しても適切に予測できる能力のことです。

医療における汎化の重要性

医療AIモデルの汎化は特に重要です。ある病院のデータで訓練したモデルが、別の病院のデータでも同様に機能するか(外部バリデーション)は、臨床実装の大きな課題です。患者の人口構成、検査機器の違い、診療プロトコルの差異などが、モデルの汎化性能に影響します。


セクション4: 評価指標

分類の評価指標

精度(Accuracy): 全データのうち、正しく分類された割合。データの偏りが少ない場合に有用。

再現率(Recall / Sensitivity): 実際に陽性のもののうち、正しく陽性と予測できた割合。「見落とし」の少なさを示す。

適合率(Precision): 陽性と予測したもののうち、実際に陽性だった割合。「誤報」の少なさを示す。

F値(F1-score): 再現率と適合率の調和平均。両方のバランスを見る指標。

医療で再現率が重視される理由

がんのスクリーニングを例にとると、再現率が低い=がんを見落とす可能性が高い、ということを意味します。見落としは患者の命に関わるため、医療では一般に再現率を高く保つことが優先されます。ただし、再現率を上げると誤報(偽陽性)も増えるため、不必要な精密検査のコストとのバランスが求められます。

回帰の評価指標

平均二乗誤差(MSE): 予測値と実際の値の差の二乗の平均。外れ値に敏感。

平均絶対誤差(MAE): 予測値と実際の値の差の絶対値の平均。外れ値に頑健。

決定係数(R²): モデルがデータの分散をどの程度説明できるかを示す(0〜1、1が最良)。


まとめ

このレッスンでは、教師あり学習の基礎を学びました。

重要なポイント:

  1. 分類と回帰:分類はカテゴリ予測、回帰は連続値予測
  2. データの分割:訓練・検証・テストの3分割が実務の基本
  3. 過学習と汎化:訓練データへの過剰適合を防ぎ、未知データでの性能を高める
  4. 評価指標:タスクの目的に合った指標を選択する。医療では再現率が特に重要

明日のアクション

仮想的な疾患スクリーニングモデルを想像してください。精度90%・再現率60%のモデルAと、精度80%・再現率95%のモデルBがあるとします。がんスクリーニングにはどちらが適切か、その理由を考えてみましょう。また、健康診断での一般検査ではどうでしょうか?