AIの分類:シンボルかパターンか

2025年の秋ごろから、Claude Codeというツールを使い始めた。
「ファイルを読んで、バグを直して、テストを書いておいて」と頼むと、AIがターミナルでコマンドを打ち、コードを書き換え、確認してまた別のファイルを開く。画面を見ながら、ふと思った。これは識別AIなのか、生成AIなのか、それとも全く別の何かなのか。
「AIの種類」という分類体系を知っていたはずなのに、目の前で動いているものが、既存のどの箱にも収まらない気がした。
分類を学ぶのは、箱に入れるためではない。「このAIは何をブラックボックスにしているか」「規制でどう扱われるか」という実践的な問いを立てるための地図を持つためだ。その地図が、目の前の技術に追いつかなくなっているとき、地図のどこを書き直せばいいかを知るためでもある。
1. なぜ分類が重要か
分類は知識の整理術ではない。問いを立てるための道具だ。
「このAIは説明できるか」という問いが、規制の話と直結する。EU AI Act(Regulation 2024/1689、2024年8月1日発効)は医療AIを「高リスク」分類に位置づけ、透明性と説明可能性を義務づけた。移行期間は2027年8月2日まで。つまり数年以内に、医療現場で使うAIは「なぜその判断をしたか」を説明できなければ、規制に引っかかる可能性が生じる。
説明できるAIとできないAIを区別する最初の問いが、分類体系にある。
もう一つの問いは「このAIはどんな条件で失敗するか」だ(L01参照)。ルールで動くAIと、パターンで動くAIでは、失敗の仕方が根本的に異なる。前者はルールに書かれていないケースで止まり、後者は訓練データと分布が離れたケースで静かに間違える。患者安全の設計に、この違いは直接関係する。
問い: あなたが使っているAIは、どの部分が見えていないか
医療現場のAIに「なぜそう判断したのか」と問えるか。
問えるなら、それはシンボリスト的な構造(ルール・フローチャート)を持つ可能性が高い。問えないなら、コネクショニスト的な分散表現がブラックボックスになっている。どちらが優れているかではなく、「自分が使うAIの何が見えていないか」を知ることが出発点になる。

2. 世代別分類:ルール、統計、そしてパターン
AIの歴史を振り返ると(L02参照)、技術的アプローチは大きく3世代に整理できる。
第1世代はルールベースAI(エキスパートシステム)だ。人間が「if A then B」のルールを明示的に書き込む。MYCINは約600のルールで細菌性感染症の起因菌を特定し、感染症専門医と同等の推薦率(適切な薬剤選択の合致率 65%)を達成した(Buchanan & Shortliffe, 1984)。
長所は説明可能性の高さだ。「なぜこの抗菌薬を選んだか」を、ルールをたどることで説明できる。短所は知識獲得のボトルネックだ。新しい知見が出るたびに、専門家が手作業でルールを追加しなければならない。「暗黙知」はルールに落とせない。
第2世代は機械学習だ。ルールを人間が書くのではなく、データからパターンを学習する。ロジスティック回帰、決定木、サポートベクターマシンがここに入る。特徴量の設計は依然として人間が行う。
第3世代は深層学習だ。多層のニューラルネットワークが、特徴量の抽出自体を自動化する。2012年のAlexNetがImageNetのエラー率を15.3%に下げたとき(2位の26.2%から10.9ポイント改善、Krizhevsky et al., 2012)、この方法論の有効性が実証的に示された。EndoBRAIN(大腸内視鏡ポリープ鑑別)やEIRL(脳動脈瘤検出)はここに位置づく。
| 世代 | 代表技術 | 知識の在処 | 説明可能性 | 医療AI例 |
|---|---|---|---|---|
| 第1世代 | ルールベース | ルール(人間が記述) | 高 | MYCIN |
| 第2世代 | 機械学習 | モデルパラメータ(特徴は人間設計) | 中 | 予後予測モデル |
| 第3世代 | 深層学習 | 分散した重みの中 | 低(ブラックボックス) | EndoBRAIN、EIRL |
MYCINの包括的評価。「適切な薬剤選択の合致率」65%が示された基準文書。PMC掲載関連資料あり。

3. シンボリスト vs コネクショニスト:論争の核心
L02の歴史編で触れたように、ルールベースAI(シンボリスト)とニューラルネットワーク(コネクショニスト)の対立は、1980年代から続く知的論争だ。
この対立を理解するには、2つの問いを立てるとよい。「知識はどこに宿るか」、そして「なぜ失敗するか」だ。
テーゼ側はシンボリストの立場、つまり「知能は記号操作」だと考える。
1975年、Allen NewellとHerbert Simonはチューリング賞講演で「物理記号システム仮説(PSSH)」を提唱した。「知的行動に必要かつ十分な手段は、物理的記号システムである」(Newell & Simon, 1975, CACM, 19(3))。
記号として知識を表現し、規則によって操作する。診断フローチャートはその典型だ。「発熱があるか」「培養結果はグラム陽性か」という問いを順番に処理し、最終判断に至る。各ステップの根拠が問えるため、EU AI Actが要求する「説明可能性」と本来的に親和性が高い。
アンチテーゼ側はコネクショニストの立場、つまり「知能は分散パターン」だと考える。
コネクショニストの立場では、知識はユニット間の接続強度として分散して格納されており、局在する記号ではない。LeCun、Bengio、HintonはこのアプローチでAlexNetを生み出し、2018年にチューリング賞を受賞した(LeCun, Bengio & Hinton, 2015, Nature, DOI:10.1038/nature14539)。
シンボリストの根本的な障壁として、記号接地問題(Symbol Grounding Problem)がある。「赤」という記号が「赤という色の感覚」と対応するのはなぜか。記号の意味は記号の内側では説明できない。外の世界との接続が必要だが、ルールベースのシステムはこの接続を本質的に説明できない。
2012年のAlexNetが10.9ポイントの圧倒的改善を示したことは、シンボリスト的アプローチの知識獲得ボトルネックに対して、コネクショニスト的アプローチが実証的に優位であることを示した歴史的転換点だった。
シンボリスト vs コネクショニスト:2つのトレードオフ
テーゼ(シンボリスト)の側は、知識を記号とルールとして明示化する。「なぜその判断をしたか」を問えるため、説明可能性が高い。EU AI Actが医療AIに求める透明性要求と親和性がある。弱点は、記号接地問題と、知識獲得のボトルネック(専門家がルールを書き続けなければならない)だ。
アンチテーゼ(コネクショニスト)の側は、知識を分散した接続強度として格納する。AlexNet以降の深層学習が実証した通り、大規模データから人間が定義できないパターンを抽出できる。2018年チューリング賞がこのアプローチの認定だ。弱点は、ブラックボックス性、訓練分布外での系統的失敗、記号接地問題への自らの回答が不明確であることだ。
論争の射程は「説明可能性」と「表現力」のトレードオフに集約できる。説明できるモデルは表現力が低く、表現力が高いモデルは説明が難しい。医療AIの設計では、このトレードオフに明示的に向き合う必要がある。
AlexNet vs MYCINの「失敗パターン」比較
2012年のAlexNet登場で、コネクショニスト的アプローチがシンボリスト的アプローチを性能面で圧倒することが示された。
仕組みは対照的だ。MYCIN(ルールベース)は専門家が書いたルールで推論する。AlexNet(深層学習)は訓練データから特徴を自動抽出する。
意義として、AlexNetはImageNet ILSVRC 2012でtop-5 error 15.3%を達成し、2位の26.2%を10.9ポイント下回った(Krizhevsky et al., 2012)。特徴量の定義を人間が行う必要がなくなった、というのが画期的な点だった。
失敗パターンは非対称だ。MYCINの失敗は「ルールにないケース」で明示的に止まる。AlexNetの失敗は「訓練データと分布が離れた画像」で静かに誤答を返す。前者は「わからない」と言えるが、後者は「わからない」と言わず確信ありげに間違える可能性がある。
現代では、EndoBRAINのような医療用深層学習AIは、コネクショニスト的アプローチの恩恵を受ける一方、「なぜその所見を検出したか」の説明は依然として難しい。2026年4月時点で、EU AI Actへの対応として説明可能AIの研究が加速している。
物理記号システム仮説(PSSH)のチューリング賞講演。「記号操作が知的行動の必要十分条件」というシンボリスト立場の根幹。
2018年チューリング賞受賞者3名による深層学習の総説。DOI:10.1038/nature14539 コネクショニスト的アプローチの包括的概観。

4. 学習方法の3分類:どのデータで、どう学ぶか
アプローチの違いとは別に、「どのデータで学ぶか」という観点から3つの学習パラダイムがある。
教師あり学習(Supervised Learning)は、正解ラベル付きデータから学習する方式だ。「この内視鏡画像はポリープあり(ラベル)」「この胸部CTは正常(ラベル)」というペアを大量に学習し、新しい画像に対してラベルを予測する。現在の医療AIの大部分がここに属する。
評価指標は臨床文脈と切り離せない。
- 感度(Sensitivity):本当に疾患がある人のうち、AIが正しく検出した割合。スクリーニング(見落としを最小化したい場面)で重要。
- 特異度(Specificity):本当に疾患がない人のうち、AIが正しく「疾患なし」と判定した割合。確定診断前の絞り込みで重要。
- PPV(陽性適中率、Positive Predictive Value):AIが「陽性」と判定した人のうち、本当に疾患がある割合。有病率が低い集団(稀少疾患のスクリーニング)では、感度が高くても PPV は低くなる。
- AUC-ROC:モデルが陽性と陰性を区別する総合的な能力を0〜1で示す。1が完璧、0.5がランダムと同等。
臨床で注意が必要なのは、論文に示された性能は「その研究の患者集団で」の数字である、という点だ。自施設の患者集団が訓練データと分布が異なれば、公表性能はそのまま適用できない(L04でさらに詳しく扱う)。
教師なし学習(Unsupervised Learning)は、正解ラベルなしで、データの構造や類似性を発見する方式だ。糖尿病患者のサブタイプ発見、遺伝子発現パターンのクラスタリングなどがここに入る。
強化学習(Reinforcement Learning)は、試行錯誤を通じて、報酬を最大化する行動を学習する方式だ。AlphaGoはプロ棋士の棋譜で教師あり学習した後、自己対局による強化学習で能力を飛躍的に向上させた(Silver et al., 2016, Nature, DOI:10.1038/nature16961)。医療では放射線治療計画の最適化など、連続的な意思決定が必要な場面に応用が進む。また、LLM(大規模言語モデル)の品質改善に使われるRLHF(人間のフィードバックによる強化学習)もここに含まれる。

5. 出力の3分類:識別、生成、そしてエージェント
AIの出力形式から分類する軸がある。この分類は、「何ができるか」の実践的理解に直結する。
識別AI(Discriminative AI)は、入力を「AかBか」に分類する。与えられた画像が「ポリープあり/なし」、ECGが「心房細動あり/なし」。出力は判定結果とその確率になる。
2026年4月時点で日本でPMDA承認を受けた医療AI(EndoBRAIN、EIRL aneurysm、nodoca)は、2024年前半時点では大部分が識別AIだ。なお、2025〜2026年にかけて生成AIベースの医療支援ツールもFDAの評価対象に入り始めており、「承認AIはすべて識別AI」という記述は更新が必要な状況になりつつある。
生成AI(Generative AI)は、新しいコンテンツを生成する。テキスト、画像、音声、コード。医療現場では、退院サマリーの下書き作成、医療記録からの臨床レポート生成、患者向け説明文書の作成が2024〜2025年に実用化が加速した。
Transformerアーキテクチャ(Vaswani et al., 2017, arXiv:1706.03762)が現在の主要言語モデルの基盤だ。GPT系列、Claude、Gemini、LLaMA、DeepSeek、いずれもここに端を発する。
エージェントAI(Agentic AI)は、識別(知覚)と生成(出力)を組み合わせ、さらに計画・行動・フィードバックのループを自律的に回す。「タスクを与えられたら、必要な操作を自分で順序立てて実行する」というモードだ。
Claude Code(Anthropic、2025年2月)はSWE-bench Proで64.3%(Opus 4.7搭載時)を達成し、ファイル読み書き・コマンド実行・コードレビューを連続実行する。OpenAI Operatorはウェブブラウザを操作して予約・フォーム記入を自律的に行う。Cognition LabsのDevinは自律的なコードベース修正を目指して開発されている。
医療に引き寄せると、三段階の展開シナリオが見えてくる。
医療AIの三段階導入シナリオ
段階1は識別AIだ。画像AIが内視鏡動画を処理し「ポリープあり、部位X」と分類する。医師が確認し、切除するかどうかを判断する。EndoBRAINはここにある。
段階2は生成AIだ。所見情報をもとにAIが放射線科レポートのドラフトを生成する。医師が確認・修正し、最終レポートとして承認する。退院サマリーの自動生成もここに入る。
段階3はエージェントAIだ。AIが画像の所見検出(識別)→レポートドラフト生成(生成)→紹介状の下書き作成→予約システムへの登録要求まで、連続して自律実行する。医師はレビューと最終承認を行う役割に特化する。
2026年4月時点、日本の医療現場では段階1と段階2の移行期にある。段階3は倫理・法的責任・説明可能性の課題から、段階的かつ慎重に進む。
エージェントAIの医療普及における最大の課題は、技術的問題と倫理・法的問題の両方にまたがっている。技術面では、複数ステップの実行でエラーが蓄積・伝播するリスクがある。倫理面では、「誰がどのステップの責任を負うか」が不明確になる。この問いに社会が答えを持つまで、段階的な導入が現実的な経路だ(MYCINが技術的には十分でも採用されなかった歴史がここに重なる。L02参照)。
Transformerアーキテクチャの原論文。GPT・BERT・Claude・Gemini全ての基盤。arXiv:1706.03762。2025年時点で被引用数173,000件超。

6. 基盤モデル:「識別か生成か」を超えた第3の軸
「識別AIか生成AIか」という二分法が機能しなくなりつつある。その理由が基盤モデル(Foundation Model)の登場だ。
基盤モデルとは、膨大なデータで汎用的に事前学習し、多様なタスクに適応(ファインチューニング)できる大規模モデルを指す。
BERT(Google、2018年)はテキストの双方向理解のために事前学習されたが、文書分類・固有表現抽出・質問応答など多様なタスクで活用される。GPT-5(OpenAI)は推論と生成を自動で切り替える。SAM(Segment Anything Model、Meta)は画像のあらゆるセグメンテーションを汎用的に行う。CLIPはテキストと画像を共通の空間で表現し、「テキストによる画像検索」を可能にした。PanDerm(Nature Medicine、2025年、DOI: 10.1038/s41591-025-03747-y)は11施設・4モダリティ・200万枚で事前学習された皮膚科特化の基盤モデルだ。
基盤モデルが「識別か生成か」の二分法を崩す理由は3つある。
1つ目、同一のモデルが識別タスク(「この画像は何か」)と生成タスク(「この画像の説明を書いてほしい」)の両方をこなす。どちらかに分類できない。
2つ目、基盤モデルは汎用的に学習した後、医療特化のデータでファインチューニングされる。「医療AI」という箱に入れる前に、すでに汎用的な知識が埋め込まれている。
3つ目、同一のモデルが使い方によってエージェント的にも機能する。入力・処理・出力という単純な分類が当てはまらなくなる。
ジンテーゼ:ニューロシンボリックとシステム2近似
シンボリスト(説明可能性)とコネクショニスト(表現力)の対立に対して、2つの統合の方向性が見えてきた。
ひとつはニューロシンボリックAIで、深層学習(コネクショニスト)と記号的推論(シンボリスト)を組み合わせる方向だ。診断フローチャート(記号的)と画像読影(分散パターン)の統合が医療AIの理想形として論じられる(Garcez & Lamb, 2023, Artificial Intelligence Review, 56, 12387–12406)。
もうひとつはChain-of-Thought(CoT)とシステム2近似の方向だ。Kahnemanの「ファスト&スロー」(Thinking, Fast and Slow, 2011)は人間の認知を「システム1(速い・直感的)」と「システム2(遅い・論理的)」に区分した。深層学習はシステム1的だ。しかしOpenAI o1/o3のChain-of-Thoughtは、推論ステップを明示的に生成することでシステム2に近似する。これはシンボリスト的な逐次推論をニューラルネット上に実装する試みとも見なせる。
「どちらの立場が正しいか」ではなく、「どのタスクにどちらの特性が必要か」を問うことが、2026年時点の実践的アプローチだ。
「第1の波=シンボリスト」「第2の波=コネクショニスト」「第3の波=ニューロシンボリック統合」の整理。医療AIへの含意も論じる。
システム1(速い・直感的)とシステム2(遅い・論理的)の二重過程理論。Chain-of-Thoughtがシステム2近似であるという解釈の参照基盤。

7. EU AI Act との接点:分類は規制に直結する
分類の議論が抽象的に感じられるなら、規制の文脈に置くと具体性が増す。
EU AI Act(Regulation 2024/1689)は2024年8月1日に発効した。医療機器(MDR Class IIa/IIb/III)に組み込まれたAIは「高リスク」に分類され、次の要件が課せられる。適切なデータ品質、技術文書化、ログの保持、透明性と情報提供、人間による監視、堅牢性とサイバーセキュリティ。移行期間は2027年8月2日まで。
この中で「透明性」と「人間による監視」は、シンボリスト的な説明可能性を実質的に要求している。「なぜそう判断したか」を問えないブラックボックスモデルは、高リスク分類での認証が困難になる可能性がある。
ここで分類が実践的意味を持つ。
- シンボリスト的なルールベースAI(MYCIN型):判断根拠をルールとして示せる。説明可能性は高い。
- コネクショニスト的な深層学習AI(EndoBRAIN型):ブラックボックス性が高い。XAI(説明可能AI)技術(Grad-CAMなど)で可視化を試みるが、「正しい場所を見ている」ことが「正しい理由で判断した」ことを保証するわけではない点に留意が必要だ。
- 基盤モデル派生(ファインチューンAI):汎用モデルを医療特化でチューニングしたもの。訓練データの透明性が問われる。
EU AI Actへの準拠は日本企業にも無関係ではない。EU市場での販売・使用を意図するなら直接適用され、日本国内でも「グローバルスタンダード」として参照されるケースが増えつつある。
2024年8月1日発効。医療機器組み込みAIは「高リスク」、移行期間2027年8月2日まで。説明可能性・人間監視・データ品質を義務化。

8. 臨床的帰結:エラーパターンの非対称性と小児科医の視点
分類の知識は、エラーの予測に使える。
シンボリスト的AIのエラーパターンは、ルールに定義されていないケースで止まる、または誤答する形をとる。新しい病原体(ルール更新前)、ルールの設計者が想定しなかった合併症のパターンが典型だ。
コネクショニスト的AIのエラーパターンは、訓練データと分布が離れたケースで、静かに間違える形をとる。稀少疾患、データ収集されていない患者集団、学習時にラベルが誤りだったパターンの繰り返しが典型だ。
両者に共通するのは「系統的な失敗」だ。ランダムに間違えるのではなく、特定の条件で間違える。その条件を知ることが、AIと医師の役割分担の設計につながる。
小児科医として一点加えておきたい。
現在の医療AIエビデンスの大部分は成人患者を対象に構築されている。EndoBRAINもEIRL aneurysm も、主要な訓練データは成人だ。公開医療画像データセットでは、小児データが全体の1%未満という推計がある。コネクショニスト的なAIは「訓練データの分布を学ぶ」ため、小児データが薄い状況では、成人で正確なモデルが小児に適用されたとき何が起きるかが予測しにくい。「このAIは小児データで検証されているか」という問いは、分類の知識が実践に落ちる具体的な問いだ。これはL06で詳しく扱う。
ここまでの整理:わかっていること、わかっていないこと
AIの分類を学んだ。ルールベースか深層学習か、識別か生成かエージェントか、基盤モデルか。この地図を持つことで、目の前のAIに「何をブラックボックスにしているか」「規制でどう扱われるか」を問えるようになる。
2026年4月時点でわかっていることと、わかっていないことを整理しておく。
わかっていること
- シンボリスト(説明可能性が高い)とコネクショニスト(表現力が高い)はトレードオフの関係にある
- 記号接地問題はシンボリスト的アプローチの根本的障壁として依然として未解決だ
- EU AI Actは医療AIを「高リスク」に分類し、2027年8月2日までの移行期間を設けた
- 基盤モデルの登場で「識別か生成か」の二分法は機能不全に陥りつつある
- エージェントAI(Claude Code、OpenAI Operator等)は医療分野でも段階的な導入が始まっているが、法的責任の所在は未整備だ
わかっていないこと
- ニューロシンボリック統合がどの程度まで「説明可能性」と「表現力」のトレードオフを解消できるか(2026年4月時点で研究段階)
- EU AI Actの「説明可能性要求」が、深層学習ベースの医療AIに対して実際にどう適用されるか(ガイドラインの詳細は策定中)
- エージェントAIの複数ステップ実行で生じるエラーの累積を、現行の品質保証フレームワークでどう扱うか
- Chain-of-Thought(システム2近似)が医療推論の品質をどの程度改善するか(進行中の研究領域)
「分類できれば理解できた」わけではない。分類は「どこを問うべきか」の地図だ。L04では、この分類の中核にある機械学習の仕組みをデータと評価指標の側面から掘り下げる。
ㅤ
今日のまとめ
3行で振り返ります。
- AIは複数の軸で分類できる——シンボル/パターン、識別/生成/エージェント、教師あり/なし/強化、世代別。1つの軸だけでは捉えきれない
- 基盤モデルが古典的な分類を崩している。1つのモデルが識別も生成もエージェントもこなす時代に、分類は「リスクと用途」の方が実用的になった
- EU AI Actは「リスク階層」で規制する。医療AIは高リスク区分。分類を理解することは、規制と臨床的責任を理解することと直結する
ㅤ
次のレッスンへ
L04「機械学習の基礎」では、分類の中核にある機械学習の仕組みを、訓練データ・損失関数・評価指標の3軸で掘り下げる。
ㅤ
明日のアクション
自施設で使用中または検討中のAIを以下の3軸で分類してみる。
分類してみる3軸:
- シンボリスト的(説明可能):ルールやフローチャートで判断根拠を示せるか
- コネクショニスト的(ブラックボックス):深層学習ベースで判断根拠が分散しているか
- 基盤モデル派生(ファインチューン):汎用モデルを医療特化でチューニングしたものか
さらに問う3点:
- EU AI Actの「高リスク」分類に該当するか(医療機器組み込みの場合)
- 「なぜその判断をしたか」を、患者や他の医師に説明できるか
- 訓練データに自施設の患者集団(年齢層・疾患スペクトラム)が含まれているか
小児科医・小児科に関わる読者向け:使用中または検討中のAIについて「小児データで検証されているか」を確認してみる。製品説明書・承認申請書類・原著論文の「患者集団(Methods)」を見て、小児が含まれているか、年齢範囲が明記されているかを確認する。「成人で承認されたAIをそのまま小児に使っているか」を意識することが、分類の知識が安全に直結する実践例だ。
参考文献
- Newell, A. & Simon, H.A. (1975). Computer science as empirical inquiry: Symbols and search. Communications of the ACM, 19(3), 113–126.
- Buchanan, B.G. & Shortliffe, E.H. (1984). Rule-Based Expert Systems: The MYCIN Experiments. Addison-Wesley.
- Rumelhart, D.E. & McClelland, J.L. (Eds.). (1986). Parallel Distributed Processing. MIT Press.
- Krizhevsky, A., Sutskever, I., & Hinton, G.E. (2012). ImageNet classification with deep convolutional neural networks. NeurIPS, 25. DOI: 10.5555/2999134.2999257
- Silver, D., Huang, A., Maddison, C.J., et al. (2016). Mastering the game of Go with deep neural networks and tree search. Nature, 529(7587), 484–489. DOI: 10.1038/nature16961. PMID: 26819042
- Vaswani, A., Shazeer, N., Parmar, N., et al. (2017). Attention is all you need. NeurIPS, 30. arXiv:1706.03762
- Kahneman, D. (2011). Thinking, Fast and Slow. Farrar, Straus and Giroux.
- LeCun, Y., Bengio, Y. & Hinton, G. (2015). Deep learning. Nature, 521, 436–444. DOI: 10.1038/nature14539
- Garcez, A. & Lamb, L. (2023). Neurosymbolic AI: the 3rd wave. Artificial Intelligence Review, 56, 12387–12406.
- Regulation (EU) 2024/1689 [EU AI Act]. (2024). https://artificialintelligenceact.eu/
- アイリス株式会社. (2022). nodoca 承認番号 30400BZX00101000. https://prtimes.jp/main/html/rd/p/000000015.000035813.html
- OpenAI. (2024). Learning to reason with LLMs (o1 technical report). https://openai.com/index/openai-o1-system-card/