メインコンテンツへスキップ
ChatGPTで医療、どこまでいける?(実力と限界)
レッスン 1 / 4|7分で読めます

ChatGPTで医療、どこまでいける?(実力と限界)

USMLE 86.7%、日本の医師国試81.5%。数字でわかるChatGPTの実力と、絶対に気をつけるべき弱点。

このレッスンで終わる頃には

  • ChatGPTが医療で 実際どのくらい使えるか が数字で分かる
  • 絶対にやってはいけないこと が頭に入ってる

もう「可能性がある」じゃない、「実力がある」

ChatGPTの医療での実力は、もう実測済み。査読論文でガッチリ検証されてます。

医師国試の成績

試験モデル正答率
USMLE Step 1-3GPT-486.7% [1]
日本医師国試GPT-481.5% [2]
日本GM-ITE(研修医テスト)GPT-470.1%(研修医平均55.8%を超え)[3]
スペインMIR(リウマチ)GPT-493.7% [4]
メタ分析(45研究)GPT-4全体81% [5]

GPT-4は 世界中の医師国試で合格ラインを超えて ます。日本の研修医平均も上回る。


医師が実際に使ってる場面

一番多いのは 文書作成

医師の業務時間の 46%が書類仕事 というデータがある。ChatGPTの最大の価値、ここです:

  • 退院サマリー
  • 紹介状
  • 保険の事前承認レター
  • 患者説明文

実績データ

英国の研究: GPT-4が書いた退院サマリーの100%が「許容可能」 判定。ジュニアドクターが書いたものは92%。GPの60%はAIが書いたと気づかなかった [6]。

日本の恵寿総合病院: ChatGPT活用で 退院サマリーの要約時間67%削減、年間540時間節約 [7]。

もう現場で動いてる。先端じゃなく実戦フェーズ。


鑑別診断の壁打ちとしても優秀

獨協医科大学の廣澤先生の研究 [8]:

  • 52の複雑症例でGPT-4の鑑別診断精度を検証
  • 上位10候補に正解が含まれる確率: 83%
  • 医師(75%)と 統計的有意差なし

ただし トップ1の正答率は60%(医師50%)。「壁打ち相手」としては優秀、「診断を任せる」レベルじゃない。この距離感が大事です。


見逃しちゃダメな弱点、3つ

実力は確かにある。でも、丸投げしていい道具ではない。ここから先の3つを押さえれば、事故は防げます

ChatGPTの3つの弱点:ハルシネーション18%、安全確認の必要性、患者情報の取り扱い
どれか1つでも崩れると医師免許に関わる。3つセットで頭に入れる。

1. ハルシネーション率18%

眼科ボード試験での検証でGPT-4のハルシネーション率は 18% [9]。GPT-3.5は42.4%だった。

5回に1回は「もっともらしい嘘」が混ざる ってこと。確認せずに信じたらアウト。

2. 患者説明文は「読みやすくなる」けど安全確認が要る

JAMA Network Openの研究 [10]:

  • GPT-4で退院サマリーを患者向けに書き換え
  • 読解レベル Grade 11 → Grade 6.2 に下がった(理解しやすくなった)
  • でも 18%のレビューで安全上の懸念 が指摘された

読みやすくなる ≠ 正確 です。ここを混同しない。

3. 患者情報は絶対に入れない

これが一番大事

ChatGPTは 患者データを安全に処理する設計にはなっていない。症例相談したい場合は:

  • 氏名、DOB、患者ID → 除去
  • 「40代男性、高血圧、胸痛」レベルの一般化情報だけ
  • 特定につながる情報(家族構成、職業、住所)は避ける

これ守れないと、医師免許にも関わる リスクがある。マジで気をつける。

出力は必ず自分の目で

ChatGPTは「確率的にもっともらしい文章を生成する」ツール。医学的事実を検証する能力は持ってません

出力は 下書き。最終確認は医師(自分)の責任。この使い分けだけ守れば、事故は起きない。


まとめ

  • GPT-4は医師国試合格ライン超え、日本の国試81.5%、研修医超え
  • 実用価値は 文書作成(退院サマリー、紹介状、患者説明文)
  • 鑑別診断は 壁打ち相手として優秀、診断を任せるレベルではない
  • ハルシネーション18%、必ず自分の目で確認
  • 患者の個人情報は絶対に入れない(匿名化して一般化)

次は、ChatGPTの出力を劇的に良くする プロンプトの書き方。この差で使いこなしが全然変わります。


参考文献

  1. Nori H, et al. arXiv:2303.13375. 2023.
  2. Yanagita Y, et al. JMIR Formative Research. 2023.
  3. Watari T, et al. JMIR Medical Education. 2023.
  4. Madrid-Garcia A, et al. Scientific Reports. 2023.
  5. Liu M, et al. J Med Internet Res. 2024.
  6. Clough RAJ, et al. BJGP Open. 2024.
  7. 恵寿総合病院 × Ubie. note.com/ai_komon, 2024.
  8. Hirosawa T, et al. JMIR Medical Informatics. 2023.
  9. Cai LZ, et al. Am J Ophthalmol. 2023.
  10. Zaretsky J, et al. JAMA Network Open. 2024.