メインコンテンツへスキップ
研究・論文|ガイド

医学図表・データ可視化作成

医学論文向けの図表やデータ可視化の作成

Ken OkamotoKen Okamoto|2026-02-1417分で読めます
データ可視化図表作成

データ可視化・図表作成ガイド(論文用)

このガイドについて

論文に掲載する図表は、研究結果を効果的に伝える上で極めて重要です。適切なグラフや表の選択、統計的表現、Figure Legendの書き方など、論文に掲載できる高品質な図表を作成する方法を解説します。

対象読者

  • 論文執筆中の研究者
  • データ可視化の基礎を学びたい方
  • 論文の図表を改善したい方

このガイドで学べること

  1. 適切なグラフの選択: データの種類に応じた最適なグラフの選び方
  2. 統計的表現: エラーバー、信頼区間、p値の適切な表示
  3. Figure Legendの書き方: 明確で完全な凡例の作成
  4. 表の作成: 読みやすく情報量の多い表の作成
  5. AIツールの活用: 図表作成を効率化するAIツールの活用法

所要時間

  • 全体: 15-20分(読了時間)
  • 実際の作業: データの種類と図表の数による

前提知識

  • 基本的な統計の知識
  • データの種類(連続データ、カテゴリカルデータなど)

使用するツール

  • Python (Matplotlib, Seaborn): グラフ作成
  • R (ggplot2): 統計グラフ作成
  • Excel / Google Sheets: 簡単なグラフ作成
  • AIツール: グラフの選択や凡例作成の支援

更新日: 2025年12月


ステップ1: データの種類と適切なグラフの選択

このステップの目的

データの種類に応じて、最適なグラフを選択する方法を学びます。適切なグラフの選択は、データを正確に伝える上で重要です。

データの種類

連続データ

数値で測定できるデータです。

例:

  • 年齢、体重、血圧
  • 検査値、スコア

カテゴリカルデータ

カテゴリに分類されるデータです。

種類:

  • 名義尺度: 順序がない(性別、血液型)
  • 順序尺度: 順序がある(重症度、グレード)

グラフの選択ガイド

1つの連続変数

ヒストグラム:

  • データの分布を表示
  • 正規分布かどうか確認

ボックスプロット:

  • 四分位数と外れ値を表示
  • 複数群の比較

2つの連続変数

散布図:

  • 2つの変数の関係を表示
  • 相関関係の確認

回帰直線付き散布図:

  • 線形関係の可視化

1つのカテゴリカル変数

棒グラフ:

  • 各カテゴリの頻度や割合
  • 比較が容易

円グラフ:

  • 全体に占める割合
  • カテゴリが少ない場合(3-5個)

カテゴリカル × 連続

ボックスプロット:

  • 各カテゴリでの連続変数の分布
  • 複数群の比較

棒グラフ(平均値 + エラーバー):

  • 各カテゴリの平均値と標準誤差
  • 比較が明確

時系列データ

折れ線グラフ:

  • 時間経過に伴う変化
  • トレンドの可視化

AIツールを活用したグラフ選択

ChatGPT / Claude プロンプト例:

以下のデータの種類に基づいて、論文に掲載するのに最適なグラフを提案してください。

データ:
- 変数1: 年齢(連続変数、20-80歳)
- 変数2: 治療群(カテゴリカル、3群: A群、B群、C群)
- 目的: 各治療群での年齢の分布を比較したい

以下の情報を提供してください:
1. 推奨するグラフの種類
2. その理由
3. 代替案(あれば)
4. 作成時の注意点

よくある質問

Q: どのグラフが最も一般的ですか? A: 論文では、ボックスプロット、棒グラフ(平均値 + エラーバー)、散布図がよく使用されます。

Q: 円グラフは論文で使用できますか? A: 一般的には推奨されません。棒グラフの方が比較しやすいです。

次のステップ

グラフの種類が決まったら、次は統計的表現の方法を学びます。


更新日: 2025年12月


ステップ2: 統計的表現の方法

このステップの目的

グラフに統計情報を適切に表示する方法を学びます。エラーバー、信頼区間、p値などの統計的表現は、データの解釈に重要です。

エラーバーの種類

標準偏差(SD)

データのばらつきを表します。

  • 記号: ±SD
  • 用途: データの分布の幅を示す

標準誤差(SE)

平均値の推定精度を表します。

  • 記号: ±SE
  • 用途: 平均値の信頼性を示す
  • 注意: 論文ではSDの方が一般的

信頼区間(CI)

真の値が含まれる可能性が高い範囲です。

  • 記号: 95% CI
  • 用途: 効果の推定と不確実性を示す

エラーバーの表示方法

棒グラフでの表示

平均値 ± SD(またはSE)

例:

  • 血圧: 120 ± 15 mmHg
  • グラフ上ではエラーバーで表示

ボックスプロットでの表示

  • 四分位数(Q1, 中央値, Q3)
  • 外れ値
  • 必要に応じて平均値も表示

p値の表示

グラフ上での表示

  • *: p < 0.05
  • **: p < 0.01
  • ***: p < 0.001

表での表示

  • 正確なp値を記載
  • p < 0.001の場合は「<0.001」と記載

AIツールを活用した統計的表現

ChatGPT / Claude プロンプト例:

以下のデータから、論文用のグラフを作成する際の統計的表現を提案してください。

データ:
- 群A: 平均 = 120, SD = 15, n = 50
- 群B: 平均 = 135, SD = 18, n = 48
- 群C: 平均 = 110, SD = 12, n = 52
- p値: A vs B = 0.02, A vs C = 0.15, B vs C = 0.001

以下の情報を提供してください:
1. エラーバーの種類(SD/SE/CI)とその理由
2. p値の表示方法
3. グラフ上での統計的表現の推奨方法

よくある質問

Q: SDとSEのどちらを使うべきですか? A: 論文ではSDが一般的です。SEは平均値の推定精度を示すため、用途が限定的です。

Q: 信頼区間はどのように表示しますか? A: エラーバーで信頼区間を表示するか、表に数値で記載します。

次のステップ

統計的表現が理解できたら、次はFigure Legendの書き方を学びます。


更新日: 2025年12月


ステップ3: Figure Legendの書き方

このステップの目的

明確で完全なFigure Legend(図の凡例)を作成する方法を学びます。良い凡例は、図を独立して理解できるようにします。

Figure Legendの構成要素

必須要素

  1. 図の説明: 図が何を示しているか
  2. 方法の説明: データの収集方法や解析方法
  3. 記号・略語の説明: 使用した記号や略語の説明
  4. 統計情報: 使用した統計手法、p値の説明

推奨要素

  • サンプルサイズ: 各群のn数
  • 統計的検定: 使用した検定方法
  • スケール: 軸の単位やスケール

良い凡例の例

例1: ボックスプロット

Figure 1. Comparison of blood pressure among three treatment groups.
Data are presented as box plots showing median (line), interquartile range (box), 
and 1.5× interquartile range (whiskers). Outliers are shown as individual points.
Group A (n=50), Group B (n=48), Group C (n=52). 
*P &lt; 0.05, **P &lt; 0.01, ***P &lt; 0.001 (Kruskal-Wallis test with post-hoc Dunn's test).

例2: 棒グラフ

Figure 2. Mean blood pressure changes from baseline.
Data are presented as mean ± standard deviation. 
Group A (n=50), Group B (n=48), Group C (n=52).
*P &lt; 0.05 vs Group A (one-way ANOVA with post-hoc Tukey's test).

AIツールを活用した凡例作成

ChatGPT / Claude プロンプト例:

以下の情報から、論文用のFigure Legendを作成してください。

図の種類: ボックスプロット
内容: 3つの治療群(A群、B群、C群)での血圧の比較
データ: 
- A群: n=50, 中央値=120, Q1=110, Q3=130
- B群: n=48, 中央値=135, Q1=125, Q3=145
- C群: n=52, 中央値=110, Q1=100, Q3=120
統計検定: Kruskal-Wallis検定、事後検定はDunn検定
p値: A vs B = 0.02, A vs C = 0.15, B vs C = 0.001

ジャーナルのスタイルに準拠した、明確で完全な凡例を作成してください。

よくある質問

Q: 凡例はどのくらいの長さが適切ですか? A: 通常は50-150語程度です。図を独立して理解できる程度の情報を含めます。

Q: 略語は凡例で説明する必要がありますか? A: はい。論文で初めて使用する略語は、凡例または本文で説明する必要があります。

次のステップ

凡例の書き方が理解できたら、次は表の作成方法を学びます。


更新日: 2025年12月


ステップ4: 表の作成方法

このステップの目的

読みやすく、情報量の多い表を作成する方法を学びます。適切な表は、データを効率的に伝えます。

表の基本構造

必須要素

  1. タイトル: 表の内容を明確に示す
  2. 列見出し: 各列の内容を明確に
  3. 行見出し: 各行の内容を明確に
  4. データ: 適切な精度で表示
  5. 脚注: 統計情報、略語の説明

表の種類

記述統計表

対象者の特性やベースライン情報を表示。

例: 対象者の特性

  • 年齢、性別、BMI、既往歴など
  • 各群での比較

結果表

研究結果を表示。

例: 治療効果の比較

  • 各群でのアウトカム
  • 効果量、信頼区間、p値

表作成のベストプラクティス

1. 情報の優先順位

重要な情報を上部に配置します。

  • 主要な結果を最初の列に
  • 補足情報は後の列に

2. 数値の精度

適切な小数点以下桁数を選択します。

  • 通常: 1-2桁
  • 統計量: 2-3桁
  • p値: 3桁(または<0.001)

3. 統計情報の表示

  • 平均値 ± SD(または中央値 [IQR])
  • 効果量と信頼区間
  • p値

AIツールを活用した表作成

ChatGPT / Claude プロンプト例:

以下のデータから、論文用の表を作成してください。

データ:
対象者の特性
- 年齢: A群 55.2±12.3歳, B群 57.1±11.8歳, C群 54.9±13.1歳
- 男性: A群 60%, B群 58%, C群 62%
- BMI: A群 25.3±4.2, B群 26.1±4.5, C群 24.9±4.1
- p値: すべて>0.05

治療効果
- 血圧変化: A群 -10.2±5.3, B群 -15.1±6.2, C群 -8.9±4.8
- p値: A vs B = 0.02, A vs C = 0.15, B vs C = 0.001

ジャーナルのスタイルに準拠した、読みやすい表を作成してください。

よくある質問

Q: 表はいくつまで掲載できますか? A: ジャーナルによって異なりますが、通常は3-5個程度です。重要な情報のみを表にします。

Q: 表とグラフのどちらを使うべきですか? A: 数値の正確な比較が必要な場合は表、視覚的な比較やトレンドの表示にはグラフが適しています。

次のステップ

表の作成方法が理解できたら、次は実践的なワークフローを学びます。


更新日: 2025年12月


ステップ5: 実践的なワークフロー

このステップの目的

データ可視化と図表作成の実践的なワークフローを学び、論文に掲載できる高品質な図表を効率的に作成します。

ワークフローの概要

ステップ1: データの準備

  • データのクリーニング
  • 必要な変数の選択
  • データの形式の統一

ステップ2: グラフの選択

  • データの種類を確認
  • 適切なグラフを選択
  • AIツールで確認(必要に応じて)

ステップ3: グラフの作成

  • Python/R/Excelで作成
  • 統計情報を追加
  • スタイルを調整

ステップ4: 凡例の作成

  • 図の説明を記載
  • 方法と統計情報を記載
  • AIツールで確認(必要に応じて)

ステップ5: 最終確認

  • データの正確性を確認
  • 統計的表現が適切か確認
  • ジャーナルのガイドラインに準拠しているか確認

AIツールを活用した効率化

グラフ作成の支援

ChatGPT / Claude プロンプト例:

以下のデータから、論文用のグラフを作成するPythonコードを生成してください。

データ:
- 群A: [120, 125, 118, 122, 130, ...] (n=50)
- 群B: [135, 140, 132, 138, 145, ...] (n=48)
- 群C: [110, 115, 108, 112, 118, ...] (n=52)

要件:
- ボックスプロットで表示
- 統計的検定の結果を表示(p値)
- 論文に掲載できる高品質なスタイル
- MatplotlibまたはSeabornを使用

コードと説明を提供してください。

凡例作成の支援

プロンプト例:

以下のグラフの凡例を作成してください。

グラフの種類: ボックスプロット
内容: [グラフの内容]
データ: [データの説明]
統計検定: [使用した検定]
p値: [p値の情報]

ジャーナルのスタイルに準拠した凡例を作成してください。

よくあるミスと対策

ミス1: エラーバーの種類が不適切

対策: SDとSEの違いを理解し、適切なものを選択

ミス2: 凡例が不十分

対策: 図を独立して理解できる程度の情報を含める

ミス3: 統計情報が不足

対策: サンプルサイズ、統計検定、p値を明記

まとめ

データ可視化と図表作成は、論文の質に直接影響します。適切なグラフの選択、統計的表現、明確な凡例により、研究結果を効果的に伝えることができます。AIツールを活用することで、効率化しながら高品質な図表を作成できます。

参考資料

  • Nature Guide to Figures: 高品質な図表作成のガイドライン
  • CBE Style Manual: 科学論文のスタイルガイド
  • ggplot2 Documentation: Rでのグラフ作成

更新日: 2025年12月

コメント