Part 3: ProfilingとTraceの比較

概要#

ProfilingとTraceは、どちらもGoプログラムのパフォーマンス分析に使用されますが、異なる目的と仕組みを持っています。このページでは、それぞれの特徴と使い分けを整理します。

データ収集方式の違い#

Profiling: サンプリングベース#

graph LR
    TIME[時間軸]
    TIME --> S1[サンプル1]
    TIME --> S2[...]
    TIME --> S3[サンプル2]
    TIME --> S4[...]
    TIME --> S5[サンプル3]

    S1 --> AGG[集計]
    S3 --> AGG
    S5 --> AGG
    AGG --> RESULT[どの関数が遅いか]

方式: 一定間隔（例: 10ms）でサンプル取得
データ: 統計情報（累積値）
オーバーヘッド: 低い（1-5%）

Trace: 全イベント記録#

graph LR
    TIME[時間軸]
    TIME --> E1[goroutine生成]
    TIME --> E2[チャネル送信]
    TIME --> E3[GC開始]
    TIME --> E4[mutex lock]
    TIME --> E5[...]

    E1 --> TIMELINE[タイムライン]
    E2 --> TIMELINE
    E3 --> TIMELINE
    E4 --> TIMELINE
    E5 --> TIMELINE
    TIMELINE --> RESULT2[いつ何が起きたか]

方式: 全てのイベントを記録
データ: 時系列情報（タイムライン）
オーバーヘッド: 高い（1~2%）

比較表#

機能面の比較#

項目	Profiling (pprof)	Trace (runtime/trace)
CPU使用率	✓ 詳細に測定可能	△ 概要のみ
メモリ使用量	✓ 詳細に測定可能	✗ 測定不可
Goroutine挙動	△ 部分的	✓ 完全に可視化
タイムライン	✗ なし	✓ あり
ブロッキング	✓ 集計データ	✓ 時系列データ
GC影響	△ 間接的	✓ 直接可視化
並行処理	△ 統計のみ	✓ 詳細に追跡

運用面の比較#

項目	Profiling	Trace (Go 1.21+)
オーバーヘッド	低い（1-5%）	低い（1-2%）
ファイルサイズ	小さい（数MB）	大きい（数十～数百MB）
記録時間	長時間可能（分～時間）	長時間可能（Go 1.21+）
本番環境	常時有効化可能	常時有効化可能（Go 1.21+）
学習コスト	低い	中～高

Go 1.21以降でtraceの運用面が大幅に改善
オーバーヘッド: 10-20% → 1-2% に削減（Go 1.21+）
本番環境での利用: 問題発生時のみ → 常時有効化が可能（Go 1.21+）
Flight Recorder: 継続的にトレースを実行し、問題発生時にスナップショット取得（Go 1.25.0以降）
スケーラビリティ: 定期的な分割により、大規模トレースでもメモリ効率が向上（Go 1.22+）
参考: More powerful Go execution traces (2024)

それぞれで得られる情報#

Profilingで得られる情報#

CPU Profile#

✓ どの関数がCPU時間を消費しているか
✓ 関数ごとのCPU使用率
✓ ホットパス（よく実行されるパス）
✗ いつ実行されたか（時系列）
✗ goroutine間の関係

ユースケース:

重い計算処理の特定
ループの最適化
アルゴリズムの改善

Heap Profile#

✓ どこでメモリを割り当てているか
✓ メモリリークの検出
✓ 割り当て回数と総量
✗ いつ割り当てられたか
✗ GCの影響

ユースケース:

メモリリークの調査
アロケーション削減
GC負荷の軽減

Goroutine Profile#

✓ 現在のgoroutine数
✓ goroutineのスタックトレース
✗ goroutineの状態遷移
✗ いつ生成/終了したか

ユースケース:

goroutineリークの検出
デッドロックの調査

Block & Mutex Profile#

✓ どこでブロッキングが発生しているか
✓ ブロッキングの累積時間
✗ ブロッキングのタイミング
✗ 同時に何が起きていたか

ユースケース:

チャネルのバッファサイズ調整
mutex競合の特定

Traceで得られる情報#

View trace#

✓ goroutineの生成・実行・終了のタイムライン
✓ いつブロックされたか
✓ GCの発生タイミングと影響
✓ プロセッサ（P）の利用状況
✗ 関数ごとのCPU使用率
✗ メモリ割り当て量

ユースケース:

goroutineの状態遷移の可視化
GCのSTW（Stop-The-World）の影響確認
スケジューラの挙動確認

Task & Region#

✓ 複数goroutineにまたがる処理の追跡
✓ 各ステップの処理時間
✓ レイテンシ分布
✗ CPU/メモリ使用量

ユースケース:

リクエスト処理の可視化
パイプラインのボトルネック特定

使い分けの戦略#

ステップ1: 問題の種類を特定#

graph TD
    START[パフォーマンス問題]
    START --> Q1{何が遅い?}

    Q1 -->|CPU使用率が高い| CPU[CPU Profiling]
    Q1 -->|メモリ使用量が多い| MEM[Heap Profiling]
    Q1 -->|goroutineが増える| GOR[Goroutine Profiling]
    Q1 -->|並行処理が遅い| CONC{詳細が必要?}

    CONC -->|統計で十分| BLOCK[Block/Mutex Profiling]
    CONC -->|タイムライン必要| TRACE[Trace]

    CPU --> FIX1[最適化]
    MEM --> FIX1
    GOR --> FIX1
    BLOCK --> FIX1
    TRACE --> FIX2[並行処理の最適化]

ステップ2: 推奨ワークフロー#

graph TD
    STEP1[1.pprofでボトルネック特定]
    STEP2[2.CPU/メモリ問題なら最適化]
    STEP3[3.並行処理問題ならtraceで詳細分析]
    STEP4[4.Task/Regionで可視化]
    STEP5[5.改善後に再度pprofで検証]

    STEP1 --> STEP2
    STEP2 --> VERIFY{改善した?}
    VERIFY -->|Yes| DONE[完了]
    VERIFY -->|No| STEP3
    STEP3 --> STEP4
    STEP4 --> STEP5
    STEP5 --> VERIFY

実践的な使い分け例#

例1: CPU使用率が高い#

症状: サーバーのCPU使用率が90%

アプローチ:

CPU Profilingで重い関数を特定
関数を最適化（アルゴリズム改善、キャッシュ活用）
再度CPU Profilingで効果を検証

Traceは不要: CPUボトルネックなので、pprofで十分

例2: メモリ使用量が増加し続ける#

症状: メモリ使用量が時間とともに増加

アプローチ:

Heap Profiling（inuse_space） でメモリリークを検出
Goroutine Profilingでgoroutineリークを確認
リークしているgoroutineやオブジェクトを修正
再度プロファイリングで検証

Traceは不要: メモリ問題なので、pprofで十分

例3: リクエスト処理が遅い（並行処理あり）#

症状: 一部のリクエストが異常に遅い

アプローチ:

CPU/Heap Profilingで明らかなボトルネックがないか確認
Trace + Taskでリクエスト処理を可視化
View traceでgoroutineのブロッキングを確認
チャネルバッファ拡大、ワーカー数調整
Block/Mutex Profilingで改善効果を検証

TraceとProfilingの両方を使用: 並行処理の問題なので、詳細な可視化が必要

例4: GCの影響を確認したい#

症状: レイテンシにスパイクが発生

アプローチ:

TraceでGCのSTW（Stop-The-World）を可視化
Heap Profiling（alloc_space） でアロケーションを削減
sync.Pool、事前確保などで最適化
再度Traceでgc頻度を確認

Traceが重要: GCのタイミングと影響はtraceで直接確認

それぞれを使うべき場面#

Profilingを使うべき場面#

✓ CPUボトルネックの特定 ✓ メモリリークの検出 ✓ 関数レベルの最適化 ✓ 本番環境での継続的監視 ✓ 長時間の分析（数分～数時間）

Traceを使うべき場面#

✓ goroutineリークの詳細調査 ✓ ブロッキング原因の時系列分析 ✓ GCの影響確認 ✓ 並行処理の挙動確認 ✓ レイテンシのばらつき分析 ✓ 複数goroutineにまたがる処理の追跡

両方を使うべき場面#

✓ 並行処理の最適化（pprofで統計、traceで詳細） ✓ パフォーマンス問題の根本原因調査 ✓ 改善前後の効果測定

まとめ#

それぞれの得意分野#

ツール	得意なこと	苦手なこと
Profiling	CPU/メモリのボトルネック特定	時系列情報、goroutine挙動
Trace	並行処理の可視化、タイムライン	CPU/メモリ使用量の詳細

推奨アプローチ#

まずpprofでボトルネックを特定
CPU/メモリ問題ならpprofで最適化
並行処理問題ならtraceで詳細分析
Task/Regionでtraceをカスタマイズ
改善後に再度pprofで検証

次は本番運用のTipsで本番環境での運用を学びます。