Level 10 実践: 複数エージェントの運用基盤を設計する
約5分
対象読者: Codex Level 10 の委任範囲と完了条件を、実際のリポジトリ作業で身につけたい方
前提知識: Level 9 を完了していること
このチュートリアルについて
Section titled “このチュートリアルについて”概念・到達基準を先に確認したい方は、Codex Level 0〜10 の定義 を参照してください。
複数エージェントを増やす前に、役割分離、品質基準、コスト、停止方法を設計する必要があります。Level 10 は人を外す段階ではなく、人が統制できる基盤を作る段階です。
このレベルで完成するもの
Section titled “このレベルで完成するもの”評価・監査・改善を含むエージェント基盤設計を完成させます。作業量の多さではなく、Level 10 の委任範囲と確認条件を再現できることが目標です。
Step 1: 依頼の境界を決める
Section titled “Step 1: 依頼の境界を決める”Codex に渡す前に、目的、対象、対象外、完了条件を短く書きます。次の依頼文をプロジェクトに合わせて調整してください。
複数の Codex ワークフローを運用する基盤を設計してください。役割、最小権限、入出力、評価指標、監査証跡、コスト上限、停止条件、改善ループを表で整理してください。確認: Codex が作業を始める前に、対象範囲と不明点を説明できれば次へ進みます。
Step 2: 実践する
Section titled “Step 2: 実践する”- 計画、実装、レビュー、セキュリティ確認の責任と権限を分離する。
- 成功率、再作業率、レビュー指摘、所要時間、コストの評価方法を決める。
- 失敗例をルール、スキル、テストへ戻す改善ループと停止手順を設計する。
一度に範囲を広げず、各段階の差分や出力を確認してから次へ進みます。
Step 3: 完了条件を確認する
Section titled “Step 3: 完了条件を確認する”各エージェントの責任境界が明確で、品質低下や予算超過時に停止し、結果から仕組みを改善できれば完了です。
確認結果には、実行した操作、得られた証拠、未確認事項を残します。成功したときだけでなく、途中で止めた理由も記録します。
よくあるトラブル
Section titled “よくあるトラブル”Codex が依頼範囲を越えた
Section titled “Codex が依頼範囲を越えた”作業を止め、差分を確認します。対象ファイルと変更禁止範囲を依頼文へ追加し、承認した範囲だけを再実行します。
完了したか判断できない
Section titled “完了したか判断できない”「実装する」のような曖昧な条件を、ファイル、コマンド、画面、レビュー結果など観測できる条件へ置き換えます。
次のステップ
Section titled “次のステップ”これで Level 0〜10 の実践は完了です。運用結果を評価し、必要なレベルだけを継続的に改善してください。
クイズ