コンテンツにスキップ
LinkedInX

Level 10 実践: 複数エージェントの運用基盤を設計する

約5分

対象読者: Codex Level 10 の委任範囲と完了条件を、実際のリポジトリ作業で身につけたい方
前提知識: Level 9 を完了していること

概念・到達基準を先に確認したい方は、Codex Level 0〜10 の定義 を参照してください。

複数エージェントを増やす前に、役割分離、品質基準、コスト、停止方法を設計する必要があります。Level 10 は人を外す段階ではなく、人が統制できる基盤を作る段階です。

評価・監査・改善を含むエージェント基盤設計を完成させます。作業量の多さではなく、Level 10 の委任範囲と確認条件を再現できることが目標です。

Codex に渡す前に、目的、対象、対象外、完了条件を短く書きます。次の依頼文をプロジェクトに合わせて調整してください。

複数の Codex ワークフローを運用する基盤を設計してください。役割、最小権限、入出力、評価指標、監査証跡、コスト上限、停止条件、改善ループを表で整理してください。

確認: Codex が作業を始める前に、対象範囲と不明点を説明できれば次へ進みます。

  1. 計画、実装、レビュー、セキュリティ確認の責任と権限を分離する。
  2. 成功率、再作業率、レビュー指摘、所要時間、コストの評価方法を決める。
  3. 失敗例をルール、スキル、テストへ戻す改善ループと停止手順を設計する。

一度に範囲を広げず、各段階の差分や出力を確認してから次へ進みます。

各エージェントの責任境界が明確で、品質低下や予算超過時に停止し、結果から仕組みを改善できれば完了です。

確認結果には、実行した操作、得られた証拠、未確認事項を残します。成功したときだけでなく、途中で止めた理由も記録します。

作業を止め、差分を確認します。対象ファイルと変更禁止範囲を依頼文へ追加し、承認した範囲だけを再実行します。

「実装する」のような曖昧な条件を、ファイル、コマンド、画面、レビュー結果など観測できる条件へ置き換えます。

これで Level 0〜10 の実践は完了です。運用結果を評価し、必要なレベルだけを継続的に改善してください。

クイズ