Agent Hooks Reading Guide

2026-05-17

#論文まとめ #Agent Hooks #Harness Engineering #Deterministic Control #Codex・Claude Code・Devin・Cursor

どんな記事か

この記事の中心は、エージェントを強くするには、よいプロンプトだけでなく、作業フローの決まった地点で必ず動く処理が必要だということ。モデルは計画や実装を柔軟に進められる一方で、毎回守るべきルールを忘れたり、後回しにしたりする。その部分を hook に寄せる。

hook は、SessionStart、UserPromptSubmit、PreToolUse、PostToolUse、Stop、SessionEnd のようなライフサイクルイベントに紐づく。イベントごとに matcher や filter で対象を絞り、コマンド、HTTP、MCP、LLM、subagent などの handler を実行する。

重要なのは、hook がモデルの思考を deterministic にするわけではないこと。モデルの実装方針や回復手順は揺れる。しかし、選んだライフサイクル地点で自分のコードが必ず走るため、保護パスのブロック、テスト実行、監査ログ、完了条件チェックのような部分を安定させられる。

記事には小さな checkout calculator のデモがあり、tests、generated code、protected fixture を使って、実務に近い hook の使い方を見せている。狙いは大規模フレームワークではなく、既存の scripts、tests、policy、runbook をエージェント作業へ接続することにある。

エージェント運用の実践記事である。主題は、agent workflow の特定地点に hook を差し込み、プロンプトだけでは守りきれない反復ルールを決定的に実行すること。

記事は Devin、Claude Code、Codex、Cursor のような複数環境を意識しており、demo では command handler を使う。shell script や Python script として policy を書けば、環境をまたいで再利用しやすい。

この記事の要点

第一に、hook を「モデルへの追加指示」ではなく「実行フローに入る制御点」として説明している。これにより、always、never、block、record、run、verify といった要件をプロンプトから分離できる。

第二に、SessionStart から SessionEnd までの代表的な lifecycle points を、開発者が最初に使いやすい形で整理している。開始時の文脈注入、プロンプト検査、ツール実行前ブロック、実行後検証、終了前チェック、終了時ログが一連の流れになる。

第三に、demo repo を通じて、保護パス、危険コマンド、テスト実行、品質ゲート、監査ログという実務で最初に欲しくなる hook を具体化している。

第四に、hook の価値を「目に見える出力」ではなく、避けられたミス、短くなった復旧ループ、残るログとして位置づけている。これは harness engineering の考え方に近い。

基本モデルは event、optional matcher or filter、handler、outcome の4つ。event は PreToolUse や Stop のような lifecycle moment。matcher は shell command だけ、file edit だけ、といった対象の絞り込み。handler は実際に動く処理。outcome は context、decision、log、state update など。

SessionStart では、プロジェクト規約、active constraints、環境情報、関連 runbook を読み込ませる。毎回最初に必要な context を、ユーザーやモデルの思い出しに依存せず渡す。

UserPromptSubmit では、ユーザーの依頼をモデルが見る前に検査し、追加 context を付けたり、危険な依頼をブロックしたり、適切なルートへ寄せたりする。

PreToolUse では、実行前の tool call を検査する。生成物、機密 fixture、.env、.git、repo 外パスの編集などをブロックする用途に向く。

PostToolUse では、成功した tool call のあとに検証を走らせる。Python や JSON の編集後に unittest を実行し、失敗したら品質ゲート state を残す、といった使い方ができる。

Stop では、エージェントが完了を宣言する前に、最後の quality gate が失敗していないかを見る。SessionEnd では、セッション終了理由、時刻、transcript path などを監査ログへ書く。

実務で効くこと

記事が示す実務上の効果は、エージェントの自由度を残しながら、守るべき制約を実行環境側へ移せること。モデルには実装や判断を任せ、保護パス、危険コマンド、テスト、完了条件は hook に任せる。

良い最初の hook は、明確に言える policy に対応する

protected paths、blocked commands、required tests、audit logging、repo context、completion gates は特に始めやすい。

prompt instruction は guidance に向く

一方で、毎回必ず実行する必要があるものは hook に向く。記事中の短い rule of thumb は、always、never、block、record、run、verify と言える要件なら hook 候補、というもの。

実務で効くこと

demo の構成は、小さな checkout calculator、tests、generated client code、protected fixture、hooks、runtime configs でできている。小さいが、実務の hook flow を一通り試せる。

注意点と読みどころ

hook はモデルの推論そのものを安定させるものではない。hook が安定させるのは、特定の lifecycle point で handler が走ることだけである。
導入には、event を選び、payload を見て、script を書き、失敗時の扱いを決める必要がある。プロンプトに一文足すよりは初期コストがある。
hook を増やしすぎると、作業が過度にブロックされたり、失敗原因が hook とモデルのどちらにあるのか分かりにくくなる。最初は明確な policy に絞るのがよい。
記事本文は実践ガイドであり、特定環境の hook API やイベント名の詳細は各公式ドキュメントで確認する必要がある。

読みながら見る場所

まず見るべき流れは、event → optional matcher/filter → handler → outcome。hook を大げさに捉えず、イベントに紐づいた小さな処理として読むと理解しやすい。
次に見るべきなのは、六つの lifecycle points。SessionStart、UserPromptSubmit、PreToolUse、PostToolUse、Stop、SessionEnd を、自分の作業フローのどこに対応するかで読む。
demo repo では hooks/ 配下の共通 policy logic と、.devin、.claude、.codex、.cursor の runtime config の分離を見る。環境ごとの差分を config に寄せ、policy 本体を共有する発想が使える。
コード例では、protected path block、command policy、quality gate、stop gate、session audit log を見る。最初に真似るなら、保護パスと品質ゲートが一番実用に近い。

次にやるなら

自分の repo で最初に作るなら、PreToolUse の保護パス hook と、PostToolUse のテスト実行 hook がよい。どちらも policy が明確で、失敗時の挙動も決めやすい。
おい丸運用に引くなら、brain や wiki の非公開情報を公開 HTML に入れない、記事生成後にモバイル表示を確認する、テスト失敗時に完了しない、のような既存ルールを hook 候補として棚卸しできる。
次に読むなら、Codex hooks、Claude Code hooks、Cursor hooks、Devin lifecycle hooks の各公式ドキュメントを見て、同じ policy をどの event に写せるか比較するとよい。
さらに進めるなら、hooks を単発 script として増やすだけでなく、audit log、state、quality gate、skill 改善ループと接続する。ここまで行くと、プロンプト改善ではなく harness engineering になる。

Agent Hooks Reading Guide

どんな記事か

この記事の要点

Hook の使い方

実務で効くこと

実務で効くこと

良い最初の hook は、明確に言える policy に対応する

prompt instruction は guidance に向く

実務で効くこと

注意点と読みどころ

読みながら見る場所

次にやるなら

読後Q&A

この記事の一番大事な主張は？

hook はプロンプトと何が違う？

代表的な lifecycle point は？

PreToolUse は何に使う？

PostToolUse は何に使う？

Stop hook はなぜ必要？

hook はモデルを deterministic にする？

最初に作る hook は何がよい？

おい丸運用にどう効く？

一言でいうと？