コード修正、リポジトリ作業、SQL生成など、開発作業をするエージェントを扱う記事です。
5件の記事
AGENTS.mdのようなリポジトリガイダンスを、書いて終わりではなく、失敗プローブで穴を見つけて改善する運用資産として扱う論文。
Text-to-SQLの失敗経験を構造化されたヒント集に変換し、実行時に関連ヒントを検索してSQL生成を改善するシステム。
LLMエージェントのスキル更新を、成功ログの足し算ではなく、検証済み軌跡に基づく事後分布の更新として扱う論文。追記、分割、圧縮、退役を更新候補として見る。
コーディングエージェントの過去トレースから、次のスキルと検証タスクを作る論文。ログを読むだけで終えず、実行検証へ戻す。
コードをLLMの最終成果物ではなく、エージェントが推論、行動、状態保持、検証、協調を行うための実行基盤として捉え直すサーベイ。