論文まとめ

公開している論文解説記事をまとめて読む入口です。

エージェント記憶 15 エージェントスキル 14 エージェントハーネス 13 エージェント型検索 8 自己進化エージェント 8 システム 7

46件の記事

Managing Procedural Memory in LLM Agents: Control, Adaptation, and Evaluation のサムネイル

論文まとめ

2026-06-23

Managing Procedural Memory in LLM Agents: Control, Adaptation, and Evaluation

AIエージェントの経験を、同じ場面だけでなく別タスクや別モデルにも移せる手続き記憶として測る論文。

論文まとめエージェント記憶エージェントスキル

Probe-and-Refine Tuning of Repository Guidance for Coding Agents のサムネイル

論文まとめ

2026-06-21 2026-06-23

Probe-and-Refine Tuning of Repository Guidance for Coding Agents

AGENTS.mdのようなリポジトリガイダンスを、書いて終わりではなく、失敗プローブで穴を見つけて改善する運用資産として扱う論文。

論文まとめコーディングエージェントエージェントスキル

論文まとめ

2026-06-19 2026-06-23

Multi-Agent Transactive Memory

LLMエージェントが実行中に生んだ行動軌跡を、別のエージェントが検索して再利用できる共有記憶として扱う論文。

論文まとめエージェント記憶エージェントハーネス

論文まとめ

2026-06-19 2026-06-23

Ctx2Skill

長い文脈や複雑なルールから、あとで再利用できる自然言語スキルを作れるかを扱う論文。課題生成、回答、採点、更新を回してスキル化を試す。

論文まとめエージェントスキル自己進化エージェント

Externalizing Research Synthesis and Validation in AI Scientists through a Research Harness のサムネイル

論文まとめ

2026-06-18 2026-06-23

Externalizing Research Synthesis and Validation in AI Scientists through a Research Harness

AI科学者の研究過程をモデル内部に閉じず、証拠、アイデア、実験、修復、主張監査を外部成果物として残す論文。

論文まとめ調査エージェントエージェントハーネス

AgenticRAG: Agentic Retrieval for Enterprise Knowledge Bases のサムネイル

論文まとめ

2026-06-17 2026-06-23

AgenticRAG: Agentic Retrieval for Enterprise Knowledge Bases

企業ナレッジベースの上で、LLMが検索、閲覧、要約を使い分けるエージェント型RAGの論文。固定検索だけでは届かない質問に、どこまで自律探索を足すべきかを見る。

論文まとめエージェント型検索RAG

A Framework for Evaluating Agentic Skills at Scale のサムネイル

論文まとめ

2026-06-17 2026-06-23

A Framework for Evaluating Agentic Skills at Scale

エージェントスキルやSKILL.mdのような手順書が、本当に行動と成果を変えているかを測る評価フレームワーク。代表タスク、隠し評価基準、スキルあり/なし比較で効き方を見る。

論文まとめエージェントスキル評価

TokenPilot: Cache-Efficient Context Management for LLM Agents のサムネイル

論文まとめ

2026-06-16 2026-06-23

TokenPilot: Cache-Efficient Context Management for LLM Agents

長期LLMエージェントの文脈管理を、削るだけでなく、プロンプトキャッシュが効く入力配置として安定させる論文。

論文まとめエージェントハーネスシステム

HarnessX: A Composable, Adaptive, and Evolvable Agent Harness Foundry のサムネイル

論文まとめ

2026-06-15 2026-06-23

HarnessX: A Composable, Adaptive, and Evolvable Agent Harness Foundry

エージェントの性能をモデル単体ではなく、プロンプト、ツール、記憶、制御からなるハーネスの設計・適応・進化問題として扱う論文。

論文まとめエージェントハーネス自己進化エージェント

Agents-K1: Towards Agent-native Knowledge Orchestration のサムネイル

論文まとめ

2026-06-14 2026-06-23

Agents-K1: Towards Agent-native Knowledge Orchestration

研究エージェントに渡す知識を、論文リストや要約ではなく、主張・証拠・手法のつながりとして構築する論文。調査の出典、系譜、根拠をエージェントが辿れる形にする。

論文まとめ調査エージェントシステム

論文まとめ

2026-06-13 2026-06-23

Recursive Agent Harnesses

長大なコーパスを扱う時に、サブエージェントを再帰的に呼び出すハーネス設計を扱う論文。裸のモデル呼び出しではなく、実行基盤ごと分割する。

論文まとめエージェントハーネス自己進化エージェント

EvoArena: Tracking Memory Evolution for Robust LLM Agents in Dynamic Environments のサムネイル

論文まとめ

2026-06-12 2026-06-23

EvoArena: Tracking Memory Evolution for Robust LLM Agents in Dynamic Environments

変化し続ける端末、ソフトウェア、好みに対して、LLMエージェントの記憶が現在状態へ追従できるかを測る論文。静的ベンチマークでは見えない記憶の劣化を見る。

論文まとめエージェント記憶評価

TAHOE: Text-to-SQL with Automated Hint Optimization from Experience のサムネイル

論文まとめ

2026-06-11 2026-06-23

TAHOE: Text-to-SQL with Automated Hint Optimization from Experience

Text-to-SQLの失敗経験を構造化されたヒント集に変換し、実行時に関連ヒントを検索してSQL生成を改善するシステム。

論文まとめエージェントスキルコーディングエージェント

What makes a harness a harness: necessary and sufficient conditions for an agent harness のサムネイル

論文まとめ

2026-06-10 2026-06-23

What makes a harness a harness: necessary and sufficient conditions for an agent harness

エージェントハーネスという曖昧な言葉を、モデルを実行可能なエージェントにする境界層として定義する概念分析の論文。

論文まとめエージェントハーネスポジションペーパー

Bayesian-Agent: Posterior-Guided Skill Evolution for LLM Agent Harnesses のサムネイル

論文まとめ

2026-06-09 2026-06-23

Bayesian-Agent: Posterior-Guided Skill Evolution for LLM Agent Harnesses

LLMエージェントのスキル更新を、成功ログの足し算ではなく、検証済み軌跡に基づく事後分布の更新として扱う論文。追記、分割、圧縮、退役を更新候補として見る。

論文まとめエージェントスキルコーディングエージェント

Socratic-SWE: Self-Evolving Coding Agents via Trace-Derived Agent Skills のサムネイル

論文まとめ

2026-06-08 2026-06-23

Socratic-SWE: Self-Evolving Coding Agents via Trace-Derived Agent Skills

コーディングエージェントの過去トレースから、次のスキルと検証タスクを作る論文。ログを読むだけで終えず、実行検証へ戻す。

論文まとめエージェントスキルコーディングエージェント

Beyond Similarity: Trustworthy Memory Search for Personal AI Agents のサムネイル

論文まとめ

2026-06-07 2026-06-23

Beyond Similarity: Trustworthy Memory Search for Personal AI Agents

個人AIエージェントの長期記憶検索を、単なる類似度検索ではなく信頼境界として扱う論文。危ない記憶を文脈に入る前に止める。

論文まとめエージェント記憶検索

Agent Memory: Characterization and System Implications of Stateful Long-Horizon Workloads のサムネイル

論文まとめ

2026-06-06 2026-06-23

Agent Memory: Characterization and System Implications of Stateful Long-Horizon Workloads

長期タスクのLLMエージェントで使われる記憶システムを、精度だけでなく構築コスト、検索遅延、鮮度、保存量の負荷として測る論文。記憶を入れれば賢くなる、で止めないための整理。

論文まとめエージェント記憶システム

SkillEvolBench: Benchmarking the Evolution from Episodic Experience to Procedural Skills のサムネイル

論文まとめ

2026-06-05 2026-06-23

SkillEvolBench: Benchmarking the Evolution from Episodic Experience to Procedural Skills

一回のタスク経験が、未来のエージェントで使える手続き的スキルへ育つかを測るベンチマーク。経験の再利用とスキル形成を分けて見る。

論文まとめエージェントスキル評価

SkillPyramid: A Hierarchical Skill Consolidation Framework for Self-Evolving Agents のサムネイル

論文まとめ

2026-06-04 2026-06-23

SkillPyramid: A Hierarchical Skill Consolidation Framework for Self-Evolving Agents

エージェントのスキル集合を、平らな保存庫ではなく、原子的スキルと抽象スキルの階層として整理する論文。

論文まとめエージェントスキル自己進化エージェント

Agent libOS: A Library-OS-Inspired Runtime for Long-Running, Capability-Controlled LLM Agents のサムネイル

論文まとめ

2026-06-03 2026-06-23

Agent libOS: A Library-OS-Inspired Runtime for Long-Running, Capability-Controlled LLM Agents

長時間動くLLMエージェントを、状態・権限・再開・監査を持つ実行主体として扱う実行環境の論文。道具を渡すだけでなく、権限境界と永続状態をどう設計するかが焦点になる。

論文まとめエージェント実行環境エージェントハーネス

Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses のサムネイル

論文まとめ

2026-06-02 2026-06-23

Harness-1: Reinforcement Learning for Search Agents with State-Externalizing Harnesses

検索エージェントの状態をモデル内に抱え込ませず、ハーネス側の作業記憶へ外出しする論文。方策を検索判断に集中させる設計を扱う。

論文まとめエージェントハーネスエージェント型検索

Is Agent Memory a Database? Rethinking Data Foundations for Long-Term AI Agent Memory のサムネイル

論文まとめ

2026-06-01 2026-06-23

Is Agent Memory a Database? Rethinking Data Foundations for Long-Term AI Agent Memory

長期エージェント記憶を、保存箱や検索システムではなく、時間とともに更新される状態管理として捉え直す論文。忘却、改訂、整合性を扱う。

論文まとめエージェント記憶システム

VikingMem: A Memory Base Management System for Stateful LLM-based Applications のサムネイル

論文まとめ

2026-05-31 2026-06-23

VikingMem: A Memory Base Management System for Stateful LLM-based Applications

長期対話やエージェントアプリの記憶を、過去メモではなく永続状態を管理する記憶基盤として設計する論文。

論文まとめエージェント記憶システム

Superintelligent Retrieval Agent: The Next Frontier of Information Retrieval のサムネイル

論文まとめ

2026-05-27 2026-06-23

Superintelligent Retrieval Agent: The Next Frontier of Information Retrieval

多段の試行錯誤検索を、語彙補強とコーパス統計にもとづく1回の強い検索へ圧縮する検索エージェントの論文。

論文まとめエージェント型検索RAG

MUSE-Autoskill: Self-Evolving Agents via Skill Creation, Memory, Management, and Evaluation のサムネイル

論文まとめ

2026-05-27 2026-06-23

MUSE-Autoskill: Self-Evolving Agents via Skill Creation, Memory, Management, and Evaluation

エージェントのスキルを、一度きりの生成物ではなく、作成、記憶、管理、評価、改善のライフサイクルで育てる論文。

論文まとめエージェントスキル自己進化エージェント

SkillOpt: Executive Strategy for Self-Evolving Agent Skills のサムネイル

論文まとめ

2026-05-25 2026-06-23

SkillOpt: Executive Strategy for Self-Evolving Agent Skills

自然言語のエージェントスキルを、凍結モデルの外側にある改善可能な状態として扱い、実行、反省、編集、検証ゲートで育てる手法。

論文まとめエージェントスキル自己進化エージェント

Is Agentic RAG worth it? An experimental comparison of RAG approaches のサムネイル

論文まとめ

2026-05-25 2026-06-23

Is Agentic RAG worth it? An experimental comparison of RAG approaches

エージェント型RAGが、従来の強化されたRAGより常に優れているわけではないことを実験で示す論文。効果、コスト、時間の釣り合いを見る。

論文まとめエージェント型検索RAG

論文まとめ

2026-05-21 2026-06-23

Code as Agent Harness

コードをLLMの最終成果物ではなく、エージェントが推論、行動、状態保持、検証、協調を行うための実行基盤として捉え直すサーベイ。

論文まとめエージェントハーネスコーディングエージェント

From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills のサムネイル

論文まとめ

2026-05-20 2026-06-23

From Skill Text to Skill Structure: The Scheduling-Structural-Logical Representation for Agent Skills

エージェントスキルを自然言語の塊ではなく、呼び出し条件、実行手順、副作用、再利用リスクを分けた構造として扱う論文。

論文まとめエージェントスキルエージェント記憶

論文まとめ

2026-05-19 2026-06-23

StructMem Paper Summary

長期会話エージェントの記憶を、孤立した事実ではなく、時刻つきの出来事と出来事どうしの関係として構造化する論文。

論文まとめエージェント記憶システム

論文まとめ

2026-05-19 2026-06-23

Skill-RAG Paper Summary

RAGの失敗を再検索回数の問題ではなく、失敗状態を診断して適切な検索スキルを選ぶ問題として扱う論文。

論文まとめエージェント型検索RAG

論文まとめ

2026-05-19 2026-06-23

Memanto Paper Summary

長期エージェント記憶を、重い知識グラフではなく、型つき意味記憶、矛盾解決、時間履歴、広めの検索で作る論文。

論文まとめエージェント記憶検索

論文まとめ

2026-05-19 2026-06-23

Argus Paper Summary

深掘り調査を、並列検索の寄せ集めではなく、足りない証拠を見つけて補う証拠グラフの組み立てとして扱う論文。未確認・矛盾・不足を見つけ、次の探索へつなげる。

論文まとめ調査エージェントエージェント型検索

論文まとめ

2026-05-17 2026-06-23

MemLens Paper Summary

画像とテキストが混ざる複数セッション会話で、長期記憶を持つ視覚言語モデルや記憶エージェントが本当に視覚証拠を使えるかを測る論文。

論文まとめエージェント記憶システム

論文まとめ

2026-05-17 2026-06-23

EvolveMem Paper Summary

長期記憶を、保存内容だけでなく検索設定、証拠の束ね方、回答検証まで含めて失敗ログから自己改善する論文。記憶システムを評価つきで育てる。

論文まとめエージェント記憶自己進化エージェント

論文まとめ

2026-05-17 2026-06-23

Agent Hooks Reading Guide

エージェントのツール実行やセッション開始・終了に、決まったフック処理を差し込む考え方。プロンプト頼みではなく、保護ファイル、禁止操作、記録、確認を実行環境側で制御する。

論文まとめエージェント実行環境エージェントハーネス

論文まとめ

2026-05-16 2026-06-23

STALE Paper Summary

長期記憶を持つAIエージェントが、古くなった記憶を見抜き、古い前提を退け、現在の状態に合わせて行動できるかを評価する論文。

論文まとめエージェント記憶評価

Is Grep All You Need? Paper Summary のサムネイル

論文まとめ

2026-05-15 2026-06-23

Is Grep All You Need? Paper Summary

エージェント検索の性能を、grepかベクトル検索かだけでなく、ハーネスや検索結果の渡し方込みで比較する論文。

論文まとめエージェント型検索エージェントハーネス

How to Interpret Agent Behavior Paper Summary のサムネイル

論文まとめ

2026-05-15 2026-06-23

How to Interpret Agent Behavior Paper Summary

長時間動くエージェントの記録を、成功率だけでなく行動分類として読む論文。計画、検索、実行、検証、記憶などの分布から失敗理由を見つける。

論文まとめエージェントハーネス評価

Counterfactual Trace Auditing Paper Summary のサムネイル

論文まとめ

2026-05-14 2026-06-23

Counterfactual Trace Auditing Paper Summary

スキルあり/なしの実行軌跡を比べ、成功率だけでは見えない探索、編集、検証の違いを監査する論文。エージェントの振る舞いが本当に変わったかを見る。

論文まとめエージェントスキル評価

Dynamic Skill Lifecycle Management のサムネイル

論文まとめ

2026-05-13 2026-06-23

Dynamic Skill Lifecycle Management

外部スキルを増やし続けるのではなく、維持、退役、拡張を選びながら管理する論文。どのスキルが今のタスクに貢献しているかを評価する。

論文まとめエージェントスキル自己進化エージェント

論文まとめ

2026-05-12 UTC 2026-06-23

Memento | Paper Summary

調査エージェントが過去の探索結果や証拠を記憶バンクとして再利用する論文。深掘り調査で何を残し、どう取り出すかを見る。

論文まとめエージェント記憶検索

論文まとめ

2026-05-12 UTC 2026-06-23

Shepherd | Paper Summary

Shepherdは、エージェントの作業を別の監督役が観察し、危ない分岐や失敗の兆候を見つけて介入する仕組み。長い自律作業を任せる時に、いつ止め、いつ戻し、いつ人へ確認するかを考える入口になる。

論文まとめエージェント実行環境エージェントハーネス

Direct Corpus Interaction | Paper Summary のサムネイル

論文まとめ

2026-05-11 UTC 2026-06-23

Direct Corpus Interaction | Paper Summary

検索結果の要約を読むだけでなく、エージェントがコーパスを直接歩き、必要な箇所を探し直す方法を扱う論文。RAGを検索器単体ではなく探索行動として見る。

論文まとめエージェント型検索RAG

Contextual Agentic Memory | Paper Summary のサムネイル

論文まとめ

2026-05-11 UTC 2026-06-23

Contextual Agentic Memory | Paper Summary

外部記憶だけに頼るエージェントの限界を整理し、良い経験をモデル重みやスキルへ戻す必要を論じる記事。文脈、記憶、学習の役割分担を考える。

論文まとめエージェント記憶ポジションペーパー