AIエージェントが過去の会話、作業、観察結果をどう残し、取り出し、更新するかを扱う記事です。
15件の記事
AIエージェントの経験を、同じ場面だけでなく別タスクや別モデルにも移せる手続き記憶として測る論文。
LLMエージェントが実行中に生んだ行動軌跡を、別のエージェントが検索して再利用できる共有記憶として扱う論文。
変化し続ける端末、ソフトウェア、好みに対して、LLMエージェントの記憶が現在状態へ追従できるかを測る論文。静的ベンチマークでは見えない記憶の劣化を見る。
個人AIエージェントの長期記憶検索を、単なる類似度検索ではなく信頼境界として扱う論文。危ない記憶を文脈に入る前に止める。
長期タスクのLLMエージェントで使われる記憶システムを、精度だけでなく構築コスト、検索遅延、鮮度、保存量の負荷として測る論文。記憶を入れれば賢くなる、で止めないための整理。
長期エージェント記憶を、保存箱や検索システムではなく、時間とともに更新される状態管理として捉え直す論文。忘却、改訂、整合性を扱う。
長期対話やエージェントアプリの記憶を、過去メモではなく永続状態を管理する記憶基盤として設計する論文。
エージェントスキルを自然言語の塊ではなく、呼び出し条件、実行手順、副作用、再利用リスクを分けた構造として扱う論文。
長期会話エージェントの記憶を、孤立した事実ではなく、時刻つきの出来事と出来事どうしの関係として構造化する論文。
長期エージェント記憶を、重い知識グラフではなく、型つき意味記憶、矛盾解決、時間履歴、広めの検索で作る論文。
画像とテキストが混ざる複数セッション会話で、長期記憶を持つ視覚言語モデルや記憶エージェントが本当に視覚証拠を使えるかを測る論文。
長期記憶を、保存内容だけでなく検索設定、証拠の束ね方、回答検証まで含めて失敗ログから自己改善する論文。記憶システムを評価つきで育てる。
長期記憶を持つAIエージェントが、古くなった記憶を見抜き、古い前提を退け、現在の状態に合わせて行動できるかを評価する論文。
調査エージェントが過去の探索結果や証拠を記憶バンクとして再利用する論文。深掘り調査で何を残し、どう取り出すかを見る。
外部記憶だけに頼るエージェントの限界を整理し、良い経験をモデル重みやスキルへ戻す必要を論じる記事。文脈、記憶、学習の役割分担を考える。