木叶吟
木叶吟
文章
简历
浅色
深色
自动
中文 (简体)
English
LLM Agents
CONCUR:让 Agent 批量推理避开中期拥塞
一篇关于 CONCUR 的技术笔记:它在 agent 层做准入控制,避免长时间运行的 LLM agent 推理把 KV cache 推入失控区间。
Zhisheng YE
May 17, 2026
4 分钟阅读时长
引用
×