Agent

最近看到一篇挺适合拿来做博客开张读物的论文：SGA-MCTS: Decoupling Planning from Execution via Training-Free Atomic Experience Retrieval。一句话概括：它想把 MCTS 这种“推理时很强但很慢”的搜索能力，提前离线跑完，压缩成一批可以检索的经验原子。真正在线执行任务时，模型不再每次从零开始搜索，而是先把相似的经验捞出来，当作软提示塞回当前上下文。 ...