SGA-MCTS:把慢思考缓存成可检索经验

最近看到一篇挺适合拿来做博客开张读物的论文:SGA-MCTS: Decoupling Planning from Execution via Training-Free Atomic Experience Retrieval。 一句话概括:它想把 MCTS 这种“推理时很强但很慢”的搜索能力,提前离线跑完,压缩成一批可以检索的经验原子。真正在线执行任务时,模型不再每次从零开始搜索,而是先把相似的经验捞出来,当作软提示塞回当前上下文。 ...

June 21, 2026 · 4 min · CheaSim