
从聊天窗口到工作台:这半年,我的 Agent 工作流换了一代
TL;DR
快到年中了。回头看,这半年我换掉的不只是云上的主力 Agent,也把入口从聊天窗口换成了工作台:Hermes 在云上做中枢,OpenCode 留在本地做 coding,Discord 则第一次让多 session 工作流真正成立。
背景
回头看,这半年真正变的不是某个 Agent,而是我和 Agent 协作的整个结构。
开年那阵子,我还在用 OpenClaw。当时写过两篇相关的博客:一篇是 《我让龙虾替我工作了 38 天,它做了什么?》,盘它到底替我干了什么;另一篇是 《Agent 装 Agent:用 OpenClaw 安装 Hermes,顺手验证自我进化》,让 OpenClaw 去安装 Hermes Agent,顺手看看它所谓的自我进化到底是不是一回事。
那时候的 Hermes Agent,对我来说更像一个值得研究的新对象,还不是来接管 OpenClaw 的主力。
但这几个月下来,情况慢慢变了。现在我的云上主力 Agent,已经从 OpenClaw 完全迁到了 Hermes Agent。部署仍然在云上,只是机房从香港换到了新加坡,原因也很现实:Claude 在不同地区的使用政策并不一样,大陆和香港这边就用不了。真正写代码这层没有跟着一起迁走,还是继续交给本地的 OpenCode。变化最大的,反而是入口:我几乎完全从 Telegram 转向了 Discord。
所以这次变化,看起来像是在换工具,实际上更像是整套 Agent 工作流换了一代。
从尝鲜到接管
当初装 Hermes Agent,主要还是想看看它到底值不值得用。吸引我的,不是它能不能替代 OpenClaw,而是它对 Skill 生命周期和自我进化的理解:不是把 Skill 当静态说明书,而是让 Agent 在任务里自己总结、自己沉淀、自己迭代。
但后来真正让我迁过去的,不是某一个单点功能,而是它越来越贴近我日常真正需要的那个位置:长期跑在云上,稳定接入口,能把会话组织起来,能接工具,能查资料,也能接住我的想法继续往下推。
到这一步,Hermes Agent 在我这里就不再是 OpenClaw 旁边的实验品了,而是正式接管了云端主力的位置。
Agent 的交互容器,决定了它能不能真正变成工作流
我后来把云上 Agent 的主要入口从 Telegram 切到了 Discord。原因不是 Telegram 不能用,而是它更像一个单线聊天入口。
Telegram 不是没有多会话能力,而是多会话组织得不自然。普通私聊里,同一个 bot 基本只有一个主会话;想并行开多个任务,通常得额外建多个 group,或者再借助 topic。想找回、继续过去的某个会话,也总归有点费劲。
Discord 则天然是另一种结构。Hermes Agent 本身支持 Discord,OpenCode 通过 Kimaki 接进去。我现在的习惯很简单:一个 thread 开一个任务。thread 在这里不是聊天分叉,而是 session 的边界。任务被隔开了,上下文不再糊成一团,多条线并行往前推也自然得多。
所以这次迁移真正改变的,不只是我在哪个平台发消息,而是 Agent 第一次有了一个适合承载工作流的容器。PC 端更宽的展示区域只是表面,更关键的是,Discord 让 Agent 不再只是“回消息”,而是真开始在一个有结构的空间里工作。
Hermes 做中枢,OpenCode 留本地
云端主力虽然已经迁到 Hermes Agent,但 coding 这层我没有一起迁走,还是继续交给本地 OpenCode。
对我来说,Hermes Hermes 更像中枢:长期跑在云上,接 Discord,接工具,接住讨论,也负责把任务组织起来。OpenCode 则更像贴着仓库干活的本地执行器,真正进入项目目录,把实现往前推。
进入 coding 之后,我一般还是会尽量用 OpenSpec 和 addyosmani/agent-skills 这套组合,把实现放进 Harness Engineering 的约束里。它们对我很重要,不是因为能让 Agent 更放飞,而是因为能让实现少一点无约束的发挥,少一点“先写出来再说”的冲动。
但即便这样,我对这件事还是很慎重。原因很简单:工程化流程可以补强执行,却替代不了判断。正如我在最近那篇 《Loop Engineering 的边界与悖论》 里写的,Loop Engineering 的边界,换成 LLM coding 一样成立。
所以对我来说,变化并不是“越来越依赖 Agent”,而是用得越来越多,判断也越来越重。Agent 参与得更深了,但真正该自己扛的判断,并没有因此变轻,反而更重了。
不是摘要器,而是第二轮讨论对象
另一个很明显的变化,是我越来越喜欢跟 Agent 聊天、讨论,甚至 battle。
但这不是把文章丢给它让它替我读。相反,通常是我自己先读,觉得某篇文章、某个观点、某个开源项目值得继续深挖,才把它转发给 Agent。而且我很少只丢一个链接过去,往往会顺手带上自己的判断:我觉得它哪里说得对,哪里站不住,或者我真正想验证的点是什么。
这样一来,Agent 就不是摘要器,而成了第二轮讨论对象。它接住的不是原始材料,而是我已经开始成形的想法,然后再配合搜索、抓取这类工具把这条线继续往下推:补资料,找原文,拆论证,找反例,必要时直接跟我 battle 一轮。它更像一个带工具的讨论对象,而不是一个负责替我读材料的助手。某种意义上说,Agent 现在不只是进入了我的执行流,也开始进入我的思考流。
结尾
回头看,这次变化不是把 OpenClaw 换成 Hermes,也不是把 Telegram 换成 Discord 这么简单。更准确地说,我是在把 Agent 从“聊天机器人”往“工作流基础设施”那个方向再推一步。
Hermes Agent 现在是云上的中枢,OpenCode 仍然守在本地的 coding 现场,Discord 则把它们放进了一个终于适合多 session 生长的容器里。
工具当然还会继续换,模型也还会继续变。但至少到现在,这半年走下来,我对这套结构的判断已经很明确了:Agent 的交互容器,决定了它能不能真正变成工作流。



