27 June, 2026

从聊天窗口到工作台：这半年，我的 Agent 工作流换了一代

TL;DR

快到年中了。回头看，这半年我换掉的不只是云上的主力 Agent，也把入口从聊天窗口换成了工作台：Hermes 在云上做中枢，OpenCode 留在本地做 coding，Discord 则第一次让多 session 工作流真正成立。

背景

回头看，这半年真正变的不是某个 Agent，而是我和 Agent 协作的整个结构。

开年那阵子，我还在用 OpenClaw。当时写过两篇相关的博客：一篇是《我让龙虾替我工作了 38 天，它做了什么？》，盘它到底替我干了什么；另一篇是《Agent 装 Agent：用 OpenClaw 安装 Hermes，顺手验证自我进化》，让 OpenClaw 去安装 Hermes Agent，顺手看看它所谓的自我进化到底是不是一回事。

那时候的 Hermes Agent，对我来说更像一个值得研究的新对象，还不是来接管 OpenClaw 的主力。

但这几个月下来，情况慢慢变了。现在我的云上主力 Agent，已经从 OpenClaw 完全迁到了 Hermes Agent。部署仍然在云上，只是机房从香港换到了新加坡，原因也很现实：Claude 在不同地区的使用政策并不一样，大陆和香港这边就用不了。真正写代码这层没有跟着一起迁走，还是继续交给本地的 OpenCode。变化最大的，反而是入口：我几乎完全从 Telegram 转向了 Discord。

所以这次变化，看起来像是在换工具，实际上更像是整套 Agent 工作流换了一代。

从尝鲜到接管

当初装 Hermes Agent，主要还是想看看它到底值不值得用。吸引我的，不是它能不能替代 OpenClaw，而是它对 Skill 生命周期和自我进化的理解：不是把 Skill 当静态说明书，而是让 Agent 在任务里自己总结、自己沉淀、自己迭代。

但后来真正让我迁过去的，不是某一个单点功能，而是它越来越贴近我日常真正需要的那个位置：长期跑在云上，稳定接入口，能把会话组织起来，能接工具，能查资料，也能接住我的想法继续往下推。

到这一步，Hermes Agent 在我这里就不再是 OpenClaw 旁边的实验品了，而是正式接管了云端主力的位置。

Agent 的交互容器，决定了它能不能真正变成工作流

我后来把云上 Agent 的主要入口从 Telegram 切到了 Discord。原因不是 Telegram 不能用，而是它更像一个单线聊天入口。

Telegram 不是没有多会话能力，而是多会话组织得不自然。普通私聊里，同一个 bot 基本只有一个主会话；想并行开多个任务，通常得额外建多个 group，或者再借助 topic。想找回、继续过去的某个会话，也总归有点费劲。

Discord 则天然是另一种结构。Hermes Agent 本身支持 Discord，OpenCode 通过 Kimaki 接进去。我现在的习惯很简单：一个 thread 开一个任务。thread 在这里不是聊天分叉，而是 session 的边界。任务被隔开了，上下文不再糊成一团，多条线并行往前推也自然得多。

所以这次迁移真正改变的，不只是我在哪个平台发消息，而是 Agent 第一次有了一个适合承载工作流的容器。PC 端更宽的展示区域只是表面，更关键的是，Discord 让 Agent 不再只是“回消息”，而是真开始在一个有结构的空间里工作。

Hermes 做中枢，OpenCode 留本地

云端主力虽然已经迁到 Hermes Agent，但 coding 这层我没有一起迁走，还是继续交给本地 OpenCode。

对我来说，Hermes Hermes 更像中枢：长期跑在云上，接 Discord，接工具，接住讨论，也负责把任务组织起来。OpenCode 则更像贴着仓库干活的本地执行器，真正进入项目目录，把实现往前推。

进入 coding 之后，我一般还是会尽量用 OpenSpec 和 addyosmani/agent-skills 这套组合，把实现放进 Harness Engineering 的约束里。它们对我很重要，不是因为能让 Agent 更放飞，而是因为能让实现少一点无约束的发挥，少一点“先写出来再说”的冲动。

但即便这样，我对这件事还是很慎重。原因很简单：工程化流程可以补强执行，却替代不了判断。正如我在最近那篇《Loop Engineering 的边界与悖论》里写的，Loop Engineering 的边界，换成 LLM coding 一样成立。

所以对我来说，变化并不是“越来越依赖 Agent”，而是用得越来越多，判断也越来越重。Agent 参与得更深了，但真正该自己扛的判断，并没有因此变轻，反而更重了。

不是摘要器，而是第二轮讨论对象

另一个很明显的变化，是我越来越喜欢跟 Agent 聊天、讨论，甚至 battle。

但这不是把文章丢给它让它替我读。相反，通常是我自己先读，觉得某篇文章、某个观点、某个开源项目值得继续深挖，才把它转发给 Agent。而且我很少只丢一个链接过去，往往会顺手带上自己的判断：我觉得它哪里说得对，哪里站不住，或者我真正想验证的点是什么。

这样一来，Agent 就不是摘要器，而成了第二轮讨论对象。它接住的不是原始材料，而是我已经开始成形的想法，然后再配合搜索、抓取这类工具把这条线继续往下推：补资料，找原文，拆论证，找反例，必要时直接跟我 battle 一轮。它更像一个带工具的讨论对象，而不是一个负责替我读材料的助手。某种意义上说，Agent 现在不只是进入了我的执行流，也开始进入我的思考流。