Hermes Agent v0.15.0：AI Agent 工具开始从聊天框变成工程化工作台_AI资讯

2026 年 5 月 28 日，NousResearch 发布了 Hermes Agent v0.15.0，版本代号是 The Velocity Release。看完发布说明，我的第一反应不是“又加了多少功能”，而是这个项目在补 Agent 工具最难看的那部分：启动速度、代码结构、任务调度、密钥、安全边界。

这次更新的规模不小。从 v0.14.0 到 v0.15.0，项目合并了 747 个 PR，包含 1,302 次提交，改动 1,746 个文件，关闭 560 多个 issue，其中包括 15 个 P0、65 个 P1 和 19 个带 security 标签的问题。这些数字放在发布说明里有点吓人，但它们确实解释了为什么这一版叫 Velocity。

一、Hermes 正在离开“单个聊天窗口”

很多 AI Agent 工具的默认姿势还是一问一答：你给它一个任务，它在终端里尝试完成。这个模式能解决不少小事。问题出在任务变长以后。一个需求要拆分、排队、并行、复核，还要把失败的部分重新派出去，单个聊天窗口很快就开始吃力。

Hermes v0.15.0 把很多精力放在 Kanban 上。发布说明里说，Kanban 已经成长为一个 multi-agent platform。新版本支持把一个任务自动拆成子任务树，也支持用 hermes kanban swarm 创建 Swarm v1 图结构：root、并行 workers、gated verifier、gated synthesizer，还有共享 blackboard。

这听起来很工程化，也确实很工程化。它想解决的不是“让一个模型更努力”，而是把模型放进一个流程里。简单样板代码可以交给便宜模型，困难判断交给强模型，验证单独过一遍，最后再合并。这个方向比“让 AI 一口气写完所有东西”更接近真实项目。

二、速度这件事很土，但很重要

发布说明里有一整组性能数字：

hermes --version 冷启动耗时减少 63%，从 701ms 降到 258ms。
Termux 冷启动从 2.9 秒降到 0.8 秒。
31 轮对话的 per-conversation function calls 从 399k 降到 213k，减少 47%。
每次工具调用通过 adaptive subprocess polling 大约减少 195ms。
延迟加载 openai._base_client，每次 CLI 冷启动减少 240ms 和 17MB 内存。

这些不是适合拿去做海报的功能。可是真正每天用工具的人会在意。终端命令多等半秒，单次无所谓；一天几十次，就会变成摩擦。工具启动慢，用户就少开一次。少开几次，它就不会进工作流。

AI 编程工具的竞争经常被说成模型竞争。模型当然重要。但冷启动、工具调用、上下文搜索、任务调度这些地方如果拖后腿，强模型也会被包在一个不好用的壳里。

三、session_search 重写：有些事不该麻烦大模型

session_search 的改动很值得单独看。旧版本依赖辅助 LLM，总结 3 个 session 大约要 30 秒，每次成本约 0.30 美元。更麻烦的是，如果 FTS5 没找到正确 session，LLM 还可能补出一段看似合理的总结。

新版本把它改成一个确定性工具，靠 discovery、scroll、browse 三种行为完成检索和浏览。官方给的数字是：discovery 从约 90 秒变成约 20ms，scroll 约 1ms。发布说明称它快了 4,500 倍，而且不再产生 LLM 调用成本。

这类改动说明 Hermes 团队没有把 LLM 当成万能胶。搜索历史、滚动结果、浏览会话，本来就是检索和界面状态问题。交给工具，比交给模型更便宜，也更少出戏。

四、安全不再只是提示语

Hermes v0.15.0 加入了针对 Promptware、Brainworm 类攻击的防御。攻击入口主要有三个：工具输出、召回记忆、已存储 skills。Agent 工具最麻烦的地方就在这里。它会读东西，也会执行东西。

普通聊天机器人答错，大多数时候只是误导。Agent 读到恶意内容以后，可能会改文件、跑命令、调用外部服务。这个风险不能只靠一句“请谨慎操作”解决。

这版的做法包括：用 tools/threat_patterns.py 维护威胁模式，增加约 15 类 Brainworm/C2 模式；加载 recalled memory 时扫描；给工具结果加 delimiter markers，防止恶意文件或远程服务伪装成系统内容；再配合 security-guidance 插件识别危险代码写入。它不保证万无一失，但至少把防线放到了系统内部。

五、密钥终于有了更像样的去处

另一个现实更新是 Bitwarden Secrets Manager 集成。很多 AI 工具用久以后，~/.env 里会堆满 API key：模型、搜索、图像、浏览器、通知服务。刚开始方便，后来就变成没人敢动的明文清单。

Hermes v0.15.0 支持用一个 BWS_ACCESS_TOKEN 接入 Bitwarden Secrets Manager。启动时需要的 credential 从 Bitwarden 取。默认情况下，Bitwarden 是 source of truth，可以覆盖本地环境变量。用户在 Bitwarden Web App 里轮换密钥，工具侧也会跟着生效。

团队使用 Agent 工具时，这个变化比它看起来更重要。多一个集成服务，就多一个密钥。密钥没有集中管理，Agent 工作流越丰富，泄露面也越大。

六、Skill bundles 把零散能力捆成工作流

Skill bundles 是这次更新里比较容易被普通用户感知的功能。一个 slash command 可以一次加载多个 skills。比如你可以配置一个 “writing day” bundle，把 humanizer、ideation、obsidian、youtube-content 一起加载，之后输入 /writing-day 就进入那套写作环境。

这比单独安装一堆工具更接近日常使用。人不会每天想着“我要调用哪个插件”，人想的是“我今天要写东西”“我要整理资料”“我要把这个项目修完”。bundle 把这类场景固定下来，少了很多启动前的手动操作。

七、xAI、Krea、MCP、ntfy：生态继续往外长

v0.15.0 还加了不少生态层面的东西。

xAI 集成更深：新增 xAI Web Search provider；hermes proxy 支持 xAI upstream；检测 5 月 15 日退役模型并提供 hermes migrate xai；xAI TTS 可以选择自动插入 [pause] 标签，让语音回复更自然；同时修复 xai-oauth 的 base_url 凭据泄露风险。

图像生成方面，Krea 2 Medium 和 Krea 2 Large 加入 image_gen 阵容。FAL 后端也从单体 image-generation tool 拆成插件。这个拆分的好处很直接：以后接入新图像服务，不必复制一大块旧代码。

MCP 方面，Hermes 提供了 Nous-approved MCP catalog 和交互式 picker。用户可以用 hermes mcp 选择安装，不用自己去 GitHub 上到处找可信 MCP server。通知方面，ntfy 成为第 23 个 messaging platform，不需要账号或 API key，只要 topic URL，就能让 agent 从 cron job、kanban task completion 或 chat send_message 发推送到手机、手表、桌面或 homelab。

这些点放在一起看，Hermes 想做的东西已经不只是 CLI。它更像一个可插拔的 Agent 工作环境。

八、普通用户会先感受到什么

普通人不会关心 14 个 agent/* 模块怎么拆，也不会每天研究 promptware 防御。但他们会感受到另一件事：AI 工具开始像一个能被长期使用的工作台，而不是临时打开的聊天窗口。

比如做一个小项目。以前你可能让 AI 写一段代码，改几次，复制出来。现在更可能是把目标放进去，让它拆任务，派 worker，跑验证，最后把结果合起来。这里面当然还有很多不稳定的地方，但协作形态已经变了。

成本也会慢慢变化。session_search 这种改动很典型：同样是找历史上下文，过去要花钱等 LLM 总结，现在用检索工具瞬间完成。好的 AI 产品不会每一步都调用最强模型。它会知道什么时候别叫模型。

安全感也会变得更复杂。一方面，工具内置了更多防线；另一方面，Agent 能做的事情更多了，用户给权限时要更清楚。让它读网页、读仓库、跑命令，这些动作背后都有边界。工具可以帮你挡一部分风险，不能替你决定什么该授权。

还有一个更慢的变化：个人工作流会被打包。写作的人有写作 bundle，开发者有编码 bundle，研究者有资料整理 bundle。以后你安装的可能不只是软件，也是一套别人整理过的工作方式。

九、这次更新真正改了什么

Hermes v0.15.0 的发布说明很长，容易读散。把细节合起来看，它主要在处理几个基础问题：代码结构太重，启动要快，多 Agent 协作要能落地，历史搜索不能乱花 LLM，密钥要有集中管理，工具输出和记忆要防注入，skills 要能按场景打包。

这些都不是特别性感的功能。甚至有些听起来很琐碎。可是 Agent 工具要进入日常工作，靠的就是这些琐碎部分。聊天框演示可以靠惊艳输出，生产工作台靠的是速度、边界、恢复能力和可重复的流程。

所以看 Hermes Agent v0.15.0，不必只问“它是不是更会写代码”。更该问的是：它能不能把复杂任务拆开？能不能让多个 Agent 分工？能不能安全地读历史、用工具、管密钥？能不能把个人工作流沉淀成一条命令？

这版没有把这些问题一次性解决完。它只是把方向说得更清楚了。

参考来源

本文基于 NousResearch 官方 GitHub Release：Hermes Agent v0.15.0 (2026.5.28) — The Velocity Release。

Hermes Agent v0.15.0：AI Agent 工具开始从聊天框变成工程化工作台