Hermes Agent v0.15.0:AI Agent 工具开始从聊天框变成工程化工作台

2026 年 5 月 28 日,NousResearch 发布了 Hermes Agent v0.15.0,版本代号是 The Velocity Release。看完发布说明,我的第一反应不是“又加了多少功能”,而是这个项目在补 Agent 工具最难看的那部分:启动速度、代码结构、任务调度、密钥、安全边界。

这次更新的规模不小。从 v0.14.0 到 v0.15.0,项目合并了 747 个 PR,包含 1,302 次提交,改动 1,746 个文件,关闭 560 多个 issue,其中包括 15 个 P0、65 个 P1 和 19 个带 security 标签的问题。这些数字放在发布说明里有点吓人,但它们确实解释了为什么这一版叫 Velocity。

一、Hermes 正在离开“单个聊天窗口”

很多 AI Agent 工具的默认姿势还是一问一答:你给它一个任务,它在终端里尝试完成。这个模式能解决不少小事。问题出在任务变长以后。一个需求要拆分、排队、并行、复核,还要把失败的部分重新派出去,单个聊天窗口很快就开始吃力。

Hermes v0.15.0 把很多精力放在 Kanban 上。发布说明里说,Kanban 已经成长为一个 multi-agent platform。新版本支持把一个任务自动拆成子任务树,也支持用 hermes kanban swarm 创建 Swarm v1 图结构:root、并行 workers、gated verifier、gated synthesizer,还有共享 blackboard。

这听起来很工程化,也确实很工程化。它想解决的不是“让一个模型更努力”,而是把模型放进一个流程里。简单样板代码可以交给便宜模型,困难判断交给强模型,验证单独过一遍,最后再合并。这个方向比“让 AI 一口气写完所有东西”更接近真实项目。

二、速度这件事很土,但很重要

发布说明里有一整组性能数字:

  • hermes --version 冷启动耗时减少 63%,从 701ms 降到 258ms。
  • Termux 冷启动从 2.9 秒降到 0.8 秒。
  • 31 轮对话的 per-conversation function calls 从 399k 降到 213k,减少 47%。
  • 每次工具调用通过 adaptive subprocess polling 大约减少 195ms。
  • 延迟加载 openai._base_client,每次 CLI 冷启动减少 240ms 和 17MB 内存。

这些不是适合拿去做海报的功能。可是真正每天用工具的人会在意。终端命令多等半秒,单次无所谓;一天几十次,就会变成摩擦。工具启动慢,用户就少开一次。少开几次,它就不会进工作流。

AI 编程工具的竞争经常被说成模型竞争。模型当然重要。但冷启动、工具调用、上下文搜索、任务调度这些地方如果拖后腿,强模型也会被包在一个不好用的壳里。

三、session_search 重写:有些事不该麻烦大模型

session_search 的改动很值得单独看。旧版本依赖辅助 LLM,总结 3 个 session 大约要 30 秒,每次成本约 0.30 美元。更麻烦的是,如果 FTS5 没找到正确 session,LLM 还可能补出一段看似合理的总结。

新版本把它改成一个确定性工具,靠 discovery、scroll、browse 三种行为完成检索和浏览。官方给的数字是:discovery 从约 90 秒变成约 20ms,scroll 约 1ms。发布说明称它快了 4,500 倍,而且不再产生 LLM 调用成本。

这类改动说明 Hermes 团队没有把 LLM 当成万能胶。搜索历史、滚动结果、浏览会话,本来就是检索和界面状态问题。交给工具,比交给模型更便宜,也更少出戏。

四、安全不再只是提示语

Hermes v0.15.0 加入了针对 Promptware、Brainworm 类攻击的防御。攻击入口主要有三个:工具输出、召回记忆、已存储 skills。Agent 工具最麻烦的地方就在这里。它会读东西,也会执行东西。

普通聊天机器人答错,大多数时候只是误导。Agent 读到恶意内容以后,可能会改文件、跑命令、调用外部服务。这个风险不能只靠一句“请谨慎操作”解决。

这版的做法包括:用 tools/threat_patterns.py 维护威胁模式,增加约 15 类 Brainworm/C2 模式;加载 recalled memory 时扫描;给工具结果加 delimiter markers,防止恶意文件或远程服务伪装成系统内容;再配合 security-guidance 插件识别危险代码写入。它不保证万无一失,但至少把防线放到了系统内部。

五、密钥终于有了更像样的去处

另一个现实更新是 Bitwarden Secrets Manager 集成。很多 AI 工具用久以后,~/.env 里会堆满 API key:模型、搜索、图像、浏览器、通知服务。刚开始方便,后来就变成没人敢动的明文清单。

Hermes v0.15.0 支持用一个 BWS_ACCESS_TOKEN 接入 Bitwarden Secrets Manager。启动时需要的 credential 从 Bitwarden 取。默认情况下,Bitwarden 是 source of truth,可以覆盖本地环境变量。用户在 Bitwarden Web App 里轮换密钥,工具侧也会跟着生效。

团队使用 Agent 工具时,这个变化比它看起来更重要。多一个集成服务,就多一个密钥。密钥没有集中管理,Agent 工作流越丰富,泄露面也越大。

六、Skill bundles 把零散能力捆成工作流

Skill bundles 是这次更新里比较容易被普通用户感知的功能。一个 slash command 可以一次加载多个 skills。比如你可以配置一个 “writing day” bundle,把 humanizer、ideation、obsidian、youtube-content 一起加载,之后输入 /writing-day 就进入那套写作环境。

这比单独安装一堆工具更接近日常使用。人不会每天想着“我要调用哪个插件”,人想的是“我今天要写东西”“我要整理资料”“我要把这个项目修完”。bundle 把这类场景固定下来,少了很多启动前的手动操作。

七、xAI、Krea、MCP、ntfy:生态继续往外长

v0.15.0 还加了不少生态层面的东西。

xAI 集成更深:新增 xAI Web Search provider;hermes proxy 支持 xAI upstream;检测 5 月 15 日退役模型并提供 hermes migrate xai;xAI TTS 可以选择自动插入 [pause] 标签,让语音回复更自然;同时修复 xai-oauth 的 base_url 凭据泄露风险。

图像生成方面,Krea 2 Medium 和 Krea 2 Large 加入 image_gen 阵容。FAL 后端也从单体 image-generation tool 拆成插件。这个拆分的好处很直接:以后接入新图像服务,不必复制一大块旧代码。

MCP 方面,Hermes 提供了 Nous-approved MCP catalog 和交互式 picker。用户可以用 hermes mcp 选择安装,不用自己去 GitHub 上到处找可信 MCP server。通知方面,ntfy 成为第 23 个 messaging platform,不需要账号或 API key,只要 topic URL,就能让 agent 从 cron job、kanban task completion 或 chat send_message 发推送到手机、手表、桌面或 homelab。

这些点放在一起看,Hermes 想做的东西已经不只是 CLI。它更像一个可插拔的 Agent 工作环境。

八、普通用户会先感受到什么

普通人不会关心 14 个 agent/* 模块怎么拆,也不会每天研究 promptware 防御。但他们会感受到另一件事:AI 工具开始像一个能被长期使用的工作台,而不是临时打开的聊天窗口。

比如做一个小项目。以前你可能让 AI 写一段代码,改几次,复制出来。现在更可能是把目标放进去,让它拆任务,派 worker,跑验证,最后把结果合起来。这里面当然还有很多不稳定的地方,但协作形态已经变了。

成本也会慢慢变化。session_search 这种改动很典型:同样是找历史上下文,过去要花钱等 LLM 总结,现在用检索工具瞬间完成。好的 AI 产品不会每一步都调用最强模型。它会知道什么时候别叫模型。

安全感也会变得更复杂。一方面,工具内置了更多防线;另一方面,Agent 能做的事情更多了,用户给权限时要更清楚。让它读网页、读仓库、跑命令,这些动作背后都有边界。工具可以帮你挡一部分风险,不能替你决定什么该授权。

还有一个更慢的变化:个人工作流会被打包。写作的人有写作 bundle,开发者有编码 bundle,研究者有资料整理 bundle。以后你安装的可能不只是软件,也是一套别人整理过的工作方式。

九、这次更新真正改了什么

Hermes v0.15.0 的发布说明很长,容易读散。把细节合起来看,它主要在处理几个基础问题:代码结构太重,启动要快,多 Agent 协作要能落地,历史搜索不能乱花 LLM,密钥要有集中管理,工具输出和记忆要防注入,skills 要能按场景打包。

这些都不是特别性感的功能。甚至有些听起来很琐碎。可是 Agent 工具要进入日常工作,靠的就是这些琐碎部分。聊天框演示可以靠惊艳输出,生产工作台靠的是速度、边界、恢复能力和可重复的流程。

所以看 Hermes Agent v0.15.0,不必只问“它是不是更会写代码”。更该问的是:它能不能把复杂任务拆开?能不能让多个 Agent 分工?能不能安全地读历史、用工具、管密钥?能不能把个人工作流沉淀成一条命令?

这版没有把这些问题一次性解决完。它只是把方向说得更清楚了。

参考来源

本文基于 NousResearch 官方 GitHub Release:Hermes Agent v0.15.0 (2026.5.28) — The Velocity Release