摘要:Hermes Agent v0.16.0 是一次明显的产品化升级:原生桌面端、远程 Gateway、Web Dashboard、简体中文界面和模糊模型选择器,让它从命令行智能体变成更完整的 AI 工作台。本文结合 4sAPI 中转站,讲清楚新版本变化、适用场景,以及 Hermes 接入 OpenAI 兼容中转 API 的配置方法。

关键词:Hermes Agent、大模型API中转站、4sAPI、Custom Endpoint、Claude API、OpenAI兼容接口、AI Agent、远程 Gateway

适合读者:国内开发者、独立创作者、小团队技术负责人,以及正在评估多模型接入方案的企业研发同学。

本文是【大模型API中转站】系列的 Hermes 专题篇。本系列致力于用最低的成本、最清晰的方法,帮你打通多模型 API 的任督二脉。建议先收藏,随用随查。

2026 年 6 月 5 日,Nous Research 发布了 Hermes Agent v0.16.0,代号是 The Surface Release。如果说之前的 Hermes 更像一个给开发者用的终端智能体,那么这个版本的重点就是把能力“浮到桌面上”:原生桌面端、浏览器管理后台、远程 gateway、多 profile、中文界面、模糊模型搜索、/undo,都在这一版集中落地。

对国内开发者来说,这个版本还有一个很实际的变化:Hermes 的模型配置入口更清晰了,Custom endpoint 这条路更适合接入大模型 API 中转站。本文就用 4sAPI 作为例子,讲清楚 Hermes v0.16.0 更新了什么,以及如何把 Hermes 配置到 4sapi.com 的中转 API 上。

1. 为什么 Hermes v0.16.0 值得关注

很多人第一次接触 Hermes,会把它理解成“另一个 Claude Code / OpenClaw / Codex 类工具”。这个理解不算错,但 v0.16.0 之后,Hermes 的定位更像是一个可以长期运行的个人或团队 AI 工作站。

它不只是发请求给模型,而是围绕模型构建了完整的工作面:

这正好对应国内开发者的一个常见痛点:本地工具越来越多,但 API Key、模型供应商、网络连通性、计费和团队共享都很分散。把 Hermes 与 4sAPI 这类中转站组合起来,本质上是把“智能体执行层”和“模型接入层”拆开管理。

2. 原理速览:Hermes + 4sAPI 的请求链路

最简单的链路如下:

Hermes Desktop / CLI / TUI
        ↓
Hermes Custom Endpoint
        ↓
4sAPI 中转站
        ↓
Claude / GPT / Gemini / DeepSeek 等模型渠道

Hermes 负责:

4sAPI 负责:

这里要先说清楚边界:本文只讨论合规的 API 接入、格式兼容、模型路由和成本管理,不建议也不鼓励用任何中转方式恶意绕过官方限制、滥用账号或处理违规内容。

3. Hermes v0.16.0 的核心更新解读

3.1 原生桌面端:Hermes 从命令行走向普通用户

v0.16.0 最大的更新是新的 Hermes Desktop。它是一个真正的 Electron 桌面应用,支持 macOS、Linux、Windows,而不是简单把终端包一层壳。

这次桌面端带来的体验变化很明显:

如果你是给团队成员或非工程背景同事部署 Hermes,这一点很关键。以前要解释命令行、配置文件、环境变量;现在可以更多依赖桌面端和后台管理界面。

3.2 远程 Gateway:把 Key 和算力留在服务器

v0.16.0 允许桌面端连接远程 Hermes Gateway,并支持 OAuth 或用户名密码登录。实际价值是:

如果你计划把 4sAPI Key 放到云服务器上,这个模式比“每台电脑各配一份 Key”更好管理,也更容易做权限和额度控制。

3.3 Web Dashboard 变成完整管理后台

以前 Dashboard 更像查看会话的页面,现在 v0.16.0 把它推进成管理面板:

这意味着 Hermes 不再只是一个“本机命令行工具”,而是更接近一个可以长期运行的 AI 操作台。对于公司内部或工作室场景,这一点比单纯多支持几个模型更重要。

3.4 模型选择器全面升级,更适合多模型中转

这一版的模型选择器支持模糊搜索,覆盖 Desktop、Web Dashboard、TUI 和 CLI。比如输入几个模型名片段,就能更快找到对应模型。

对接中转站时,这个更新尤其有用。因为中转站通常会提供很多模型名,开发者最容易踩的坑就是模型 ID 填错。现在 Hermes 的模型选择和切换体验更统一,后续维护也更轻。

3.5 /undo [N]:智能体跑偏时可以回退

/undo [N] 支持回退最近 N 轮用户消息,并把上一条消息预填回来方便修改重发。这个功能看起来小,但对 agent 类工具很实用。

因为 Hermes 经常会执行工具、读文件、改代码,一旦提示词不清楚,模型可能会沿着错误方向连续做几步。/undo 能减少重复消耗,也能间接降低中转 API 的 token 成本。

3.6 安全和稳定性:这版不是只有 UI

v0.16.0 从 v0.15.2 到当前版本合入了 874 个 commits、542 个 PR,关闭 399 个 issues,其中包括 2 个 P0、62 个 P1 和 16 个 security-tagged 问题。安全相关更新包括 Starlette CVE 修复、SSRF 检查硬化、子进程凭证剥离等。

一句话总结:这版的重点不是“多了一个漂亮界面”,而是 Hermes 开始具备更完整的产品化表面。

4. 方案对比:官方直连 vs 4sAPI 中转

方案 优点 风险与限制 适合人群
官方 API 直连 链路最短;控制权最高;官方文档最完整 注册、支付、网络、模型切换、团队 Key 管理都要自己处理 海外环境稳定、合规要求高、能直接使用官方 API 的团队
4sAPI 中转 一个 URL + 一个 Key 接入多模型;国内调用更方便;可做分组、额度、日志管理 多一层中转依赖;要关注隐私、稳定性、价格和可用模型 国内开发者、独立创作者、小团队、需要快速验证多模型的项目

我的建议是:如果你是生产级、强合规、强隐私项目,优先做官方直连和企业合同;如果你是原型开发、个人效率工具、内部低敏感度项目,4sAPI 这类中转方式可以显著降低接入门槛。

5. 实战:Hermes 接入 4sapi.com 中转 API

下面以 Hermes v0.16.0 为例,配置 4sAPI 的 OpenAI 兼容接口。核心思路是:在 Hermes 里选择 Custom endpoint,然后填入 4sAPI 的 URL、Key 和模型 ID。

5.1 环境准备

你需要先准备四样东西:

  1. 已安装或已更新到 Hermes v0.16.0。
  2. 一个 4sAPI 账号,并确保余额大于 0。
  3. 在 4sAPI 控制台创建好的 API Key。
  4. 从 4sAPI 模型广场复制的模型 ID,例如 claude-sonnet-4-5-20250929。实际发布时请以模型广场显示为准,不要手打。

Linux / macOS / WSL2 可以这样安装或更新:

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
source ~/.bashrc
hermes update
hermes doctor

Windows PowerShell 可以使用:

iex (irm https://hermes-agent.nousresearch.com/install.ps1)
hermes update
hermes doctor

5.2 在 4sAPI 创建 Key

在 4sAPI 控制台里的大致流程是:

注册账号 → 充值余额 → 创建令牌 → 选择模型分组 → 设置额度/期限 → 复制 API Key

这里建议给 Hermes 单独创建一个 Key,不要和其他工具共用。原因很简单:后续你可以单独看 Hermes 的调用日志、限额和消耗,也方便在 Key 泄露时快速停用。

5.3 推荐方式:用 hermes model 交互配置

在终端执行:

hermes model

然后按提示选择:

Custom endpoint (self-hosted / VLLM / etc.)

依次填入:

API base URL: https://4sapi.com/v1
API key:      sk-xxxxxxxxxxxxxxxxxxxxxxxx
Model name:   从 4sAPI 模型广场复制的模型 ID
API mode:     chat_completions

如果 https://4sapi.com/v1 调不通,可以按 4sAPI 文档提示改成:

https://4sapi.com

注意不要把 Hermes 的 base_url 填成 https://4sapi.com/v1/chat/completions/chat/completions 通常是完整接口路径,Hermes 自己会在 base URL 后面拼接请求路径。只有某些第三方软件明确要求完整路径时,才需要填到这一层。

5.4 配置文件方式:适合服务器部署

如果你要部署到服务器,建议把 Key 放在 ~/.hermes/.env,不要明文写进 config.yaml

先在 ~/.hermes/.env 中放入:

FOURSAPI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxx

然后在 ~/.hermes/config.yaml 里配置命名 custom provider:

custom_providers:
  - name: "4sapi"
    base_url: "https://4sapi.com/v1"
    key_env: FOURSAPI_API_KEY
    api_mode: chat_completions

model:
  provider: "custom:4sapi"
  default: "claude-sonnet-4-5-20250929"

Hermes 官方文档里也有 model.provider: custom 的最短手动配置写法,适合本地临时验证。但长期使用时,我更推荐上面这种命名 provider 写法:Key 放进 .env,配置文件只引用环境变量。后面你可以继续加 openrouterlocal-ollamacompany-proxy 等 endpoint,并在会话里用 /model 快速切换。

5.5 启动并测试

启动 Hermes:

hermes

进入会话后可以发一条简单测试:

请用一句话说明你当前可以帮助我做什么。

如果已经配置了多个 custom provider,可以在会话内切换:

/model custom:4sapi:claude-sonnet-4-5-20250929

也可以先用 curl 直接测试 4sAPI 的 OpenAI 兼容接口:

curl https://4sapi.com/v1/chat/completions \
  -H "Authorization: Bearer $FOURSAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-5-20250929",
    "messages": [
      {"role": "user", "content": "ping"}
    ]
}'

如果你参考 4sAPI 文档手动调试,也可能看到 Authorization: sk-... 这种直接放 Key 的写法;而 OpenAI 兼容客户端通常会发送 Authorization: Bearer sk-...。实际以当前控制台和文档说明为准,Hermes 这类客户端一般不需要你手写 Header。

如果 curl 能通、Hermes 不通,优先检查 Hermes 的 base_urlapi_mode 和模型 ID。反过来,如果 curl 也不通,就先回到 4sAPI 控制台检查 Key 状态、余额、分组和模型是否可用。

6. 常见坑位与解决方法

坑 1:URL 多写了一层路径

错误示例:

https://4sapi.com/v1/chat/completions

在 Hermes 的 Custom endpoint 里,通常应该填:

https://4sapi.com/v1

如果出现 404、405 或路径重复,先检查这里。

坑 2:模型 ID 手打导致失败

中转站的模型名经常很长,例如 Claude、Gemini、DeepSeek、Qwen 的不同版本会带日期或后缀。模型 ID 必须从模型广场复制,不要凭记忆输入。

坑 3:Key 有余额但分组不支持该模型

4sAPI 的分组会影响可用模型、稳定性和价格。如果你遇到“Key 可用但某个模型不可用”,不要只看余额,还要看这个 Key 绑定的分组是否支持目标模型。

坑 4:Claude 原生接口和 OpenAI 兼容接口混用

Hermes 的 Custom endpoint 可以接 OpenAI 兼容接口,也可以在部分场景接 Anthropic Messages 兼容接口。使用 4sAPI 时,如果你走的是 OpenAI 兼容的 /v1/chat/completionsapi_mode 就选 chat_completions

如果你改用 Claude 原生 messages 接口,则需要对应的 endpoint 和 anthropic_messages 模式。不要把两种接口格式混在一起。

坑 5:把 API Key 写进截图或教程

写博客、录教程、发 issue 时,务必打码 Key。更稳妥的做法是把 Key 放到 .env,配置里只引用环境变量。

7. 成本与风险提示

使用 Hermes + 4sAPI 时,成本主要来自三块:

省钱建议:

风险方面,要重点关注三点:

8. 一句话总结

Hermes v0.16.0 的关键变化,是从“终端里的强力 agent”升级成“桌面端 + 后台 + 远程 gateway + 多模型配置”的完整工作台;而 4sAPI 这类大模型 API 中转站,正好可以补上国内开发者在多模型接入、Key 管理和调用稳定性上的短板。

如果你只是想快速体验 Hermes,直接用 hermes model 选择 Custom endpoint 接入 4sAPI 就够了;如果你要长期使用,建议采用“远程 Hermes Gateway + .env 管理 Key + 4sAPI 单独限额”的方式,把安全、成本和可维护性一起考虑进去。

如果你已经在用 Hermes、Claude Code、Codex 或其他 AI Agent 工具,也欢迎在评论区补充你的模型接入方案、踩坑记录和成本数据。下一篇可以继续横向对比不同中转站在稳定性、价格和模型覆盖上的差异。

参考资料