摘要:Hermes Agent v0.16.0 是一次明显的产品化升级:原生桌面端、远程 Gateway、Web Dashboard、简体中文界面和模糊模型选择器,让它从命令行智能体变成更完整的 AI 工作台。本文结合 4sAPI 中转站,讲清楚新版本变化、适用场景,以及 Hermes 接入 OpenAI 兼容中转 API 的配置方法。
关键词:Hermes Agent、大模型API中转站、4sAPI、Custom Endpoint、Claude API、OpenAI兼容接口、AI Agent、远程 Gateway
适合读者:国内开发者、独立创作者、小团队技术负责人,以及正在评估多模型接入方案的企业研发同学。
本文是【大模型API中转站】系列的 Hermes 专题篇。本系列致力于用最低的成本、最清晰的方法,帮你打通多模型 API 的任督二脉。建议先收藏,随用随查。
2026 年 6 月 5 日,Nous Research 发布了 Hermes Agent v0.16.0,代号是 The Surface Release。如果说之前的 Hermes 更像一个给开发者用的终端智能体,那么这个版本的重点就是把能力“浮到桌面上”:原生桌面端、浏览器管理后台、远程 gateway、多 profile、中文界面、模糊模型搜索、/undo,都在这一版集中落地。
对国内开发者来说,这个版本还有一个很实际的变化:Hermes 的模型配置入口更清晰了,Custom endpoint 这条路更适合接入大模型 API 中转站。本文就用 4sAPI 作为例子,讲清楚 Hermes v0.16.0 更新了什么,以及如何把 Hermes 配置到 4sapi.com 的中转 API 上。
1. 为什么 Hermes v0.16.0 值得关注
很多人第一次接触 Hermes,会把它理解成“另一个 Claude Code / OpenClaw / Codex 类工具”。这个理解不算错,但 v0.16.0 之后,Hermes 的定位更像是一个可以长期运行的个人或团队 AI 工作站。
它不只是发请求给模型,而是围绕模型构建了完整的工作面:
- 桌面端负责日常聊天、文件拖拽、会话管理、模型切换。
- Web Dashboard 负责 MCP、消息渠道、凭证、webhook、memory、gateway 等管理。
- CLI/TUI 仍然保留给重度开发者。
- Remote Gateway 让本地电脑只当“薄客户端”,真正的 Hermes 和 API Key 可以放在远程服务器上。
这正好对应国内开发者的一个常见痛点:本地工具越来越多,但 API Key、模型供应商、网络连通性、计费和团队共享都很分散。把 Hermes 与 4sAPI 这类中转站组合起来,本质上是把“智能体执行层”和“模型接入层”拆开管理。
2. 原理速览:Hermes + 4sAPI 的请求链路
最简单的链路如下:
Hermes Desktop / CLI / TUI
↓
Hermes Custom Endpoint
↓
4sAPI 中转站
↓
Claude / GPT / Gemini / DeepSeek 等模型渠道
Hermes 负责:
- 会话、记忆、工具、技能、MCP、文件读写等智能体能力。
- 模型选择、请求格式、streaming、工具调用等客户端逻辑。
- 桌面端、TUI、CLI、Gateway、Dashboard 等使用入口。
4sAPI 负责:
- 提供统一 API 地址和 Key。
- 按模型名路由到不同模型渠道。
- 做分组、额度、日志和计费管理。
- 在兼容 OpenAI 格式的接口中调用 Claude、GPT、Gemini 等模型。
这里要先说清楚边界:本文只讨论合规的 API 接入、格式兼容、模型路由和成本管理,不建议也不鼓励用任何中转方式恶意绕过官方限制、滥用账号或处理违规内容。
3. Hermes v0.16.0 的核心更新解读
3.1 原生桌面端:Hermes 从命令行走向普通用户
v0.16.0 最大的更新是新的 Hermes Desktop。它是一个真正的 Electron 桌面应用,支持 macOS、Linux、Windows,而不是简单把终端包一层壳。
这次桌面端带来的体验变化很明显:
- 可以像普通 App 一样安装和自更新。
- 支持流式聊天窗口、会话列表、归档和搜索。
- 支持把文件拖进聊天区域,也支持剪贴板图片粘贴。
- 状态栏内置模型选择器。
- 支持 Cmd+K 命令面板。
- 支持完整简体中文界面。
如果你是给团队成员或非工程背景同事部署 Hermes,这一点很关键。以前要解释命令行、配置文件、环境变量;现在可以更多依赖桌面端和后台管理界面。
3.2 远程 Gateway:把 Key 和算力留在服务器
v0.16.0 允许桌面端连接远程 Hermes Gateway,并支持 OAuth 或用户名密码登录。实际价值是:
- 笔记本只负责 UI。
- API Key、工具环境、长期任务放在远程服务器。
- 多 profile 可以指向不同远程 host。
- 团队或个人多环境之间切换更自然。
如果你计划把 4sAPI Key 放到云服务器上,这个模式比“每台电脑各配一份 Key”更好管理,也更容易做权限和额度控制。
3.3 Web Dashboard 变成完整管理后台
以前 Dashboard 更像查看会话的页面,现在 v0.16.0 把它推进成管理面板:
- MCP catalog 可以在浏览器里启用、停用和配对。
- Telegram、Discord、Slack 等消息渠道可以在页面上配置。
- 凭证、webhook、hook、memory、gateway 都有管理入口。
- 支持 OIDC 和用户名密码等登录方式。
这意味着 Hermes 不再只是一个“本机命令行工具”,而是更接近一个可以长期运行的 AI 操作台。对于公司内部或工作室场景,这一点比单纯多支持几个模型更重要。
3.4 模型选择器全面升级,更适合多模型中转
这一版的模型选择器支持模糊搜索,覆盖 Desktop、Web Dashboard、TUI 和 CLI。比如输入几个模型名片段,就能更快找到对应模型。
对接中转站时,这个更新尤其有用。因为中转站通常会提供很多模型名,开发者最容易踩的坑就是模型 ID 填错。现在 Hermes 的模型选择和切换体验更统一,后续维护也更轻。
3.5 /undo [N]:智能体跑偏时可以回退
/undo [N] 支持回退最近 N 轮用户消息,并把上一条消息预填回来方便修改重发。这个功能看起来小,但对 agent 类工具很实用。
因为 Hermes 经常会执行工具、读文件、改代码,一旦提示词不清楚,模型可能会沿着错误方向连续做几步。/undo 能减少重复消耗,也能间接降低中转 API 的 token 成本。
3.6 安全和稳定性:这版不是只有 UI
v0.16.0 从 v0.15.2 到当前版本合入了 874 个 commits、542 个 PR,关闭 399 个 issues,其中包括 2 个 P0、62 个 P1 和 16 个 security-tagged 问题。安全相关更新包括 Starlette CVE 修复、SSRF 检查硬化、子进程凭证剥离等。
一句话总结:这版的重点不是“多了一个漂亮界面”,而是 Hermes 开始具备更完整的产品化表面。
4. 方案对比:官方直连 vs 4sAPI 中转
| 方案 | 优点 | 风险与限制 | 适合人群 |
|---|---|---|---|
| 官方 API 直连 | 链路最短;控制权最高;官方文档最完整 | 注册、支付、网络、模型切换、团队 Key 管理都要自己处理 | 海外环境稳定、合规要求高、能直接使用官方 API 的团队 |
| 4sAPI 中转 | 一个 URL + 一个 Key 接入多模型;国内调用更方便;可做分组、额度、日志管理 | 多一层中转依赖;要关注隐私、稳定性、价格和可用模型 | 国内开发者、独立创作者、小团队、需要快速验证多模型的项目 |
我的建议是:如果你是生产级、强合规、强隐私项目,优先做官方直连和企业合同;如果你是原型开发、个人效率工具、内部低敏感度项目,4sAPI 这类中转方式可以显著降低接入门槛。
5. 实战:Hermes 接入 4sapi.com 中转 API
下面以 Hermes v0.16.0 为例,配置 4sAPI 的 OpenAI 兼容接口。核心思路是:在 Hermes 里选择 Custom endpoint,然后填入 4sAPI 的 URL、Key 和模型 ID。
5.1 环境准备
你需要先准备四样东西:
- 已安装或已更新到 Hermes v0.16.0。
- 一个 4sAPI 账号,并确保余额大于 0。
- 在 4sAPI 控制台创建好的 API Key。
- 从 4sAPI 模型广场复制的模型 ID,例如
claude-sonnet-4-5-20250929。实际发布时请以模型广场显示为准,不要手打。
Linux / macOS / WSL2 可以这样安装或更新:
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
source ~/.bashrc
hermes update
hermes doctor
Windows PowerShell 可以使用:
iex (irm https://hermes-agent.nousresearch.com/install.ps1)
hermes update
hermes doctor
5.2 在 4sAPI 创建 Key
在 4sAPI 控制台里的大致流程是:
注册账号 → 充值余额 → 创建令牌 → 选择模型分组 → 设置额度/期限 → 复制 API Key
这里建议给 Hermes 单独创建一个 Key,不要和其他工具共用。原因很简单:后续你可以单独看 Hermes 的调用日志、限额和消耗,也方便在 Key 泄露时快速停用。
5.3 推荐方式:用 hermes model 交互配置
在终端执行:
hermes model
然后按提示选择:
Custom endpoint (self-hosted / VLLM / etc.)
依次填入:
API base URL: https://4sapi.com/v1
API key: sk-xxxxxxxxxxxxxxxxxxxxxxxx
Model name: 从 4sAPI 模型广场复制的模型 ID
API mode: chat_completions
如果 https://4sapi.com/v1 调不通,可以按 4sAPI 文档提示改成:
https://4sapi.com
注意不要把 Hermes 的 base_url 填成 https://4sapi.com/v1/chat/completions。/chat/completions 通常是完整接口路径,Hermes 自己会在 base URL 后面拼接请求路径。只有某些第三方软件明确要求完整路径时,才需要填到这一层。
5.4 配置文件方式:适合服务器部署
如果你要部署到服务器,建议把 Key 放在 ~/.hermes/.env,不要明文写进 config.yaml。
先在 ~/.hermes/.env 中放入:
FOURSAPI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxx
然后在 ~/.hermes/config.yaml 里配置命名 custom provider:
custom_providers:
- name: "4sapi"
base_url: "https://4sapi.com/v1"
key_env: FOURSAPI_API_KEY
api_mode: chat_completions
model:
provider: "custom:4sapi"
default: "claude-sonnet-4-5-20250929"
Hermes 官方文档里也有 model.provider: custom 的最短手动配置写法,适合本地临时验证。但长期使用时,我更推荐上面这种命名 provider 写法:Key 放进 .env,配置文件只引用环境变量。后面你可以继续加 openrouter、local-ollama、company-proxy 等 endpoint,并在会话里用 /model 快速切换。
5.5 启动并测试
启动 Hermes:
hermes
进入会话后可以发一条简单测试:
请用一句话说明你当前可以帮助我做什么。
如果已经配置了多个 custom provider,可以在会话内切换:
/model custom:4sapi:claude-sonnet-4-5-20250929
也可以先用 curl 直接测试 4sAPI 的 OpenAI 兼容接口:
curl https://4sapi.com/v1/chat/completions \
-H "Authorization: Bearer $FOURSAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-5-20250929",
"messages": [
{"role": "user", "content": "ping"}
]
}'
如果你参考 4sAPI 文档手动调试,也可能看到 Authorization: sk-... 这种直接放 Key 的写法;而 OpenAI 兼容客户端通常会发送 Authorization: Bearer sk-...。实际以当前控制台和文档说明为准,Hermes 这类客户端一般不需要你手写 Header。
如果 curl 能通、Hermes 不通,优先检查 Hermes 的 base_url、api_mode 和模型 ID。反过来,如果 curl 也不通,就先回到 4sAPI 控制台检查 Key 状态、余额、分组和模型是否可用。
6. 常见坑位与解决方法
坑 1:URL 多写了一层路径
错误示例:
https://4sapi.com/v1/chat/completions
在 Hermes 的 Custom endpoint 里,通常应该填:
https://4sapi.com/v1
如果出现 404、405 或路径重复,先检查这里。
坑 2:模型 ID 手打导致失败
中转站的模型名经常很长,例如 Claude、Gemini、DeepSeek、Qwen 的不同版本会带日期或后缀。模型 ID 必须从模型广场复制,不要凭记忆输入。
坑 3:Key 有余额但分组不支持该模型
4sAPI 的分组会影响可用模型、稳定性和价格。如果你遇到“Key 可用但某个模型不可用”,不要只看余额,还要看这个 Key 绑定的分组是否支持目标模型。
坑 4:Claude 原生接口和 OpenAI 兼容接口混用
Hermes 的 Custom endpoint 可以接 OpenAI 兼容接口,也可以在部分场景接 Anthropic Messages 兼容接口。使用 4sAPI 时,如果你走的是 OpenAI 兼容的 /v1/chat/completions,api_mode 就选 chat_completions。
如果你改用 Claude 原生 messages 接口,则需要对应的 endpoint 和 anthropic_messages 模式。不要把两种接口格式混在一起。
坑 5:把 API Key 写进截图或教程
写博客、录教程、发 issue 时,务必打码 Key。更稳妥的做法是把 Key 放到 .env,配置里只引用环境变量。
7. 成本与风险提示
使用 Hermes + 4sAPI 时,成本主要来自三块:
- 模型调用费用:按 4sAPI 对应模型和分组计费。
- Hermes 运行环境:本地电脑免费;远程服务器则有 VPS 或云主机成本。
- 额外工具消耗:如果启用联网、图片、TTS、浏览器自动化等工具,要单独关注后端成本。
省钱建议:
- 给 Hermes 单独创建 Key,并设置额度上限。
- 开发和测试阶段优先用便宜模型,复杂任务再切 Claude/GPT 高阶模型。
- 善用
/undo,避免错误提示词导致连续无效调用。 - 定期看 4sAPI 调用日志,找出高消耗任务。
- 低敏感任务走中转,高敏感任务走官方直连或本地模型。
风险方面,要重点关注三点:
- 数据隐私:不要把未脱敏的客户数据、源代码机密、生产凭证直接发给不确定的第三方链路。
- 稳定性:中转站多一层依赖,生产环境要准备 fallback 和监控。
- 合规性:只在授权范围内使用模型和 API,不要用于绕过限制、滥用账号或生成违规内容。
8. 一句话总结
Hermes v0.16.0 的关键变化,是从“终端里的强力 agent”升级成“桌面端 + 后台 + 远程 gateway + 多模型配置”的完整工作台;而 4sAPI 这类大模型 API 中转站,正好可以补上国内开发者在多模型接入、Key 管理和调用稳定性上的短板。
如果你只是想快速体验 Hermes,直接用 hermes model 选择 Custom endpoint 接入 4sAPI 就够了;如果你要长期使用,建议采用“远程 Hermes Gateway + .env 管理 Key + 4sAPI 单独限额”的方式,把安全、成本和可维护性一起考虑进去。
如果你已经在用 Hermes、Claude Code、Codex 或其他 AI Agent 工具,也欢迎在评论区补充你的模型接入方案、踩坑记录和成本数据。下一篇可以继续横向对比不同中转站在稳定性、价格和模型覆盖上的差异。
参考资料
- Hermes Agent v0.16.0 Release Notes: https://github.com/NousResearch/hermes-agent/releases/tag/v2026.6.5
- Hermes Agent AI Providers 文档: https://hermes-agent.nousresearch.com/docs/integrations/providers
- Hermes Agent Configuration 文档: https://hermes-agent.nousresearch.com/docs/user-guide/configuration/
- 4sAPI 快速上手调用大模型 API: https://4sapi.apifox.cn/8181987m0
- 4sAPI OpenAI 兼容文本生成接口: https://4sapi.apifox.cn/359535005e0
- 4sAPI Claude 原生 messages 接口示例: https://4sapi.apifox.cn/383153629e0