Hermes Agent

Hermes Agent 是一款终端 AI 编程工具,通过配置可接入云知声Token Hub 大模型服务平台上的 AI 模型,支持按量付费/模型资源包、Token Plan两种接入方式。

一、前置工作

获取配置凭证

支持两种使用方式,但对应的凭证获取方式不同:

使用方式
说明
获取方式(以下为 API Key 均为示例)
按量付费 API 调用
按实际使用量计费,适合轻度使用
  • Base URL OpenAI 兼容协议:https://maas-api.hivoice.cn/v1 Anthropic 兼容协议:https://maas-api.hivoice.cn/anthropic
  • API Key
  • 格式:sk-xxxxx

前往 API Key 创建 API Key

Token Plan
固定订阅费,按套餐限量调用
  • Base URL OpenAI 兼容协议:https://maas-api.hivoice.cn/v1 Anthropic 兼容协议:https://maas-api.hivoice.cn/anthropic
  • API Key
  • 格式:tp-xxxxx

成功订阅后,前往 订阅管理 获取专属 API Key

二、安装Hermes Agent

Hermes Agent 支持 Linux、macOS、WSL2(Windows)等系统,如需了解更多内容,可参考 Hermes Agent 官方文档

  • Linux / macOS 系统不需要额外操作,默认环境即可。
  • Windows 系统需要参考 Windows 系统安装 WSL 安装 WSL2,然后在 WSL2 中执行下方命令。

安装命令:

Bash
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装完成后,重新加载终端环境:

Bash
source ~/.bashrc  # or source ~/.zshrc

验证安装(如有版本号输出,则表示安装成功):

Bash
hermes --version

安装完成后会出现以下界面:

安装完成后会出现以下界面:

三、配置接入凭证

安全提示

切勿将密钥分享给他人,或将其明文嵌入浏览器/客户端代码中。

如怀疑密钥泄露,请立即删除并重新生成。

  • 按量付费/模型资源包:通过 控制台 > API Key > 创建API Key,获取 API Key

按量付费支持使用所有模态模型,包括文本、语音、视觉等。

  • Token Plan:通过 控制台 > 订阅管理 > Token Plan,获取 API Key

Token Plan Key 用于 Token Plan 额度。它可以在付费资源可用之前存在;当您拥有 Token Plan Credits 时,会优先使用该资源。详情见 Token Plan 订阅概要

四、在Hermes Agent中配置 Unisound U2

下面两种配置方式中的 BASE_URL 和 API_KEY 需要替换为实际获取的。

方式一:在线编辑输入以下命令快速配置

这里的 model.provider 只能设置为 custom,自定义其他名称将不合法,比如 unisound-coding。

Bash
hermes config set model.provider custom
hermes config set model.base_url BASE_URL
hermes config set model.api_key UNISOUND_API_KEY
hermes config set model.default u2

配置完成后,可在 ~/.hermes/config.yaml 中查看配置信息。

方式二:手动编辑配置文件

手动编辑 ~/.hermes/config.yaml 进行设置:

YAML
model:
  provider: custom
  base_url: BASE_URL
  api_key: UNISOUND_API_KEY
  default: u2

验证配置

配置完成后,可执行以下命令发送一条测试消息:

Bash
hermes chat -q "你好"

如果返回正常的回复,则配置成功。如需切换模型,通过 -m 参数指定:

Bash
hermes chat -m qwen3.7-max

五、快速接入能力模型

我们预置U2-ASR、U2-TTS、U2-TTS-Clone、U1-OCR 模型能力,只需在Hermes Agent内添加对应模型技能,即可快速调用相关模型服务,无需单独对接各类模型 API 接口。

点击下方链接跳转至对应skill页面,可通过对话或命令行安装skill,安装完成后,skill将会引导您进行相关模型的配置。

模型名称
Skill名称
Skill说明
操作
U1-OCR
u1-ocr-parser-pro
文档解析
U1-OCR
u1-ocr-extract-pro
文档信息抽取与分类
U2-ASR
u2-asr-pro
语音转写
U2-TTS
u2-tts-pro
语音合成
U2-TTS-Clone
u2-tts-clone-pro
声音克隆