Google Gemini#
Hermes Agent 通过 Google AI Studio / Gemini API 原生支持 Google Gemini——而非 OpenAI 兼容端点。这使 Hermes 能够将其内部 OpenAI 格式的消息和工具循环转换为 Gemini 原生的 generateContent API,同时保留工具调用、流式传输、多模态输入以及 Gemini 特有的响应元数据。Hermes 还支持独立的 Google Gemini(OAuth) provider,使用与 Google Gemini CLI 相同的 Cloud Code Assist 后端。如需最低风险的官方 API 路径,请使用 API 密钥 provider(gemini)。前提条件#
已启用计费的 Google Cloud 项目 — 推荐用于 Agent 场景。Gemini 免费层级对长时间运行的 Agent 会话而言配额过小,因为 Hermes 每次用户交互可能发起多次模型调用。
已安装 Hermes — 原生 Gemini provider 无需额外安装 Python 包。
设置 GOOGLE_API_KEY 或 GEMINI_API_KEY。Hermes 对 gemini provider 会同时检查这两个名称。
快速开始#
如果你偏好直接编辑配置文件,请使用原生 Gemini API 基础 URL:运行 hermes model 后,~/.hermes/config.yaml 将包含:原生 Gemini API#
https://generativelanguage.googleapis.com/v1beta
Hermes 检测到该端点后会创建原生 Gemini 适配器。在内部,Hermes 仍以 OpenAI 格式维护 Agent 循环,然后将每个请求转换为 Gemini 原生 schema:messages[] → Gemini contents[]
系统提示(system prompt)→ Gemini systemInstruction
工具 schema → Gemini functionDeclarations
工具结果 → Gemini functionResponse 部分
流式响应 → 供 Hermes 循环使用的 OpenAI 格式流式数据块
对于 Gemini 3 的工具调用,Hermes 会保留附加在函数调用部分的 thoughtSignature 值,并在下一个工具轮次中重放。这覆盖了多步骤 Agent 工作流中验证关键路径的需求。Gemini 3 也可能在其他响应部分附加思维签名。Hermes 的原生适配器目前针对 Agent 工具循环进行了优化,尚未以完整的部分级保真度重放所有非工具调用签名。
优先使用原生端点#
https://generativelanguage.googleapis.com/v1beta/openai/
对于 Hermes Agent 会话,请优先使用上述原生 Gemini 端点。Hermes 内置原生 Gemini 适配器,可将多轮工具调用、工具调用结果、流式传输、多模态输入以及 Gemini 响应元数据直接映射到 Gemini 的 generateContent API。OpenAI 兼容端点在你明确需要 OpenAI API 兼容性时仍然有用。如果你之前将 GEMINI_BASE_URL 设置为 /openai URL,请将其删除或修改:OAuth Provider#
Hermes 还提供 google-gemini-cli provider:该方式使用浏览器 PKCE 登录和 Cloud Code Assist 后端。对于希望使用 Gemini CLI 风格 OAuth 的用户可能有用,但 Hermes 会显示明确警告,因为 Google 可能将第三方软件使用 Gemini CLI OAuth 客户端的行为视为违反政策。对于生产环境或最低风险使用场景,请优先使用上述 API 密钥 provider。可用模型#
hermes model 选择器显示 Hermes provider 注册表中维护的 Gemini 模型。常见选项包括:| 模型 | ID | 说明 |
|---|
| Gemini 3.1 Pro Preview | gemini-3.1-pro-preview | 可用时最强大的预览模型 |
| Gemini 3 Pro Preview | gemini-3-pro-preview | 强大的推理和编码模型 |
| Gemini 3 Flash Preview | gemini-3-flash-preview | 推荐的默认选项,速度与能力均衡 |
| Gemini 3.1 Flash Lite Preview | gemini-3.1-flash-lite-preview | 可用时速度最快、成本最低的选项 |
模型可用性会随时间变化。如果某个模型消失或未对你的密钥启用,请重新 运行 hermes model 并从当前列表中选择。当 provider: gemini 时,请使用 Gemini 原生模型 ID,如 gemini-3-flash-preview,而非 OpenRouter 风格的 ID(如 google/gemini-3-flash-preview)。
最新别名#
Google 为 Pro 和 Flash Gemini 系列发布了滚动别名。当你希望 Google 自动升级模型而无需修改 Hermes 配置时,gemini-pro-latest 和 gemini-flash-latest 非常实用。| 别名 | 当前指向 | 说明 |
|---|
gemini-pro-latest | 最新 Gemini Pro 模型 | 需要 Google 当前 Pro 默认值时的最佳选择 |
gemini-flash-latest | 最新 Gemini Flash 模型 | 需要 Google 当前 Flash 默认值时的最佳选择 |
如果需要严格的可复现性,请优先使用明确的模型 ID,如 gemini-3.1-pro-preview 或 gemini-3-flash-preview。通过 Gemini API 使用 Gemma