词元之母TOK.MOM - 平台充值汇率 1:1 即 1 人民币充值到账 1 美元,支持一个 Key 调用近 600+ 海内外模型,限时特价模型低至 1 折,欢迎上岸!
| 组件 | 最低配置 | 推荐配置 |
|---|---|---|
| 内存 | 8 GB(适用于 3B 模型) | 32+ GB(适用于 27B+ 模型) |
| 存储 | 5 GB 可用空间 | 30+ GB(适用于多个模型) |
| CPU | 4 核 | 8+ 核(AMD EPYC、Ryzen、Intel Xeon) |
| GPU | 非必需 | 配备 8+ GB 显存的 NVIDIA GPU 可显著提速 |
config.yaml 键)放宽 API 超时时间:| 模型 | 磁盘占用 | 所需内存 | 工具调用 | 适用场景 |
|---|---|---|---|---|
gemma4:31b | ~20 GB | 24+ GB | 支持 | 最佳质量——工具使用和推理能力强 |
gemma2:27b | ~16 GB | 20+ GB | 不支持 | 对话任务,不支持工具使用 |
gemma2:9b | ~5 GB | 8+ GB | 不支持 | 快速问答——无法调用工具 |
llama3.2:3b | ~2 GB | 4+ GB | 不支持 | 仅适合轻量级快速回答 |
gemma4:31b)。/model 切换。Ollama 按需将活跃模型加载到内存,并自动卸载空闲模型。http://localhost:11434/v1no-key(Ollama 不需要密钥)gemma4:31b(或你拉取的模型)~/.hermes/config.yaml:You: List all Python files in this directory and count the lines of code in each
You: Read the README.md and summarize what this project does
You: Create a Python script that fetches the weather for Ho Chi Minh City| 任务 | 推荐模型 | 原因 |
|---|---|---|
| 文件编辑、代码、终端命令 | gemma4:31b | 唯一具备可靠工具调用能力的模型 |
| 快速问答(无需工具调用) | gemma2:9b | 对话任务响应速度快 |
| 轻量级聊天 | llama3.2:3b | 最快,但能力非常有限 |
gemma4:31b 目前是支持工具调用的最佳本地选项。请关注 Ollama 的模型库 以获取更新模型——工具调用支持正在快速扩展。/model gemma2:9bgemma4-16k。~/.hermes/config.yaml:hermes gateway