对比
Whale 与其他 AI 编程 Agent 的比较——诚实地展示各自的优劣。
功能对比
主流 AI 编程工具详细对比。
| Feature | Whale | Claude Code | Codex CLI | Cursor | Aider |
|---|---|---|---|---|---|
| 主要界面 | 终端 TUI/CLI | 终端 Agent | 终端 Agent | IDE | CLI |
| 默认模型 | DeepSeek | Anthropic | OpenAI | 多模型 | 多模型 |
| DeepSeek 优化 | ✓ | — | — | — | 有限 |
| 前缀缓存友好 | ✓ | — | — | 依模型 | 有限 |
| 本地代码读写 | ✓ | ✓ | ✓ | ✓ | ✓ |
| Shell 命令执行 | ✓ | ✓ | ✓ | 部分 | ✓ |
| /ask 只读模式 | ✓ | 部分 | 部分 | — | 部分 |
| /plan 计划模式 | ✓ | ✓ | ✓ | — | 部分 |
| MCP 支持 | ✓ | ✓ | 依版本 | 部分 | 部分 |
| Skills 工作流 | ✓ | ✓ | ✓ | 部分 | 有限 |
| 开源 | ✓ | — | ✓ | — | ✓ |
成本对比
Whale 的 DeepSeek 原生设计带来显著的成本优势。
| Scenario | Whale (DeepSeek) | Claude Code | Savings |
|---|---|---|---|
| 5 轮编程会话 | ~$0.001 | ~$0.015 | ~93% |
| 工具调用任务 | ~$0.00014 | ~$0.0034 | ~96% |
| R1 推理任务 | ~$0.0065 | ~$0.044 | ~85% |
为什么只支持 DeepSeek?
Whale 不打算支持所有模型。它的目标是将 DeepSeek API 打造成一个稳定、低成本的本地编程 Agent, 可以长时间保持开放会话。
DeepSeek 的低 token 价格只是故事的一部分。对于长时间运行的编程 Agent 来说,真正的优势在于 前缀缓存。DeepSeek 的前缀缓存对字节稳定性非常敏感。 Whale 的循环就是围绕这一约束设计的:追加式轮次、稳定的上下文排序和可恢复的会话记录。
这就是为什么 Whale 不急于做通用的多模型抽象。Claude、OpenAI 和 DeepSeek 在缓存机制、 工具调用行为和推理控制上各不相同。通用的包装器通常会隐藏最重要的 DeepSeek 特有部分。
| 通用 Agent 假设 | DeepSeek 实际表现 | Whale 的处理 |
|---|---|---|
| 工具调用 JSON 稳定 | 负载可能格式错误、被转义或混入推理内容 | schema 引导修复 / 回收路径 |
| 深层工具 Schema 完整保留 | 部分嵌套参数可能被丢弃 | 展平工具参数 |
| 工具失败应触发重新计划 | 某些失败应传递给模型 | 更精细的失败分类和恢复 |
| 取消操作只是另一种失败 | 取消不应继续恢复或重新计划 | 专用的中断路径 |
| 推理深度仅通过提示控制 | DeepSeek 暴露 reasoning_effort | 运行时 Effort 控制 |