Whale

对比

Whale 与其他 AI 编程 Agent 的比较——诚实地展示各自的优劣。

功能对比

主流 AI 编程工具详细对比。

Feature Whale Claude Code Codex CLI Cursor Aider
主要界面 终端 TUI/CLI 终端 Agent 终端 Agent IDE CLI
默认模型 DeepSeek Anthropic OpenAI 多模型 多模型
DeepSeek 优化 有限
前缀缓存友好 依模型 有限
本地代码读写
Shell 命令执行 部分
/ask 只读模式 部分 部分 部分
/plan 计划模式 部分
MCP 支持 依版本 部分 部分
Skills 工作流 部分 有限
开源

成本对比

Whale 的 DeepSeek 原生设计带来显著的成本优势。

Scenario Whale (DeepSeek) Claude Code Savings
5 轮编程会话 ~$0.001 ~$0.015 ~93%
工具调用任务 ~$0.00014 ~$0.0034 ~96%
R1 推理任务 ~$0.0065 ~$0.044 ~85%

为什么只支持 DeepSeek?

Whale 不打算支持所有模型。它的目标是将 DeepSeek API 打造成一个稳定、低成本的本地编程 Agent, 可以长时间保持开放会话。

DeepSeek 的低 token 价格只是故事的一部分。对于长时间运行的编程 Agent 来说,真正的优势在于 前缀缓存。DeepSeek 的前缀缓存对字节稳定性非常敏感。 Whale 的循环就是围绕这一约束设计的:追加式轮次、稳定的上下文排序和可恢复的会话记录。

这就是为什么 Whale 不急于做通用的多模型抽象。Claude、OpenAI 和 DeepSeek 在缓存机制、 工具调用行为和推理控制上各不相同。通用的包装器通常会隐藏最重要的 DeepSeek 特有部分。

通用 Agent 假设 DeepSeek 实际表现 Whale 的处理
工具调用 JSON 稳定 负载可能格式错误、被转义或混入推理内容 schema 引导修复 / 回收路径
深层工具 Schema 完整保留 部分嵌套参数可能被丢弃 展平工具参数
工具失败应触发重新计划 某些失败应传递给模型 更精细的失败分类和恢复
取消操作只是另一种失败 取消不应继续恢复或重新计划 专用的中断路径
推理深度仅通过提示控制 DeepSeek 暴露 reasoning_effort 运行时 Effort 控制

试试 Whale,感受差异