一行命令干翻5个API!阿里云百炼CLI开源,Agent水电煤之战正式开打

封面

5月29日,阿里云干了一件让 Agent 开发者集体高潮的事——百炼核心能力正式 CLI 化,一行命令就能让 AI Agent 自动接入 150 多款模型、10 多款应用、知识库、记忆、联网搜索等全套能力。

更关键的是,百炼 CLI 已在 GitHub 开源(modelstudioai/cli),原生支持 Claude Code、Qoder、OpenClaw、Hermes Agent 等主流 Agent 框架。

一句话总结:以前你要手动调 10 个 API 才能实现的 Agent 能力,现在一行 bl 命令全搞定。

百炼 CLI 到底是什么

阿里云百炼(Model Studio)是一站式大模型与 Agent 应用开发平台。以前它的交互方式是 Web 控制台 + API SDK,你得写代码、配环境、管 Token。

现在百炼 CLI 把核心能力全部搬到了命令行:

  • 文本对话:Qwen3.7-max 等主流模型
  • 多模态(Omni):文本 + 图片 + 音频 + 视频全支持
  • 图片生成/编辑:Qwen-Image 2.0,专业文字渲染、照片级画质、多图合成
  • 视频生成/编辑:HappyHorse-1.0 系列,文生视频/图生视频/参考视频,最多 9 图参考
  • 语音合成/识别:CosyVoice 流式 TTS + 5-20 秒语音克隆;FunAudio-ASR 覆盖 30 种语言含 7 种中文方言
  • 图像/视频理解:Qwen-VL,长视频分析、图表文档解析、视觉推理、多语言 OCR
  • 知识库 + 记忆:多模态 RAG 检索 + 跨会话记忆
  • 应用调用:直接调用百炼平台已发布的 Agent 和 Workflow
  • 联网搜索:实时互联网检索
  • 控制台能力:浏览应用列表、查免费额度
  • 本地文件自动上传:每个 URL 参数都接受本地路径,自动上传到免费临时存储(48小时有效)

而且每个命令都可以作为结构化的 tool call——这意味着 AI Agent 可以直接调用,不用你写 wrapper。

三步安装,即刻起飞

环境要求:Node.js >= 22.12。

Step 1:安装 CLI + Skills

npm install -g bailian-cli
npx skills add modelstudioai/skills --all -g

Step 2:认证

bl auth login --api-key sk-xxxxx

API Key 从百炼控制台获取,免费用户每个模型送 100 万 Token,最高可领 5000 万。

Step 3:开用

跟 Qwen 聊天:

bl text chat --message "What is DashScope?"

多模态对话(文字+图片+音频+视频):

bl omni --message "描述这张图" --image ./photo.jpg

生成图片:

bl image generate --prompt "A cat in a spacesuit" --out-dir ./images/

生成视频(从本地图片):

bl video generate --image ./cat.png --prompt "Make the cat move" --download cat.mp4

查免费额度:

bl usage free --model qwen3-max

浏览百炼应用:

bl app list

自更新:

bl update

一句话生成 2 分钟日系青春视频:官方真实 Demo

插图

百炼 CLI 的 GitHub README 上有一段官方 Demo,看完整个人就懵了。

原始 Prompt:

帮我生成一段日系影视风格,高中女生的青涩初恋故事,剧情高甜,让人看了想谈恋爱,2分钟左右的视频,尺寸是16:9

最终产出:完整 2 分钟、16:9 电影级短片,全程零人工剪辑。

背后的执行链是这样的:

  • Qwen Code(agentic coding 模型)解析用户意图、规划叙事节奏、决定调用哪些工具
  • spark-video Skill 把故事拆分成镜头、写每个镜头的 prompt、保持视觉连贯性(角色、灯光、色调、镜头语言)
  • 百炼 CLI 的 bl video generate 把每个镜头并行分发给 HappyHorse 1.0 生成
  • Skill 把所有片段重新拼接成最终 16:9、2 分钟的成品

没有时间轴拖拉、没有逐帧编辑,一句话进、一个视频出。

这就是 CLI 化最大的价值——把复杂工作流变成可被 Agent 自动编排的原子能力。

为什么 CLI 化是 Agent 时代的杀招

你可能觉得:CLI 不就是命令行嘛,老技术了,至于这么激动?

关键就在 CLI 这个形式跟 Agent 的契合度。

传统 API 接入:

  • 要写代码(Python/Node/Go 各搞一套)
  • 要管 SDK 版本
  • 要处理鉴权、超时、重试、错误码
  • Agent 调用还要写 wrapper

CLI 接入:

  • Agent 就是用 shell 干活的,CLI 是天然语言
  • 一行命令就是一个工具调用,结构化输出直接喂回模型
  • 跨语言无压力,bash、Python、Node、Go 都能调
  • 升级只需 bl update,Agent 不用改代码

更刺激的是,百炼 CLI 直接原生兼容 Claude Code、Qoder、OpenClaw、Hermes Agent 这些主流 Agent 框架。意思就是:

  • 你在 Claude Code 里说帮我生成一张图,它直接调 bl image generate
  • 你在 OpenClaw 里说分析这段视频,它直接调 bl 的视频理解能力
  • 你在 Qoder 里写代码,缺啥能力直接 bl 一下

Agent 不需要任何额外配置,就能拥有百炼 150+ 模型的全套能力。

150+ 模型背后是什么

百炼平台聚合的不只是阿里通义系列,还包括:

  • 通义千问全系列(Qwen3-Max、Qwen-Image 2.0、Qwen-VL、Qwen Code 等)
  • DeepSeek 系列
  • GLM 系列(智谱)
  • Kimi 系列(月之暗面)
  • MiniMax 系列
  • 阿里自研多模态:HappyHorse、CosyVoice、FunAudio-ASR
  • 第三方开源模型大量集成

这种聚合的好处是:你不用为每家模型公司单独申请 API Key、单独充值、单独对接。一份百炼账号通吃。

配合阿里云另一个杀手锏 Coding Plan(多模型合一的固定月费订阅),开发者每个月固定花费就能用遍所有头部模型,不再担心 API 调用超预算。

鉴权方式很贴心

插图

百炼 CLI 提供三种鉴权方式:

  • 环境变量:export DASHSCOPE_API_KEY=sk-xxxxx
  • 登录命令:bl auth login –api-key sk-xxxxx(持久化到 ~/.bailian/config.json)
  • 单次命令:bl text chat –api-key sk-xxxxx –message Hello

控制台能力(app list、usage free)需要浏览器登录:

bl auth login --console

知识库检索需要 RAM 子账号 AccessKey:

export ALIBABA_CLOUD_ACCESS_KEY_ID=LTAI5t...
export ALIBABA_CLOUD_ACCESS_KEY_SECRET=...
export BAILIAN_WORKSPACE_ID=ws-...

官方还提醒:用 RAM 子账号,别用根账号 AK/SK——这个安全提醒非常专业。

阿里这波布局的真正信号

把百炼 CLI 这件事放到阿里云今年的整体动作里看,节奏就很清晰了:

  • 1 月 28 日:阿里云上线 OpenClaw 全套云服务,全面提供 Agent 所需的基础设施
  • 4 月:通义千问 Qwen3.7-Max 发布,编程能力直追 Claude
  • 5 月:Coding Plan 订阅套餐上线,49 元/月起聚合 4 大头部模型
  • 5 月 29 日:百炼 CLI 正式开源,Agent 即装即用

这一串组合拳的意图非常明显:

阿里云不打算只做卖模型 API的生意。它要做的是Agent 时代的水电煤——你要做 Agent 应用,从基础设施(OpenClaw 云服务)、到模型选型(Coding Plan)、到能力调用(百炼 CLI)、到 Agent 框架兼容(Claude Code/OpenClaw/Hermes/Qoder),整条链路全部覆盖。

这跟 AWS 在云时代做 S3+EC2+Lambda 的逻辑一模一样——卖单个服务,更要卖整个生态。

跟 OpenClaw、Hermes 这些项目什么关系

懂 Agent 生态的人会问:阿里既然有自己的 Qwen Code 和百炼,为啥还要主动兼容 OpenClaw、Hermes 这些第三方框架?

答案很现实:开发者的工作流早就被这些开源 Agent 框架占领了。

  • OpenClaw 35.6 万 Star,是 GitHub 历史上增速最快的开源项目之一
  • Hermes Agent 两个多月 7.1 万 Star,独立开发者迁移最积极
  • Claude Code、Qoder 在国内外都是头部 AI 编程工具

阿里云的选择是:与其和这些项目竞争用户心智,不如直接当好基础设施供应商——你用什么 Agent 框架我都不管,反正我的能力你都能调到。

这是非常成熟的卖铲子策略。淘金的人换来换去,铲子永远在卖。

给开发者的实操建议

插图

如果你今天就想试,按这个顺序来:

第一步:领免费 Token

去百炼控制台开通账号,每个模型送 100 万 Token,最高 5000 万额度。普通开发者跑两个月都跑不完。

第二步:装 CLI

npm install -g bailian-cli
bl auth login --api-key sk-xxxxx

第三步:测最值钱的能力

依次试:

  • bl image generate(图片生成,对比 MidJourney)
  • bl video generate(视频生成,HappyHorse 1.0)
  • bl omni(多模态对话)
  • bl text chat(Qwen3.7-Max,对比 Claude)

第四步:接入你的 Agent

如果你在用 Claude Code、OpenClaw、Hermes 或 Qoder,直接把 bl 配置为可用工具,Agent 就能自主调用。

第五步:跑跑视频 Demo

用官方的 spark-video Skill 试试一句话生成短视频,感受下完整 Agent 工作流是什么样。

写在最后

AI Agent 时代的竞争,已经不再是谁的模型分数高,而是谁能让 Agent 最容易用上多模态、多能力、跨工具的复合能力。

百炼 CLI 开源这件事的真正分量,在于它把调用能力这个最痛的环节抹平了。以前你想做一个能识图、能写文、能生视频、能联网搜索、能调用知识库的 Agent,得对接 5 个以上的 API。现在一个 bl 命令搞定。

对个人开发者:少写 80% 的 boilerplate 代码,专心做产品逻辑。

对企业团队:少了一堆 API 集成的运维成本,多了百炼平台的国内合规背书。

对整个 Agent 生态:百炼 CLI 这种原子化能力 + Agent 友好的设计模式,可能会被其他大厂效仿。未来一两年我们大概率会看到腾讯云、华为云、字节火山引擎跟进类似的 CLI 工具。

AI Agent 的水电煤之战,正式开打。

GitHub 地址:github.com/modelstudioai/cli

暂无介绍....

延伸阅读:

一行命令干翻5个API!阿里云百炼CLI开源,Agent水电煤之战正式开打

5月29日,阿里云干了一件让 Agent 开发者集体高潮的事——百炼核心能力正式 CLI 化,一行命令就能让 AI Ag...

itadol5j
2026年5月29日
20亿用户握手!PayPal钱包正式接入微信支付,老外来华扫码时代到了

5月27日,支付圈传出来一个让人眼前一亮的消息:腾讯财付通全球与 PayPal World 正式达成合作,PayPal ...

itadol5j
2026年5月28日
支付宝杭州扔下王炸:3亿笔智能体支付已跑通,AI付Token Pay四件套定义新范式

5月26日下午,支付宝在杭州未来科技城国际会议中心办了一场叫"AI 支付生态大会"的活动。表面看是常规的产品发布会,实际...

itadol5j
2026年5月27日
渗透圈一夜变天!Xalgorix 22阶段全自动 AI 攻击平台开源,国产模型直接接

渗透测试这行最累的是什么?不是写报告,是重复劳动——侦察、目录爆破、注入点测试、SSRF 验证、CORS 检查……一个标...

itadol5j
2026年5月27日
Claude Mythos 企业版挖出超1万高危漏洞:Anthropic 联手13家巨头建AI安全联盟

Anthropic 最近搞了个大动作,但这次不是发新模型那么简单。4月7日,它联合了一串你可能做梦都想不到会站在一起的公...

itadol5j
2026年5月26日