一行命令干翻5个API!阿里云百炼CLI开源,Agent水电煤之战正式开打

5月29日,阿里云干了一件让 Agent 开发者集体高潮的事——百炼核心能力正式 CLI 化,一行命令就能让 AI Agent 自动接入 150 多款模型、10 多款应用、知识库、记忆、联网搜索等全套能力。
更关键的是,百炼 CLI 已在 GitHub 开源(modelstudioai/cli),原生支持 Claude Code、Qoder、OpenClaw、Hermes Agent 等主流 Agent 框架。
一句话总结:以前你要手动调 10 个 API 才能实现的 Agent 能力,现在一行 bl 命令全搞定。
百炼 CLI 到底是什么
阿里云百炼(Model Studio)是一站式大模型与 Agent 应用开发平台。以前它的交互方式是 Web 控制台 + API SDK,你得写代码、配环境、管 Token。
现在百炼 CLI 把核心能力全部搬到了命令行:
- 文本对话:Qwen3.7-max 等主流模型
- 多模态(Omni):文本 + 图片 + 音频 + 视频全支持
- 图片生成/编辑:Qwen-Image 2.0,专业文字渲染、照片级画质、多图合成
- 视频生成/编辑:HappyHorse-1.0 系列,文生视频/图生视频/参考视频,最多 9 图参考
- 语音合成/识别:CosyVoice 流式 TTS + 5-20 秒语音克隆;FunAudio-ASR 覆盖 30 种语言含 7 种中文方言
- 图像/视频理解:Qwen-VL,长视频分析、图表文档解析、视觉推理、多语言 OCR
- 知识库 + 记忆:多模态 RAG 检索 + 跨会话记忆
- 应用调用:直接调用百炼平台已发布的 Agent 和 Workflow
- 联网搜索:实时互联网检索
- 控制台能力:浏览应用列表、查免费额度
- 本地文件自动上传:每个 URL 参数都接受本地路径,自动上传到免费临时存储(48小时有效)
而且每个命令都可以作为结构化的 tool call——这意味着 AI Agent 可以直接调用,不用你写 wrapper。
三步安装,即刻起飞
环境要求:Node.js >= 22.12。
Step 1:安装 CLI + Skills
npm install -g bailian-cli
npx skills add modelstudioai/skills --all -g
Step 2:认证
bl auth login --api-key sk-xxxxx
API Key 从百炼控制台获取,免费用户每个模型送 100 万 Token,最高可领 5000 万。
Step 3:开用
跟 Qwen 聊天:
bl text chat --message "What is DashScope?"
多模态对话(文字+图片+音频+视频):
bl omni --message "描述这张图" --image ./photo.jpg
生成图片:
bl image generate --prompt "A cat in a spacesuit" --out-dir ./images/
生成视频(从本地图片):
bl video generate --image ./cat.png --prompt "Make the cat move" --download cat.mp4
查免费额度:
bl usage free --model qwen3-max
浏览百炼应用:
bl app list
自更新:
bl update
一句话生成 2 分钟日系青春视频:官方真实 Demo

百炼 CLI 的 GitHub README 上有一段官方 Demo,看完整个人就懵了。
原始 Prompt:
帮我生成一段日系影视风格,高中女生的青涩初恋故事,剧情高甜,让人看了想谈恋爱,2分钟左右的视频,尺寸是16:9
最终产出:完整 2 分钟、16:9 电影级短片,全程零人工剪辑。
背后的执行链是这样的:
- Qwen Code(agentic coding 模型)解析用户意图、规划叙事节奏、决定调用哪些工具
- spark-video Skill 把故事拆分成镜头、写每个镜头的 prompt、保持视觉连贯性(角色、灯光、色调、镜头语言)
- 百炼 CLI 的 bl video generate 把每个镜头并行分发给 HappyHorse 1.0 生成
- Skill 把所有片段重新拼接成最终 16:9、2 分钟的成品
没有时间轴拖拉、没有逐帧编辑,一句话进、一个视频出。
这就是 CLI 化最大的价值——把复杂工作流变成可被 Agent 自动编排的原子能力。
为什么 CLI 化是 Agent 时代的杀招
你可能觉得:CLI 不就是命令行嘛,老技术了,至于这么激动?
关键就在 CLI 这个形式跟 Agent 的契合度。
传统 API 接入:
- 要写代码(Python/Node/Go 各搞一套)
- 要管 SDK 版本
- 要处理鉴权、超时、重试、错误码
- Agent 调用还要写 wrapper
CLI 接入:
- Agent 就是用 shell 干活的,CLI 是天然语言
- 一行命令就是一个工具调用,结构化输出直接喂回模型
- 跨语言无压力,bash、Python、Node、Go 都能调
- 升级只需 bl update,Agent 不用改代码
更刺激的是,百炼 CLI 直接原生兼容 Claude Code、Qoder、OpenClaw、Hermes Agent 这些主流 Agent 框架。意思就是:
- 你在 Claude Code 里说帮我生成一张图,它直接调 bl image generate
- 你在 OpenClaw 里说分析这段视频,它直接调 bl 的视频理解能力
- 你在 Qoder 里写代码,缺啥能力直接 bl 一下
Agent 不需要任何额外配置,就能拥有百炼 150+ 模型的全套能力。
150+ 模型背后是什么
百炼平台聚合的不只是阿里通义系列,还包括:
- 通义千问全系列(Qwen3-Max、Qwen-Image 2.0、Qwen-VL、Qwen Code 等)
- DeepSeek 系列
- GLM 系列(智谱)
- Kimi 系列(月之暗面)
- MiniMax 系列
- 阿里自研多模态:HappyHorse、CosyVoice、FunAudio-ASR
- 第三方开源模型大量集成
这种聚合的好处是:你不用为每家模型公司单独申请 API Key、单独充值、单独对接。一份百炼账号通吃。
配合阿里云另一个杀手锏 Coding Plan(多模型合一的固定月费订阅),开发者每个月固定花费就能用遍所有头部模型,不再担心 API 调用超预算。
鉴权方式很贴心

百炼 CLI 提供三种鉴权方式:
- 环境变量:export DASHSCOPE_API_KEY=sk-xxxxx
- 登录命令:bl auth login –api-key sk-xxxxx(持久化到 ~/.bailian/config.json)
- 单次命令:bl text chat –api-key sk-xxxxx –message Hello
控制台能力(app list、usage free)需要浏览器登录:
bl auth login --console
知识库检索需要 RAM 子账号 AccessKey:
export ALIBABA_CLOUD_ACCESS_KEY_ID=LTAI5t...
export ALIBABA_CLOUD_ACCESS_KEY_SECRET=...
export BAILIAN_WORKSPACE_ID=ws-...
官方还提醒:用 RAM 子账号,别用根账号 AK/SK——这个安全提醒非常专业。
阿里这波布局的真正信号
把百炼 CLI 这件事放到阿里云今年的整体动作里看,节奏就很清晰了:
- 1 月 28 日:阿里云上线 OpenClaw 全套云服务,全面提供 Agent 所需的基础设施
- 4 月:通义千问 Qwen3.7-Max 发布,编程能力直追 Claude
- 5 月:Coding Plan 订阅套餐上线,49 元/月起聚合 4 大头部模型
- 5 月 29 日:百炼 CLI 正式开源,Agent 即装即用
这一串组合拳的意图非常明显:
阿里云不打算只做卖模型 API的生意。它要做的是Agent 时代的水电煤——你要做 Agent 应用,从基础设施(OpenClaw 云服务)、到模型选型(Coding Plan)、到能力调用(百炼 CLI)、到 Agent 框架兼容(Claude Code/OpenClaw/Hermes/Qoder),整条链路全部覆盖。
这跟 AWS 在云时代做 S3+EC2+Lambda 的逻辑一模一样——卖单个服务,更要卖整个生态。
跟 OpenClaw、Hermes 这些项目什么关系
懂 Agent 生态的人会问:阿里既然有自己的 Qwen Code 和百炼,为啥还要主动兼容 OpenClaw、Hermes 这些第三方框架?
答案很现实:开发者的工作流早就被这些开源 Agent 框架占领了。
- OpenClaw 35.6 万 Star,是 GitHub 历史上增速最快的开源项目之一
- Hermes Agent 两个多月 7.1 万 Star,独立开发者迁移最积极
- Claude Code、Qoder 在国内外都是头部 AI 编程工具
阿里云的选择是:与其和这些项目竞争用户心智,不如直接当好基础设施供应商——你用什么 Agent 框架我都不管,反正我的能力你都能调到。
这是非常成熟的卖铲子策略。淘金的人换来换去,铲子永远在卖。
给开发者的实操建议

如果你今天就想试,按这个顺序来:
第一步:领免费 Token
去百炼控制台开通账号,每个模型送 100 万 Token,最高 5000 万额度。普通开发者跑两个月都跑不完。
第二步:装 CLI
npm install -g bailian-cli
bl auth login --api-key sk-xxxxx
第三步:测最值钱的能力
依次试:
- bl image generate(图片生成,对比 MidJourney)
- bl video generate(视频生成,HappyHorse 1.0)
- bl omni(多模态对话)
- bl text chat(Qwen3.7-Max,对比 Claude)
第四步:接入你的 Agent
如果你在用 Claude Code、OpenClaw、Hermes 或 Qoder,直接把 bl 配置为可用工具,Agent 就能自主调用。
第五步:跑跑视频 Demo
用官方的 spark-video Skill 试试一句话生成短视频,感受下完整 Agent 工作流是什么样。
写在最后
AI Agent 时代的竞争,已经不再是谁的模型分数高,而是谁能让 Agent 最容易用上多模态、多能力、跨工具的复合能力。
百炼 CLI 开源这件事的真正分量,在于它把调用能力这个最痛的环节抹平了。以前你想做一个能识图、能写文、能生视频、能联网搜索、能调用知识库的 Agent,得对接 5 个以上的 API。现在一个 bl 命令搞定。
对个人开发者:少写 80% 的 boilerplate 代码,专心做产品逻辑。
对企业团队:少了一堆 API 集成的运维成本,多了百炼平台的国内合规背书。
对整个 Agent 生态:百炼 CLI 这种原子化能力 + Agent 友好的设计模式,可能会被其他大厂效仿。未来一两年我们大概率会看到腾讯云、华为云、字节火山引擎跟进类似的 CLI 工具。
AI Agent 的水电煤之战,正式开打。
GitHub 地址:github.com/modelstudioai/cli
没有啦 (T▽T)
延伸阅读:
一行命令干翻5个API!阿里云百炼CLI开源,Agent水电煤之战正式开打
5月29日,阿里云干了一件让 Agent 开发者集体高潮的事——百炼核心能力正式 CLI 化,一行命令就能让 AI Ag...
20亿用户握手!PayPal钱包正式接入微信支付,老外来华扫码时代到了
5月27日,支付圈传出来一个让人眼前一亮的消息:腾讯财付通全球与 PayPal World 正式达成合作,PayPal ...
支付宝杭州扔下王炸:3亿笔智能体支付已跑通,AI付Token Pay四件套定义新范式
5月26日下午,支付宝在杭州未来科技城国际会议中心办了一场叫"AI 支付生态大会"的活动。表面看是常规的产品发布会,实际...
渗透圈一夜变天!Xalgorix 22阶段全自动 AI 攻击平台开源,国产模型直接接
渗透测试这行最累的是什么?不是写报告,是重复劳动——侦察、目录爆破、注入点测试、SSRF 验证、CORS 检查……一个标...
Claude Mythos 企业版挖出超1万高危漏洞:Anthropic 联手13家巨头建AI安全联盟
Anthropic 最近搞了个大动作,但这次不是发新模型那么简单。4月7日,它联合了一串你可能做梦都想不到会站在一起的公...