Browser-Use开源:让AI自动帮你操作任何网站

Browser-Use架构

🌐 Browser-Use:让 AI 自动帮你操作任何网站

想象一下:你只需要说“帮我买一份午餐”,AI 就会自动打开外卖网站、选择餐厅、下单付款。这就是 Browser-Use 的能力。

Browser-Use 是一个开源的 AI Agent 工具,能让 AI Agent自动操作浏览器,完成各种网页任务。它就像你的“浏览器替身”

🎯 核心能力

能力 说明 示例
求职申请 自动投简历 “帮我申请 10 个前端岗位”
购物下单 自动买商品 “帮我买一份午餐”
数据采集 网页爬虫 “抓取 GitHub Trending 前 10”
自动操作 任何网站 “查航班价格并预订”

⚡ 工作流程

用户输入自然语言任务 → AI Agent 理解意图 → 浏览器执行操作 → 返回结果
  1. 用户输入:你用自然语言描述任务,比如 “帮我申请这份工作”
  2. AI 理解:Agent 分析任务,拆解成浏览器操作步骤
  3. 浏览器执行:自动打开网页、点击按钮、填写表单、提交数据
  4. 返回结果:完成任务后,Agent 返回结果给你

📊 Benchmark:100 个真实任务测试

Browser-Use 在100 个真实浏览器任务上进行基准测试,表现优异:

  • ChatBrowserUse 模型:比其他模型快 3-5 倍,准确率 SOTA
  • Cloud Agent:比开源版本更强大,适合复杂任务

🔧 两种使用方式

1. 开源版本(免费)

# 安装(Python 3.11+)
uv init && uv add browser-use && uv sync

# 运行第一个 Agent
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio

async def main():
    browser = Browser()
    agent = Agent(
        task="Find the number of stars of the browser-use repo",
        llm=ChatBrowserUse(),
        browser=browser,
    )
    await agent.run()

asyncio.run(main())

特点

  • 免费,MIT License
  • 需要自己配置 LLM(OpenAI、Google、Ollama 等)
  • 适合深度定制和本地部署

2. Cloud 版本(推荐)

特点

  • 隐身浏览器:避免被检测和封禁
  • 代理轮换:自动切换 IP
  • CAPTCHA 解决:自动处理验证码
  • 1000+ 集成:Gmail、Slack、Notion 等
  • 持久文件系统:跨会话保存数据
  • 记忆功能:记住用户偏好
# 使用 Cloud
browser = Browser(use_cloud=True)  # 启用隐身浏览器

🛠️ CLI 命令行工具

Browser-Use 提供快速 CLI 工具,适合开发调试:

# 快速浏览器自动化
browser-use open https://example.com  # 打开网页
browser-use state                     # 查看可点击元素
browser-use click 5                   # 点击第 5 个元素
browser-use type "Hello"              # 输入文本
browser-use screenshot page.png       # 截图
browser-use close                     # 关闭浏览器

CLI 保持浏览器运行,命令之间无需重新启动,迭代速度快。

🔗 Claude Code 集成

Browser-Use 提供Claude Code Skill,让 Claude Code AI 助手也能操作浏览器:

# 安装 Claude Code Skill
mkdir -p ~/.claude/skills/browser-use
curl -o ~/.claude/skills/browser-use/SKILL.md \
  https://raw.githubusercontent.com/browser-use/browser-use/main/skills/browser-use/SKILL.md

安装后,Claude Code 就能自动帮你操作浏览器了。

💰 定价

ChatBrowserUse 模型定价(每 1M tokens):

  • 输入 tokens:$0.20
  • 缓存输入 tokens:$0.02
  • 输出 tokens:$2.00

比其他 LLM 提供商便宜很多,而且专门优化了浏览器任务。

🔐 认证和 CAPTCHA

认证处理

  • 真实浏览器 Profile:复用你现有的 Chrome 登录状态
  • AgentMail:使用临时邮箱账户
  • Profile 同步:同步认证状态到远程浏览器

CAPTCHA 处理

Cloud 版本提供隐身浏览器,自动:

  • 避免触发 CAPTCHA
  • 处理验证码挑战
  • 代理轮换防止封禁

📝 总结

Browser-Use 是AI Agent 时代的浏览器自动化神器

  • 开源免费,MIT License
  • 自然语言控制浏览器
  • ChatBrowserUse 模型比其他模型快 3-5 倍
  • Cloud 版本提供隐身浏览器、代理轮换、CAPTCHA 解决
  • 1000+ 集成(Gmail、Slack、Notion 等)
  • CLI 快速迭代,Claude Code Skill 集成

告诉你的电脑做什么,它就会完成。

GitHubhttps://github.com/browser-use/browser-use

官方文档https://docs.browser-use.com

暂无介绍....

延伸阅读:

12万字符被扒光!Claude Fable 5系统提示词泄露,AI安全底裤还剩几条?

Claude Fable 5 这瓜,越看越像一场 AI 安全行业的公开裸奔。据多家中文安全媒体和聚合平台报道,Anthr...

itadol5j
2026年6月17日
一行命令干翻5个API!阿里云百炼CLI开源,Agent水电煤之战正式开打

5月29日,阿里云干了一件让 Agent 开发者集体高潮的事——百炼核心能力正式 CLI 化,一行命令就能让 AI Ag...

itadol5j
2026年5月29日
20亿用户握手!PayPal钱包正式接入微信支付,老外来华扫码时代到了

5月27日,支付圈传出来一个让人眼前一亮的消息:腾讯财付通全球与 PayPal World 正式达成合作,PayPal ...

itadol5j
2026年5月28日
支付宝杭州扔下王炸:3亿笔智能体支付已跑通,AI付Token Pay四件套定义新范式

5月26日下午,支付宝在杭州未来科技城国际会议中心办了一场叫"AI 支付生态大会"的活动。表面看是常规的产品发布会,实际...

itadol5j
2026年5月27日
渗透圈一夜变天!Xalgorix 22阶段全自动 AI 攻击平台开源,国产模型直接接

渗透测试这行最累的是什么?不是写报告,是重复劳动——侦察、目录爆破、注入点测试、SSRF 验证、CORS 检查……一个标...

itadol5j
2026年5月27日