Browser-Use开源:让AI自动帮你操作任何网站

Browser-Use架构

🌐 Browser-Use:让 AI 自动帮你操作任何网站

想象一下:你只需要说“帮我买一份午餐”,AI 就会自动打开外卖网站、选择餐厅、下单付款。这就是 Browser-Use 的能力。

Browser-Use 是一个开源的 AI Agent 工具,能让 AI Agent自动操作浏览器,完成各种网页任务。它就像你的“浏览器替身”

🎯 核心能力

能力 说明 示例
求职申请 自动投简历 “帮我申请 10 个前端岗位”
购物下单 自动买商品 “帮我买一份午餐”
数据采集 网页爬虫 “抓取 GitHub Trending 前 10”
自动操作 任何网站 “查航班价格并预订”

⚡ 工作流程

用户输入自然语言任务 → AI Agent 理解意图 → 浏览器执行操作 → 返回结果
  1. 用户输入:你用自然语言描述任务,比如 “帮我申请这份工作”
  2. AI 理解:Agent 分析任务,拆解成浏览器操作步骤
  3. 浏览器执行:自动打开网页、点击按钮、填写表单、提交数据
  4. 返回结果:完成任务后,Agent 返回结果给你

📊 Benchmark:100 个真实任务测试

Browser-Use 在100 个真实浏览器任务上进行基准测试,表现优异:

  • ChatBrowserUse 模型:比其他模型快 3-5 倍,准确率 SOTA
  • Cloud Agent:比开源版本更强大,适合复杂任务

🔧 两种使用方式

1. 开源版本(免费)

# 安装(Python 3.11+)
uv init && uv add browser-use && uv sync

# 运行第一个 Agent
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio

async def main():
    browser = Browser()
    agent = Agent(
        task="Find the number of stars of the browser-use repo",
        llm=ChatBrowserUse(),
        browser=browser,
    )
    await agent.run()

asyncio.run(main())

特点

  • 免费,MIT License
  • 需要自己配置 LLM(OpenAI、Google、Ollama 等)
  • 适合深度定制和本地部署

2. Cloud 版本(推荐)

特点

  • 隐身浏览器:避免被检测和封禁
  • 代理轮换:自动切换 IP
  • CAPTCHA 解决:自动处理验证码
  • 1000+ 集成:Gmail、Slack、Notion 等
  • 持久文件系统:跨会话保存数据
  • 记忆功能:记住用户偏好
# 使用 Cloud
browser = Browser(use_cloud=True)  # 启用隐身浏览器

🛠️ CLI 命令行工具

Browser-Use 提供快速 CLI 工具,适合开发调试:

# 快速浏览器自动化
browser-use open https://example.com  # 打开网页
browser-use state                     # 查看可点击元素
browser-use click 5                   # 点击第 5 个元素
browser-use type "Hello"              # 输入文本
browser-use screenshot page.png       # 截图
browser-use close                     # 关闭浏览器

CLI 保持浏览器运行,命令之间无需重新启动,迭代速度快。

🔗 Claude Code 集成

Browser-Use 提供Claude Code Skill,让 Claude Code AI 助手也能操作浏览器:

# 安装 Claude Code Skill
mkdir -p ~/.claude/skills/browser-use
curl -o ~/.claude/skills/browser-use/SKILL.md \
  https://raw.githubusercontent.com/browser-use/browser-use/main/skills/browser-use/SKILL.md

安装后,Claude Code 就能自动帮你操作浏览器了。

💰 定价

ChatBrowserUse 模型定价(每 1M tokens):

  • 输入 tokens:$0.20
  • 缓存输入 tokens:$0.02
  • 输出 tokens:$2.00

比其他 LLM 提供商便宜很多,而且专门优化了浏览器任务。

🔐 认证和 CAPTCHA

认证处理

  • 真实浏览器 Profile:复用你现有的 Chrome 登录状态
  • AgentMail:使用临时邮箱账户
  • Profile 同步:同步认证状态到远程浏览器

CAPTCHA 处理

Cloud 版本提供隐身浏览器,自动:

  • 避免触发 CAPTCHA
  • 处理验证码挑战
  • 代理轮换防止封禁

📝 总结

Browser-Use 是AI Agent 时代的浏览器自动化神器

  • 开源免费,MIT License
  • 自然语言控制浏览器
  • ChatBrowserUse 模型比其他模型快 3-5 倍
  • Cloud 版本提供隐身浏览器、代理轮换、CAPTCHA 解决
  • 1000+ 集成(Gmail、Slack、Notion 等)
  • CLI 快速迭代,Claude Code Skill 集成

告诉你的电脑做什么,它就会完成。

GitHubhttps://github.com/browser-use/browser-use

官方文档https://docs.browser-use.com

暂无介绍....

延伸阅读:

Hermes Agent 2026.5 最新版起飞:一份订阅吃遍所有 AI 工具,启动快 19 秒

5月份 AI 圈最不安分的开源项目,必须留个名字给 Hermes Agent。Nous Research 这次甩出的 v...

itadol5j
2026年5月24日
启动直接起飞!OpenClaw 5.22 把网关性能干到 4100 倍,AI 助手再没借口慢

凌晨一点,OpenClaw 团队甩出了 2026.5.22 这个版本。这次的看点不是新模型、不是新皮肤,而是把 Gate...

itadol5j
2026年5月24日
Qwen3.7-Max百炼上线:¥12/M输入,国产模型登顶Arena

🤖 Qwen3.7-Max百炼上线:¥12/M输入,国产模型登顶Arena北京时间2026年5月22日,Qwen3.7-...

itadol5j
2026年5月22日
Claude 2026.05.20:29万员工部署,Karpathy加盟Anthropic

🤖 Claude 2026.05.20:29万员工部署,Karpathy加盟Anthropic北京时间2026年5月20...

itadol5j
2026年5月21日
OpenClaw 2026.5.19:Android实时语音体验

🦞 OpenClaw 2026.5.19:Android实时语音,Mac设置优化OpenClaw 发布2026.5.19...

itadol5j
2026年5月21日