Browser-Use开源:让AI自动帮你操作任何网站

Browser-Use架构

🌐 Browser-Use:让 AI 自动帮你操作任何网站

想象一下:你只需要说“帮我买一份午餐”,AI 就会自动打开外卖网站、选择餐厅、下单付款。这就是 Browser-Use 的能力。

Browser-Use 是一个开源的 AI Agent 工具,能让 AI Agent自动操作浏览器,完成各种网页任务。它就像你的“浏览器替身”

🎯 核心能力

能力 说明 示例
求职申请 自动投简历 “帮我申请 10 个前端岗位”
购物下单 自动买商品 “帮我买一份午餐”
数据采集 网页爬虫 “抓取 GitHub Trending 前 10”
自动操作 任何网站 “查航班价格并预订”

⚡ 工作流程

用户输入自然语言任务 → AI Agent 理解意图 → 浏览器执行操作 → 返回结果
  1. 用户输入:你用自然语言描述任务,比如 “帮我申请这份工作”
  2. AI 理解:Agent 分析任务,拆解成浏览器操作步骤
  3. 浏览器执行:自动打开网页、点击按钮、填写表单、提交数据
  4. 返回结果:完成任务后,Agent 返回结果给你

📊 Benchmark:100 个真实任务测试

Browser-Use 在100 个真实浏览器任务上进行基准测试,表现优异:

  • ChatBrowserUse 模型:比其他模型快 3-5 倍,准确率 SOTA
  • Cloud Agent:比开源版本更强大,适合复杂任务

🔧 两种使用方式

1. 开源版本(免费)

# 安装(Python 3.11+)
uv init && uv add browser-use && uv sync

# 运行第一个 Agent
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio

async def main():
    browser = Browser()
    agent = Agent(
        task="Find the number of stars of the browser-use repo",
        llm=ChatBrowserUse(),
        browser=browser,
    )
    await agent.run()

asyncio.run(main())

特点

  • 免费,MIT License
  • 需要自己配置 LLM(OpenAI、Google、Ollama 等)
  • 适合深度定制和本地部署

2. Cloud 版本(推荐)

特点

  • 隐身浏览器:避免被检测和封禁
  • 代理轮换:自动切换 IP
  • CAPTCHA 解决:自动处理验证码
  • 1000+ 集成:Gmail、Slack、Notion 等
  • 持久文件系统:跨会话保存数据
  • 记忆功能:记住用户偏好
# 使用 Cloud
browser = Browser(use_cloud=True)  # 启用隐身浏览器

🛠️ CLI 命令行工具

Browser-Use 提供快速 CLI 工具,适合开发调试:

# 快速浏览器自动化
browser-use open https://example.com  # 打开网页
browser-use state                     # 查看可点击元素
browser-use click 5                   # 点击第 5 个元素
browser-use type "Hello"              # 输入文本
browser-use screenshot page.png       # 截图
browser-use close                     # 关闭浏览器

CLI 保持浏览器运行,命令之间无需重新启动,迭代速度快。

🔗 Claude Code 集成

Browser-Use 提供Claude Code Skill,让 Claude Code AI 助手也能操作浏览器:

# 安装 Claude Code Skill
mkdir -p ~/.claude/skills/browser-use
curl -o ~/.claude/skills/browser-use/SKILL.md \
  https://raw.githubusercontent.com/browser-use/browser-use/main/skills/browser-use/SKILL.md

安装后,Claude Code 就能自动帮你操作浏览器了。

💰 定价

ChatBrowserUse 模型定价(每 1M tokens):

  • 输入 tokens:$0.20
  • 缓存输入 tokens:$0.02
  • 输出 tokens:$2.00

比其他 LLM 提供商便宜很多,而且专门优化了浏览器任务。

🔐 认证和 CAPTCHA

认证处理

  • 真实浏览器 Profile:复用你现有的 Chrome 登录状态
  • AgentMail:使用临时邮箱账户
  • Profile 同步:同步认证状态到远程浏览器

CAPTCHA 处理

Cloud 版本提供隐身浏览器,自动:

  • 避免触发 CAPTCHA
  • 处理验证码挑战
  • 代理轮换防止封禁

📝 总结

Browser-Use 是AI Agent 时代的浏览器自动化神器

  • 开源免费,MIT License
  • 自然语言控制浏览器
  • ChatBrowserUse 模型比其他模型快 3-5 倍
  • Cloud 版本提供隐身浏览器、代理轮换、CAPTCHA 解决
  • 1000+ 集成(Gmail、Slack、Notion 等)
  • CLI 快速迭代,Claude Code Skill 集成

告诉你的电脑做什么,它就会完成。

GitHubhttps://github.com/browser-use/browser-use

官方文档https://docs.browser-use.com

暂无介绍....

延伸阅读:

Browser-Use开源:让AI自动帮你操作任何网站

🌐 Browser-Use:让 AI 自动帮你操作任何网站想象一下:你只需要说"帮我买一份午餐",AI 就会自动打开外卖...

itadol5j
2026年4月13日
Hermes Agent单日暴涨6438星:唯一内置学习循环的AI Agent

🔥 Hermes Agent 今日暴涨 6438 星:自我进化的 AI AgentHermes Agent 今天在 Gi...

itadol5j
2026年4月12日
X推出独立聊天应用:4月17日iOS首发,对标WhatsApp

💬 X 推出独立聊天应用 XChat,4月17日 iOS 首发Elon Musk 的 X(原 Twitter)正在推出独...

itadol5j
2026年4月11日
腾讯开源机器人大脑:22基准16项第一,对标Gemini

🤖 腾讯混元开源机器人大脑:具身智能的新玩家腾讯混元昨天放出了 HY-Embodied-0.5,这不是普通的大语言模型—...

itadol5j
2026年4月11日
Apache ActiveMQ高危RCE漏洞:5步完成攻击链

🚨 Apache ActiveMQ 爆出高危 RCE 漏洞Apache ActiveMQ 近日披露了一个高危远程代码执行...

itadol5j
2026年4月11日