Browser-Use开源:让AI自动帮你操作任何网站

Browser-Use架构

🌐 Browser-Use:让 AI 自动帮你操作任何网站

想象一下:你只需要说“帮我买一份午餐”,AI 就会自动打开外卖网站、选择餐厅、下单付款。这就是 Browser-Use 的能力。

Browser-Use 是一个开源的 AI Agent 工具,能让 AI Agent自动操作浏览器,完成各种网页任务。它就像你的“浏览器替身”

🎯 核心能力

能力 说明 示例
求职申请 自动投简历 “帮我申请 10 个前端岗位”
购物下单 自动买商品 “帮我买一份午餐”
数据采集 网页爬虫 “抓取 GitHub Trending 前 10”
自动操作 任何网站 “查航班价格并预订”

⚡ 工作流程

用户输入自然语言任务 → AI Agent 理解意图 → 浏览器执行操作 → 返回结果
  1. 用户输入:你用自然语言描述任务,比如 “帮我申请这份工作”
  2. AI 理解:Agent 分析任务,拆解成浏览器操作步骤
  3. 浏览器执行:自动打开网页、点击按钮、填写表单、提交数据
  4. 返回结果:完成任务后,Agent 返回结果给你

📊 Benchmark:100 个真实任务测试

Browser-Use 在100 个真实浏览器任务上进行基准测试,表现优异:

  • ChatBrowserUse 模型:比其他模型快 3-5 倍,准确率 SOTA
  • Cloud Agent:比开源版本更强大,适合复杂任务

🔧 两种使用方式

1. 开源版本(免费)

# 安装(Python 3.11+)
uv init && uv add browser-use && uv sync

# 运行第一个 Agent
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio

async def main():
    browser = Browser()
    agent = Agent(
        task="Find the number of stars of the browser-use repo",
        llm=ChatBrowserUse(),
        browser=browser,
    )
    await agent.run()

asyncio.run(main())

特点

  • 免费,MIT License
  • 需要自己配置 LLM(OpenAI、Google、Ollama 等)
  • 适合深度定制和本地部署

2. Cloud 版本(推荐)

特点

  • 隐身浏览器:避免被检测和封禁
  • 代理轮换:自动切换 IP
  • CAPTCHA 解决:自动处理验证码
  • 1000+ 集成:Gmail、Slack、Notion 等
  • 持久文件系统:跨会话保存数据
  • 记忆功能:记住用户偏好
# 使用 Cloud
browser = Browser(use_cloud=True)  # 启用隐身浏览器

🛠️ CLI 命令行工具

Browser-Use 提供快速 CLI 工具,适合开发调试:

# 快速浏览器自动化
browser-use open https://example.com  # 打开网页
browser-use state                     # 查看可点击元素
browser-use click 5                   # 点击第 5 个元素
browser-use type "Hello"              # 输入文本
browser-use screenshot page.png       # 截图
browser-use close                     # 关闭浏览器

CLI 保持浏览器运行,命令之间无需重新启动,迭代速度快。

🔗 Claude Code 集成

Browser-Use 提供Claude Code Skill,让 Claude Code AI 助手也能操作浏览器:

# 安装 Claude Code Skill
mkdir -p ~/.claude/skills/browser-use
curl -o ~/.claude/skills/browser-use/SKILL.md \
  https://raw.githubusercontent.com/browser-use/browser-use/main/skills/browser-use/SKILL.md

安装后,Claude Code 就能自动帮你操作浏览器了。

💰 定价

ChatBrowserUse 模型定价(每 1M tokens):

  • 输入 tokens:$0.20
  • 缓存输入 tokens:$0.02
  • 输出 tokens:$2.00

比其他 LLM 提供商便宜很多,而且专门优化了浏览器任务。

🔐 认证和 CAPTCHA

认证处理

  • 真实浏览器 Profile:复用你现有的 Chrome 登录状态
  • AgentMail:使用临时邮箱账户
  • Profile 同步:同步认证状态到远程浏览器

CAPTCHA 处理

Cloud 版本提供隐身浏览器,自动:

  • 避免触发 CAPTCHA
  • 处理验证码挑战
  • 代理轮换防止封禁

📝 总结

Browser-Use 是AI Agent 时代的浏览器自动化神器

  • 开源免费,MIT License
  • 自然语言控制浏览器
  • ChatBrowserUse 模型比其他模型快 3-5 倍
  • Cloud 版本提供隐身浏览器、代理轮换、CAPTCHA 解决
  • 1000+ 集成(Gmail、Slack、Notion 等)
  • CLI 快速迭代,Claude Code Skill 集成

告诉你的电脑做什么,它就会完成。

GitHubhttps://github.com/browser-use/browser-use

官方文档https://docs.browser-use.com

暂无介绍....

延伸阅读:

Nginx潜伏18年漏洞CVE-2026-42945:原理PoC修复全解析

🚨 Nginx 潜伏 18 年高危漏洞 CVE-2026-42945:原理、PoC 及修复方案2026年5月13日,安全...

itadol5j
2026年5月15日
GPT-5.5-Cyber独立完成网络攻击:从域名到Shell全自动

🚨 GPT-5.5-Cyber 已能独立完成网络攻击:从域名到 Shell 全自动OpenAI 发布了 GPT-5.5-...

itadol5j
2026年5月14日
支付宝收钱Skill:AI助手帮你收款

💰 支付宝"收钱"Skill 来了:AI 助手帮你收款支付宝"收钱"Skill来了——这是 OpenClaw 的一个新 ...

itadol5j
2026年5月13日
腾讯元宝群聊总结:一键提取关键信息

💬 腾讯元宝支持微信群聊一键总结:群聊信息不再漏腾讯元宝(基于腾讯混元大模型)现已支持微信群聊一键总结功能:一键总结:自...

itadol5j
2026年5月13日
Hermes Agent 2026.05.09 更新

AI Agent 领域再次迎来重要进展。Hermes Agent 在 2026 年 5 月 9 日发布重要更新,带来多项...

itadol5j
2026年5月10日