Browser-Use开源:让AI自动帮你操作任何网站

🌐 Browser-Use:让 AI 自动帮你操作任何网站
想象一下:你只需要说“帮我买一份午餐”,AI 就会自动打开外卖网站、选择餐厅、下单付款。这就是 Browser-Use 的能力。
Browser-Use 是一个开源的 AI Agent 工具,能让 AI Agent自动操作浏览器,完成各种网页任务。它就像你的“浏览器替身”。
🎯 核心能力
| 能力 | 说明 | 示例 |
|---|---|---|
| 求职申请 | 自动投简历 | “帮我申请 10 个前端岗位” |
| 购物下单 | 自动买商品 | “帮我买一份午餐” |
| 数据采集 | 网页爬虫 | “抓取 GitHub Trending 前 10” |
| 自动操作 | 任何网站 | “查航班价格并预订” |
⚡ 工作流程
用户输入自然语言任务 → AI Agent 理解意图 → 浏览器执行操作 → 返回结果
- 用户输入:你用自然语言描述任务,比如 “帮我申请这份工作”
- AI 理解:Agent 分析任务,拆解成浏览器操作步骤
- 浏览器执行:自动打开网页、点击按钮、填写表单、提交数据
- 返回结果:完成任务后,Agent 返回结果给你
📊 Benchmark:100 个真实任务测试
Browser-Use 在100 个真实浏览器任务上进行基准测试,表现优异:
- ChatBrowserUse 模型:比其他模型快 3-5 倍,准确率 SOTA
- Cloud Agent:比开源版本更强大,适合复杂任务
🔧 两种使用方式
1. 开源版本(免费)
# 安装(Python 3.11+)
uv init && uv add browser-use && uv sync
# 运行第一个 Agent
from browser_use import Agent, Browser, ChatBrowserUse
import asyncio
async def main():
browser = Browser()
agent = Agent(
task="Find the number of stars of the browser-use repo",
llm=ChatBrowserUse(),
browser=browser,
)
await agent.run()
asyncio.run(main())
特点:
- 免费,MIT License
- 需要自己配置 LLM(OpenAI、Google、Ollama 等)
- 适合深度定制和本地部署
2. Cloud 版本(推荐)
特点:
- 隐身浏览器:避免被检测和封禁
- 代理轮换:自动切换 IP
- CAPTCHA 解决:自动处理验证码
- 1000+ 集成:Gmail、Slack、Notion 等
- 持久文件系统:跨会话保存数据
- 记忆功能:记住用户偏好
# 使用 Cloud browser = Browser(use_cloud=True) # 启用隐身浏览器
🛠️ CLI 命令行工具
Browser-Use 提供快速 CLI 工具,适合开发调试:
# 快速浏览器自动化 browser-use open https://example.com # 打开网页 browser-use state # 查看可点击元素 browser-use click 5 # 点击第 5 个元素 browser-use type "Hello" # 输入文本 browser-use screenshot page.png # 截图 browser-use close # 关闭浏览器
CLI 保持浏览器运行,命令之间无需重新启动,迭代速度快。
🔗 Claude Code 集成
Browser-Use 提供Claude Code Skill,让 Claude Code AI 助手也能操作浏览器:
# 安装 Claude Code Skill mkdir -p ~/.claude/skills/browser-use curl -o ~/.claude/skills/browser-use/SKILL.md \ https://raw.githubusercontent.com/browser-use/browser-use/main/skills/browser-use/SKILL.md
安装后,Claude Code 就能自动帮你操作浏览器了。
💰 定价
ChatBrowserUse 模型定价(每 1M tokens):
- 输入 tokens:$0.20
- 缓存输入 tokens:$0.02
- 输出 tokens:$2.00
比其他 LLM 提供商便宜很多,而且专门优化了浏览器任务。
🔐 认证和 CAPTCHA
认证处理
- 真实浏览器 Profile:复用你现有的 Chrome 登录状态
- AgentMail:使用临时邮箱账户
- Profile 同步:同步认证状态到远程浏览器
CAPTCHA 处理
Cloud 版本提供隐身浏览器,自动:
- 避免触发 CAPTCHA
- 处理验证码挑战
- 代理轮换防止封禁
📝 总结
Browser-Use 是AI Agent 时代的浏览器自动化神器:
- 开源免费,MIT License
- 自然语言控制浏览器
- ChatBrowserUse 模型比其他模型快 3-5 倍
- Cloud 版本提供隐身浏览器、代理轮换、CAPTCHA 解决
- 1000+ 集成(Gmail、Slack、Notion 等)
- CLI 快速迭代,Claude Code Skill 集成
告诉你的电脑做什么,它就会完成。
没有啦 (T▽T)
延伸阅读:
Browser-Use开源:让AI自动帮你操作任何网站
🌐 Browser-Use:让 AI 自动帮你操作任何网站想象一下:你只需要说"帮我买一份午餐",AI 就会自动打开外卖...
Hermes Agent单日暴涨6438星:唯一内置学习循环的AI Agent
🔥 Hermes Agent 今日暴涨 6438 星:自我进化的 AI AgentHermes Agent 今天在 Gi...
X推出独立聊天应用:4月17日iOS首发,对标WhatsApp
💬 X 推出独立聊天应用 XChat,4月17日 iOS 首发Elon Musk 的 X(原 Twitter)正在推出独...
腾讯开源机器人大脑:22基准16项第一,对标Gemini
🤖 腾讯混元开源机器人大脑:具身智能的新玩家腾讯混元昨天放出了 HY-Embodied-0.5,这不是普通的大语言模型—...
Apache ActiveMQ高危RCE漏洞:5步完成攻击链
🚨 Apache ActiveMQ 爆出高危 RCE 漏洞Apache ActiveMQ 近日披露了一个高危远程代码执行...