AI 见闻

浏览器使用/浏览器使用:让人工智能代理可以访问网站。轻松在线自动化任务。

GitHub Trending (AI repos)··browser-use·约 6 分钟阅读
Hacker News 98131

🌤️Want to skip the setup?使用我们的云实现更快、可扩展、可隐藏的浏览器自动化!- 将您最喜欢的编码代理(Cursor、Claude Code等)引导到代理。MD- 提示离开!

1.创建环境并安装Browser-use with uv(Python>=3. 11):uv init & uv添加浏览器-使用& uv同步# uvx浏览器使用安装#如果您没有安装Chromium,请运行2. [可选]从浏览器使用云获取您的API密钥:

# . envBROWSER_USE_API_Key=your-key# GOOGLE_API_Key=your-key# ANTHROPIC_API_Key=your-key3.运行您的第一个代理:

来自browser_use导入代理、浏览器、

ChatBrowseruse# from browser_use导入ChatGoogle # ChatGoogle(型号=' gemini-3-flash-preview ')# from browser_use导入ChatAnthropic # ChatAnthropi

c(型号=' claude-sonnet-4- 6 ')进口西班牙语c dev main():

浏览器=浏览器(# use_cloud=True,#在浏览器使用云上使用隐形浏览器)代理=代理(tasky =“查找浏览器使用仓库的星数”,llm=ChatBrowserUse(),

# llm=ChatGoogle(型号=' gemini-3-flash-preview '),# llm=ChatAnthropic(型号=' claude-sonnet-4- 6 '),浏览器=浏览器,)等待代理。

run()如果__name__==“__main__":我的天run(main())查看库文档和云文档了解更多信息!我们对100个现实世界的浏览器任务的浏览器使用进行基准测试。完整的基准测试是开源的:浏览器使用/基准测试。

使用开源代理- 您需要自定义工具或深度代码级集成- 我们建议与我们的云浏览器配对,以实现领先的隐身,代理旋转和扩展- 或者完全在自己的机器上自托管开源代理使用完全托管的云代理(推荐)- 更强大的代理,

用于复杂任务(请参阅上图)- 最简单的开始和扩展方式- 具有代理轮换和验证码解决的最佳隐形效果- 1000+个集成(Gmail、Slack、Notion等)- 持久文件系统和内存杂货-使用-大型。

MP4电脑使用大。MP4💡在这里查看更多例子想要更快地开始吗?生成可运行的模板:uvx浏览器-使用初始化--模板默认这将创建browser_use_default。py带有工作示例的文件。

可用模板:默认- 快速入门的最低设置高级- 所有配置选项以及详细的评论- 自定义工具和扩展代理的示例您还可以指定自定义输出路径:uvx浏览器-使用初始化--模板默认--输出my_Agent。

py从命令行实现快速、持久的浏览器自动化:浏览器使用打开https://example。com #导航至URL浏览器使用状态#查看可点击元素浏览器使用单击5 #按索引单击元素浏览器使用类型“Hello”#类型文本浏览器使用屏幕截图页面。

png #截图浏览器使用关闭#关闭浏览器CLI使浏览器在命令之间运行,以实现快速迭代。

有关所有命令,请参阅CLI文档。对于Claude Code,安装启用AI辅助浏览器自动化的技能:mkdis-p ~/。克劳德/技能/浏览器使用curl -o ~/。claude/skills/browser-use/SKILL。

MD \https://raw。githubusercontent。com/browser-use/browser-use/main/skills/browser-use/SKILL。MD我们的收件箱上的集成、托管、自定义工具、LCP等最好使用的模型是什么?

我们专门针对浏览器自动化任务优化了ChatBrowserUse()。在avg上,它在SOTA准确性方面比其他型号快3- 5倍。定价(每100万个代币):- 输入代币:0美元。20- 缓存的输入令牌:0美元。

02- 输出代币:2美元。00有关其他LLM提供商,请参阅我们支持的模型文档。我应该将浏览器使用系统提示与开源预览模型一起使用吗?是的如果您使用ChatBrowseruse(型号=' browser-use/bu-30 b-a3 b-preview ')使用普通代理(。

. . ),“浏览器使用”仍会为您发送其默认代理系统提示。您不需要添加单独的自定义“浏览器使用系统消息”,只是因为您切换到开源预览模型。仅使用extend_system_message或override_system_message当您有意要自定义任务的默认行为时。

如果您想要最佳的默认速度/准确性,我们仍然推荐较新的托管bu-*模型如果您想要开源预览模型,则除了模型之外的设置保持相同=值我可以对代理使用自定义工具吗?是的!

您可以添加自定义工具来扩展代理的功能:从浏览器_使用导入工具工具=工具()@tools。action(描述='此工具的功能描述。

')dev custom_tool(param:url)-> url:返回f“结果:{param}”代理=代理(任务=“您的任务”,llm=llm,浏览器=浏览器,工具=工具,)我可以免费使用这个吗?

是的!Browser-Use是开源且免费使用的。您只需选择LLM提供商(例如OpenAI、Google、ChatBrowseruse,或使用Olama运行本地模型)。服务条款该开源库根据麻省理工学院许可证进行许可。

有关浏览器使用服务和数据政策,请参阅我们的服务条款和隐私政策。如何处理身份验证?

查看我们的身份验证示例:- 使用真实的浏览器配置文件-通过保存的登录名重复使用您现有的Chrome配置文件- 如果您想在收件箱中使用临时帐户,请选择AgentMail- 要与远程浏览器同步您的授权配置文件,请运行curl -fsSL https:

//browser-use. com/profile. sh| BROWSER_USE_API_KEY=默认值(用您的API密钥替换收件箱)这些示例展示了如何无缝维护会话和处理身份验证。如何解决验证码?

对于CAPTCHA处理,您需要更好的浏览器指纹识别和代理。使用浏览器使用云,该云提供旨在避免检测和验证码挑战的隐形浏览器。如何进入生产?Chrome可能会消耗大量内存,并且并行运行多个代理可能很难管理。

对于生产用例,请使用我们的浏览器使用云API,该API处理:- 可扩展的浏览器基础设施- 存储器管理- 代理轮换- 隐形浏览器指纹识别- 高性能并行执行

原文出处
browser-use/browser-use: 🌐 Make websites accessible for AI agents. Automate tasks online with ease.

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。