Mozilla发布TABS API:用于浏览器自动化的开源人工智能
Mozilla 发布了 TABS API,这是一套免费的开源工具集,供开发者构建能够自动执行浏览器任务(例如标签页操作和网页导航)的 AI 代理。该 API 强调隐私和伦理,使 Mozilla 能够与 Google 和 Microsoft 等竞争对手抗衡,并有望彻底改变网络交互和生产力。

Mozilla 的 TABS API:开启智能 Web 自动化新时代
在人工智能领域飞速发展的今天,Mozilla 正采取大胆举措,力图将自身定位在基于浏览器的 AI 创新前沿。这家以 Firefox 浏览器闻名的非营利组织发布了 TABS API,这是一套专为构建 AI 代理的开发者而设计的新工具集。此次发布正值人们对“代理型”AI 的兴趣激增之际——这类系统能够代表用户自主执行任务,例如预订航班或管理电子邮件,而无需持续的人工干预。根据Slashdot最近的一篇文章,TABS API 旨在实现 AI 代理与 Web 环境的无缝集成,从而有可能彻底改变我们与互联网的交互方式。
TABS API(标签页自动化和浏览器脚本)允许开发者创建人工智能驱动的扩展程序,从而动态操控浏览器标签页。这包括以编程方式打开、关闭多个标签页以及与它们进行交互,这对需要处理复杂网络工作流程的智能体至关重要。Mozilla 在该领域的布局紧随其后,此前 Firefox 145 的更新为智能体交互奠定了基础,OMG! Ubuntu的一篇文章对此进行了详细介绍。该公司对人工智能寄予厚望,将其视为未来发展方向,并推出了诸如人工智能浏览模式等举措,旨在实现日常在线任务的自动化。
业内专家认为,这是 Mozilla 对谷歌和微软等竞争对手的战略回应,这些竞争对手一直在积极地将人工智能集成到各自的浏览器中。例如,谷歌的 Chrome 浏览器已经为开发者引入了内置的人工智能功能,详情请参阅Chrome for Developers文档。然而,Mozilla 强调开放性和隐私保护,这是其使命的核心原则。TABS API 基于开源原则构建,允许开发者自由地对其进行定制和扩展,这可能会吸引那些对专有生态系统持谨慎态度的用户。
TABS API 的技术基础
深入了解后发现,TABS API 提供了一套基于 JavaScript 的接口,使 AI 代理能够对浏览器元素进行精细控制。开发者可以编写脚本让代理执行诸如表单填写、数据抓取甚至绕过验证码等操作——尽管 Mozilla 强调必须合乎道德地使用,以避免隐私风险。来自 X(前身为 Twitter)等科技爱好者的帖子凸显了人们对这项技术的兴奋之情,其中一位用户指出,“机器人驱动的浏览”的潜力可能会彻底改变自动化领域。这与 AI 代理开发领域的更广泛趋势相符,例如,据TechCrunch报道,OpenAI 的 AgentKit 等工具(将于 2025 年 10 月发布)正在简化生产就绪型代理的创建。
Mozilla 的这项公告建立在其现有的 AI 生态系统之上,其中包括 Mozilla.ai 平台,该平台提供诸如 Any-Agent 之类的开源库,用于测试和比较 AI 代理。2025 年 4 月的一篇GIGAZINE文章赞扬了 Any-Agent 对多代理协调协议 (MCP) 的支持,从而实现了代理之间的无缝协作。TABS API 与这些协议集成,允许开发人员构建在 Firefox 中运行的代理,同时利用外部 LLM(大型语言模型)进行决策。
定价和易用性是关键的差异化因素。与微软一些面向企业的工具(据SiliconANGLE报道,微软的 AI 代理管理更新计划于 2025 年 11 月推出)不同,Mozilla 的 API 对开发者免费开放,并通过合作伙伴关系提供可选的高级支持。这使得访问权限更加普及,并有可能加速电子商务自动化或研究工具等领域的创新。然而,在 X 的讨论中,也出现了关于滥用(例如未经授权的数据收集)的担忧,这凸显了建立健全安全保障机制的必要性。
竞争格局及市场影响
智能体人工智能的兴起并非 Mozilla 独有。OpenAI 的 Responses API 于 2025 年 3 月推出,并由Techzine Global报道,它将聊天自动补全功能与智能体功能相结合,使构建响应式系统变得更加容易。同样,Mistral 的 AI 智能体 API 支持 Python 执行和图像生成,并在 2025 年 5 月的VentureBeat文章中被重点介绍。Mozilla 的 TABS API 则专注于浏览器原生集成,这使其在以 Web 为中心的应用程序中具有潜在优势。
对于业内人士而言,这意味着网络体验将更加自动化。试想一下,一个人工智能代理能够实时比较不同标签页的价格来预订行程,或者一个能够智能填写表格来自动完成求职申请的代理。开发者们纷纷发帖表达乐观态度,其中一个帖子讨论了2025年必备的人工智能代理技术栈,包括AutoGen和CrewAI等框架,这些框架可以与TABS完美结合。Mozilla强调通过透明、可控的人工智能实现可信赖性,这与其Mozilla.ai博客的理念相呼应,该博客倡导在不违背伦理的前提下解决用户的实际问题。
然而,挑战依然存在。隐私倡导者担心人工智能代理访问敏感标签页数据会带来不良后果。Mozilla 通过内置权限模型来解决这个问题,但正如StartupNews.fyi 的一篇报道所指出的,Mozilla 的企业部门正在积极争取重视开源替代方案的开发者。其普及程度可能取决于它与现有工具的集成效果,例如之前 X 论坛上关于 Mozilla AI Help 功能的文章中提到的基于 Supabase 的代理。
未来前景与开发者采纳
展望未来,TABS API 有望催生一波浏览器扩展程序浪潮,重新定义生产力。例如 Rohan Paul 在 X 篇博文中讨论的那些用于 AI 网络自动化的开源 Chrome 扩展程序,已经展现了市场对能够处理网页抓取和摘要的隐私保护工具的需求。Mozilla 的这项举措有望在浏览器中实现这些功能的标准化,尤其是在其代理平台(详见Mozilla.ai )获得广泛认可的情况下。
企业级应用前景广阔。随着微软等公司不断改进人工智能代理管理,Mozilla 的免费开源模式可能会吸引初创公司和独立开发者。FryAI 于 2025 年 11 月 23 日在 X 平台上发布的一篇文章恰好反映了这一趋势,文章指出 TABS 增强了人工智能代理的网页交互体验。这种观点在更广泛的讨论中也得到了印证,用户预测内置代理的人工智能浏览器可能会取代传统浏览器。
至关重要的是,成功取决于社区的参与。Mozilla 通过 GitHub 邀请用户贡献代码,从而促进协作生态系统的发展。根据 OpenAI 在 2025 年 3 月发布的公告,随着OpenAI不断完善其可靠代理平台,Mozilla 也必须紧跟步伐。X 平台上的早期用户已经开始进行实验,他们发布的帖子重点介绍了 TABS 在多代理工作流程中的潜力。
战略押注与行业转变
Mozilla 对人工智能的投入由来已久,但 TABS API 代表着其对“代理网络”的一次关键性押注。它使开发者能够构建在浏览器中原生自动执行任务的代理,从而解决了当前人工智能工具的痛点,例如有限的网页交互能力。这可能会颠覆金融科技和医疗保健等行业,在这些行业中,自动化网页代理负责处理繁琐的合规流程。
与新兴的人工智能浏览器(例如在 X 论坛上因其自主研究而备受赞誉的 FellouAI)相比,TABS 或许能为 Firefox 带来类似的创新。然而,其可扩展性仍是一个问题——它能否应对企业级部署?Slashdot 的 X 论坛数据显示,开发者对此表现出浓厚的兴趣,相关公告的浏览量激增。
最终,随着人工智能代理的普及,Mozilla 的 TABS API 将使该组织成为开放人工智能的守护者。通过将创新与伦理考量相结合,它有望重新定义浏览器开发,从而促进更具包容性的数字未来。业内人士将密切关注开发者在未来几个月内如何利用这一工具,这或许会为网络自动化树立新的标准。
