用自然语言控制浏览器？Page Agent Ext 实测体验：AI 自动化插件的黑马

最近发现一款名为 Page Agent Ext 的浏览器插件，彻底颠覆了我对网页自动化的认知。过去要用 iMacros 或 Selenium 写脚本才能完成的任务，现在只需一句日常语言就能搞定。比如我直接告诉它：“帮我登录 Gmail 并下载今天所有的附件”，它就在后台跨标签页执行完毕，完全不需要我碰代码。

核心体验：自然语言真能指挥浏览器

安装后配置好自己的 OpenAI 或 Anthropic API Key 就能用（也提供免费测试端点）。我在多个标签页间测试过：让它“把京东购物车里的商品价格提取到记事本里”，结果它自动切换到购物车页、抓取价格、再粘贴到新标签页的记事本中，全程无卡顿。这种跨标签页操作能力是很多同类插件（比如单页的自动填表工具）不具备的。

隐私与安全：数据只进你的 API

最让我放心的是它的隐私设计：所有 DOM 分析在本地完成，清洗后的 HTML 结构直接发送到我自己的 LLM 服务商服务器。插件不收集任何数据，代码也在 GitHub 上开源（MIT 协议）。对比那些需要上传完整页面截图到第三方服务的插件，Page Agent Ext 更像是“你的私人自动化管家”。

与其他插件的对比

vs 传统宏录制插件 (如 iMacros)：无需学习脚本语法，自然语言直接下达指令，学习成本几乎为零。
vs 基于规则的 RPA 插件：Page Agent Ext 能理解模糊意图，例如“把最近的订阅邮件归档”，而规则引擎则需要精确定义条件。
vs 纯前端脚本工具：不需要安装 Node.js 或写 jQuery，安装即用，对非技术用户极其友好。

谁适合用？

日常需要重复操作网页的运营、分析师、自媒体人，甚至普通用户都能用。比如自动比价、批量下载资料、定时检查网页更新等场景。而且你可以用自己的模型，数据完全自主可控，企业级用户也能放心部署。

总之，如果你还在手动重复点鼠标，或者被复杂的自动化工具劝退，Page Agent Ext 值得一试。它把浏览器的掌控权真正交还给了语言——你说，它做。