最近发现一款名为 Page Agent Ext 的浏览器插件,彻底颠覆了我对网页自动化的认知。过去要用 iMacros 或 Selenium 写脚本才能完成的任务,现在只需一句日常语言就能搞定。比如我直接告诉它:“帮我登录 Gmail 并下载今天所有的附件”,它就在后台跨标签页执行完毕,完全不需要我碰代码。

核心体验:自然语言真能指挥浏览器

安装后配置好自己的 OpenAI 或 Anthropic API Key 就能用(也提供免费测试端点)。我在多个标签页间测试过:让它“把京东购物车里的商品价格提取到记事本里”,结果它自动切换到购物车页、抓取价格、再粘贴到新标签页的记事本中,全程无卡顿。这种跨标签页操作能力是很多同类插件(比如单页的自动填表工具)不具备的。

隐私与安全:数据只进你的 API

最让我放心的是它的隐私设计:所有 DOM 分析在本地完成,清洗后的 HTML 结构直接发送到我自己的 LLM 服务商服务器。插件不收集任何数据,代码也在 GitHub 上开源(MIT 协议)。对比那些需要上传完整页面截图到第三方服务的插件,Page Agent Ext 更像是“你的私人自动化管家”。

与其他插件的对比

  • vs 传统宏录制插件 (如 iMacros):无需学习脚本语法,自然语言直接下达指令,学习成本几乎为零。
  • vs 基于规则的 RPA 插件:Page Agent Ext 能理解模糊意图,例如“把最近的订阅邮件归档”,而规则引擎则需要精确定义条件。
  • vs 纯前端脚本工具:不需要安装 Node.js 或写 jQuery,安装即用,对非技术用户极其友好。

谁适合用?

日常需要重复操作网页的运营、分析师、自媒体人,甚至普通用户都能用。比如自动比价、批量下载资料、定时检查网页更新等场景。而且你可以用自己的模型,数据完全自主可控,企业级用户也能放心部署。

总之,如果你还在手动重复点鼠标,或者被复杂的自动化工具劝退,Page Agent Ext 值得一试。它把浏览器的掌控权真正交还给了语言——你说,它做。