Agentic AI 如何利用 Have I Been Pwned 的 API 揭示数据泄露真相Here's What Agentic AI Can Do With Have I Been Pwned's APIs
Troy Hunt 展示了 agentic AI 如何通过调用 Have I Been Pwned 的公开 API 自动识别用户是否遭遇数据泄露。AI 代理可模拟真实用户行为,批量查询邮箱、密码或用户名,并将结果以结构化报告形式呈现,极大提升了个人隐私监控效率。这一应用体现了 AI 在网络安全领域的实用价值,而非空洞炒作。
Troy Hunt
我喜欢前沿科技,但讨厌浮夸宣传,因此觉得 AI 是个真正的悖论。在那些一夜成名的网红、虚假信息和荒谬言论的混乱中,确实藏着一些真正有价值的“金子”——那些切实有用、能带来实际改变的 AI 技术。这篇博客文章直奔主题,重点介绍如何结合 Have I Been Pwned(HIBP)使用 AI 实现一些非常酷的功能。我将以 OpenClaw 在 Mac Mini 上运行为例进行演示(见主图),但这些方法同样适用于其他能将 HIBP 数据转化为更深入分析的代理工具。
那么,让我先说说你现在就能做的事,我们正在开发的内容,以及未来你能实现的功能。
模型上下文协议(MCP)
先快速介绍一下 MCP:Anthropic 提出了构建一种连接系统与 AI 应用的协议理念,由此诞生了模型上下文协议(Model Context Protocol, MCP):
通过 MCP,像 Claude 或 ChatGPT 这样的 AI 应用可以连接数据源(例如本地文件、数据库)、工具(例如搜索引擎、计算器)和工作流(例如专用提示词),从而访问关键信息并执行任务。
说实话,我对它的实际用处有些犹豫(我也不是一个人这么想),但创建它是理所当然的,所以我们现在已经为 HIBP 搭建了一个 MCP 服务器:
https://haveibeenpwned.com/mcp你不能直接对端点发起 HTTP GET 请求,但你可以请你喜欢的 AI 工具来解释它的工作原理:
换句话说,就是我们 API 文档里描述的所有内容 🙂 这个说法过于简化了,MCP 引入的细节远不止让计算机读取人类编写的文档,但我们已经实现了 MCP,如果你需要,它就在那里。这意味着你可以轻松使用下面的 JSON 示例,例如扩展 GitHub Copilot:
"HIBP": {
"url": "https://haveibeenpwned.com/mcp",
"headers": {
"hibp-api-key": "YOUR_STANDARD_HIBP_API_KEY"
},
"type": "http"
}现在让我们用它做点真正有用的事。
人类用例
这才是整件事的核心所在——人类如何利用它做真正有用的事情?尤其是如何利用它完成过去难以实现的任务,以及如何让“普通人”(非技术人员)无需开发者协助就能完成以前必须依赖程序员的工作?我一直在思考这些问题。以下是我的一些想法:
首先,我将在 OpenClaw 上运行所有这些演示。过去一个月,我每周的直播中一直在讨论它,其“代理式”特性(能够作为独立代理整合多个原本独立的动作)极其强大。如今所有认真对待 AI 的公司都在发力构建代理式 AI,所以我用 OpenClaw 来做这些演示,但你完全可以在你选择的平台(无论是现在还是不久的将来)实现完全相同的功能。
我通过 Telegram 机器人与 OpenClaw 交互,让我们开始吧:
很简单,对吧? 🙂 关于密钥的安全存储和保护方式还有不同讨论,但这属于另一个话题(显然也取决于你的代理工具)。不过关键的是,你可以在 HIBP 仪表盘中轻松轮换密钥。如果你还没有密钥,可以去订阅一个服务(起价每月几美元),很快就能上手使用。
既然我已确认连接成功,让我们看看我现在是如何使用这项服务的:
这些大多显而易见,但我还在这里添加了一个我用来监控服务在大型组织中表现情况的工具。这是一个真实的域名和真实数据,所以我将对其进行混淆以保护隐私,但它很好地展示了 AI 的强大作用。事实上,这篇博客的灵感来自于上周收到这条通知时:
在大型组织中的某个人收到这样一封邮件后,最常问的问题之一是“这16个人是谁?”因为我们无法在用户界面中可靠地过滤大型域名,我通常会建议他们要么从仪表板下载 CSV 或 JSON 格式,然后在其中搜索“Hallmark”,要么使用 API 并编写一些代码。但现在,有一种更简单的方法:
嗯,这很简单 😎 我喜欢额外的上下文,现在我对他们最近在做什么感到好奇:
因为我使用的是 Pro 计划(或者如果你还在使用旧的 Pwned 5 计划),我还获得了偷窃日志的访问权限。让我们看看那里发生了什么:
如果你在运行在线服务,第一个数字表示受影响的客户。但正如 OpenClaw 在此处指出的那样,第二个数字更有趣,因为它涉及员工使用公司邮箱地址在其他网站上输入数据。但他们应该不会重用工作密码吧?🤔 最好检查一下他们将这些数据输入到了哪些组织的资产中:
第一个看起来合理,当你考虑到这些人感染了信息窃取器时,就更令人担忧了。这不一定是公司设备上的恶意软件;他们可能总是使用受感染的个人设备登录公司资产……哦,这也相当糟糕!说实话,我看到 Steam 在里面有点惊讶——谁会用公司邮箱登录游戏平台?!可能需要和他们进行一番安静的交流。至于 bamboozled.net 的内容则很奇怪,我想进一步了解它:
现在我失去了对这个博客的兴趣,真正想知道数据里到底有什么!
好吧,那边有一个完整的兔子洞!我们先搁置这个话题,想想这种信息对信息安全团队来说多么有用,而且你可以如此轻松地获取它。或者它对人力资源团队来说多么有用 😬
请记住,这些是与公司绑定的企业邮箱地址,属于公司的财产,所以,是的……
但请记住,OpenClaw 的代理性质意味着我们可以让它去后台执行任务,比如这样的任务:
这只是几天前我设置的一个小实验,直到昨天加载了一个新的泄露事件我才想起来:
我从未要求它查找“功能/系统账户”;它只是认为这是相关的。而它确实是——这次泄露显然包含了很多与服务购买相关的数据,这是一个有趣的方面。
按计划运行某些操作的想法开辟了大量新的可能性。例如,监控你家人的邮箱地址:“当 mum@example.com 出现在新的泄露事件中时通知我”。从这里开始,你的创造力就是唯一的限制(甚至这个说法也有争议,因为 AI 代理自己会想出很多东西)。例如,创建数据可视化:
我可以一直说下去(我曾想过让它根据所有数据生成高管级别的报告),但你已经明白了。
AI Pipeline
这关乎我们管道中的内容,主要主题是将工具部署到更易被大众接触的地方。在 Claude 中创建连接器、在 ChatGPT 中开发应用,以及在其他主流 AI 工具中搭建类似的基础设施,显然是下一步的合理举措。这很可能涉及为 HIBP 添加 OAuth 层,让用户能够配置相应工具,以其身份查询 HIBP API,从而获得与上文相同的结果,但以人们熟悉的“传统”AI 工具集成方式实现。
未来
这其中很大一部分在于 AI 能促成更多人类对话以实现技术目标。我昨天刚注意到 Cloudflare 的案例,它完美诠释了这一点:
Cloudflare 仪表盘现在可以为你完成任务。“创建一个 Worker 并绑定一个新的 R2 bucket”“将我的 DNS 记录更改为 1.1.1.1”“本周发生了多少错误”——我们不仅会告知你结果,还会通过生成式 UI 直观展示。提示:使用全屏模式。pic.twitter.com/Q1o1vyoOwk— Brayden (@BraydenWilmoth) April 15, 2026
我对整个过程之简便以及从长期积累的数据中获得如此多洞察力感到十分震撼。未来我们将构建更多工具并制作易于复现的演示案例,我相信其中很多功能会超出我们当前的想象。如果你尝试了这些方法并发现了其他精彩用例,请在评论区留言告诉我你的成果,尤其是那些突破 hype、创造出真正惊艳作品的人 😎
需要完整排版与评论请前往来源站点阅读。