five

disposable-email-domains

收藏
github2026-05-11 更新2026-05-12 收录
下载链接:
https://github.com/castle/disposable-email-domains
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个每日更新的前1,000个一次性电子邮件域的精选列表,通过自动化管道维护,独立验证每个域名,确保其与真实的一次性电子邮件服务相关,并基于实际滥用活动观察,旨在提供一个小而专注的数据集,以减少误报。

This is a curated list of the top 1,000 disposable email domains, updated daily. Maintained via an automated pipeline, each domain is independently verified to confirm its connection to genuine disposable email services. Built upon observations of real-world abusive activities, this small, focused dataset is designed to reduce false positives.
创建时间:
2026-05-11
原始信息汇总

数据集概述

该数据集是一个经过精心筛选的一次性邮箱域名列表,专注于提供高质量的、可用于实际风控场景的域名集合。

核心目标

  • 提供一份 每日更新严格筛选 的 Top 1,000 个一次性邮箱域名列表。
  • 解决现有公共列表常见的误报率高、噪声大、难以投入生产的问题。

收录原则

  • 严格筛选:每个域名都经过独立验证,并关联到真实的一次性邮箱服务提供商。
  • 聚焦滥用:仅收录在 Fake 注册、促销滥用、垃圾邮件、多账户等真实攻击行为中被观测到的域名。
  • 排除干扰:明确排除了以隐私为主要目的的服务商(如 Proton Mail、Tuta),仅关注用于创建一次性账户的域名。
  • 小巧精准:仅维护 1,000 个域名,旨在降低误报率并提升查询效率。

数据采集方法

该列表通过以下三种技术组合生成:

  1. 网站爬取:持续爬取已知的一次性邮箱服务商网站,发现其提供的域名。
  2. DNS 分析:分析 MX、A 记录等 DNS 记录,识别与已知服务共享基础设施的域名,从而发现隐藏的自定义域名和白标服务。
  3. 真实滥用遥测:基于 Castle 网络观测到的实际滥用活动(如虚假账户创建、多账户操作等)对域名进行排序。

数据集文件

  • 主列表文件disposable-email-domains.txt
  • 格式:纯文本格式,每行一个域名,按观测到的滥用量降序排列(最常被滥用的域名排在前面)。

更新频率与许可

  • 更新频率:每日自动更新。
  • 许可协议:MIT。
搜集汇总
数据集介绍
main_image_url
构建方式
在数字身份欺诈与滥用行为日益猖獗的背景下,临时邮箱(disposable email)已成为恶意用户绕过平台风控、进行虚假注册或滥用促销活动的常用工具。为此,Castle研究团队构建了disposable-email-domains数据集,其创建过程融合了被动与主动采集技术。通过持续爬取已知临时邮箱服务商的网站,识别其所提供或关联的域名;同时借助DNS记录的MX和A记录分析,定位与已知服务共享基础设施的隐藏域名或白标服务。更重要的是,该数据集依托Castle在保护大型消费平台时所积累的真实世界滥用遥测数据,对在虚假账号创建、多重账户注册、促销滥用及垃圾邮件等活动中被观测到的域名进行排序,最终精选出前1000个高频滥用域名,确保每个收录的域名均有明确的滥用证据支撑。
特点
该数据集最显著的特点在于其高度精选与严格聚焦的定位。与许多社区维护、通过合并请求不断膨胀的临时邮箱列表不同,disposable-email-domains严格区分并排除了以隐私保护为核心的服务提供商(如Proton Mail、Tuta),确保收录域名均服务于纯粹的临时邮箱场景,从而显著降低误判风险。数据集每日通过全自动管道更新,不依赖社区提交,保证信息的时效性与独立性。每个域名均经过独立验证,而非简单聚合其他公开列表,这使得列表规模被有意控制在1000个,体积小巧、查询高效,易于加载至内存且不易产生误报。域名按观测到的滥用流量排序,高频滥用者置于前列,为风控决策提供了清晰的风险优先级。此外,数据集明确声明其不追求穷尽性,也不提供硬性阻断建议,而是作为一个精准的临时邮箱信号供团队灵活集成。
使用方法
该数据集以纯文本格式存储于GitHub仓库中,每个域名独占一行,可直接通过HTTP请求获取最新版本。用户可通过curl命令或编程语言中的HTTP客户端(如Python的urllib、JavaScript的fetch)快速拉取及缓存数据。由于文件体积较小,开发者可将整个域名列表加载至内存中的集合(Set)数据结构,从而以常数级时间复杂度高效查询某个邮箱是否为临时邮箱。典型的集成流程包括:从指定URL下载文件,按行解析并去重构建集合,然后提取待验证邮箱的域名部分进行匹配。该方法简单易用,适用于多种风控场景,如作为登录、注册或促销活动前的一道校验环节,辅助实现硬性阻断、风险评分、逐步验证或人工审查等差异化策略。
背景与挑战
背景概述
在数字化时代,电子邮件作为身份验证与用户沟通的核心载体,其安全性直接关系到互联网服务的生态健康。临时邮箱(Disposable Email)因其匿名性与短暂有效期,常被用于注册垃圾账户、实施促销滥用、发起垃圾邮件及多账号欺诈等恶意活动,给电商、社交平台及金融服务等领域的信任体系带来严峻挑战。针对这一问题,Castle研究团队于近年创建了disposable-email-domains数据集,旨在精准识别并阻断临时邮箱滥用行为。该数据集通过每日自动更新的流程,严格筛选出经独立验证的、与真实临时邮箱服务绑定的前1000个域名,剔除隐私导向型服务(如Proton Mail),仅聚焦于实际被用于网络攻击的域名,从而为欺诈防护与安全运营提供高效、低误报的支撑资源。
当前挑战
该数据集所应对的核心挑战包括:一是领域问题层面,传统临时邮箱列表常因混入隐私服务或归属不明的自定义域名而产生误报,本数据集通过严格区分“滥用性临时邮箱”与“隐私性邮箱”,减少了阻断决策中的误伤风险,同时强调临时邮箱本身并非恶意,需结合具体业务场景(如硬阻断、风险评分、逐步验证等)灵活处置,避免单一策略的局限性。二是在构建过程中,面临临时邮箱服务商频繁新增轮换域名的动态对抗,需综合运用网站爬虫持续抓取、DNS记录分析以发现共享基础设施的隐藏域名,以及基于Castle平台真实遥测数据(如虚假注册、多账号操作)对域名进行攻击活跃度排序,确保数据集反映最新伪装技术并保持最小化规模(1000个域名),以降低维护与查询成本,并提升实时更新流程的自动化可靠性。
常用场景
经典使用场景
在网络安全与反欺诈领域,disposable-email-domains数据集最经典的使用场景是作为实时邮件地址验证的判别依据。开发者或安全工程师通过将用户注册时提供的邮箱域名与此精心维护的列表进行比对,能够快速识别出由一次性邮箱服务商生成的临时地址。该数据集因其每日自动化更新与严谨的策展机制,有效规避了常见列表中混淆隐私邮箱或误伤合法用户的问题,为账户注册、登录及敏感操作等环节提供了轻量级且高精度的过滤基础。
实际应用
在实际产业应用中,该数据集被广泛部署于电商平台、社交媒体、在线支付及内容订阅等系统的风控模块。通过集成轻量级的域名查询接口,业务方能够在用户注册瞬间识别并干预那些企图利用临时邮箱批量创建账号、套取注册奖励、实施促销滥用或进行多账号刷单的恶意行为。不同于全量禁止的策略,许多平台将其作为风险评分因子之一,结合设备指纹与行为分析,对高风险操作实施验证升级、限流或人工审核,既降低了欺诈损失,又尽量减少了对正常用户体验的干扰。
衍生相关工作
围绕disposable-email-domains衍生了一系列经典的工程与研究工作。在工程层面,开发者将其集成到身份验证SDK、Web应用防火墙及自研风控引擎中,形成了与威胁情报联动的实时阻断方案。在学术层面,该数据集常被用作基准评测的重要组成部分,支撑了关于异常注册检测模型、图神经网络关联分析及跨平台多账号识别等前沿探索。此外,Castle团队维护此列表所采用的DNS基础设施分析与真实攻击遥测融合的方法论,也为后续研究如何构建高质量、低误报的威胁情报源提供了可复现的范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作