five

universities-database

收藏
github2026-06-29 更新2026-07-01 收录
下载链接:
https://github.com/matinzd/universities-database
下载链接
链接失效反馈
官方服务:
资源简介:
一个社区维护的全球大学邮箱域名数据库,用于验证学术邮箱地址,包含148所大学和149个邮箱域名,数据以JSON文件(按国家组织)和多种派生格式提供,支持直接集成或作为swot兼容的替代品。
创建时间:
2026-06-29
原始信息汇总

数据集概述

Universities Database 是一个社区维护的全球大学数据库,提供大学电子邮件域名列表,用于验证来自世界各地机构的学生邮箱。

背景

该项目源于 JetBrains 的 swot 仓库停止接受伊朗大学域名的事件,旨在确保伊朗学生与其他国家学生拥有相同的学术验证访问权限。目前已扩展为通用的全球大学数据库,欢迎所有国家的贡献。

数据规模

  • 148 所大学149 个电子邮件域名
  • 数据来源:universities/ 目录下的 JSON 文件,每个国家一个文件(例如 universities/IR.json
  • 派生格式由 CI 在每次合并时自动重新生成

数据格式

核心数据:每所大学的 JSON 条目

json { "name": "University of Tehran", "name_local": "دانشگاه تهران", "country": "IR", "domains": ["ut.ac.ir"], "type": "public", "city": "Tehran", "website": "https://ut.ac.ir" }

  • namecountrydomains 是必填字段
  • country 使用 ISO 3166-1 alpha-2 代码(如 IRUSGB
  • 每个域名在整个数据库中只能出现一次
  • 按大学名称字母顺序排列

大学类型

类型 描述
public 政府资助的公立大学
private 私立非政府大学
islamic-azad 伊斯兰阿扎德大学(分支)
medical 医科大学
distance 远程教育机构
applied-science 应用科学与技术大学

集成方式

选项1:JSON(推荐)

直接从 GitHub 原始 URL 获取每个国家的 JSON 文件,例如:

  • https://raw.githubusercontent.com/matinzd/iran-universities-database/main/universities/IR.json
  • https://raw.githubusercontent.com/matinzd/iran-universities-database/main/universities/US.json

选项2:swot 兼容替换

domains/ 目录镜像了 swot 的文件结构,现有使用 swot 的应用无需修改代码即可指向此仓库。

选项3:扁平域名列表

domains.txt 文件每行一个域名,适用于简单的 grep 查询或加载到集合中。

贡献方式

  • 编辑 universities/ 目录下对应国家的 JSON 文件(如 universities/IR.json
  • 如果该国家没有对应文件,则创建一个
  • 提交 Pull Request,CI 会自动验证架构和检查重复域名
  • domains/ 目录和 domains.txt 是自动生成的,请勿直接编辑

许可证

MIT

搜集汇总
数据集介绍
main_image_url
构建方式
Universities Database 是一个由社区维护的全球大学邮箱域名数据库,旨在为各类应用提供验证学术邮箱的能力。其构建始于对 JetBrains 的 swot 仓库停止接受伊朗大学域名的回应,如今已扩展为通用全球数据库。数据以国家为单位存储于 JSON 文件中,每个文件对应一个国家,例如 universities/IR.json 包含伊朗大学信息。数据库初始种子数据源自 swot,包含 148 所大学和 149 个邮箱域名,并通过社区贡献持续扩充。每次合并后,CI 系统自动生成派生的数据格式,包括 Swot 兼容的目录结构和扁平域名列表。
使用方法
使用者可根据实际需求选择三种集成方式。推荐方式是通过直接获取 universities/ 目录下的国家 JSON 文件,从 GitHub 原始 URL 加载数据,然后解析域名列表进行邮箱验证。对于已集成 swot 的应用,可无缝切换到 domains/ 目录,其文件结构与 swot 完全一致,无需修改代码。此外,domains.txt 提供了一行一个域名的扁平列表,适合简单的查找或加载到集合中。集成时需注意 v2 版本的破坏性变更:name_fa 已重命名为 name_local,country 字段变为必需。
背景与挑战
背景概述
universities-database数据集诞生于2024年,由社区开发者matinzd发起,旨在回应JetBrains旗下swot项目因制裁合规问题停止接受伊朗大学域名所造成的学术验证空白。该项目不仅为伊朗学生提供了平等的学术邮箱验证服务,还迅速扩展为一个全球性的高校数据库。其核心研究问题在于构建一个开放、社区维护且不受政治因素干扰的高校邮箱域名集合,以支持各类应用对全球学术邮箱真实性的验证。该数据集在学术验证领域产生了深远影响,为开发者和平台提供了替代方案,确保学术福利的公平获取。
当前挑战
该数据集面临的挑战首先在于政治与法律层面,即如何在遵守国际制裁法规的前提下,确保对伊朗等受限制国家高校的包容性。构建过程中,挑战包括从swot项目迁移并扩充初始数据,维持数据的准确性和时效性,以及处理不同国家高校域名体系的多样性。此外,社区维护模式带来了数据一致性问题,需通过严格的CI验证和格式规范来保证质量,同时鼓励全球贡献者参与,避免数据偏见和覆盖不足。
常用场景
经典使用场景
在学术身份验证与教育科技领域,universities-database数据集最为经典的应用场景是为各类在线教育平台、学术协作工具及研究资源分发系统提供全球高校电子邮件域名的高效校验服务。开发者可通过该数据集的JSON格式或扁平域名列表,快速判断某一邮箱是否隶属于已收录的高等教育机构,从而实现对用户学术身份的无缝认证。该数据集还兼容Swot项目的文件结构,使得原有依赖Swot的应用能够以零代码改动的方式迁移至本数据集,降低了跨平台集成的迁移成本。
解决学术问题
该数据集的核心价值在于解决了学术邮箱验证领域长期存在的覆盖不完整与地缘政治歧视问题。此前,JetBrains的Swot项目因制裁合规原因停止接收伊朗高校域名,导致伊朗学生无法享受任何依赖该数据库的平台所提供的学术认证功能,这实质上构成了教育资源获取上的不平等。universities-database不仅填补了这一空白,还建立了一个由社区维护、无地域限制的全球高校数据库,确保来自任何国家、包括受制裁地区的师生都能平等地参与学术服务验证,维护了教育公平与学术自由的核心理念。
实际应用
在实际应用层面,universities-database被广泛整合进SaaS产品、学术协作平台及开源工具中,用于实现基于教育邮箱的权限管理、折扣计划及内容过滤。例如,云服务商可据此为.edu或.ac域名的用户提供免费或折扣的技术资源;学术社交网络可自动识别并汇集研究人员的所在院校信息;反垃圾邮件系统则能通过该数据库区分学术机构邮件与普通广告邮件,提高过滤准确率。由于数据格式灵活且更新频繁,该数据集特别适合需要实时、跨区域邮件验证的现代化网络服务。
数据集最近研究
最新研究方向
该数据集聚焦于构建一个包容性、社区驱动的全球高校邮箱域名数据库,以应对特定平台因制裁而拒绝收录伊朗高校域名所引发的学术验证不公问题。其研究前沿紧密关联地缘政治与学术自由的交叉领域,强调通过开放协作打破信息壁垒,确保全球学生平等享有学术身份验证服务。此项目不仅填补了特定区域高校数据库的空白,还推动了开源社区对出口管制法律(如OFAC通用许可证D-2)的重新审视与合规实践,对促进教育科技普惠性和跨文化学术交流具有深远意义。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务