adanosorg/free-global-stock-ticker-database
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/adanosorg/free-global-stock-ticker-database
下载链接
链接失效反馈官方服务:
资源简介:
这是一个全球股票和ETF的免费数据库,包含了股票代码、上市信息、别名、标识符以及经过审核的符号变更等信息。数据集由Adanos Software GmbH维护,主要用于股票代码检测、标识符解析和市场数据工作流。数据集包含多个文件,如tickers.csv(每只股票或ETF的标准主要安全导出)、listings.csv(按listing_key键控的场所级上市导出,包括交叉上市)、aliases.csv(用于股票代码解析的别名、名称和标识符查找行)等。数据集的使用建议、引用、来源、许可证和限制也在README中进行了详细说明。
Global stocks and ETFs with listings, identifiers, aliases, and reviewed symbol changes. Maintained by Adanos Software GmbH for ticker detection, identifier resolution, and market-data workflows. The dataset includes multiple files such as tickers.csv (canonical primary security export, one row per stock or ETF), listings.csv (venue-level listing export keyed by listing_key, including cross-listings), aliases.csv (alias, name, and identifier lookup rows for ticker resolution), etc. The README also provides detailed information on recommended use, citation, provenance, license, and limitations.
提供机构:
adanosorg
搜集汇总
数据集介绍

构建方式
该数据集由Adanos Software GmbH基于官方交易所主文件与参考目录,结合经过验证的增强数据源构建而成。原始输入涵盖交易所层面的证券档案与参考信息,增强数据则在通过标识符、上市代码、别名及覆盖率报告的严格验证门控后,才被纳入公开输出。数据集以Parquet与CSV两种格式发布,包含八个核心配置:tickers提供每只证券的规范行,listings记录交易所层面的上市信息,aliases支持代码与名称的解析查找,identifiers提供紧凑的ISIN与WKN映射,cross_listings记录跨交易所的同一ISIN上市分组,instrument_scopes界定核心与扩展上市范围,listing_events跟踪上市生命周期事件,symbol_changes则收录经过审查的代码变更记录。
特点
该数据集的显著特点在于其全面且规范的全球证券覆盖范围,包含逾五万条规范证券主记录与六万余条上市级别记录,涵盖股票与ETF两大类别。每个配置均经过精心设计以服务于特定查询场景:tickers提供每只证券的唯一规范行,listings则保留交易所层面的精细标识,而aliases整合了超过十万条别名与标识符查询条目,极大提升了代码解析的效率。尤为突出的是symbol_changes配置,收录了附带来源链接与审查标志的代码变更记录,为监控证券标识的演进提供了可靠依据。数据源自官方来源并经审查验证,确保了参考信息的可信度。
使用方法
用户可通过Hugging Face的datasets库便捷加载该数据集,每个配置均以独立参数暴露,例如使用load_dataset('adanosorg/free-global-stock-ticker-database', 'tickers', split='train')加载证券主表。推荐的使用路径包括:利用tickers配置获取每只证券的规范行;当需要交易所层面的身份信息时,应使用listings配置并以listing_key而非ticker进行连接;aliases配置适用于代码、名称、ISIN与WKN的查找工作流;symbol_changes配置则适用于监控经过审核的代码变更。用户在使用前应验证数据对其下游应用的适用性,该数据集仅供参考之用,不构成投资建议。
背景与挑战
背景概述
在全球金融市场的数字化进程中,股票及ETF等证券品种的标准化标识与跨市场映射是量化分析、资产管理和风险控制的基础设施。由Adanos Software GmbH于2025年发布的Free Global Stock Ticker Database,是当前规模最大且持续维护的全球证券参考数据集之一,涵盖了超过5.4万种证券的主标识、6.2万条交易所层面的上市记录、10.3万个别名与标识符映射,以及经过人工审核的符号变更历史。该数据集通过整合官方交易所主文件与第三方校验源,致力于解决多源标识符冲突与数据碎片化问题,为金融科技与学术研究提供了统一的证券本体参考,推动了低延迟行情解析与跨市场归因分析的发展。
当前挑战
该数据集所应对的领域核心挑战在于全球证券标识的异质性:不同交易所、托管机构与数据供应商对同一证券采用不同的代码体系(如Ticker、ISIN、WKN),且易发生符号变更、退市与重上市事件,导致下游系统错配。构建过程中的技术挑战包括:从数十个异质化官方源中持续同步与消歧,需设计高鲁棒性的别名解析流水线与变更追溯机制;校验环节难以避免部分新兴市场数据滞后或缺失,需依赖人工审核与覆盖报告来平衡数据广度与准确性;在维持MIT开源许可的同时,需确保证据完整性与版本迭代的透明度,这对非盈利性维护者的资源调度构成了长期压力。
常用场景
经典使用场景
在金融量化分析与计算金融学领域,Free Global Stock Ticker Database 为研究者提供了全球股票与ETF的标准化参考数据集,其经典使用场景涵盖证券代码解析、跨市场实体对齐及资产标识符映射等核心工作流。该数据集通过提供包括ISIN、WKN、别名及上市事件在内的多维度规范表格,有力地支撑了金融数据清洗、多源数据融合与投资组合构建等下游任务,成为连接原始市场数据与高级分析模型的桥梁。
衍生相关工作
围绕该数据集衍生了一系列重要的学术与工程工作,包括基于别名表构建的多语言证券搜索引擎、利用挂牌事件序列预测上市状态变化的动态模型,以及用于全球ETF持仓穿透分析的高效实体解析框架。此外,其审校后的代码变更数据已成为研究交易所合并、代码迁移规则及市场微观结构冲击的宝贵资源,激发了更多关于金融参考数据质量控制与异常检测的研究课题。
数据集最近研究
最新研究方向
该数据集作为全球股票与ETF的标准化参考数据源,正深度融入金融科技领域的前沿研究。当前热点聚焦于利用其多维度标识符(如ISIN、WKN)与跨交易所上市信息,推动基于机器学习的自动证券识别与异常检测模型发展。尤其在市场微观结构分析中,数据集提供的生命周期事件与符号变更记录,为高频交易策略的回测与监管合规验证提供了关键基准。其开源属性和结构化存储格式,正在重塑量化投资社区对全球证券市场元数据的获取范式,显著降低了多市场数据融合的复杂性,对推动跨境投资决策系统的智能化演进具有里程碑意义。
以上内容由遇见数据集搜集并总结生成



