NEPSE Open Data
收藏github2025-07-02 更新2025-07-03 收录
下载链接:
https://github.com/socrateai/nepse-open-data
下载链接
链接失效反馈官方服务:
资源简介:
首个针对尼泊尔证券交易所(NEPSE)的开源金融数据集,旨在为尼泊尔资本市场的透明度、学习和创新提供支持。数据集包括每日原始交易数据、调整和未调整的OHLC价格(股票和指数级别)、公司符号主数据以及行业分类。
The first open-source financial dataset for the Nepal Stock Exchange (NEPSE), aimed at supporting transparency, learning, and innovation in the Nepalese capital market. The dataset includes daily raw trading data, adjusted and unadjusted OHLC prices at both stock and index levels, as well as master data for company symbols and industry classifications.
创建时间:
2025-07-02
原始信息汇总
NEPSE Open Data 数据集概述
数据集简介
- 首个针对尼泊尔证券交易所(NEPSE)的开源金融数据集
- 旨在促进尼泊尔资本市场的透明度、学习和创新
数据集结构
主要目录
floorsheet/:每日原始交易数据ohlc_adjusted/:股票特定调整后的OHLC价格ohlc_unadjusted/:未调整的OHLC价格ohlc_adjusted_index/:指数级别的调整后数据ohlc_unadjusted_index/:指数级别的未调整数据ohlc_adjusted_stock/:股票级别的调整后OHLCohlc_unadjusted_stock/:股票级别的未调整OHLC
元数据
meta/symbols.csv:公司符号主表meta/sector_map.csv:行业分类表
许可信息
- 采用开源许可证(具体类型见LICENSE文件)
搜集汇总
数据集介绍

构建方式
NEPSE Open Data作为尼泊尔证券交易市场的首个开源金融数据集,其构建过程体现了严谨的数据采集与处理流程。数据集通过系统化爬取尼泊尔证券交易所的公开交易数据,经过多维度清洗与校验后形成结构化存储。核心数据模块采用分层目录设计,包含原始交易记录、股票与指数的调整/未调整OHLC价格数据,并辅以上市公司代码映射表和行业分类元数据,确保数据粒度的完整性与可追溯性。
特点
该数据集最显著的特征在于其开创性地填补了尼泊尔资本市场高质量开放数据的空白。通过提供股票级与指数级的双维度OHLC数据(含调整与未调整版本),支持精细化的金融计量分析。独特的行业分类元数据与证券符号映射表,为跨领域研究提供了关键关联维度。数据更新机制遵循交易所官方发布周期,保障了时序数据的经济意义有效性。
使用方法
研究者可通过克隆GitHub仓库直接获取CSV格式的结构化数据,各子目录按数据类型与处理层级清晰划分。股票价格数据适合用于构建量化交易模型或计算技术指标,而行业分类元数据可用于基本面分析与板块效应研究。建议结合Python pandas等工具进行数据加载,利用调整后价格消除公司行为干扰,未调整价格则适用于交易模拟等场景。
背景与挑战
背景概述
NEPSE Open Data是由SocrateAI团队构建的首个尼泊尔证券交易所开源金融数据集,旨在推动尼泊尔资本市场的透明度提升与学术研究创新。作为南亚地区新兴经济体金融数据基础设施的重要补充,该数据集系统收录了包括逐笔交易数据、复权/未复权OHLC价格、指数及个股分类数据在内的多层次市场信息,其构建标志着尼泊尔证券市场数据开放进程的里程碑。数据集通过标准化清洗流程与模块化存储结构,为量化金融、宏观经济分析等领域提供了高质量的研究素材,填补了发展中国家非主流金融市场数据资源的空白。
当前挑战
该数据集主要应对新兴市场金融数据稀缺性与非标准化两大核心挑战。在领域问题层面,需解决尼泊尔证券市场特有的高频数据缺失、公司行为调整规则不透明等难题,这对构建跨周期可比的价格序列提出严峻考验。数据构建过程中,研发团队面临原始数据非结构化存储、交易所披露格式频繁变更等技术障碍,同时需设计适应本地市场特性的复权算法以准确反映分红配股等公司行为。此外,跨行业分类标准缺失与上市公司信息更新滞后等问题,亦为数据集的完整性与时效性保障带来持续挑战。
常用场景
经典使用场景
NEPSE Open Data作为尼泊尔股票交易所的首个开源金融数据集,为研究新兴市场资本流动提供了独特视角。其经典使用场景集中在量化金融领域,研究人员通过分析调整后与未调整的OHLC价格数据,构建时间序列模型来预测喜马拉雅地区特有的市场波动模式。分层存储的板块和个股数据允许学者进行横截面研究,探索不同行业在政治经济变化中的差异化表现。
实际应用
在实践层面,本地金融机构利用该数据集开发智能投顾系统,针对尼泊尔散户投资者的特点优化资产配置策略。监管机构通过分析板块级OHLC指数数据,监测系统性风险并制定市场稳定政策。数据中精确的行业分类信息还被用于ESG投资研究,评估喜马拉雅地区企业的可持续发展表现。
衍生相关工作
基于该数据集衍生的经典工作包括《Himalayan Market Anomalies》系列研究,揭示了季风气候与农业股波动的非线性关系。开源社区构建了NepalQuant框架,集成机器学习算法处理本地特有的数据缺口问题。世界银行2023年发布的南亚金融包容性报告,其核心论证便来源于此数据集的跨年分析。
以上内容由遇见数据集搜集并总结生成



