Indonesia Bank Stock Dataset
收藏github2025-09-27 更新2025-09-28 收录
下载链接:
https://github.com/queryflow-ai/indonesia-bank-stock-dataset
下载链接
链接失效反馈官方服务:
资源简介:
印度尼西亚银行股票历史价格数据集,从雅虎财经和印度尼西亚证券交易所等公开来源自动收集的每日银行股票数据,用于研究、市场分析、机器学习和教育目的
Historical Price Dataset of Indonesian Bank Stocks: Daily bank stock data automatically collected from public sources such as Yahoo Finance and the Indonesia Stock Exchange, intended for research, market analysis, machine learning and educational purposes.
创建时间:
2025-09-27
原始信息汇总
Indonesia Bank Stock Dataset 数据集概述
数据集基本信息
- 名称: Indonesia Bank Stock Dataset
- 描述: 印度尼西亚银行股票日度数据集,自动从Yahoo Finance和IDX官方发行人列表收集
- 用途: 研究、资本市场分析、机器学习和教育目的
- 更新频率: 每日20:00 WIB(13:00 UTC)通过GitHub Actions自动更新
数据来源
- Yahoo Finance(https://finance.yahoo.com/)
- IDX官方发行人列表(https://www.idx.co.id/)
数据集结构
datasets/ ├── BBRI/ │ ├── 02-01-2004.json │ ├── 03-01-2004.json │ └── ... ├── BBCA/ │ ├── 02-01-2004.json │ └── ... └── ...
数据内容
- 覆盖时间: 自2004年起每日数据
- 数据格式: JSON文件
- 股票范围: 印度尼西亚银行板块股票
- 数据示例:
- BBRI(Bank Rakyat Indonesia Tbk.)
- BBCA(Bank Central Asia Tbk.)
- BNI(Bank Negara Indonesia Tbk.)
技术实现
- 采集方式: 通过Python脚本自动爬取
- 自动化工具: GitHub Actions
- 依赖管理: requirements.txt文件
- 错误处理: errors.log错误日志记录
股票列表信息
- 文件位置: profile/daftar_saham.csv
- 包含字段:
- No(序号)
- Kode(股票代码)
- Nama Perusahaan(公司名称)
- Tanggal Pencatatan(上市日期)
- Saham(股票数量)
- Papan Pencatatan(上市板块)
未来发展计划
- 数据格式转换为CSV/Parquet
- 添加简单分析功能(移动平均线、日收益率)
- 提供简单的API文档用于数据消费
搜集汇总
数据集介绍

构建方式
在金融数据科学领域,高质量的数据集是支撑研究与实践的基石。印度尼西亚银行股票数据集的构建依托自动化技术,每日从雅虎财经平台抓取印尼上市银行的股价信息,同时整合了印尼证券交易所官方发布的上市公司名录。通过精心设计的GitHub Actions工作流,系统在每日20:00 WIB定时触发数据采集任务,确保数据集持续更新。原始数据以JSON格式按股票代码分目录存储,完整覆盖自2004年以来的历史交易记录,形成了结构化的时间序列数据库。
特点
该数据集凸显出多维度特征,其时间跨度逾二十年,为长期趋势分析提供了丰富样本。数据粒度精细至每日交易单元,包含开盘价、收盘价等关键指标,且严格遵循印尼金融市场规范对银行板块进行分类。动态更新机制通过版本控制实现数据追溯性,而跨平台兼容的JSON格式则便于各类分析工具调用。特别值得注意的是,数据集同步收录了上市公司基本面信息,为多因子模型构建创造了条件。
使用方法
研究者可通过克隆GitHub仓库直接获取结构化数据,利用Python环境运行配套的爬虫脚本实现本地化数据同步。对于自动化分析需求,用户可参照工作流配置实现定时数据拉取,或直接读取已归档的JSON文件进行量化分析。数据集支持金融工程领域的典型应用场景,包括波动率建模、风险价值计算以及机器学习特征工程,其标准化结构亦方便与Pandas、NumPy等数据分析库无缝对接。
背景与挑战
背景概述
印度尼西亚银行股票数据集由queryflow-ai团队于2023年创建,旨在为东南亚新兴资本市场研究提供结构化数据支持。该数据集聚焦印尼银行业上市公司,涵盖自2004年以来的每日股价数据,通过自动化采集系统整合雅虎财经与印尼证券交易所官方数据。作为新兴市场金融实证研究的重要基础设施,该数据集为资本流动分析、风险管理模型构建及机器学习算法验证提供了关键数据支撑,显著提升了区域资本市场研究的可重复性与比较分析效率。
当前挑战
在金融时间序列分析领域,该数据集需应对新兴市场特有的高波动性、交易不连续及政策干预频繁等挑战。数据构建过程中面临多源异构数据融合难题,包括雅虎财经API频次限制、印尼证券交易所数据格式迭代兼容性问题,以及伊斯兰节日等区域性非交易日数据的标准化处理。自动化采集系统还需解决网络延迟导致的时序错位,确保跨境金融数据在UTC与WIB时区转换中的精确同步。
常用场景
经典使用场景
在印度尼西亚金融市场分析领域,该数据集为研究者和分析师提供了银行股历史价格数据的核心资源,其每日自动更新的特性使其成为时间序列分析和市场趋势预测的理想选择。经典使用场景包括构建股价波动模型、计算技术指标如移动平均线,以及评估银行板块的整体表现,为量化交易策略和风险管理提供数据支撑。
实际应用
在实际金融业务中,该数据集被投资机构用于开发自动化交易系统,银行风控部门借助其监测同业股价关联性以优化资产配置。监管机构亦可利用该数据追踪系统性风险,而金融科技公司则将其整合至教育平台,为投资者提供历史回测工具,强化印尼资本市场的透明度与参与度。
衍生相关工作
基于该数据集衍生的经典研究包括结合机器学习算法预测银行股崩盘风险、开发印尼银行业波动率指数模型,以及构建ESG因子与股价表现的关联分析框架。相关成果已发表于东南亚金融研究期刊,并催生了针对新兴市场银行股的跨周期投资策略工具包。
以上内容由遇见数据集搜集并总结生成



