qlib回测所需股票日k历史数据
收藏github2023-12-02 更新2024-05-31 收录
下载链接:
https://github.com/daedalus2022/qlib_data
下载链接
链接失效反馈官方服务:
资源简介:
提供qlib回测所需股票日k历史数据,涵盖2008年到2023年10月27日,每月更新一次。由于qlib提供的数据较旧,且使用的是对国内用户不太友好的yahoo数据源,更新速度较慢,本仓库旨在解决这些问题。
This dataset provides daily K-line historical stock data required for qlib backtesting, covering the period from 2008 to October 27, 2023, with monthly updates. Since the data provided by qlib is outdated and uses the Yahoo data source, which is not very user-friendly for domestic users and has slow update speeds, this repository aims to address these issues.
创建时间:
2023-10-29
原始信息汇总
数据集概述
数据集名称
qlib_data
数据集内容
- 提供2008年至2023年10月27日的股票日k历史数据,每月更新一次。
- 基于原始日k数据,提供每日数据更新服务。
数据集更新功能
- 使用qshare下载当天数据并更新到source数据中。
- 处理source数据生成normalize。
- 使用normalize数据重新构建qlib_data。
使用说明
- 更新当天数据命令:
qlib_data update-today [2023-10-27]
搜集汇总
数据集介绍

构建方式
该数据集以qlib回测需求为核心,整合了2008年至2023年10月27日的股票日K线历史数据,并通过每月更新机制确保数据的时效性。数据集的构建采用了分块压缩技术,用户可通过命令行工具将分块文件合并为完整的压缩包,便于存储与传输。此外,数据集还支持基于[qshare](https://crates.io/crates/qshare)工具的每日数据更新功能,能够自动下载最新数据并完成数据归一化处理,最终生成适用于qlib的标准化数据集。
特点
该数据集的特点在于其覆盖时间长、更新频率高,且针对国内用户优化了数据获取方式,避免了因数据源限制导致的更新延迟问题。数据集不仅提供了原始的日K线数据,还通过归一化处理生成了适用于量化回测的标准化数据,极大地方便了用户的使用。此外,数据集的分块压缩设计使其在存储和传输上更具灵活性,适合不同场景下的需求。
使用方法
用户可通过命令行工具`qlib_data update-today`更新当天的股票数据,确保数据集的实时性。在数据更新过程中,系统会自动调用[qshare](https://crates.io/crates/qshare)工具下载最新数据,并将其整合到现有数据集中。此外,用户需通过配置`.env`文件指定缓存路径,以便系统正确存储和处理数据。对于需要使用libtorch的用户,需按照说明下载并配置相关环境变量,以确保数据处理的兼容性和高效性。
背景与挑战
背景概述
qlib回测所需股票日k历史数据数据集由qlib项目团队于2008年至2023年期间持续更新,旨在为金融量化研究提供高质量的股票日K线数据。该数据集覆盖了广泛的股票市场历史数据,为量化投资策略的回测和优化提供了坚实的基础。其主要研究人员和机构包括qlib开源社区,该社区致力于通过开源工具和数据推动金融科技的发展。数据集的核心研究问题在于如何高效、准确地获取和处理大规模的股票市场数据,以支持复杂的量化分析。该数据集在金融量化领域具有重要影响力,为研究人员和从业者提供了宝贵的数据资源,推动了量化投资策略的创新和优化。
当前挑战
该数据集在构建和应用过程中面临多重挑战。首先,数据源的更新速度和稳定性是主要问题,尤其是对于国内用户而言,使用Yahoo数据源存在更新缓慢和访问不便的困难。其次,数据的完整性和一致性要求极高,确保每日数据的准确更新和规范化处理是构建过程中的关键挑战。此外,数据集的规模庞大,处理和管理这些数据需要高效的算法和计算资源,尤其是在进行数据合并和重新构建时,技术复杂度较高。最后,如何确保数据的时效性和可用性,特别是在高频交易和实时分析场景中,仍然是一个亟待解决的问题。
常用场景
经典使用场景
在金融量化分析领域,qlib回测所需股票日k历史数据为研究人员和投资者提供了一个全面的历史股票数据平台。该数据集涵盖了从2008年至2023年的日K线数据,支持高频次的回测操作,使得用户能够基于历史数据模拟交易策略的有效性。通过这种方式,用户可以评估和优化其交易算法,从而提高投资决策的准确性。
实际应用
在实际应用中,qlib数据集被广泛应用于股票市场的策略回测和风险管理。金融机构和独立投资者利用这一数据集来测试和验证交易策略的历史表现,从而在实际交易中做出更为明智的决策。此外,该数据集的支持工具如qshare,使得数据的获取和更新变得更加便捷,极大地提高了数据处理的效率。
衍生相关工作
基于qlib数据集,许多经典的研究工作得以展开。例如,一些研究利用该数据集开发了新的机器学习模型来预测股票价格走势,另一些研究则专注于通过历史数据分析市场趋势和波动性。这些研究不仅推动了量化金融领域的发展,也为投资者提供了更多有效的投资工具和策略。
以上内容由遇见数据集搜集并总结生成



