The supporting data for the paper "Synergistic Enhancement of LSTM Time Series Prediction via Companion Strategy and Decay Operator-Improved Aquila Optimization"
收藏NIAID Data Ecosystem2026-05-02 收录
下载链接:
https://zenodo.org/records/13894887
下载链接
链接失效反馈官方服务:
资源简介:
数据生成程序
该数据集是使用 The Investor's Exchange API 生成的,脚本会定期获取标准普尔 500 指数中所有公司的历史股价。详细说明和脚本可以在 GitHub 存储库中找到。该数据每5年更新一次,最近一次更新于2018年2月。
数据处理方法和步骤
数据处理的主要步骤包括:
数据采集:使用 API 获取每只股票的历史数据,存储在.csv文件中。
数据清理:删除重复条目,纠正格式错误,确保数据完整性。
数据合并:将单个股票数据合并到一个大.csv文件中,以便于使用。
数据验证:通过检查时间序列的连续性和完整性来验证数据的准确性。
使用的设备和工具
数据采集工具:Python 脚本
数据处理工具:用于数据清洗和处理的 Pandas 库
数据存储:CSV文件格式
时间和地理范围
时间范围:数据涵盖过去 5 年的历史股票价格,最新更新于 2018 年 2 月。
地理范围:数据涵盖标准普尔500指数中的所有公司,主要是美国市场数据。
时间和空间分辨率
时间分辨率:每日数据,每个交易日一条记录。
空间分辨率:无地理空间分辨率;数据按公司分组。
表格数据
条目总数:条目总数取决于标准普尔500指数中的公司数量和总交易日数。
行标题和列标题:
日期:交易日期格式为yy-mm-dd
开盘价:开盘价(美元)
最高价:当日最高价(美元)
最低价:当日最低价格(美元)
收盘价:收盘价(美元)
交易量:成交股数
名称:以股票代码的名义
缺失数据
数据集在某些交易日可能缺少数据,主要是由于非交易日(例如节假日)或API数据采集过程中的临时网络问题。这些缺失的数据通常不会影响整体分析结果。
数据错误
由于数据源是第三方 API,因此数据错误的可能性很低。如果发现错误,通常是由于 API 数据采集过程中的临时网络问题造成的。数据清理过程旨在最大限度地减少和纠正这些错误。
数据文件说明
数据文件类型:
all_stocks_5yr.csv:包含所有股票的合并数据文件。
individual_stocks_5yr文件夹:包含每个股票的单个.csv文件。
文件内容和格式:文件采用 CSV 格式,每个文件包含日期、开盘价、最高价、最低价、收盘价、成交量和股票名称列。
文件大小:文件大小取决于特定股票的交易数据量,通常从几MB到几十MB不等。
文件格式说明
数据以通用的 CSV 格式存储,可以使用 Excel、Notepad++ 或任何支持 CSV 文件的工具打开和查看。对于进一步的数据处理和分析,可以使用 Python Pandas 库。
总结
该数据集提供过去5年标准普尔500指数中所有公司的历史股价数据,包括开盘价、最高价、最低价、收盘价、交易量等详细信息。它适用于各种财务数据分析和建模应用。数据通过 API 获取并处理,以确保准确性和完整性。
创建时间:
2024-10-06



