five

The supporting data for the paper "Synergistic Enhancement of LSTM Time Series Prediction via Companion Strategy and Decay Operator-Improved Aquila Optimization"

收藏
科学数据银行2024-12-13 更新2026-04-23 收录
下载链接:
https://www.scidb.cn/detail?dataSetId=66c676a541ad493a8504976b170cfd28
下载链接
链接失效反馈
官方服务:
资源简介:
数据生成程序该数据集是使用 The Investor's Exchange API 生成的,脚本会定期获取标准普尔 500 指数中所有公司的历史股价。详细说明和脚本可以在 GitHub 存储库中找到。该数据每5年更新一次,最近一次更新于2018年2月。数据处理方法和步骤数据处理的主要步骤包括:数据采集:使用 API 获取每只股票的历史数据,存储在.csv文件中。数据清理:删除重复条目,纠正格式错误,确保数据完整性。数据合并:将单个股票数据合并到一个大.csv文件中,以便于使用。数据验证:通过检查时间序列的连续性和完整性来验证数据的准确性。使用的设备和工具数据采集工具:Python 脚本数据处理工具:用于数据清洗和处理的 Pandas 库数据存储:CSV文件格式时间和地理范围时间范围:数据涵盖过去 5 年的历史股票价格,最新更新于 2018 年 2 月。地理范围:数据涵盖标准普尔500指数中的所有公司,主要是美国市场数据。时间和空间分辨率时间分辨率:每日数据,每个交易日一条记录。空间分辨率:无地理空间分辨率;数据按公司分组。表格数据条目总数:条目总数取决于标准普尔500指数中的公司数量和总交易日数。行标题和列标题:日期:交易日期格式为yy-mm-dd开盘价:开盘价(美元)最高价:当日最高价(美元)最低价:当日最低价格(美元)收盘价:收盘价(美元)交易量:成交股数名称:以股票代码的名义缺失数据数据集在某些交易日可能缺少数据,主要是由于非交易日(例如节假日)或API数据采集过程中的临时网络问题。这些缺失的数据通常不会影响整体分析结果。数据错误由于数据源是第三方 API,因此数据错误的可能性很低。如果发现错误,通常是由于 API 数据采集过程中的临时网络问题造成的。数据清理过程旨在最大限度地减少和纠正这些错误。数据文件说明数据文件类型:all_stocks_5yr.csv:包含所有股票的合并数据文件。individual_stocks_5yr文件夹:包含每个股票的单个.csv文件。文件内容和格式:文件采用 CSV 格式,每个文件包含日期、开盘价、最高价、最低价、收盘价、成交量和股票名称列。文件大小:文件大小取决于特定股票的交易数据量,通常从几MB到几十MB不等。文件格式说明数据以通用的 CSV 格式存储,可以使用 Excel、Notepad++ 或任何支持 CSV 文件的工具打开和查看。对于进一步的数据处理和分析,可以使用 Python Pandas 库。总结该数据集提供过去5年标准普尔500指数中所有公司的历史股价数据,包括开盘价、最高价、最低价、收盘价、交易量等详细信息。它适用于各种财务数据分析和建模应用。数据通过API获取并处理,以确保准确性和完整性。
提供机构:
China University of Mining and Technology; Shi-Xing Zheng
创建时间:
2024-07-24
二维码
社区交流群
二维码
科研交流群
商业服务