five

The supporting data for the paper "Synergistic Enhancement of LSTM Time Series Prediction via Companion Strategy and Decay Operator-Improved Aquila Optimization"

收藏
NIAID Data Ecosystem2026-05-02 收录
下载链接:
https://zenodo.org/records/13894887
下载链接
链接失效反馈
官方服务:
资源简介:
数据生成程序 该数据集是使用 The Investor's Exchange API 生成的,脚本会定期获取标准普尔 500 指数中所有公司的历史股价。详细说明和脚本可以在 GitHub 存储库中找到。该数据每5年更新一次,最近一次更新于2018年2月。   数据处理方法和步骤 数据处理的主要步骤包括:   数据采集:使用 API 获取每只股票的历史数据,存储在.csv文件中。 数据清理:删除重复条目,纠正格式错误,确保数据完整性。 数据合并:将单个股票数据合并到一个大.csv文件中,以便于使用。 数据验证:通过检查时间序列的连续性和完整性来验证数据的准确性。 使用的设备和工具 数据采集工具:Python 脚本 数据处理工具:用于数据清洗和处理的 Pandas 库 数据存储:CSV文件格式 时间和地理范围 时间范围:数据涵盖过去 5 年的历史股票价格,最新更新于 2018 年 2 月。 地理范围:数据涵盖标准普尔500指数中的所有公司,主要是美国市场数据。 时间和空间分辨率 时间分辨率:每日数据,每个交易日一条记录。 空间分辨率:无地理空间分辨率;数据按公司分组。 表格数据 条目总数:条目总数取决于标准普尔500指数中的公司数量和总交易日数。 行标题和列标题: 日期:交易日期格式为yy-mm-dd 开盘价:开盘价(美元) 最高价:当日最高价(美元) 最低价:当日最低价格(美元) 收盘价:收盘价(美元) 交易量:成交股数 名称:以股票代码的名义 缺失数据 数据集在某些交易日可能缺少数据,主要是由于非交易日(例如节假日)或API数据采集过程中的临时网络问题。这些缺失的数据通常不会影响整体分析结果。   数据错误 由于数据源是第三方 API,因此数据错误的可能性很低。如果发现错误,通常是由于 API 数据采集过程中的临时网络问题造成的。数据清理过程旨在最大限度地减少和纠正这些错误。   数据文件说明 数据文件类型: all_stocks_5yr.csv:包含所有股票的合并数据文件。 individual_stocks_5yr文件夹:包含每个股票的单个.csv文件。 文件内容和格式:文件采用 CSV 格式,每个文件包含日期、开盘价、最高价、最低价、收盘价、成交量和股票名称列。 文件大小:文件大小取决于特定股票的交易数据量,通常从几MB到几十MB不等。 文件格式说明 数据以通用的 CSV 格式存储,可以使用 Excel、Notepad++ 或任何支持 CSV 文件的工具打开和查看。对于进一步的数据处理和分析,可以使用 Python Pandas 库。   总结 该数据集提供过去5年标准普尔500指数中所有公司的历史股价数据,包括开盘价、最高价、最低价、收盘价、交易量等详细信息。它适用于各种财务数据分析和建模应用。数据通过 API 获取并处理,以确保准确性和完整性。
创建时间:
2024-10-06
二维码
社区交流群
二维码
科研交流群
商业服务