five

股票价格预测数据集

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-26043.html
下载链接
链接失效反馈
官方服务:
资源简介:
Data Set Information: 在预测股票价格时,你会收集某个时间段的数据——天、周、月等,但你不能利用某个时间段的数据,直到该时间段的下一个增量。例如,假设您每天收集数据。周一结束后,你就有了当天的所有数据。不过,你可以在周一投资,因为你要到一天结束才能得到数据。你可以利用周一的数据在周二进行投资。 在我们的研究中,每个记录(行)都是一周的数据。每一条记录也有股票在下一周的回报率(变化率、下一周的价格)。理想情况下,你需要确定哪只股票在接下来的一周内产生最大的回报率。这可以帮助您训练和测试您的算法。 这些属性中的一些可能不用于您的研究。它们最初被添加到我们的数据库中以执行计算。(Brown,Pelosi&Dirska,2013)使用了过去一周的价格变动百分比、交易量变动百分比、下一次分红天数和下一次分红回报百分比。我们将其他属性保留在数据集中,以防您想要使用它们中的任何一个。当然,你想要最大化的是未来几周的价格变化百分比。 Training data vs Test data: In (Brown, Pelosi & Dirska, 2013) we used quarter 1 (Jan-Mar) data for training and quarter 2 (Apr-Jun) data for testing. Interesting data points: If you use quarter 2 data for testing, you will notice something interesting in the week ending 5/27/2011 every Dow Jones Index stock lost money. Attribute Information: quarter: the yearly quarter (1 = Jan-Mar; 2 = Apr=Jun). stock: the stock symbol (see above) date: the last business day of the work (this is typically a Friday) open: the price of the stock at the beginning of the week high: the highest price of the stock during the week low: the lowest price of the stock during the week close: the price of the stock at the end of the week volume: the number of shares of stock that traded hands in the week percent_change_price: the percentage change in price throughout the week percent_chagne_volume_over_last_wek: the percentage change in the number of shares of stock that traded hands for this week compared to the previous week previous_weeks_volume: the number of shares of stock that traded hands in the previous week next_weeks_open: the opening price of the stock in the following week next_weeks_close: the closing price of the stock in the following week percent_change_next_weeks_price: the percentage change in price of the stock in the following week days_to_next_dividend: the number of days until the next dividend percent_return_next_dividend: the percentage of return on the next dividend Relevant Papers: Brown, M. S., Pelosi, M. & Dirska, H. (2013). Dynamic-radius Species-conserving Genetic Algorithm for the Financial Forecasting of Dow Jones Index Stocks. Machine Learning and Data Mining in Pattern Recognition, 7988, 27-41. Citation Request: We request that you provide a citation to this paper when using the dataset. We welcome you to compare your results against ours in (Brown, Pelosi & Dirska, 2013). Dr. Michael Brown, michael.brown '@' umuc.edu, University of Maryland University College

数据集信息:在股票价格预测任务中,研究者会按固定周期(如日、周、月等)采集数据,但需注意:无法在该周期结束前使用当期数据。例如,若按日度采集数据,周一的完整数据需等到周一收盘后方可获取,因此无法在周一进行投资决策,仅可依托周一的数据在周二开展投资操作。 本研究中,每条数据记录对应一周的行情数据,同时包含该股票下一周的回报率(即价格变化率与下一周收盘价)。任务目标为筛选出下一周回报率最高的股票,以此为基础开展算法的训练与测试工作。 部分属性可能并非所有研究均需使用:这些属性最初为辅助计算而加入数据集。Brown、Pelosi与Dirska(2013)的研究仅使用了过去一周价格变动百分比、交易量环比变动百分比、下一次分红距当前的天数以及下一次分红的回报率百分比。本数据集保留其余属性,供研究者按需选用。本任务的优化目标为最大化未来一周的价格变动百分比。 训练集与测试集划分:在Brown等人(2013)的研究中,以第一季度(1-3月)数据作为训练集,第二季度(4-6月)数据作为测试集。 有趣的数据发现:若使用第二季度数据作为测试集,可观察到在2011年5月27日当周,所有道琼斯指数(Dow Jones Index)成分股均出现亏损。 属性信息: quarter:季度(quarter,1代表1-3月;2代表4-6月) stock:股票代码(stock symbol,详见前文说明) date:日期(date,当周最后一个交易日,通常为周五) open:开盘价(open) high:最高价(high) low:最低价(low) close:收盘价(close) volume:成交量(volume,当周易手的股票份额数) percent_change_price:当周价格变动百分比(percent_change_price) percent_change_volume_over_last_week:当周成交量较上一周的环比变动百分比(percent_change_volume_over_last_week,原文存在拼写笔误,已修正) previous_weeks_volume:上一周成交量(previous_weeks_volume) next_weeks_open:下一周开盘价(next_weeks_open) next_weeks_close:下一周收盘价(next_weeks_close) percent_change_next_weeks_price:下一周价格变动百分比(percent_change_next_weeks_price) days_to_next_dividend:距下一次分红天数(days_to_next_dividend) percent_return_next_dividend:下一次分红回报率百分比(percent_return_next_dividend) 相关论文:Brown, M. S., Pelosi, M. & Dirska, H. (2013). 《用于道琼斯指数(Dow Jones Index)成分股金融预测的动态半径物种保护遗传算法(Dynamic-radius Species-conserving Genetic Algorithm)》. 模式识别中的机器学习与数据挖掘, 7988, 27-41. 引用要求:使用本数据集时,请务必引用该论文。欢迎研究者将自身实验结果与Brown等人(2013)的研究结果进行对比。 联系人:Michael Brown博士,邮箱:michael.brown '@' umuc.edu,马里兰大学全球分校(University of Maryland University College)
提供机构:
帕依提提
二维码
社区交流群
二维码
科研交流群
商业服务