descartes100/Dow30_stock_prediction
收藏Hugging Face2023-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/descartes100/Dow30_stock_prediction
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: answer
dtype: string
- name: period
dtype: string
- name: label
dtype: string
- name: symbol
dtype: string
splits:
- name: train
num_bytes: 3127735
num_examples: 480
- name: test
num_bytes: 797367
num_examples: 120
download_size: 1523163
dataset_size: 3925102
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
# Dow30 Stock Prediction Dataset
## Overview
Welcome to the Dow30 Stock Prediction dataset! This dataset is designed to assist in predicting stock returns for companies in the Dow Jones Industrial Average (Dow30). It includes essential information about each company, such as news from the last two weeks, basic financial data, and stock prices over the same period.
## Dataset Structure
The dataset consists of the following columns:
1. **prompt:** Information about the company, including news from the last two weeks, basic financial data, and stock prices for the same period. The system prompt is generated using the code provided in the [FinGPT_Forecaster](https://github.com/AI4Finance-Foundation/FinGPT/blob/master/fingpt/FinGPT_Forecaster/prepare_data.ipynb) repository.
2. **answer:** Stock return predictions generated by ChatGPT.
3. **period:** Time period of the data, recorded on a weekly basis.
4. **label:** Indicates whether the stock is predicted to go up or down, along with the percentage change.
5. **symbol:** Stock symbol representing the company in the Dow Jones Industrial Average.
数据集信息:
字段列表:
- 字段名称:提示词(prompt),数据类型:字符串
- 字段名称:回答(answer),数据类型:字符串
- 字段名称:时间周期(period),数据类型:字符串
- 字段名称:标签(label),数据类型:字符串
- 字段名称:股票代码(symbol),数据类型:字符串
数据分割:
- 分割集名称:训练集(train),字节数:3127735,样本量:480
- 分割集名称:测试集(test),字节数:797367,样本量:120
下载大小:1523163,数据集总大小:3925102
配置项:
- 配置名称:默认配置(default),数据文件:
- 训练集对应路径:data/train-*
- 测试集对应路径:data/test-*
# 道指30成分股预测数据集(Dow30 Stock Prediction Dataset)
## 数据集概览
欢迎使用道指30成分股预测数据集!本数据集旨在助力道琼斯工业平均指数(Dow Jones Industrial Average,简称道指30)成分股的收益率预测任务,涵盖各成分股的核心信息,包括近两周的新闻动态、基础财务数据以及同期股价表现。
## 数据集结构
本数据集包含以下字段:
1. **提示词(prompt)**:包含目标公司的相关信息,具体为近两周的新闻动态、基础财务数据以及同期股价表现。本数据集的系统提示词通过[FinGPT_Forecaster](https://github.com/AI4Finance-Foundation/FinGPT/blob/master/fingpt/FinGPT_Forecaster/prepare_data.ipynb)仓库提供的代码生成。
2. **回答(answer)**:由ChatGPT生成的股票收益率预测结果。
3. **时间周期(period)**:数据对应的时间区间,按周进行记录。
4. **标签(label)**:用于标注股票价格的预测涨跌方向及对应的涨跌幅百分比。
5. **股票代码(symbol)**:道琼斯工业平均指数中对应公司的股票交易代码。
提供机构:
descartes100
原始信息汇总
Dow30 Stock Prediction Dataset
概述
Dow30 Stock Prediction 数据集旨在帮助预测道琼斯工业平均指数(Dow30)中公司的股票回报。该数据集包括每个公司的基本信息,如过去两周的新闻、基本财务数据和同一时期的股票价格。
数据集结构
数据集包含以下列:
-
prompt: 公司的信息,包括过去两周的新闻、基本财务数据和同一时期的股票价格。系统提示是使用 FinGPT_Forecaster 仓库中提供的代码生成的。
-
answer: ChatGPT 生成的股票回报预测。
-
period: 数据的时间周期,按周记录。
-
label: 指示股票是预测上涨还是下跌,以及百分比变化。
-
symbol: 道琼斯工业平均指数中代表公司的股票代码。
数据集详情
-
特征:
prompt: 字符串类型answer: 字符串类型period: 字符串类型label: 字符串类型symbol: 字符串类型
-
分割:
train: 3127735 字节, 480 个样本test: 797367 字节, 120 个样本
-
下载大小: 1523163 字节
-
数据集大小: 3925102 字节
-
配置:
default配置包含以下数据文件:train分割:data/train-*test分割:data/test-*
搜集汇总
数据集介绍

背景与挑战
背景概述
This dataset provides weekly stock prediction data for Dow30 companies, including news, financials, and price movements, aimed at forecasting stock returns. It features 600 entries with detailed company insights and ChatGPT-generated predictions.
以上内容由遇见数据集搜集并总结生成



