koen430/preprocessed_stock_twitter
收藏Hugging Face2024-05-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/koen430/preprocessed_stock_twitter
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: timestamp
dtype: timestamp[ns]
- name: text
dtype: string
- name: url
dtype: string
- name: ticker
dtype: string
- name: ticker_tweet
dtype: string
- name: valid_ticker
dtype: bool
- name: prompt
dtype: string
- name: token_counts
dtype: int64
- name: token_count
dtype: int64
- name: open
dtype: float64
- name: close_1
dtype: float64
- name: close_2
dtype: float64
- name: close_3
dtype: float64
- name: close_4
dtype: float64
- name: close_5
dtype: float64
- name: result_1
dtype: string
- name: result_2
dtype: string
- name: result_3
dtype: string
- name: result_4
dtype: string
- name: result_5
dtype: string
- name: result_1_bin
dtype: int64
- name: result_2_bin
dtype: int64
- name: result_3_bin
dtype: int64
- name: result_4_bin
dtype: int64
- name: result_5_bin
dtype: int64
- name: relevance
dtype: string
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 11897022
num_examples: 15494
download_size: 3182955
dataset_size: 11897022
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
## INFO
A preprocessed version of StephanAkkerman/financial-tweets-stocks.
Further info will follow soon.
提供机构:
koen430
原始信息汇总
数据集概述
数据集特征
- timestamp:时间戳,数据类型为
timestamp[ns]。 - text:文本,数据类型为
string。 - url:网址,数据类型为
string。 - ticker:股票代码,数据类型为
string。 - ticker_tweet:包含股票代码的推文,数据类型为
string。 - valid_ticker:股票代码有效性,数据类型为
bool。 - prompt:提示信息,数据类型为
string。 - token_counts:词数,数据类型为
int64。 - token_count:词数,数据类型为
int64。 - open:开盘价,数据类型为
float64。 - close_1至close_5:连续五个交易日的收盘价,数据类型均为
float64。 - result_1至result_5:结果字段1至5,数据类型均为
string。 - result_1_bin至result_5_bin:结果字段1至5的二进制表示,数据类型均为
int64。 - relevance:相关性,数据类型为
string。 - index_level_0:索引级别0,数据类型为
int64。
数据集分割
- train:训练集,包含
15494个示例,数据大小为11897022字节。
数据集大小
- 下载大小:
3182955字节。 - 数据集大小:
11897022字节。
配置
- config_name:默认配置。
- data_files:训练数据文件路径为
data/train-*。



