koen430/random_selected_stock_twitter

Name: koen430/random_selected_stock_twitter
Creator: koen430
Published: 2024-05-20 10:44:13
License: 暂无描述

Hugging Face2024-05-20 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/koen430/random_selected_stock_twitter

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含一系列推文，用于微调大型语言模型（LLM）以预测推文发布后第二天的股票价格走势。数据集包含多个特征，如股票代码（ticker）、提示（prompt）、推文内容（text）、URL等。数据集分为训练集、验证集和测试集，分别包含3600、200和200个样本。数据集的来源是koen430/preprocessed_stock_twitter。

提供机构：

koen430

原始信息汇总

数据集概述

数据集特征

ticker：字符串类型
prompt：字符串类型
text：字符串类型
url：字符串类型
result_1：字符串类型
result_1_bin：整数类型（int64）
relevance：字符串类型
token_count：整数类型（int64）
index_level_0：整数类型（int64）

数据集划分

train：
- 数据量：2284852字节
- 示例数：3600
val（验证集）：
- 数据量：128718字节
- 示例数：200
test（测试集）：
- 数据量：128847字节
- 示例数：200

数据集大小

下载大小：965881字节
数据集总大小：2542417字节

配置文件

config_name：default
data_files：
- train：路径为data/train-*
- val：路径为data/val-*
- test：路径为data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集