koen430/random_selected_stock_twitter
收藏Hugging Face2024-05-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/koen430/random_selected_stock_twitter
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含一系列推文,用于微调大型语言模型(LLM)以预测推文发布后第二天的股票价格走势。数据集包含多个特征,如股票代码(ticker)、提示(prompt)、推文内容(text)、URL等。数据集分为训练集、验证集和测试集,分别包含3600、200和200个样本。数据集的来源是koen430/preprocessed_stock_twitter。
该数据集包含一系列推文,用于微调大型语言模型(LLM)以预测推文发布后第二天的股票价格走势。数据集包含多个特征,如股票代码(ticker)、提示(prompt)、推文内容(text)、URL等。数据集分为训练集、验证集和测试集,分别包含3600、200和200个样本。数据集的来源是koen430/preprocessed_stock_twitter。
提供机构:
koen430
原始信息汇总
数据集概述
数据集特征
- ticker:字符串类型
- prompt:字符串类型
- text:字符串类型
- url:字符串类型
- result_1:字符串类型
- result_1_bin:整数类型(int64)
- relevance:字符串类型
- token_count:整数类型(int64)
- index_level_0:整数类型(int64)
数据集划分
- train:
- 数据量:2284852字节
- 示例数:3600
- val(验证集):
- 数据量:128718字节
- 示例数:200
- test(测试集):
- 数据量:128847字节
- 示例数:200
数据集大小
- 下载大小:965881字节
- 数据集总大小:2542417字节
配置文件
- config_name:default
- data_files:
- train:路径为
data/train-* - val:路径为
data/val-* - test:路径为
data/test-*
- train:路径为



