jwigginton/news-sp500
收藏Hugging Face2024-03-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jwigginton/news-sp500
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: symbol
dtype: string
- name: body
dtype: string
- name: publisher
dtype: string
- name: publish_time
dtype: timestamp[ns, tz=GMT]
- name: title
dtype: string
- name: url
dtype: string
- name: uuid
dtype: string
splits:
- name: train
num_bytes: 12055461
num_examples: 2010
download_size: 5673552
dataset_size: 12055461
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段如下:
- 符号(symbol):字符串类型
- 正文(body):字符串类型
- 发布方(publisher):字符串类型
- 发布时间(publish_time):类型为带GMT时区的纳秒级时间戳(timestamp[ns, tz=GMT])
- 标题(title):字符串类型
- 统一资源定位符(url):字符串类型
- 通用唯一标识符(uuid):字符串类型
数据划分:
- 训练集(train):占用字节数为12055461,样本总数为2010
下载总大小为5673552,数据集总大小为12055461
数据集配置:
- 默认配置(default):数据文件对应训练集划分,路径为data/train-*
提供机构:
jwigginton
原始信息汇总
数据集概述
数据集特征
- symbol: 数据类型为字符串。
- body: 数据类型为字符串。
- publisher: 数据类型为字符串。
- publish_time: 数据类型为时间戳,时区为GMT。
- title: 数据类型为字符串。
- url: 数据类型为字符串。
- uuid: 数据类型为字符串。
数据集分割
- train: 包含2010个样本,占用12055461字节。
数据集大小
- 下载大小: 5673552字节。
- 数据集大小: 12055461字节。
配置
- default: 包含训练数据文件,路径为
data/train-*。



