CabraVC/vector_dataset_roberta-fine-tuned
收藏Hugging Face2023-12-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CabraVC/vector_dataset_roberta-fine-tuned
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本、标签和嵌入向量三个特征,标签分为BUY、HOLD和SELL三类。数据集分为训练集、验证集和测试集,分别包含3289、411和412个样本。数据集的下载大小为27783754字节,总大小为38336362.0字节。
The dataset includes three main features: texts, labels, and embeddings. The texts feature is of string type, the labels feature is a class label with three categories: BUY, HOLD, and SELL. The embeddings feature is a sequence of float64. The dataset is divided into three parts: train, val, and test, each with corresponding bytes and number of examples. The total download size and dataset size are also provided.
提供机构:
CabraVC
原始信息汇总
数据集概述
特征信息
- 文本 (texts): 数据类型为字符串 (string)。
- 标签 (labels): 数据类型为分类标签 (class_label),包含以下类别:
- 0: BUY
- 1: HOLD
- 2: SELL
- 嵌入向量 (embeddings): 数据类型为浮点数序列 (sequence: float64)。
数据分割
- 训练集 (train): 包含3289个样本,占用30663495.77字节。
- 验证集 (val): 包含411个样本,占用3831771.59字节。
- 测试集 (test): 包含412个样本,占用3841094.64字节。
数据大小
- 下载大小: 27783754字节。
- 数据集大小: 38336362.0字节。
配置信息
- 默认配置 (default):
- 训练集文件路径:
data/train-* - 验证集文件路径:
data/val-* - 测试集文件路径:
data/test-*
- 训练集文件路径:



