five

CabraVC/vector_dataset_roberta-fine-tuned

收藏
Hugging Face2023-12-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CabraVC/vector_dataset_roberta-fine-tuned
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含文本、标签和嵌入向量三个特征,标签分为BUY、HOLD和SELL三类。数据集分为训练集、验证集和测试集,分别包含3289、411和412个样本。数据集的下载大小为27783754字节,总大小为38336362.0字节。

The dataset includes three main features: texts, labels, and embeddings. The texts feature is of string type, the labels feature is a class label with three categories: BUY, HOLD, and SELL. The embeddings feature is a sequence of float64. The dataset is divided into three parts: train, val, and test, each with corresponding bytes and number of examples. The total download size and dataset size are also provided.
提供机构:
CabraVC
原始信息汇总

数据集概述

特征信息

  • 文本 (texts): 数据类型为字符串 (string)。
  • 标签 (labels): 数据类型为分类标签 (class_label),包含以下类别:
    • 0: BUY
    • 1: HOLD
    • 2: SELL
  • 嵌入向量 (embeddings): 数据类型为浮点数序列 (sequence: float64)。

数据分割

  • 训练集 (train): 包含3289个样本,占用30663495.77字节。
  • 验证集 (val): 包含411个样本,占用3831771.59字节。
  • 测试集 (test): 包含412个样本,占用3841094.64字节。

数据大小

  • 下载大小: 27783754字节。
  • 数据集大小: 38336362.0字节。

配置信息

  • 默认配置 (default):
    • 训练集文件路径: data/train-*
    • 验证集文件路径: data/val-*
    • 测试集文件路径: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作