snegha24/cl4_cosine
收藏Hugging Face2024-09-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/snegha24/cl4_cosine
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个主要特征:查询(query)、文本(text)、标签(label)和提示(prompt)。查询和文本为字符串类型,标签为int64类型。数据集仅包含一个训练集,共有4,260,411个样本,总大小为5,689,800,347字节,下载大小为693,684,607字节。数据集的配置文件名为default,数据文件路径为data/train-*。
The dataset contains four main features: query, text, label, and prompt. The query and text are of string type, while the label is of int64 type. The dataset includes only a training set with 4,260,411 samples, totaling 5,689,800,347 bytes in size and 693,684,607 bytes in download size. The configuration file for the dataset is named default, and the data files are located at data/train-*.
提供机构:
snegha24
原始信息汇总
数据集概述
数据集信息
特征
- text: 类型为字符串
- emb_text: 类型为字符串
- instruction: 类型为字符串
- emb: 类型为浮点数序列
- input: 类型为字符串
- output: 类型为字符串
- cluster: 类型为字符串
- id: 类型为整数
数据分割
- train: 包含50个样本,占用578695字节
数据集大小
- 下载大小: 466823字节
- 数据集大小: 578695字节
配置
- default: 包含训练数据文件,路径为
data/train-*



