AdapterOcean/physics_dataset_standardized_cluster_6
收藏Hugging Face2024-05-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/AdapterOcean/physics_dataset_standardized_cluster_6
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本、对话ID、嵌入向量和聚类标签四个特征。数据集仅包含训练集,共有2510个示例,总大小为90099394字节。数据文件的路径指定为data/train-*。
该数据集包含文本、对话ID、嵌入向量和聚类标签四个特征。数据集仅包含训练集,共有2510个示例,总大小为90099394字节。数据文件的路径指定为data/train-*。
提供机构:
AdapterOcean
原始信息汇总
数据集概述
数据集特征
- text:文本类型,数据类型为字符串。
- conversation_id:对话ID,数据类型为整数64位。
- embedding:嵌入序列,数据类型为浮点数64位。
- cluster:聚类标识,数据类型为整数64位。
数据集分割
- train:训练集,包含2510个样本,总大小为90099394字节。
数据集大小
- 下载大小:67660938字节。
- 数据集总大小:90099394字节。
配置信息
- config_name:default
- data_files:
- split:train
- path:data/train-*



