zhan1993/flan-10k-flat-cluster-embedding
收藏Hugging Face2024-06-09 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/zhan1993/flan-10k-flat-cluster-embedding
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: source
dtype: string
- name: target
dtype: string
- name: task_name
dtype: string
- name: task_source
dtype: string
- name: template_type
dtype: string
- name: template_idx
dtype: int64
- name: split
dtype: string
- name: cluster_id
dtype: string
splits:
- name: train
num_bytes: 5580639801
num_examples: 2391621
download_size: 3024658814
dataset_size: 5580639801
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集详情:
数据特征:
- 名称:source(源字段),数据类型:字符串(string)
- 名称:target(目标字段),数据类型:字符串(string)
- 名称:task_name(任务名称),数据类型:字符串(string)
- 名称:task_source(任务来源),数据类型:字符串(string)
- 名称:template_type(模板类型),数据类型:字符串(string)
- 名称:template_idx(模板索引),数据类型:int64
- 名称:split(数据集划分标识),数据类型:字符串(string)
- 名称:cluster_id(聚类ID),数据类型:字符串(string)
数据集划分列表:
- 划分名称:train(训练集),字节大小:5580639801,样本数量:2391621
下载大小:3024658814,数据集总大小:5580639801
配置项:
- 配置名称:default(默认配置),数据文件:
- 划分集:train(训练集),文件路径:data/train-*
提供机构:
zhan1993
原始信息汇总
数据集概述
数据集特征
- source: 数据类型为字符串
- target: 数据类型为字符串
- task_name: 数据类型为字符串
- task_source: 数据类型为字符串
- template_type: 数据类型为字符串
- template_idx: 数据类型为整数
- split: 数据类型为字符串
- cluster_id: 数据类型为字符串
数据集分割
- train:
- 数据量: 2391621条
- 数据大小: 5580639801字节
数据集大小
- 下载大小: 3024658814字节
- 数据集总大小: 5580639801字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



