tuanacanal/conversation-ds-2
收藏Hugging Face2024-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tuanacanal/conversation-ds-2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: answer
dtype: string
- name: answer_length
dtype: int64
- name: question_length
dtype: int64
splits:
- name: train
num_bytes: 293277.0534228188
num_examples: 3352
- name: validation
num_bytes: 32634.946577181207
num_examples: 373
download_size: 192188
dataset_size: 325912.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
数据集信息(dataset_info):
特征列表(features):
- 字段名称:question(问题),数据类型(dtype):字符串(string)
- 字段名称:answer(答案),数据类型(dtype):字符串(string)
- 字段名称:answer_length(答案长度),数据类型(dtype):64位整型(int64)
- 字段名称:question_length(问题长度),数据类型(dtype):64位整型(int64)
数据集划分(splits):
- 训练集(train):字节数为293277.0534228188,样本数量为3352
- 验证集(validation):字节数为32634.946577181207,样本数量为373
下载大小(download_size):192188
数据集总大小(dataset_size):325912.0
配置项(configs):
- 配置名称:default(默认配置),数据文件(data_files)配置如下:
- 对应训练集(split: train):数据路径为data/train-*
- 对应验证集(split: validation):数据路径为data/validation-*
提供机构:
tuanacanal
原始信息汇总
数据集概述
特征信息
- question: 类型为字符串 (string)
- answer: 类型为字符串 (string)
- answer_length: 类型为整数 (int64)
- question_length: 类型为整数 (int64)
数据分割
- train: 包含3352个样本,大小为293277.05字节
- validation: 包含373个样本,大小为32634.94字节
数据大小
- 下载大小: 192188字节
- 数据集大小: 325912.0字节
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-*
- train: 路径为
- data_files:



