shidowake/Doctor-Shotgun_capybara-sharegpt_subset_split_7
收藏Hugging Face2024-03-25 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/shidowake/Doctor-Shotgun_capybara-sharegpt_subset_split_7
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: source
dtype: string
- name: conversations
list:
- name: from
dtype: string
- name: value
dtype: string
splits:
- name: train
num_bytes: 9059570.785955267
num_examples: 2000
download_size: 4575658
dataset_size: 9059570.785955267
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征项:
- 源字段(source):数据类型为字符串
- 对话字段(conversations):为列表类型,列表内每个元素包含两个子字段:
- 来源子字段(from):数据类型为字符串,用于标识对话角色的来源
- 内容子字段(value):数据类型为字符串,用于存储对话的具体文本内容
数据集拆分:
- 训练集(train):占用字节数为9059570.785955267,共包含2000条样本
下载大小:4575658
数据集总大小:9059570.785955267
配置项:
- 默认配置(default):数据文件配置为,训练集拆分对应的数据文件路径格式为data/train-*
提供机构:
shidowake
原始信息汇总
数据集概述
数据集特征
- source:数据类型为字符串。
- conversations:列表类型,包含以下子特征:
- from:数据类型为字符串。
- value:数据类型为字符串。
数据集分割
- train:包含2000个样本,数据集大小为9059570.785955267字节。
数据集大小
- 下载大小:4575658字节。
- 数据集总大小:9059570.785955267字节。
配置信息
- default:训练数据文件路径为
data/train-*。



