distilabel-internal-testing/deita-after-conversation
收藏Hugging Face2024-03-27 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/deita-after-conversation
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: evolved_instruction
dtype: string
- name: completion
dtype: string
- name: meta
struct:
- name: category
dtype: string
- name: completion
dtype: string
- name: id
dtype: int64
- name: input
dtype: 'null'
- name: motivation_app
dtype: 'null'
- name: prompt
dtype: string
- name: source
dtype: string
- name: subcategory
dtype: string
- name: answer
dtype: string
- name: model_name
dtype: string
- name: evol_instruction_score
dtype: float64
- name: evolved_response
dtype: string
- name: evol_response_score
dtype: float64
- name: conversation
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 6923587
num_examples: 1800
download_size: 1022792
dataset_size: 6923587
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 字段名:进化指令(evolved_instruction),数据类型:字符串
- 字段名:完成内容(completion),数据类型:字符串
- 字段名:元数据(meta),为结构体类型,包含以下子字段:
- 子字段名:类别(category),数据类型:字符串
- 子字段名:完成内容(completion),数据类型:字符串
- 子字段名:标识符(id),数据类型:64位整型
- 子字段名:输入(input),数据类型:空值
- 子字段名:应用动机(motivation_app),数据类型:空值
- 子字段名:提示词(prompt),数据类型:字符串
- 子字段名:来源(source),数据类型:字符串
- 子字段名:子类别(subcategory),数据类型:字符串
- 字段名:回答(answer),数据类型:字符串
- 字段名:模型名称(model_name),数据类型:字符串
- 字段名:进化指令得分(evol_instruction_score),数据类型:64位浮点型
- 字段名:进化响应(evolved_response),数据类型:字符串
- 字段名:进化响应得分(evol_response_score),数据类型:64位浮点型
- 字段名:对话(conversation),为列表类型,列表元素为结构体:
- 子字段名:内容(content),数据类型:字符串
- 子字段名:角色(role),数据类型:字符串
数据集划分:
- 划分名称:训练集(train),数据字节数:6923587,样本数量:1800
下载总大小:1022792,数据集总大小:6923587
配置项:
- 配置名:默认配置(default),数据文件信息:
- 对应划分:训练集(train),文件路径:data/train-*
提供机构:
distilabel-internal-testing



