chrisgru/commonsense-dialogues
收藏Hugging Face2023-10-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chrisgru/commonsense-dialogues
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: system
dtype: string
- name: instruction
dtype: string
- name: output
dtype: string
splits:
- name: train
num_bytes: 13583083
num_examples: 20176
- name: test
num_bytes: 1415597
num_examples: 2158
- name: validation
num_bytes: 1443693
num_examples: 2157
download_size: 6854218
dataset_size: 16442373
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
- split: validation
path: data/validation-*
---
# Dataset Card for "commonsense-dialogues"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征:
- 字段名:system,数据类型:字符串
- 字段名:instruction,数据类型:字符串
- 字段名:output,数据类型:字符串
数据集拆分:
- 拆分名称:train(训练集),字节大小:13583083,样本数量:20176
- 拆分名称:test(测试集),字节大小:1415597,样本数量:2158
- 拆分名称:validation(验证集),字节大小:1443693,样本数量:2157
下载大小:6854218
数据集总大小:16442373
配置项:
- 配置名称:default(默认配置)
数据文件:
- 拆分类型:train,文件路径:data/train-*
- 拆分类型:test,文件路径:data/test-*
- 拆分类型:validation,文件路径:data/validation-*
---
# 「commonsense-dialogues」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
chrisgru
原始信息汇总
数据集信息
特征
- 名称: system
- 数据类型: string
- 名称: instruction
- 数据类型: string
- 名称: output
- 数据类型: string
分割
- 名称: train
- 字节数: 13583083
- 样本数: 20176
- 名称: test
- 字节数: 1415597
- 样本数: 2158
- 名称: validation
- 字节数: 1443693
- 样本数: 2157
大小
- 下载大小: 6854218
- 数据集大小: 16442373
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 分割: test
- 路径: data/test-*
- 分割: validation
- 路径: data/validation-*
- 分割: train
- 数据文件:
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个常识对话数据集,包含约24.5k条文本对话,涵盖日常生活中的多种场景(如情感支持、学习、家庭互动等),旨在训练和评估对话模型的常识推理能力。数据以system-instruction-output格式组织,分为训练、验证和测试集,适用于自然语言处理任务。
以上内容由遇见数据集搜集并总结生成



