Undi95/ConversationChronicles-sharegpt-SHARDED
收藏Hugging Face2024-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Undi95/ConversationChronicles-sharegpt-SHARDED
下载链接
链接失效反馈官方服务:
资源简介:
CC数据集是PocketDoc/ConversationChronicles-sharegpt数据集的分片版本,后者是jihyoung/ConversationChronicles数据集的ShareGPT转换版本。该数据集主要包含经过修复的对话内容,这些对话分布在不同的关系中,如同学、邻居、同事等。总对话数量约为200,000条,具体数量可能因清理和格式不同而有所变化。
CC数据集是PocketDoc/ConversationChronicles-sharegpt数据集的分片版本,后者是jihyoung/ConversationChronicles数据集的ShareGPT转换版本。该数据集主要包含经过修复的对话内容,这些对话分布在不同的关系中,如同学、邻居、同事等。总对话数量约为200,000条,具体数量可能因清理和格式不同而有所变化。
提供机构:
Undi95
原始信息汇总
数据集概述
数据集名称
- 名称: CC
数据集来源
数据集类型
- 类型: 对话数据集
语言
- 语言: 英语 (en)
任务类别
- 任务类别: 对话 (conversational)
数据集内容
- 关系类型及数量:
- Classmates: 66,090 (33.05%)
- Neighbors: 49,521 (24.76%)
- Co-workers: 28,856 (14.43%)
- Mentee and Mentor: 16,035 (8.02%)
- Husband and Wife: 13,486 (6.74%)
- Patient and Doctor: 6,980 (3.49%)
- Parent and Child: 6,514 (3.26%)
- Student and Teacher: 5,018 (2.51%)
- Employee and Boss: 4,811 (2.41%)
- Athlete and Coach: 2,689 (1.34%)
- 总计: 200,000*
备注
- 数量说明: 数量可能因清洗和不同格式而有所变化。



