five

Undi95/ConversationChronicles-sharegpt-SHARDED

收藏
Hugging Face2024-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Undi95/ConversationChronicles-sharegpt-SHARDED
下载链接
链接失效反馈
官方服务:
资源简介:
CC数据集是PocketDoc/ConversationChronicles-sharegpt数据集的分片版本,后者是jihyoung/ConversationChronicles数据集的ShareGPT转换版本。该数据集主要包含经过修复的对话内容,这些对话分布在不同的关系中,如同学、邻居、同事等。总对话数量约为200,000条,具体数量可能因清理和格式不同而有所变化。

CC数据集是PocketDoc/ConversationChronicles-sharegpt数据集的分片版本,后者是jihyoung/ConversationChronicles数据集的ShareGPT转换版本。该数据集主要包含经过修复的对话内容,这些对话分布在不同的关系中,如同学、邻居、同事等。总对话数量约为200,000条,具体数量可能因清理和格式不同而有所变化。
提供机构:
Undi95
原始信息汇总

数据集概述

数据集名称

  • 名称: CC

数据集来源

数据集类型

  • 类型: 对话数据集

语言

  • 语言: 英语 (en)

任务类别

  • 任务类别: 对话 (conversational)

数据集内容

  • 关系类型及数量:
    • Classmates: 66,090 (33.05%)
    • Neighbors: 49,521 (24.76%)
    • Co-workers: 28,856 (14.43%)
    • Mentee and Mentor: 16,035 (8.02%)
    • Husband and Wife: 13,486 (6.74%)
    • Patient and Doctor: 6,980 (3.49%)
    • Parent and Child: 6,514 (3.26%)
    • Student and Teacher: 5,018 (2.51%)
    • Employee and Boss: 4,811 (2.41%)
    • Athlete and Coach: 2,689 (1.34%)
    • 总计: 200,000*

备注

  • 数量说明: 数量可能因清洗和不同格式而有所变化。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作