ChineseConversationsDataset
收藏Opencsg2024-02-29 更新2024-06-22 收录
下载链接:
https://www.opencsg.com/datasets/billionaire/ChineseConversationsDataset
下载链接
链接失效反馈官方服务:
资源简介:
OpenLabel-Chinese Conversations Dataset (OL-CC)
开放标签中文对话数据集(OpenLabel-Chinese Conversations Dataset,OL-CC)
创建时间:
2024-02-29
搜集汇总
数据集介绍

背景与挑战
背景概述
OpenLabel-Chinese Conversations Dataset (OL-CC) 是首个以众包方式、人工生成的开源中文对话指令集,包含超过10,000条'指令-回答'数据对和1,649条人工指令,覆盖问答、写作、抽取、编辑、分类、闲聊、逻辑数学等多种任务类型。该数据集由276位志愿者参与构建,旨在用于训练语言大模型、生成合成数据和数据扩充,语言为中文,版本为1.0,由北京智源人工智能研究院(BAAI)发布,采用Apache 2.0许可证。
以上内容由遇见数据集搜集并总结生成



