five

ChineseConversationsDataset

收藏
Opencsg2024-02-29 更新2024-06-22 收录
下载链接:
https://www.opencsg.com/datasets/billionaire/ChineseConversationsDataset
下载链接
链接失效反馈
官方服务:
资源简介:
OpenLabel-Chinese Conversations Dataset (OL-CC)

开放标签中文对话数据集(OpenLabel-Chinese Conversations Dataset,OL-CC)
创建时间:
2024-02-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
OpenLabel-Chinese Conversations Dataset (OL-CC) 是首个以众包方式、人工生成的开源中文对话指令集,包含超过10,000条'指令-回答'数据对和1,649条人工指令,覆盖问答、写作、抽取、编辑、分类、闲聊、逻辑数学等多种任务类型。该数据集由276位志愿者参与构建,旨在用于训练语言大模型、生成合成数据和数据扩充,语言为中文,版本为1.0,由北京智源人工智能研究院(BAAI)发布,采用Apache 2.0许可证。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作