COIG-CQIA
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/COIG-CQIA
下载链接
链接失效反馈官方服务:
资源简介:
欢迎来到COIG-CQIA,COIG-CQIA全称为Chinese Open Instruction Generalist - Quality is All You Need, 是一个开源的高质量指令微调数据集,旨在为中文NLP社区提供高质量且符合人类交互行为的指令微调数据。
Welcome to COIG-CQIA, whose full name is Chinese Open Instruction Generalist - Quality is All You Need. It is an open-source high-quality instruction tuning dataset designed to provide the Chinese NLP community with high-quality instruction tuning data that aligns with human interaction behaviors.
提供机构:
OpenDataLab
创建时间:
2024-04-07
搜集汇总
数据集介绍

背景与挑战
背景概述
COIG-CQIA是一个高质量的中文指令微调数据集,专注于从中文互联网来源(如问答和文章)收集数据,并经过深度清洗和人工审核,以确保数据符合人类交互行为。该数据集涵盖多个领域,包括社交媒体、百科、考试、传统文化、金融、医疗和法律,总计约6万条数据,适用于训练大语言模型进行指令响应。数据集由零一万物、中科院深圳先进技术研究院等机构合作构建,旨在通过少量高质量数据提升模型对齐效果。
以上内容由遇见数据集搜集并总结生成



