five

BAAI_COIG

收藏
OpenCSG2024-07-19 更新2026-01-19 收录
下载链接:
https://opencsg.com/datasets/BAAI/BAAI_COIG?tab=summary
下载链接
链接失效反馈
官方服务:
资源简介:
COIG旨在维护一个无害、有益且多样化的中文指令数据集,促进中文大型语言模型的发展。它包含多个数据集,包括翻译指令集(66,858条,源自Super-NaturalInstructions、Self-Instruct和Unnatural Instructions,经过自动翻译、人工验证和校正),考试指令集(63,532条,来自中国高考、中考和公务员考试,包含指令、问题背景、问题、答案、答案分析和粗粒度科目),人类价值观对齐指令集(34,471条,分为通用价值观和特定区域文化价值观),反事实修正多轮对话数据集(13,653条,基于CN-DBpedia知识图谱,包含学生和老师之间的五轮对话),以及Leetcode指令集(11,737条,来自CC-BY-SA-4.0许可的编程问题集合)。COIG遵循Apache 2.0许可协议,部分数据也包含其他许可协议的内容。
提供机构:
BAAI
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作