COIG
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/COIG
下载链接
链接失效反馈官方服务:
资源简介:
我们提出了中文开放教学通才 (COIG) 项目,以维护一套无害,有用和多样化的中文教学语料库。我们欢迎社区中的所有研究人员为语料库集做出贡献并与我们合作。我们仅发布了COIG的第一个芯片,以帮助中国llms在探索阶段的发展,并呼吁更多的研究人员加入我们的行列。我们引入了手动验证的翻译通用指令语料库,手动注释的考试指令语料库,人类价值对齐指令语料库,多轮反事实纠正聊天语料库和leetcode指令语料库。我们提供这些新的教学语料库,以协助社区对中文llm进行教学调整。这些指令语料库也是如何有效构建和扩展新中文指令语料库的模板工作流。
提供机构:
OpenDataLab
创建时间:
2023-04-26



