five

10万对中文大模型通用领域复杂指令跟随SFT文本数据集-数据堂

收藏
始智AI2024-06-21 更新2024-06-22 收录
下载链接:
https://wisemodel.cn/datasets/Nexdata/100000InstructionFollowingEvaluationSFTforChineseLLMTextData
下载链接
链接失效反馈
资源简介:
10万对中文复杂的prompt指令,字数在50~400字之间,每个prompt中的约束条件不低于3个,用于训练提升大模型的指令跟随性。类别覆盖生成类(写新闻稿、采访提纲、文案创作、文稿校对、中英作文、语法学习、研究报告、学习计划、诗歌创作、美食介绍、广告软文、销售话术、公文辅助写作、公文审核、政策文件问答等)、重写类(改写句子、文本纠错、句子合并、简化文案)、摘要类(内容摘要)、提取类(事件要素提取、观点提取、关键词提取、立场抽取、实体抽取)。所有prompt均为人工编写,满足多样性覆盖
提供机构:
始智AI
创建时间:
2024-06-21
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含10万对中文复杂指令,用于提升大模型的指令跟随能力,覆盖多种任务类型且均为人工编写,具有高多样性和复杂性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作