cvmistralparis/Q20LLM
收藏Hugging Face2024-05-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/cvmistralparis/Q20LLM
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为20 Questions game with LLM,是通过使用多种大型语言模型(LLMs)生成的。数据集生成分为两个阶段:首先,LLM被提示生成关键词;然后,为每个关键词生成长度不同的对话。关键词的生成涵盖了广泛的类别,如动物、文化、科学、地理等。问题的生成则旨在通过从一般到具体的问题来识别关键词,并且每个问题都专注于单一属性或特征。数据集包含训练和测试两个部分,分别存储在不同的CSV文件中。
该数据集名为20 Questions game with LLM,是通过使用多种大型语言模型(LLMs)生成的。数据集生成分为两个阶段:首先,LLM被提示生成关键词;然后,为每个关键词生成长度不同的对话。关键词的生成涵盖了广泛的类别,如动物、文化、科学、地理等。问题的生成则旨在通过从一般到具体的问题来识别关键词,并且每个问题都专注于单一属性或特征。数据集包含训练和测试两个部分,分别存储在不同的CSV文件中。
提供机构:
cvmistralparis
原始信息汇总
数据集概述
名称: 20 Questions game with LLM
许可证: CC0-1.0
任务类别: 问答
语言: 英语
数据集大小: 1K<n<10K
配置:
- 游戏配置:
- 数据文件:
- 训练集:
train.csv - 测试集:
test.csv
- 训练集:
- 默认: 是
- 数据文件:
- 关键词配置:
- 数据文件:
- 训练集:
keywords/train.csv - 测试集:
keywords/test.csv
- 训练集:
- 数据文件:
生成过程:
- 使用LLM生成关键词
- 为每个关键词生成不同长度的对话
关键词生成提示:
- 生成500个多样且简单的关键词,涵盖广泛类别,如动物、文化、科学等。
问题生成提示:
- 生成20个深入且策略性的问题,用于帮助识别关键词。问题从一般到具体,目标是在最少数量的提问中猜出关键词。每个问题提供“是”或“否”答案,其中必须包含5个“是”答案。



