five

cvmistralparis/Q20LLM

收藏
Hugging Face2024-05-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/cvmistralparis/Q20LLM
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为20 Questions game with LLM,是通过使用多种大型语言模型(LLMs)生成的。数据集生成分为两个阶段:首先,LLM被提示生成关键词;然后,为每个关键词生成长度不同的对话。关键词的生成涵盖了广泛的类别,如动物、文化、科学、地理等。问题的生成则旨在通过从一般到具体的问题来识别关键词,并且每个问题都专注于单一属性或特征。数据集包含训练和测试两个部分,分别存储在不同的CSV文件中。

该数据集名为20 Questions game with LLM,是通过使用多种大型语言模型(LLMs)生成的。数据集生成分为两个阶段:首先,LLM被提示生成关键词;然后,为每个关键词生成长度不同的对话。关键词的生成涵盖了广泛的类别,如动物、文化、科学、地理等。问题的生成则旨在通过从一般到具体的问题来识别关键词,并且每个问题都专注于单一属性或特征。数据集包含训练和测试两个部分,分别存储在不同的CSV文件中。
提供机构:
cvmistralparis
原始信息汇总

数据集概述

名称: 20 Questions game with LLM

许可证: CC0-1.0

任务类别: 问答

语言: 英语

数据集大小: 1K<n<10K

配置:

  • 游戏配置:
    • 数据文件:
      • 训练集: train.csv
      • 测试集: test.csv
    • 默认: 是
  • 关键词配置:
    • 数据文件:
      • 训练集: keywords/train.csv
      • 测试集: keywords/test.csv

生成过程:

  1. 使用LLM生成关键词
  2. 为每个关键词生成不同长度的对话

关键词生成提示:

  • 生成500个多样且简单的关键词,涵盖广泛类别,如动物、文化、科学等。

问题生成提示:

  • 生成20个深入且策略性的问题,用于帮助识别关键词。问题从一般到具体,目标是在最少数量的提问中猜出关键词。每个问题提供“是”或“否”答案,其中必须包含5个“是”答案。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作