five

SimulBench/SimulBench-seed-tasks

收藏
Hugging Face2024-03-15 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/SimulBench/SimulBench-seed-tasks
下载链接
链接失效反馈
官方服务:
资源简介:
SimulBench数据集是一个用于文本生成任务的英语数据集,包含多个子集,如all, hard, objective, subjective, system, tool, role。数据格式为JSONL,每个条目包含id, task_description, act字段。数据集的任务来源于Awesome ChatGPT Prompts,并进行了修改。
提供机构:
SimulBench
原始信息汇总

数据集概述

许可证

  • MIT

任务类别

  • 文本生成

语言

  • 英语

数据规模

  • 小于1K

配置

  • all: 包含所有数据,文件路径为 simulbench_all.jsonl
  • hard: 包含难度较高的数据,文件路径为 simulbench_hard.jsonl
  • objective: 包含客观数据,文件路径为 simulbench_objective.jsonl
  • subjective: 包含主观数据,文件路径为 simulbench_subjective.jsonl
  • system: 包含系统相关数据,文件路径为 simulbench_system.jsonl
  • tool: 包含工具相关数据,文件路径为 simulbench_tool.jsonl
  • role: 包含角色相关数据,文件路径为 simulbench_role.jsonl

数据格式

jsonl { "id": "...", "task_description": "...", "act": "..." }

数据加载示例

python from dataset import load_dataset

all_tasks = load_dataset("SimulBench/SimulBench", "all", split="test")

其他可用子集包括:hard, subjective, objective, system, tool, role

引用信息

latex @article{simulbench2024, title={SimulBench: Evaluating LLMs with Diverse Simulation Tasks}, author={Qi Jia, Xiang Yue, Tianyu Zheng, Jie Huang, and Bill Yuchen Lin}, year={2024}, eprint={}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作