fangyuan/kiwi

Name: fangyuan/kiwi
Creator: fangyuan
Published: 2024-04-09 22:40:27
License: 暂无描述

Hugging Face2024-04-09 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/fangyuan/kiwi

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含用于撰写段落级别回答研究问题的指令数据。数据集中的每个实例都是用户和模型之间的交互部分，包含原始问题、模型名称、初始答案、初始文档、交互等多个字段。数据集的语言为英语，大小在1K到10K之间。

提供机构：

fangyuan

原始信息汇总

数据集卡片 🥝 KIWI

数据集描述

数据集摘要

该数据集包含用于撰写研究问题段落级答案的指令数据。查看我们的数据探索器以获取示例！

语言

数据集包含英语数据。

数据集结构

数据实例

每个实例是用户和模型之间的交互部分。

数据字段

每个实例包含以下字段：

original_question: 输入问题 q
model_name: gpt-4, gpt-3.5-turbo, llama-2
initial answer: 初始答案
initial_docs: 用于生成初始答案的段落集合（ref_index 字段应对应于生成的答案中的内联引用（例如 "[0]"））
interaction: 一系列回合，每个回合是一个字典，包含
- instruction: 用户发出的指令
- answer_1: 模型生成的答案
- answer_2: 用户编辑的答案
- rating: 好、中或差
- comment: 用户评论解释评分
- docs: 检索到的段落列表（风格指令为空）

数据集创建

请参阅我们的论文以获取关于标注过程和局限性的详细讨论。

许可信息

https://creativecommons.org/licenses/by-sa/4.0/legalcode

引用信息

@article{xu2024kiwi, title = {KIWI: A Dataset of Knowledge-Intensive Writing Instructions for Answering Research Questions}, author = {Xu, Fangyuan and Lo, Kyle and Kuehl, Bailey and Soldaini, Luca and Choi, Eunsol and Wadden, David}, year = 2024, }

5,000+

优质数据集

54 个

任务类型

进入经典数据集