five

fangyuan/kiwi

收藏
Hugging Face2024-04-09 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/fangyuan/kiwi
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于撰写段落级别回答研究问题的指令数据。数据集中的每个实例都是用户和模型之间的交互部分,包含原始问题、模型名称、初始答案、初始文档、交互等多个字段。数据集的语言为英语,大小在1K到10K之间。

该数据集包含用于撰写段落级别回答研究问题的指令数据。数据集中的每个实例都是用户和模型之间的交互部分,包含原始问题、模型名称、初始答案、初始文档、交互等多个字段。数据集的语言为英语,大小在1K到10K之间。
提供机构:
fangyuan
原始信息汇总

数据集卡片 🥝 KIWI

数据集描述

数据集摘要

该数据集包含用于撰写研究问题段落级答案的指令数据。查看我们的数据探索器以获取示例!

语言

数据集包含英语数据。

数据集结构

数据实例

每个实例是用户和模型之间的交互部分。

数据字段

每个实例包含以下字段:

  • original_question: 输入问题 q
  • model_name: gpt-4, gpt-3.5-turbo, llama-2
  • initial answer: 初始答案
  • initial_docs: 用于生成初始答案的段落集合(ref_index 字段应对应于生成的答案中的内联引用(例如 "[0]"))
  • interaction: 一系列回合,每个回合是一个字典,包含
    • instruction: 用户发出的指令
    • answer_1: 模型生成的答案
    • answer_2: 用户编辑的答案
    • rating: 好、中或差
    • comment: 用户评论解释评分
    • docs: 检索到的段落列表(风格指令为空)

数据集创建

请参阅我们的论文以获取关于标注过程和局限性的详细讨论。

许可信息

https://creativecommons.org/licenses/by-sa/4.0/legalcode

引用信息

@article{xu2024kiwi, title = {KIWI: A Dataset of Knowledge-Intensive Writing Instructions for Answering Research Questions}, author = {Xu, Fangyuan and Lo, Kyle and Kuehl, Bailey and Soldaini, Luca and Choi, Eunsol and Wadden, David}, year = 2024, }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作