fangyuan/kiwi
收藏Hugging Face2024-04-09 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/fangyuan/kiwi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于撰写段落级别回答研究问题的指令数据。数据集中的每个实例都是用户和模型之间的交互部分,包含原始问题、模型名称、初始答案、初始文档、交互等多个字段。数据集的语言为英语,大小在1K到10K之间。
该数据集包含用于撰写段落级别回答研究问题的指令数据。数据集中的每个实例都是用户和模型之间的交互部分,包含原始问题、模型名称、初始答案、初始文档、交互等多个字段。数据集的语言为英语,大小在1K到10K之间。
提供机构:
fangyuan
原始信息汇总
数据集卡片 🥝 KIWI
数据集描述
数据集摘要
该数据集包含用于撰写研究问题段落级答案的指令数据。查看我们的数据探索器以获取示例!
语言
数据集包含英语数据。
数据集结构
数据实例
每个实例是用户和模型之间的交互部分。
数据字段
每个实例包含以下字段:
original_question: 输入问题 qmodel_name:gpt-4,gpt-3.5-turbo,llama-2initial answer: 初始答案initial_docs: 用于生成初始答案的段落集合(ref_index字段应对应于生成的答案中的内联引用(例如 "[0]"))interaction: 一系列回合,每个回合是一个字典,包含-
instruction: 用户发出的指令
-
answer_1: 模型生成的答案
-
answer_2: 用户编辑的答案
-
rating: 好、中或差
-
comment: 用户评论解释评分
-
docs: 检索到的段落列表(风格指令为空)
数据集创建
请参阅我们的论文以获取关于标注过程和局限性的详细讨论。
许可信息
https://creativecommons.org/licenses/by-sa/4.0/legalcode
引用信息
@article{xu2024kiwi, title = {KIWI: A Dataset of Knowledge-Intensive Writing Instructions for Answering Research Questions}, author = {Xu, Fangyuan and Lo, Kyle and Kuehl, Bailey and Soldaini, Luca and Choi, Eunsol and Wadden, David}, year = 2024, }



