InterScript

github2021-12-15 更新2024-05-31 收录

下载链接：

https://github.com/allenai/interscript

下载链接

链接失效反馈

官方服务：

资源简介：

InterScript数据集包含用户对T5-11B模型生成脚本的交互式反馈。数据集包含8466个样本，每个样本是一个JSON对象，包含输入脚本、用户反馈和修正后的输出脚本等字段。

The InterScript dataset encompasses interactive feedback from users on scripts generated by the T5-11B model. It comprises 8,466 samples, each represented as a JSON object that includes fields such as the input script, user feedback, and the revised output script.

创建时间：

2021-12-15

原始信息汇总

Interscript 数据集概述

数据集内容

文件格式: 数据集包含两个主要文件：data.json 和 data.jsonl。
样本数量: 总计 8466 个样本，每个样本独立一行。
样本结构: 每个样本为一个JSON对象，包含以下字段：
- input_script: 模型生成的原始脚本。
- input_feedback: 用户对原始脚本的反馈。
- output_script: 根据反馈修正后的脚本。
- metadata: 样本的元数据，包括：
  - id: 样本的唯一标识符。
  - goal: 脚本的目标。
  - is_distractor: 反馈是否为干扰项。
  - feedback_type: 反馈类型。
  - edit: 将输入反馈转化为对输入脚本的编辑操作。
  - input_script_formatted: 输入脚本以句子列表形式呈现。
  - output_script_formatted: 输出脚本以句子列表形式呈现。

数据收集过程

反馈收集平台: 使用 Amazon Mechanical Turk 收集用户对错误脚本的反馈。
反馈收集模板: 通过 turk_template.html 文件提供的模板进行。

搜集汇总

数据集介绍

构建方式

InterScript数据集的构建过程依托于亚马逊的Mechanical Turk平台，通过该平台收集用户对T5-11B模型生成的脚本的反馈。每个样本包含一个由模型生成的初始脚本、用户对该脚本的反馈以及修正后的脚本。数据以JSON格式存储，每个样本均包含详细的元数据，如唯一标识符、脚本目标、反馈类型等。数据收集过程中，用户被要求对脚本中的错误进行反馈，并提供修正建议，从而形成高质量的数据集。

特点

InterScript数据集的特点在于其丰富的交互式反馈信息。每个样本不仅包含模型生成的初始脚本和修正后的脚本，还详细记录了用户的反馈内容及其类型。元数据部分进一步提供了脚本的目标、反馈是否为干扰项、反馈的具体操作等信息。这种结构化的数据格式使得研究者能够深入分析用户反馈对脚本修正的影响，并为模型优化提供有力支持。

使用方法

InterScript数据集的使用方法较为直观。研究者可以通过加载JSON或JSONL格式的数据文件，直接访问每个样本的初始脚本、用户反馈、修正脚本及其元数据。数据集适用于自然语言处理领域的研究，特别是针对脚本生成与修正的任务。通过分析用户反馈与修正脚本之间的关系，研究者可以训练和评估模型在生成高质量脚本方面的能力，并探索如何有效利用用户反馈进行模型优化。

背景与挑战

背景概述

InterScript数据集由研究人员于近年开发，旨在通过收集用户对T5-11B模型生成的脚本的交互反馈，推动自然语言处理领域中的脚本生成与修正研究。该数据集由8466个样本组成，每个样本包含模型生成的初始脚本、用户反馈以及修正后的脚本。通过Amazon Mechanical Turk平台，研究人员收集了大量用户对脚本错误的反馈，涵盖了多种反馈类型和编辑操作。这一数据集为研究如何通过用户反馈改进模型生成的脚本提供了宝贵资源，对自动化脚本生成和修正领域具有重要影响。

当前挑战

InterScript数据集面临的主要挑战包括如何有效处理用户反馈的多样性和复杂性。用户反馈可能涉及语义、逻辑或语法层面的修正，这对模型的反馈理解和修正能力提出了较高要求。此外，数据收集过程中，确保反馈的质量和一致性也是一个重要挑战，尤其是在众包平台上，不同用户的理解和表达方式可能存在较大差异。构建过程中，如何设计合理的任务模板以引导用户提供高质量的反馈，同时避免噪声数据的引入，也是研究人员需要解决的关键问题。

常用场景

经典使用场景

InterScript数据集在自然语言处理领域中被广泛应用于模型生成脚本的优化与改进。通过收集用户对T5-11B模型生成的脚本的反馈，该数据集为研究者提供了一个评估和提升模型生成脚本质量的基准。特别是在任务型对话系统和自动化脚本生成领域，InterScript数据集帮助研究者理解用户反馈如何影响脚本的修正与优化。

衍生相关工作

基于InterScript数据集，研究者们开展了多项经典工作，主要集中在如何有效利用用户反馈进行模型优化。例如，一些研究提出了基于反馈的脚本修正算法，通过分析用户反馈自动修正模型生成的脚本。此外，还有研究探索了如何将用户反馈整合到模型训练过程中，以提升模型在生成脚本时的鲁棒性和准确性。这些工作为自然语言处理领域提供了新的研究方向和方法。

数据集最近研究