Hexagons
收藏github2022-11-30 更新2024-05-31 收录
下载链接:
https://github.com/OnlpLab/Hexagons
下载链接
链接失效反馈官方服务:
资源简介:
Hexagons数据集包含4177个自然发生的视觉基础指令,这些指令富含多样化的类型和抽象层次。数据集用于训练和评估从指令到执行的任务。
The Hexagons dataset comprises 4,177 naturally occurring visual grounding instructions, which are rich in diverse types and levels of abstraction. This dataset is utilized for training and evaluating tasks from instruction to execution.
创建时间:
2022-08-21
原始信息汇总
数据集概述
数据集名称
Hexagons
数据集内容
包含4177个自然发生的视觉基础指令,这些指令富含多样类型和层次的抽象。
数据集下载
数据格式
数据集分为三个文件:训练集、开发集和测试集,比例为80/10/10。每个文件采用jsonl格式,每个条目是一个包含单个绘图过程的字典。
数据结构
每个绘图过程包含以下字段:
- index: 唯一标识符,范围从0到619。
- annotation_round: 标识收集绘图过程的轮次。
- category: 触发目标图像的抽象机制。
- image_id: 图像的唯一标识符。
- instructor_id: 教师的唯一标识符。
- number_of_drawing_steps: 绘图步骤的数量。
- agreement_tags: 表示教师和验证者之间每个绘图步骤的协议级别的标签列表。
- agreement_scores: 使用Board-Based F1度量计算的协议分数列表。
- drawing_procedure: 表示绘图过程的列表,每个子列表包含步骤ID、指令和板状态。
数据集引用
@article{hexagons,
title={Draw me a Flower: {P}rocessing and Grounding Abstraction in Natural Language},
author={Lachmy, Royi and Pyatkin, Valentina and Manevich, Avshalom and Tsarfaty, Reut},
year={2022},
journal = {Accepted to Transaction of ACL}
}
搜集汇总
数据集介绍

构建方式
Hexagons数据集的构建基于自然语言指令与视觉任务的结合,通过多轮数据收集与标注完成。数据收集分为三个阶段:初步阶段、第一轮和第二轮。初步阶段主要进行试验性数据采集,第一轮使用项目团队设计的图像,第二轮则由经验丰富的众包工作者设计图像。每个绘图过程包含唯一的标识符、图像ID、指导者ID、绘图步骤数量以及详细的绘图步骤描述。数据以jsonl格式存储,分为训练集、开发集和测试集,比例为80/10/10。
使用方法
Hexagons数据集的使用方法较为直观,用户可以通过下载训练集、开发集和测试集进行模型训练与评估。每条数据以jsonl格式存储,包含绘图过程的详细信息。用户可以通过`index`字段与数据集的可视化工具结合,查看具体的绘图过程。此外,数据集提供了详细的标注信息,如`agreement_tags`和`agreement_scores`,用户可以利用这些信息评估模型在指令执行任务中的表现。数据集的使用需遵循CC-BY 4.0许可,仅限于研究与学术用途。
背景与挑战
背景概述
Hexagons数据集由ONLP实验室于2022年发布,旨在支持自然语言处理领域中指令到执行任务的研究。该数据集包含4177条自然生成的视觉基础指令,涵盖了多样化的抽象类型和层次。数据集的核心研究问题是如何通过自然语言指令生成复杂的图形绘制过程,并评估指令的准确性和一致性。Hexagons数据集通过引入多轮标注和验证机制,推动了自然语言处理与视觉任务结合的深入研究,为抽象语言处理和指令理解提供了重要的实验平台。
当前挑战
Hexagons数据集在构建和应用过程中面临多重挑战。首先,数据集的核心任务是解决自然语言指令到图形执行的复杂映射问题,这要求模型具备高度的抽象理解和执行能力。其次,数据集的构建过程中,如何确保指令的多样性和抽象层次的丰富性是一个关键挑战。此外,数据集的标注和验证过程涉及多个参与者的协作,如何保证标注的一致性和准确性也是一个技术难点。最后,数据集的评估依赖于复杂的度量标准,如基于棋盘状态的精确匹配和F1分数,这对模型的性能评估提出了更高的要求。
常用场景
经典使用场景
Hexagons数据集在自然语言处理领域中被广泛应用于指令到执行的转化任务。该数据集包含4177条自然生成的视觉基础指令,涵盖了多种抽象类型和层次,为研究指令的解析与执行提供了丰富的实验材料。通过Hexagons数据集,研究者能够深入探讨指令的抽象机制及其在视觉任务中的表现。
解决学术问题
Hexagons数据集解决了自然语言处理中指令解析与执行的复杂性问题。通过提供多样化的抽象指令和对应的执行结果,该数据集为研究指令的语义理解、抽象层次划分以及执行一致性提供了重要支持。其独特的标注机制和评估指标,如基于棋盘状态的精确匹配和F1分数,为量化指令执行效果提供了科学依据。
实际应用
Hexagons数据集的实际应用场景包括智能助手的指令解析、教育领域的编程教学工具以及自动化设计系统。通过训练模型理解并执行复杂的视觉指令,该数据集能够提升智能系统的交互能力,使其更好地服务于用户需求。此外,Hexagons数据集还可用于开发基于自然语言的图形生成工具,推动人机交互技术的发展。
数据集最近研究
最新研究方向
在自然语言处理领域,Hexagons数据集为研究视觉基础指令的抽象处理提供了丰富的资源。该数据集包含4177条自然发生的视觉基础指令,涵盖了多种类型和层次的抽象。最新的研究方向集中在如何利用这些指令来训练和评估指令到执行的模型,特别是在处理复杂抽象概念时的表现。研究者们正在探索如何通过改进模型架构和训练策略,来提高模型在理解和执行高度抽象指令时的准确性和鲁棒性。此外,该数据集还被用于研究多模态学习,结合视觉和语言信息,以增强模型对复杂指令的理解能力。这些研究不仅推动了自然语言处理技术的发展,也为人工智能在更广泛的应用场景中的部署提供了理论支持。
以上内容由遇见数据集搜集并总结生成



