NOS

github2025-02-06 更新2025-02-17 收录

下载链接：

https://github.com/eaglelab-zju/NOS

下载链接

链接失效反馈

官方服务：

资源简介：

NOS数据集包含界面可聚焦性的数据，用于移动网络的可访问性研究。

The NOS Dataset includes data on interface focusability for mobile network accessibility research.

创建时间：

2025-01-21

原始信息汇总

数据集概述

数据集名称

NOS & NOS-raw

数据集描述

该数据集包含用于自然语言处理和视觉任务的数据，分为NOS和NOS-raw两部分。

数据集组成

NOS
- extra-nos-raw-labeled
- nos-raw-labeled
NOS-raw
- extra-rico-labeled
- rico-labeled
- mixed-split
- weights

数据集结构

. ├── dataset │ ├── nos-raw-labeled │ │ ├── box │ │ ├── box_feat │ │ ├── graph │ │ ├── hierarchy │ │ ├── screenshot │ │ ├── text_feat │ │ └── dataset_split_{1,2,3}.json │ ├── rico-labeled │ │ ├── box │ │ ├── box_feat │ │ ├── graph │ │ ├── hierarchy │ │ ├── screenshot │ │ ├── text_feat │ │ └── dataset_split_{1,2,3}.json │ └── mixed │ ├── box │ ├── box_feat │ ├── graph │ ├── hierarchy │ ├── screenshot │ ├── text_feat │ └── dataset_split_{1,2,3}.json ├── main.py ├── config.py ├── data_loader.py ├── model.py ├── predict.py ├── utils.py └── IGNN

下载链接

使用方法

安装依赖：bash .ci/install-dev.sh 和 bash .ci/install.sh
数据集预处理：根据preprocess.py生成额外数据
训练和预测：使用main.py进行模型的训练和预测

方法

使用GIFT方法进行训练和预测。

搜集汇总

数据集介绍

构建方式

NOS数据集的构建采取了对原始图像、文本和图结构信息进行预处理的方式，通过对图像中的框、框特征、图结构以及文本特征进行系统化组织，形成了结构化的数据集。这一构建过程不仅涉及到数据清洗和格式化，还包括了对额外数据部分的生成，以增强数据集的多样性。

特点

NOS数据集的特点在于其综合了多种数据类型，包括图像、文本和图结构信息，这样的多模态数据为视觉问答、图像标注等任务提供了丰富的信息基础。数据集还提供了不同子集的划分，以支持混合实验的需要，同时，训练好的模型权重也为预测任务提供了便利。

使用方法

使用NOS数据集时，首先需要根据数据集的结构将其放置在指定的目录下。之后，用户可以根据需要编辑预处理脚本，选择相应的数据集子集进行预处理，生成所需的额外数据部分。在训练或预测时，用户需要将模型权重文件放置在对应的目录，并运行指定的脚本来执行训练或预测操作。

背景与挑战

背景概述

NOS数据集，全称为Nodes of Science，其创建旨在为学术研究提供一种全新的数据资源。该数据集由专业研究团队于近年构建，核心研究问题聚焦于如何通过图神经网络等深度学习技术对学术文献进行高效的结构化表示和语义理解。NOS数据集的构建，为学术搜索、知识图谱构建以及学术趋势分析等领域的研究提供了重要支撑，对于促进学术领域的智能化发展产生了深远影响。

当前挑战

在研究领域问题方面，NOS数据集面临的挑战主要包括如何精确提取学术文献中的关键结构化信息，以及如何有效融合不同模态的数据（如文本、图像等）。在构建过程中，数据集的挑战集中在高质量数据的获取、数据标注的一致性和准确性，以及大规模数据处理的效率与可扩展性等问题。这些问题对于数据集的应用效果和后续研究的发展至关重要。

常用场景

经典使用场景

NOS数据集，作为自然语言处理与计算机视觉领域的重要资源，其经典使用场景主要集中于图像-文本联合推理任务。该数据集提供了丰富的视觉与文本信息，使得研究者能够构建模型以理解图像内容与文本描述之间的复杂关系，进而实现有效的信息抽取、场景理解等目标。

实际应用

在实际应用中，NOS数据集的应用场景广泛，包括但不限于智能搜索系统、智能推荐系统、内容审核系统等。通过该数据集训练的模型，可以有效地提升系统对图像与文本内容的理解能力，增强用户体验，提高信息处理的效率与准确性。

衍生相关工作

NOS数据集衍生了众多经典工作，如GIFT模型等，这些工作不仅提高了图像-文本联合推理任务的性能，也推动了跨模态学习领域的发展。研究者基于该数据集的实验成果，为后续的研究提供了宝贵的参考和启示。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集