SauravMaheshkar/pareto-amazon-photo

Name: SauravMaheshkar/pareto-amazon-photo
Creator: SauravMaheshkar
Published: 2024-02-14 17:46:23
License: 暂无描述

Hugging Face2024-02-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/SauravMaheshkar/pareto-amazon-photo

下载链接

链接失效反馈

官方服务：

资源简介：

--- size_categories: - 1K<n<10K task_categories: - graph-ml license: cc --- ## Dataset Information | # Nodes | # Edges | # Features | |:-------:|:-------:|:----------:| | 7,650 | 119,043 | 745 | Pre-processed as per the official codebase of https://arxiv.org/abs/2210.02016 ## Citations ``` @article{ju2023multi, title={Multi-task Self-supervised Graph Neural Networks Enable Stronger Task Generalization}, author={Ju, Mingxuan and Zhao, Tong and Wen, Qianlong and Yu, Wenhao and Shah, Neil and Ye, Yanfang and Zhang, Chuxu}, booktitle={International Conference on Learning Representations}, year={2023} } ```

规模类别： - 1000 < 节点数 < 10000 任务类别： - 图机器学习（graph-ml）许可协议：CC（知识共享许可协议） --- ## 数据集信息 | 节点数量 | 边数量 | 特征维度 | |:-------:|:-------:|:----------:| | 7,650 | 119,043 | 745 | 本数据集已按照论文https://arxiv.org/abs/2210.02016 的官方代码库完成预处理。 ## 引用文献 @article{ju2023multi, title={多任务自监督图神经网络实现更强任务泛化能力}, author={Ju, Mingxuan and Zhao, Tong and Wen, Qianlong and Yu, Wenhao and Shah, Neil and Ye, Yanfang and Zhang, Chuxu}, booktitle={国际学习表征会议}, year={2023} }

提供机构：

SauravMaheshkar

原始信息汇总

数据集信息

数据集规模

节点数量：7,650
边数量：119,043
特征数量：745

数据集分类

大小分类：1K<n<10K
任务分类：graph-ml

许可证

引用

@article{ju2023multi, title={Multi-task Self-supervised Graph Neural Networks Enable Stronger Task Generalization}, author={Ju, Mingxuan and Zhao, Tong and Wen, Qianlong and Yu, Wenhao and Shah, Neil and Ye, Yanfang and Zhang, Chuxu}, booktitle={International Conference on Learning Representations}, year={2023} }

搜集汇总

数据集介绍

构建方式

SauravMaheshkar/pareto-amazon-photo数据集的构建，是基于对亚马逊照片数据的社会网络分析。该数据集从原始的亚马逊照片数据中提取了7,650个节点，以及119,043条边，每个节点具有745个特征。其构建过程遵循了官方代码库中预处理的标准，旨在为图机器学习任务提供高质量的数据基础。

特点

该数据集显著的特点在于其丰富的节点特征和大规模的边连接，为研究图机器学习任务提供了良好的实验平台。此外，它遵循Creative Commons许可，保证了数据的开放性与共享性。数据集的节点与边分布呈现出帕累托分布特征，有利于探索复杂网络结构中的幂律分布规律。

使用方法

使用SauravMaheshkar/pareto-amazon-photo数据集，研究人员可以将其直接应用于图机器学习相关的任务中，如节点分类、链接预测等。用户需遵守Creative Commons许可协议，合法使用数据。在实践操作层面，数据集的加载与处理应遵循官方代码库的指导，确保数据的正确解析和应用。

背景与挑战

背景概述

SauravMaheshkar/pareto-amazon-photo数据集，创建于近年来，源自于学术研究的深入需求，由Ju, Mingxuan等研究人员共同构建。该数据集专注于图机器学习领域，其核心研究问题是如何通过图神经网络进行多任务自监督学习，以实现更强的任务泛化能力。该数据集的构建，对图机器学习领域产生了显著影响，为相关研究提供了宝贵的实验资源。

当前挑战

在领域问题上，SauravMaheshkar/pareto-amazon-photo数据集面临的挑战包括如何有效处理图数据中的复杂关系，以及如何提高图神经网络的泛化能力。在构建过程中，研究者们需要处理的数据规模较大，节点数量达到7,650，边数达到119,043，特征维度为745，这对数据预处理和模型训练都提出了较高的要求。此外，数据集的许可问题也是构建过程中的一大挑战，需要确保遵守相关的版权法规。

常用场景

经典使用场景

在深度学习领域，图机器学习已成为研究热点。SauravMaheshkar/pareto-amazon-photo数据集，作为图机器学习任务的典范，其经典使用场景在于为多任务自监督图神经网络提供训练数据，以实现更强大的任务泛化能力。

实际应用

在实际应用中，SauravMaheshkar/pareto-amazon-photo数据集可被用于改进商品推荐系统，通过分析商品间的复杂关系，为用户提供更加精准的推荐。

衍生相关工作

基于此数据集，已衍生出多项经典工作，如Ju等人在2023年的ICLR会议上发表的'Multi-task Self-supervised Graph Neural Networks Enable Stronger Task Generalization'，该研究利用该数据集验证了多任务自监督图神经网络在任务泛化上的优势。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集