DyGraphs_raw
收藏Hugging Face2024-12-08 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/WeiChow/DyGraphs_raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于论文[CrossLink](https://arxiv.org/pdf/2402.02168.pdf)的动态图数据集。数据集用于学习特定下游图的演化模式,并进行模式特定的链接预测。数据集采用了一种称为条件链接生成(conditioned link generation)的技术,结合了演化和结构建模,以执行演化特定的链接预测。该技术通过transformer解码器架构实现,支持高效的并行训练和推理。数据集包含600万个动态边,涵盖多个领域。实验表明,CrossLink在跨领域链接预测中达到了最先进的性能,平均精度比先进基线提高了11.40%。数据集的格式为CSV,包含源节点、目标节点、交互时间等信息。
This dynamic graph dataset is developed for the paper titled [CrossLink](https://arxiv.org/pdf/2402.02168.pdf). It is designed to learn evolutionary patterns of specific downstream graphs and perform pattern-specific link prediction tasks. The dataset adopts a technique named conditioned link generation, which combines evolutionary and structural modeling to conduct evolution-specific link prediction. This technique is implemented via the Transformer decoder architecture, enabling efficient parallel training and inference. The dataset contains 6 million dynamic edges spanning multiple domains. Experiments demonstrate that CrossLink achieves state-of-the-art performance in cross-domain link prediction, with its average precision outperforming existing state-of-the-art baselines by 11.40%. The dataset is stored in CSV format, including information such as source nodes, target nodes, interaction timestamps and other relevant details.
创建时间:
2024-12-05
原始信息汇总
DyGraphs_raw 数据集概述
基本信息
- 许可证: Apache 2.0
- 标签:
- text
- graph
- 任务类别:
- graph-ml
- 语言:
- en
- 数据格式: csv
数据集简介
该数据集用于论文 CrossLink,旨在学习特定下游图的演化模式,并进行模式特定的链接预测。数据集采用了一种称为条件链接生成的技术,结合了演化和结构建模,以执行演化特定的链接预测。该技术通过transformer解码器架构实现,支持高效的并行训练和推理。数据集包含600万个动态边,涵盖多个领域。在八个未训练的图上进行的广泛实验表明,CrossLink在跨域链接预测方面达到了最先进的性能,平均精度比先进基线提高了11.40%。
数据格式
数据集的格式如下:
| Unnamed: 0 | u | i | ts | label | idx |
|---|---|---|---|---|---|
idx-1 |
source node |
target node |
interaction time |
defalut: 0 |
from 1 to the #edges |
数据可以通过preprocess_data文件夹中的代码进行准备,也可以使用在huggingface上预处理的数据。
引用
如果该工作对您有帮助,请考虑引用:
bibtex @misc{huang2024graphmodelcrossdomaindynamic, title={One Graph Model for Cross-domain Dynamic Link Prediction}, author={Xuanwen Huang and Wei Chow and Yang Wang and Ziwei Chai and Chunping Wang and Lei Chen and Yang Yang}, year={2024}, eprint={2402.02168}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2402.02168}, }
搜集汇总
数据集介绍

构建方式
DyGraphs_raw数据集的构建基于动态图的演化模式,旨在支持跨领域的链接预测任务。该数据集通过收集和整合多个领域的动态图数据,涵盖了600万条动态边,确保了数据的多样性和广泛性。数据集的格式经过精心设计,包含源节点、目标节点、交互时间等关键信息,并通过预处理步骤将原始数据转换为适合模型训练的格式。
特点
DyGraphs_raw数据集的核心特点在于其动态性和跨领域性。数据集不仅捕捉了图结构的演化过程,还通过条件链接生成技术,实现了对特定演化模式的建模。此外,数据集的规模庞大,涵盖了多个领域的动态图数据,为跨领域链接预测提供了丰富的训练资源。
使用方法
使用DyGraphs_raw数据集时,用户可以通过提供的预处理代码将原始数据转换为模型可接受的格式。数据集的格式包括源节点、目标节点、交互时间等关键字段,用户可以根据需要进行进一步的处理和分析。此外,用户还可以直接使用HuggingFace平台上已处理的数据集,简化数据准备过程。
背景与挑战
背景概述
DyGraphs_raw数据集是由Xuanwen Huang等人于2024年创建,旨在支持动态图领域的研究,特别是针对跨领域动态链接预测问题。该数据集基于CrossLink模型,通过条件链接生成技术,结合进化和结构建模,实现了高效的动态图链接预测。数据集包含了600万条动态边,覆盖多个领域,展示了在跨领域链接预测任务中的卓越性能。其研究成果发表于arXiv,展示了在多个未训练图上的最先进表现,平均精度提升了11.40%,并在6个未训练图上超越了8个先进基线的全监督性能。
当前挑战
DyGraphs_raw数据集在构建过程中面临的主要挑战包括:首先,如何有效整合进化和结构建模以实现精确的链接预测;其次,跨领域数据的异质性增加了模型训练的复杂性。此外,动态图数据的高维性和时序特性也对数据处理和模型训练提出了更高的要求。在应用层面,如何确保模型在不同领域和场景下的泛化能力,以及如何处理大规模动态数据的实时更新和处理,也是该数据集面临的重要挑战。
常用场景
经典使用场景
DyGraphs_raw数据集在动态图领域的经典应用场景主要体现在跨领域链接预测任务中。该数据集通过捕捉动态图的演化模式,利用条件链接生成技术,结合进化和结构建模,实现了特定进化模式下的链接预测。其采用的transformer-decoder架构,不仅提升了训练和推理的效率,还显著提高了跨领域链接预测的准确性。
衍生相关工作
基于DyGraphs_raw数据集,研究者们已经开展了一系列相关工作,特别是在动态图模型的改进和优化方面。例如,有研究提出了基于该数据集的改进型transformer-decoder架构,进一步提升了链接预测的性能。此外,还有研究探索了如何将该数据集应用于多模态数据融合,以增强跨领域链接预测的鲁棒性和泛化能力。
数据集最近研究
最新研究方向
在动态图领域的研究中,DyGraphs_raw数据集因其对跨领域动态链接预测的卓越表现而备受关注。该数据集支持的CrossLink模型通过条件链接生成技术,结合进化与结构建模,实现了高效的链接预测。其采用的transformer-decoder架构不仅提升了训练与推理的效率,还在多个未训练的图数据上展示了领先于现有基线的性能,平均精确度提升了11.40%。这一研究方向不仅推动了动态图分析技术的前沿发展,还为跨领域数据分析提供了新的视角和方法,具有重要的学术和应用价值。
以上内容由遇见数据集搜集并总结生成



