five

cjerzak/LinkOrgs

收藏
Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cjerzak/LinkOrgs
下载链接
链接失效反馈
官方服务:
资源简介:
该存储库包含用于改进组织数据链接的大规模训练数据。`NegMatches_mat.csv`和`NegMatches_mat_hold.csv`文件包含来自LinkedIn网络的数百万个负面名称匹配示例(详见论文)。`PosMatches_mat.csv`和`PosMatches_mat_hold.csv`文件包含来自LinkedIn网络的数百万个正面名称匹配示例(详见论文)。此外,带有`*_bipartite`的文件指的是用于改进链接的LinkedIn网络的二分网络表示,带有`*_bipartite`的文件指的是用于改进链接的LinkedIn网络的马尔可夫网络表示。

该存储库包含用于改进组织数据链接的大规模训练数据。`NegMatches_mat.csv`和`NegMatches_mat_hold.csv`文件包含来自LinkedIn网络的数百万个负面名称匹配示例(详见论文)。`PosMatches_mat.csv`和`PosMatches_mat_hold.csv`文件包含来自LinkedIn网络的数百万个正面名称匹配示例(详见论文)。此外,带有`*_bipartite`的文件指的是用于改进链接的LinkedIn网络的二分网络表示,带有`*_bipartite`的文件指的是用于改进链接的LinkedIn网络的马尔可夫网络表示。
提供机构:
cjerzak
原始信息汇总

数据集概述

数据集来源

  • 论文信息:Brian Libgober, Connor T. Jerzak. Linking Datasets on Organizations Using Half-a-Billion Open-Collaborated Records. ArXiv Preprint, 2023.

数据集内容

  • 文件描述
    • NegMatches_mat.csvNegMatches_mat_hold.csv:包含数百万个从LinkedIn网络中提取的负面名称匹配示例。
    • PosMatches_mat.csvPosMatches_mat_hold.csv:包含数百万个从LinkedIn网络中提取的正面名称匹配示例。
    • *_bipartite 文件:表示用于改进链接的LinkedIn网络的双模网络表示。
    • *_bipartite 文件:表示用于改进链接的LinkedIn网络的马尔可夫网络表示。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作