cjerzak/LinkOrgs
收藏Hugging Face2024-02-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cjerzak/LinkOrgs
下载链接
链接失效反馈官方服务:
资源简介:
该存储库包含用于改进组织数据链接的大规模训练数据。`NegMatches_mat.csv`和`NegMatches_mat_hold.csv`文件包含来自LinkedIn网络的数百万个负面名称匹配示例(详见论文)。`PosMatches_mat.csv`和`PosMatches_mat_hold.csv`文件包含来自LinkedIn网络的数百万个正面名称匹配示例(详见论文)。此外,带有`*_bipartite`的文件指的是用于改进链接的LinkedIn网络的二分网络表示,带有`*_bipartite`的文件指的是用于改进链接的LinkedIn网络的马尔可夫网络表示。
该存储库包含用于改进组织数据链接的大规模训练数据。`NegMatches_mat.csv`和`NegMatches_mat_hold.csv`文件包含来自LinkedIn网络的数百万个负面名称匹配示例(详见论文)。`PosMatches_mat.csv`和`PosMatches_mat_hold.csv`文件包含来自LinkedIn网络的数百万个正面名称匹配示例(详见论文)。此外,带有`*_bipartite`的文件指的是用于改进链接的LinkedIn网络的二分网络表示,带有`*_bipartite`的文件指的是用于改进链接的LinkedIn网络的马尔可夫网络表示。
提供机构:
cjerzak
原始信息汇总
数据集概述
数据集来源
- 论文信息:Brian Libgober, Connor T. Jerzak. Linking Datasets on Organizations Using Half-a-Billion Open-Collaborated Records. ArXiv Preprint, 2023.
数据集内容
- 文件描述:
NegMatches_mat.csv和NegMatches_mat_hold.csv:包含数百万个从LinkedIn网络中提取的负面名称匹配示例。PosMatches_mat.csv和PosMatches_mat_hold.csv:包含数百万个从LinkedIn网络中提取的正面名称匹配示例。*_bipartite文件:表示用于改进链接的LinkedIn网络的双模网络表示。*_bipartite文件:表示用于改进链接的LinkedIn网络的马尔可夫网络表示。



