Human-labeled security record groups
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/FernandoDeMeer/GraLMatch
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了63,500个人工标注的安全记录组以及1,500个手动发现的边缘情况记录组,总计涵盖来自8个不同数据源的65,000家公司和证券信息。该数据集会根据现实世界事件定期更新,其中包括具有缺失标识符的挑战性记录组,其设计旨在模拟现实世界中的匹配挑战。这是一个现实世界数据的较小子集,其任务是实体组匹配。
提供机构:
Confidential nature of data, synthetic dataset produced from publicly available data



