five

Amazon-Google

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/Amazon-Google
下载链接
链接失效反馈
官方服务:
资源简介:
用于实体解析的 Amazon-Google 数据集源自在线零售商 Amazon.com 和可通过 Google Base Data API 访问的 Google 产品搜索服务。该数据集包含来自 amazon.com 的 1363 个实体和 3226 个 google 产品,以及两个数据源之间具有 1300 个匹配记录对的黄金标准(完美映射)。两个数据源之间的共同属性是:产品名称、产品描述、制造商和价格。该数据集最初发布在莱比锡大学数据库组的存储库中:https://dbs.uni-leipzig.de/research/projects/object_matching/benchmark_datasets_for_entity_resolution 以实现结果的可重复性和性能的可比性在亚马逊-谷歌匹配任务上的不同匹配器中,数据集被分成固定的训练集、验证集和测试集。 CompERBench 存储库中提供了固定拆分:http://data.dws.informatik.uni-mannheim.de/benchmarkmatchingtasks/index.html
提供机构:
OpenDataLab
创建时间:
2022-05-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作