five

bstds/home_depot

收藏
Hugging Face2023-02-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bstds/home_depot
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含Home Depot网站上的产品和真实客户搜索词,旨在预测搜索词和产品之间的相关性得分。相关性得分由人工评估得出,范围从1(不相关)到3(高度相关),每个组合至少由三个人评估,平均得分作为最终相关性得分。评估时,评估者无法访问产品属性,但可以查看产品图像。数据集的目的是预测测试集中每个搜索词和产品组合的相关性。

该数据集包含Home Depot网站上的产品和真实客户搜索词,旨在预测搜索词和产品之间的相关性得分。相关性得分由人工评估得出,范围从1(不相关)到3(高度相关),每个组合至少由三个人评估,平均得分作为最终相关性得分。评估时,评估者无法访问产品属性,但可以查看产品图像。数据集的目的是预测测试集中每个搜索词和产品组合的相关性。
提供机构:
bstds
原始信息汇总

数据集概述

数据集名称

home_depot

数据集特征

  • id: int64
  • entity_id: int64
  • name: string
  • query: string
  • relevance: float64
  • description: string

数据集拆分

  • train:
    • 数据量: 74803048 字节
    • 示例数量: 74067

数据集大小

  • 下载大小: 32449185 字节
  • 数据集大小: 74803048 字节

数据集描述

该数据集包含Home Depot网站上的多个产品和真实客户搜索词。挑战在于预测给定搜索词和产品组合的相关性得分。为了创建地面实况标签,Home Depot将搜索/产品对众包给多个人类评分者。

相关性得分是一个介于1(不相关)到3(高度相关)之间的数字。例如,搜索“AA电池”对于一包AA尺寸电池(相关性=3)是高度相关的,对于无绳钻电池(相关性=2)是中度相关的,对于雪铲(相关性=1)是不相关的。

每个对至少由三个人类评分者评估。提供的相关性得分是评分平均值。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作