Office-31
收藏arXiv2025-09-30 收录
下载链接:
https://www.cc.gatech.edu/~judy/domainadapt/
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了来自亚马逊办公用品类别下的产品描述,用于根据产品标题和描述提供的内容生成澄清问题(CQs)。相较于家居与厨房类别,办公用品数据集在规模上较小,平均每条产品描述产生约6个问题。该数据集的具体规模为:训练集2,190条,验证集285条,以及测试集256条,其任务是进行澄清问题生成(Cqgen)。
This dataset comprises product descriptions from the Amazon Office Supplies category, designed for generating clarification questions (CQs) based on the content of product titles and descriptions. Compared with the Home & Kitchen category dataset, the Office Supplies dataset is smaller in scale, with approximately 6 questions generated per product description on average. The specific sizes of the dataset splits are as follows: 2,190 samples for the training set, 285 for the validation set, and 256 for the test set. The task of this dataset is clarification question generation (Cqgen).
提供机构:
Amazon
搜集汇总
数据集介绍

背景与挑战
背景概述
Office-31是一个用于域适应研究的计算机视觉数据集,包含三个视觉域:Amazon(亚马逊网站图像)、Webcam(网络摄像头拍摄的办公室图像)和Dslr(数码单反相机拍摄的办公室图像),每个域涵盖31个相同类别。数据集的特点是模拟真实世界中的视觉域变化,如光照和姿态差异,旨在评估和开发跨域对象识别算法。
以上内容由遇见数据集搜集并总结生成



