raw output of No-river case
收藏TREC 2007 Public Corpus Dataset
TREC 2007公共语料库数据集是一个用于构建垃圾邮件检测模型的预处理数据集。它包含50199封垃圾邮件和25220封非垃圾邮件(正常邮件)。数据集中有一个CSV文件,包含5个字段:标签(1代表垃圾邮件,其他代表正常邮件)、邮件主题、收件人、发件人和邮件正文。
github 收录
PetFace
PetFace数据集由京都大学和日本东京大学联合创建,是一个大规模的动物面部识别数据集,包含257,484个独特的个体,跨越13个动物家族和319个品种类别。数据集包含1,012,934张图像,通过互联网自动和手动过滤过程收集,确保数据集不仅规模大,而且细节丰富且清洁。数据集提供了包括性别、品种、颜色和图案在内的细粒度注释,支持对已知和未知个体的识别。PetFace数据集的应用领域包括动物行为监测、栖息地调查和失踪动物寻找,旨在推动非侵入性动物自动识别方法的发展。
arXiv 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
CAMO(Camouflaged Object)
伪装对象 (CAMO) 数据集,专为伪装对象分割任务而设计。我们关注两类,即自然伪装的物体和人工伪装的物体,它们通常分别对应于现实世界中的动物和人类。 伪装对象图像由 1250 张图像组成(训练集 1000 张图像,测试集 250 张图像)。从 MS-COCO 数据集中收集非伪装对象图像(训练集 1000 张图像,测试集 250 张图像)。 CAMO 具有客观性掩码真实性。
OpenDataLab 收录
OECD Statistics
OECD Statistics 数据集包含了经济合作与发展组织(OECD)发布的各种统计数据,涵盖了经济、社会、环境、教育、科技等多个领域。数据集提供了详细的指标和时间序列数据,帮助研究人员和政策制定者分析和理解全球经济和社会发展趋势。
stats.oecd.org 收录
