HES-XPLAIN/SportsImageClassification|图像分类数据集|体育数据集
收藏体育图像分类数据集
数据集概述
- 来源: Kaggle上的100 Sports Image Classification
- 内容: 包含100种不同体育项目的图像,图像格式为224x224x3的jpg格式。
数据划分
- 训练集: 13493张图像
- 测试集: 500张图像
- 验证集: 500张图像
附加文件
- 包含一个csv文件,供用户创建自定义的训练、测试和验证数据集。
数据集操作
-
克隆数据集:
git clone https://huggingface.co/datasets/HES-XPLAIN/SportsImageClassification
或
git clone git@hf.co:datasets/HES-XPLAIN/SportsImageClassification
-
添加数据:
-
需要安装LFS(Large File Storage):
git lfs install
-
然后使用
git add
和git push
进行操作。
-
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录
UAVDT
UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。
arXiv 收录