math_tasks|数学问题数据集|基准测试数据集
收藏数据集概述
数据集名称
- HuggingFaceTB/math_tasks
许可证
- odc-by
配置
配置名称:math
- 数据文件
- split: train
- path: data/math/train.jsonl
- split: test
- path: data/math/test.jsonl
- split: demo
- path: data/math/demo.jsonl
- split: train
配置名称:gsm8k
- 数据文件
- split: train
- path: data/gsm8k/train.jsonl
- split: test
- path: data/gsm8k/test.jsonl
- split: train
数据来源
- 该数据集是从Qwen2.5-Math改编的数学基准数据集。

HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
VisDrone 2021
VisDrone2021 数据集由天津大学机器学习与数据挖掘实验室 AISKYEYE 团队收集。基准数据集由 400 个视频片段组成,由 265,228 帧和 10,209 张静态图像组成,由各种无人机摄像头拍摄,涵盖了广泛的方面,包括位置(取自中国相隔数千公里的 14 个不同城市)、环境(城市和乡村)、物体(行人、车辆、自行车等)和密度(稀疏和拥挤的场景)。请注意,数据集是使用各种无人机平台(即具有不同型号的无人机)、在不同场景以及各种天气和照明条件下收集的。这些框架使用超过 260 万个边界框或经常感兴趣的目标点进行手动注释,例如行人、汽车、自行车和三轮车。为了更好地利用数据,还提供了一些重要的属性,包括场景可见性、对象类别和遮挡。
OpenDataLab 收录
GFS
数据来源采自美国国家环境预报中心的GFS(全球预报系统),该系统每天发布4次全球范围的气象数据,分辨率最高可达到0.25° x 0.25°。GFS数据提供FTP下载方式:https://nomads.ncep.noaa.gov/pub/data/nccf/com/gfs/。每次发布的数据保存在命名为gfs.YYYYMMDDHH的文件夹中。本次需要的数据精度为0.25°(0p25),所以数据的文件名为:gfs.t{ HH }z.pgrb2.0p25.f{ XXX }
地球大数据科学工程 收录
IRSTD-1k
最大的逼真红外小目标检测数据集,由1,001个手动标记的逼真图像组成,这些图像具有各种目标形状,不同的目标大小以及来自不同场景的丰富杂波背景。
OpenDataLab 收录