Kelsey residence, Indian Wells, Calif., 2006
收藏AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
涡轮叶片缺陷数据集
本数据集是一个专门为研究航空发动机缺陷检测和识别而创建的数据集。该数据集包含了一系列涡轮叶片的图像和相关的缺陷标注信息。通过使用这个数据集,研究人员和工程师可以开展针对发动机缺陷的机器学习和深度学习算法的训练、评估和优化工作。
阿里云天池 收录
SMSSpamCollection
该数据集包含数千条标记为spam或ham(非垃圾邮件)的短信。它反映了日常通信的典型情况,并包含常见的垃圾邮件词汇,为评估文本分类模型提供了现实基础。
github 收录
Paper III (Walker et al. 2024)
Data products used in 3-D CMZ Paper III, Walker et al. (2024). The full cloud catalogue is provided in tabular format, along with a full CMZ map showing the clouds and their assigned IDs. For each cloud ID in the published catalogue there are: - Individual cube cutouts from the MOPRA 3mm CMZ survey (HC3N, HCN, and HNCO). - Individual cube cutouts from the APEX 1mm CMZ survey (13CO, C18O, and H2CO). - Cloud-averaged spectra of the ATCA H2CO 4.83 GHz line. - PV slices of the ATCA H2CO 4.83 GHz line, taken across the major axis of the source. - Where applicable, there are mask files which correspond to the different velocity components of the cloud. In these cases, there are two mask files per velocity component, corresponding to the different masking approaches described in the paper.
DataCite Commons 收录
cifar10
该数据集包含了完整的CIFAR10数据集,通过PyTorch下载并分割成.png格式的32x32图片。数据集分为三个部分:训练集(train,49,000个样本)、校准集(calibration,1,000个样本)和测试集(test,10,000个样本),每个部分按类别平衡。
huggingface 收录
