Man and a woman tending to an ostrich in Lincoln Park, [s.d.]
收藏MHEALTH Dataset
该数据集名为MHEALTH,包含了12种人类活动,这些活动是由10位不同的受试者进行的,每位受试者在左脚踝和右手腕上佩戴了运动传感器。数据由128个时间步长的序列组成;正常活动被标记为正常,而其他活动被视为异常。该数据集具有18个维度,来自10位受试者,其任务是进行异常检测。
arXiv 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
EmotionTalk
EmotionTalk是一个包含丰富注释的交互式中文多模态情感数据集,由南开大学和北京人工智能研究院的学者共同创建。该数据集从19名演员参与的对话场景中收集了多模态信息,包括声音、视觉和文本模态。它包含了23.6小时的语音(19250个话语),并标注了7种话语级别的情感类别(快乐、惊讶、悲伤、厌恶、愤怒、恐惧和中性),5维情感标签(负面、弱负面、中性、弱正面和正面),以及4维语音字幕(说话者、说话风格、情感和整体)。该数据集非常适合单模态和多模态情感识别、缺失模态挑战和语音字幕任务的研究。据我们所知,它是第一个高质量的、多功能的中文对话多模态情感数据集,对跨文化情感分析和识别的研究是一个宝贵的贡献。此外,我们还在EmotionTalk上进行了实验,以证明数据集的有效性和质量。它将开源并免费提供给所有学术目的。
arXiv 收录
HAM10000
HAM10000数据集是一个全面收集的皮肤镜图像集合,用于皮肤病变分类,广泛应用于医学影像和机器学习领域。该数据集包含多种皮肤病变,旨在推动皮肤病学研究,特别是皮肤癌的诊断。数据集由10,000张高分辨率的皮肤病变图像组成,来源多样,有助于训练稳健的机器学习模型,使其能够很好地泛化到未见过的数据。数据集的主要挑战是其显著的不平衡性。
github 收录
CAMO(Camouflaged Object)
伪装对象 (CAMO) 数据集,专为伪装对象分割任务而设计。我们关注两类,即自然伪装的物体和人工伪装的物体,它们通常分别对应于现实世界中的动物和人类。 伪装对象图像由 1250 张图像组成(训练集 1000 张图像,测试集 250 张图像)。从 MS-COCO 数据集中收集非伪装对象图像(训练集 1000 张图像,测试集 250 张图像)。 CAMO 具有客观性掩码真实性。
OpenDataLab 收录
