中山市南头镇境内外上市企业名单信息|上市企业数据集|地方经济数据集
收藏中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
MHEALTH Dataset
该数据集名为MHEALTH,包含了12种人类活动,这些活动是由10位不同的受试者进行的,每位受试者在左脚踝和右手腕上佩戴了运动传感器。数据由128个时间步长的序列组成;正常活动被标记为正常,而其他活动被视为异常。该数据集具有18个维度,来自10位受试者,其任务是进行异常检测。
arXiv 收录
cifar10
该数据集包含了完整的CIFAR10数据集,通过PyTorch下载并分割成.png格式的32x32图片。数据集分为三个部分:训练集(train,49,000个样本)、校准集(calibration,1,000个样本)和测试集(test,10,000个样本),每个部分按类别平衡。
huggingface 收录
中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。时间为北京时间。
国家海洋科学数据中心 收录
EmotionTalk
EmotionTalk是一个包含丰富注释的交互式中文多模态情感数据集,由南开大学和北京人工智能研究院的学者共同创建。该数据集从19名演员参与的对话场景中收集了多模态信息,包括声音、视觉和文本模态。它包含了23.6小时的语音(19250个话语),并标注了7种话语级别的情感类别(快乐、惊讶、悲伤、厌恶、愤怒、恐惧和中性),5维情感标签(负面、弱负面、中性、弱正面和正面),以及4维语音字幕(说话者、说话风格、情感和整体)。该数据集非常适合单模态和多模态情感识别、缺失模态挑战和语音字幕任务的研究。据我们所知,它是第一个高质量的、多功能的中文对话多模态情感数据集,对跨文化情感分析和识别的研究是一个宝贵的贡献。此外,我们还在EmotionTalk上进行了实验,以证明数据集的有效性和质量。它将开源并免费提供给所有学术目的。
arXiv 收录
