中国主要水稻产区各省1:100万水稻土空间分布图(2015年)|农业土壤科学数据集|地理信息系统数据集
收藏RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
中国农村教育发展报告
该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。
www.moe.gov.cn 收录
Adver-City
Adver-City是由皇后大学计算学院创建的第一个开源多模态协作感知数据集,专注于恶劣天气条件。该数据集包含超过24,000帧和890,000个标注,涵盖110个独特场景,涉及六种不同的天气条件。数据集内容包括来自车辆和路边单元的LiDAR、RGB和语义分割相机、GNSS和IMU数据。创建过程基于CARLA模拟器和OpenCDA框架,场景设计基于真实事故报告,旨在模拟恶劣天气和低能见度条件下的最相关道路配置。该数据集主要用于测试和改进自动驾驶车辆在恶劣天气条件下的感知模型,解决传感器性能下降和物体检测困难的问题。
arXiv 收录
中国车牌识别数据集(7类,33万张)
这是一个高质量、平衡的中国车牌识别数据集,包含了33万张各类中国车牌的图片。数据集经过精心设计,确保了图像质量的优秀和大部分各类车牌类型的平衡分布。这个数据集非常适合用于训练和评估车牌识别模型。
魔搭社区 收录