ccmusic-database/CTIS|中国传统乐器数据集|音频分类数据集
收藏数据集概述
数据集描述
- 名称: Chinese Traditional Instrument Sound Dataset (CTIS)
- 任务类别: 音频分类
- 语言: 中文, 英文
- 标签: 音乐, 艺术
- 大小: 1K<n<10K
- 许可证: MIT
数据集摘要
- 原始数据: 包含287种中国传统乐器、改良乐器及少数民族乐器的录音。
- 清洗后数据: 包含200种中国传统乐器的录音,共3,974个音频片段,平均每种乐器约20个音频片段。
- 数据结构: 包含三列,分别是音频文件(.wav格式,22,050 Hz采样率)、标签(200个类别,对应乐器名称的拼音)和中文乐器名称。
支持的任务
- 音频分类: 用于中国乐器识别或乐器声学分析。
数据集结构
- 音频文件: .wav格式,22,050 Hz采样率
- 标签: 200个类别,对应乐器名称的拼音
- 中文乐器名称: 字符串格式
数据实例
- 格式: .zip(包含.wav文件)和.csv文件
数据字段
- 乐器种类: 最多287种中国传统乐器、改良乐器及少数民族乐器
数据分割
- 乐器: 乐器分类
- 打击乐器: 打击乐器分类
数据集创建
- 动机: 缺乏中国传统乐器的数据集
- 数据收集与标准化: 由Zhaorui Liu和Monan Zhou进行
- 语言生产者: CCMUSIC的学生
- 注释过程: 构建高质量音乐声数据库,考虑录音环境、表演者、样本内容、注释标准和录音及表演质量。
- 注释者: CCMUSIC的学生
使用数据集的考虑
- 社会影响: 推进中国传统乐器的数字化进程
- 偏见讨论: 仅限于中国传统乐器
- 已知限制: 样本不平衡
额外信息
- 数据集策展人: Zijin Li
- 评估: 相关研究论文和会议论文
- 许可证信息: MIT许可证
- 引用信息: bibtex @dataset{zhaorui_liu_2021_5676893, author = {Monan Zhou, Shenyang Xu, Zhaorui Liu, Zhaowen Wang, Feng Yu, Wei Li and Baoqiang Han}, title = {CCMusic: an Open and Diverse Database for Chinese and General Music Information Retrieval Research}, month = {mar}, year = {2024}, publisher = {HuggingFace}, version = {1.2}, url = {https://huggingface.co/ccmusic-database} }
贡献
- 提供数据集: 为中国传统乐器声音提供数据集

中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
BC-MRI-SEG
BC-MRI-SEG是一个专注于乳腺癌MRI肿瘤分割的基准数据集,由中佛罗里达大学计算机视觉研究中心创建。该数据集整合了四个公开的MRI数据集,包括RIDER、ISPY1、BreastDM和DUKE,总计包含1320名患者的数据。这些数据集在MRI扫描仪的使用、配置及数据处理方法上各有不同,提供了多样化的数据来源。数据集的创建旨在解决医学影像领域中标记数据缺乏的问题,并推动开发适用于临床环境的稳健且适应性强的模型。BC-MRI-SEG的应用领域主要集中在乳腺癌的诊断和治疗评估,通过深度学习方法提高肿瘤分割的准确性和效率。
arXiv 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
CrowdHuman
CrowdHuman是一个用于评估人群场景中检测器性能的基准数据集。该数据集规模大、注释丰富且具有高多样性,包含训练、验证和测试集,共计47万个标注的人体实例,平均每张图像有23个人,包含各种遮挡情况。每个人体实例都标注有头部边界框、可见区域边界框和全身边界框。
github 收录