AudioSet|音频识别数据集|机器学习数据集
收藏
- AudioSet首次发表,由Google AI团队发布,包含约200万个音频片段,涵盖527个声音事件类别。
- AudioSet被广泛应用于音频事件检测和分类任务,成为音频处理领域的重要基准数据集。
- AudioSet的扩展版本发布,增加了更多的音频样本和类别,进一步丰富了数据集的内容。
- AudioSet开始应用于多模态学习研究,特别是在音频与视频数据的联合分析中展现出其独特价值。
- AudioSet的标注质量得到进一步提升,引入了更精细的标签体系,提高了数据集在复杂场景下的应用效果。
- AudioSet被用于开发新一代的音频识别模型,推动了音频技术在智能家居、自动驾驶等领域的应用。
- 1AudioSet: An ontology and human-labeled dataset for audio eventsGoogle · 2017年
- 2Weakly-Supervised Sound Event Detection Using Audiovisual CorrespondenceUniversity of Surrey · 2020年
- 3Sound Event Detection Using Weakly Labeled Data with AudioSetUniversity of Rochester · 2019年
- 4Audio-Visual Scene Analysis with Self-Supervised Multisensory FeaturesUniversity of Oxford · 2018年
- 5Learning to Recognize Sounds with Weak SupervisionUniversity of California, Berkeley · 2021年
AlphaFold Protein Structure Database
AlphaFold是由Google DeepMind开发的AI系统,可从氨基酸序列预测蛋白质的三维结构,其准确性媲美实验方法。Google DeepMind与欧洲生物信息学研究所(EMBL-EBI)合作创建了AlphaFold Protein Structure Database,免费向科学界开放,现已涵盖超过2亿条UniProt蛋白序列,包含人类及47种重要生物的蛋白质组。
alphafold.com 收录
stanford_cars
该数据集是一个包含多个汽车品牌和型号的图片数据集,每个图片样本都标记有相应的汽车品牌和型号信息。数据集适用于图像识别和分类任务,特别是汽车品牌和型号的识别。
huggingface 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
rpi_test
该数据集为HuggingFace LeRobot格式机器人数据集。
huggingface 收录
猫狗分类
## 数据集描述 ### 数据集简介 本数据集是简单的猫狗二分类数据集,共2个类别,其中训练集包含275张带注释的图像,验证集包含70张带注释的图像。整个数据集共10.3MB,可用于快速模型验证、性能评估、小数据集训练等。 ### 数据集支持的任务 可用于快速模型验证、性能评估、小数据集训练等。 ## 数据集的格式和结构 ### 数据格式 数据集包括训练集train和验证集val,train和val文件夹之下按文件夹进行分类,共有2个子文件夹,同类别标签的图片在同一个文件夹下,图片格式为JPG。同时包含与标注文件中label id相对应的类名文件classname.txt。 ### 数据集加载方式 ```python from modelscope.msdatasets import MsDataset from modelscope.utils.constant import DownloadMode ms_train_dataset = MsDataset.load( 'cats_and_dogs', namespace='tany0699', subset_name='default', split='train') # 加载训练集 print(next(iter(ms_train_dataset))) ms_val_dataset = MsDataset.load( 'cats_and_dogs', namespace='tany0699', subset_name='default', split='validation') # 加载验证集 print(next(iter(ms_val_dataset))) ``` ### 数据分片 本数据集包含train和val数据集。 | 子数据集 | train | val | test | |---------|-------------:|-----------:|---------:| | default | 训练集 | 验证集 | / | ### Clone with HTTP ```bash git clone https://www.modelscope.cn/datasets/tany0699/cats_and_dogs.git ```
魔搭社区 收录
