CVSS|语音翻译数据集|多语言处理数据集
收藏数据集概述
名称: CVSS (A Massively Multilingual Speech-to-Speech Translation Corpus)
描述: CVSS是一个大规模的多语言到英语的语音到语音翻译语料库,包含21种语言到英语的句子级平行语音到语音翻译对。该数据集源自Common Voice语音语料库和CoVoST 2语音到文本翻译语料库。翻译语音使用基于LibriTTS语料库训练的两个最先进的TTS模型合成。
版本:
- CVSS-C: 所有翻译语音使用单一规范发言人声音,具有高自然度和清洁度,以及一致的说话风格。
- CVSS-T: 翻译语音声音从相应源语音转移,每对翻译在不同语言中保持相似声音。
数据量: 每个版本包含约1,900小时的语音数据。
额外提供: 与翻译语音匹配的标准化翻译文本,用于模型训练和标准化评估。
数据获取
数据可通过以下链接下载,每个链接包含train
, dev
, test
目录的音频剪辑和train.tsv
, dev.tsv
, test.tsv
文件的标准化翻译文本。
许可证
CVSS数据集根据Creative Commons Attribution 4.0 International (CC BY 4.0)许可证发布。
引用
当引用CVSS语料库时,请使用以下引用信息:
@inproceedings{jia2022cvss, title={{CVSS} Corpus and Massively Multilingual Speech-to-Speech Translation}, author={Jia, Ye and Tadmor Ramanovich, Michelle and Wang, Quan and Zen, Heiga}, booktitle={Proceedings of Language Resources and Evaluation Conference (LREC)}, pages={6691--6703}, year={2022} }

历史航班准点率
航班在最近30天里准点程度的参数综合,反映了该航班可能延误的概率指数。具体计算方法:在最近30天内,航班降落时间比计划降落时间(航班时刻表上的时间)延迟半小时以上或航班取消的情况称为延误,将出现延误情况的航班数量除以30天内实际执飞的航班数量得出延误率,准点率=1-延误率。每日全面更新一次。
苏州大数据交易所 收录
Food101
构建Food Vision使用Food101数据集中的所有数据
github 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录
animelist-dataset
一个基于JSON的动漫数据集,包含了最重要的元数据以及与其他多个动漫网站(如MAL、ANIDB、ANILIST、KITSU等)的交叉引用。数据集每周更新,涵盖了从10K到100K条记录的规模,主要语言为英语和日语,标签为'anime'。
huggingface 收录