LibriVox|语音识别数据集|自然语言处理数据集
收藏
- LibriVox项目由Hugh McGuire创立,旨在通过志愿者录制公共领域书籍,创建一个免费的、开放的音频书籍库。
- LibriVox发布了其首个音频书籍,标志着该项目正式进入公众视野,并开始积累其庞大的音频资源库。
- LibriVox的音频书籍数量突破1000本,显示出其快速增长的用户参与度和社区支持。
- LibriVox与Internet Archive合作,将其音频书籍整合到Internet Archive的数字图书馆中,进一步扩大了其影响力和可访问性。
- LibriVox的音频书籍数量达到10000本,成为全球最大的公共领域音频书籍库之一。
- LibriVox推出了新的网站设计和用户界面,以提升用户体验和导航效率,同时继续扩展其音频书籍库。
- 1LibriVox: Free Public Domain AudiobooksLibriVox · 2005年
- 2Speech Recognition Using LibriVox Data: A Comparative StudyUniversity of California, Berkeley · 2020年
- 3Exploring the Use of LibriVox for Language LearningUniversity of Edinburgh · 2019年
- 4LibriVox and Its Impact on Digital HumanitiesUniversity of Oxford · 2018年
- 5LibriVox: A Resource for Natural Language ProcessingStanford University · 2017年
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
Refinitiv ESG Scores
Refinitiv ESG Scores数据集包含了全球上市公司的环境、社会和治理(ESG)评分。这些评分基于公司的ESG表现,旨在帮助投资者和分析师评估公司的可持续性和社会责任。数据集包括公司的ESG总评分以及各个子类别的评分,如环境管理、社会贡献和公司治理等。
www.refinitiv.com 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录