CN-Celeb|语音识别数据集|说话人识别数据集
收藏
- CN-Celeb数据集首次发布,由清华大学语音与语言技术中心(CSLT)创建,旨在推动中文语音识别和说话人识别技术的发展。
- CN-Celeb数据集进行了首次大规模更新,增加了更多的语音样本和说话人,以提高数据集的多样性和覆盖范围。
- CN-Celeb数据集被广泛应用于多个国际语音识别和说话人识别竞赛中,展示了其在中文语音处理领域的应用价值。
- CN-Celeb数据集的开发团队发布了CN-Celeb2,这是一个扩展版本,包含了更多的说话人和更复杂的语音场景,进一步推动了中文语音技术的研究。
- 1CN-Celeb: A Challenging Chinese Speaker Recognition DatasetInstitute of Automation, Chinese Academy of Sciences · 2020年
- 2Speaker Recognition Using Deep Learning: A SurveyUniversity of Surrey, UK · 2021年
- 3Deep Speaker: An End-to-End Neural Speaker Embedding SystemCarnegie Mellon University · 2017年
- 4A Study on Speaker Recognition Using CN-Celeb DatasetTsinghua University · 2021年
- 5Speaker Diarization with LSTMGoogle · 2017年
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
DAT
DAT是一个统一的跨场景跨领域基准,用于开放世界无人机主动跟踪。它提供了24个视觉复杂的场景,以评估算法的跨场景和跨领域泛化能力,并具有高保真度的现实机器人动力学建模。
github 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
UIEB, U45, LSUI
本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。
github 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录