five

LRS2

收藏
arXiv2025-09-30 收录
下载链接:
https://www.robots.ox.ac.uk/~vgg/data/lip_reading/lrs2.html
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了从BBC电视节目中提取的224小时音频视觉转写数据,用于验证该方法的有效性。数据集的规模属于中等,其任务是对音频视觉语音进行识别。

This dataset, which contains 224 hours of audiovisual transcribed data extracted from BBC television programs, is designed to validate the effectiveness of this method. It is of moderate scale, and its core task is audiovisual speech recognition.
提供机构:
University of Oxford
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
LRS2数据集是一个用于唇读研究的大规模口语句子数据集,来源于BBC电视节目,包含数千个长度最多100字符的句子。数据集按广播日期划分为预训练集、训练集、验证集和测试集,总utterances数量超过14万,其中测试集经过额外验证以确保准确性,适用于音频-视觉语音识别模型的训练和评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作