five

CAS-VSR-W1k 唇语识别数据集

收藏
超神经2022-09-09 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/19690
下载链接
链接失效反馈
官方服务:
资源简介:
CAS-VSR-W1k 原名为 LRW-1000,是目前公开的最大的普通话词汇级唇语数据集。该数据集包含 1,000 个词类,包括来自 2,000 多位发言者的 700,000 个样本。该数据集包含超过 1,000,000 个汉字实例。

CAS-VSR-W1k, formerly named LRW-1000, is currently the largest publicly available Mandarin vocabulary-level lip-reading dataset. This dataset contains 1,000 word categories, with over 700,000 samples from more than 2,000 speakers. It includes more than 1,000,000 Chinese character instances.
创建时间:
2022-09-09
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CAS-VSR-W1k(原LRW-1000)是目前公开的最大的普通话词汇级唇语识别数据集,包含1,000个词类、来自2,000多位发言者的700,000个样本,以及超过1,000,000个汉字实例。该数据集旨在模拟不同语音模式和成像条件下的自然变化,以支持实际唇语识别应用,适用于非商业用途的研究。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务