CAS-VSR-W1k 唇语识别数据集

超神经2022-09-09 更新2024-05-15 收录

下载链接：

https://hyper.ai/cn/datasets/19690

下载链接

链接失效反馈

官方服务：

资源简介：

CAS-VSR-W1k 原名为 LRW-1000，是目前公开的最大的普通话词汇级唇语数据集。该数据集包含 1,000 个词类，包括来自 2,000 多位发言者的 700,000 个样本。该数据集包含超过 1,000,000 个汉字实例。

CAS-VSR-W1k, formerly named LRW-1000, is currently the largest publicly available Mandarin vocabulary-level lip-reading dataset. This dataset contains 1,000 word categories, with over 700,000 samples from more than 2,000 speakers. It includes more than 1,000,000 Chinese character instances.

创建时间：

2022-09-09

搜集汇总

数据集介绍

背景与挑战

背景概述

CAS-VSR-W1k（原LRW-1000）是目前公开的最大的普通话词汇级唇语识别数据集，包含1,000个词类、来自2,000多位发言者的700,000个样本，以及超过1,000,000个汉字实例。该数据集旨在模拟不同语音模式和成像条件下的自然变化，以支持实际唇语识别应用，适用于非商业用途的研究。

以上内容由遇见数据集搜集并总结生成