five

rioeigen/luminova-diarized-audio

收藏
Hugging Face2025-10-15 更新2025-10-18 收录
下载链接:
https://hf-mirror.com/datasets/rioeigen/luminova-diarized-audio
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含音频和文本信息的的数据集,音频信息包括唯一标识符、时长、语言和语言概率等,文本信息包括对应的文本内容。数据集还详细记录了音频的分段信息,包括每个分段的起始时间、结束时间、文本内容和单词信息,以及每个单词的起始时间、结束时间、单词内容和说话者。此外,数据集还包含了说话者的转录信息和分段信息。数据集被划分为训练集,共有403个示例。

This dataset contains audio and text information, with audio details such as unique identifier, duration, language, and language probability, and text details including the corresponding text content. The dataset also records detailed segment information of the audio, including start and end times, text content, and word information for each segment, as well as the start and end times, word content, and speaker for each word. In addition, the dataset includes speaker transcript and segment information. The dataset is split into a training set with a total of 403 examples.
提供机构:
rioeigen
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作