five

test

收藏
Hugging Face2026-03-16 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/DDD-Cambodia/test
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含56,716条训练样本,总大小约66.59GB,主要存储为音频文本配对数据。每条记录包含10个结构化字段:说话人ID(string)、年龄(float)、性别(string);内容分类字段包括主题(topic)和子主题(subtopic);文本标识字段包含段落ID(int64)和句子ID(string);核心数据为转录文本(transcript)和音频(16kHz采样率的音频数据),并附带音频时长(duration)字段。数据集仅包含训练集划分,未说明具体应用场景或收集背景。
创建时间:
2026-03-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作