five

DataoceanAI/Serbian_language_free_dialogue_Corpus

收藏
Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/DataoceanAI/Serbian_language_free_dialogue_Corpus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个塞尔维亚语自由对话语料库,适用于16K移动设备。语料内容涵盖了家庭、健康、旅行、教育、工作、烹饪、婚姻、电影、音乐、社交、名人、天气、体育等日常生活常见话题,适用于所有行业。发音者性别比例大致均衡,年龄主要在16-45岁之间,口音主要来自塞尔维亚中部。数据集包含60小时的录音,语言为塞尔维亚语,由50人参与录制。

This dataset is a Serbian language free dialogue corpus, suitable for 16K mobile devices. The corpus covers common topics in daily life such as family, health, travel, education, work, cuisine, marriage, movies, music, socializing, celebrities, weather, sports, and is applicable to all industries. The pronouncers have an approximately even gender distribution, mainly aged between 16-45, with accents primarily from central Serbia. The dataset contains 60 hours of recordings in Serbian, with 50 speakers.
提供机构:
DataoceanAI
原始信息汇总

数据集概述

产品类型

  • 语言:塞尔维亚语
  • 对话类型:自由对话
  • 应用场景:移动设备,16K采样率

语料类型

  • 主题:家庭、健康、旅行、教育、工作、烹饪、婚姻、电影、音乐、社交、名人、天气、体育及其他日常生活话题
  • 上下文:自然语境,适用于各行业

发音人信息

  • 性别:男女比例大致均衡
  • 年龄:主要涵盖16-45岁年龄段
  • 口音:主要来自塞尔维亚中部

数据集标识

  • ID:King-ASR-938

数据规模

  • 时长:60小时

语言

  • 语言:塞尔维亚语

发音人数

  • 人数:50人
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作