DataoceanAI/Serbian_language_free_dialogue_Corpus

Name: DataoceanAI/Serbian_language_free_dialogue_Corpus
Creator: DataoceanAI
Published: 2024-07-17 16:22:06
License: 暂无描述

Hugging Face2024-07-17 更新2024-07-22 收录

下载链接：

https://hf-mirror.com/datasets/DataoceanAI/Serbian_language_free_dialogue_Corpus

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个塞尔维亚语自由对话语料库，适用于16K移动设备。语料内容涵盖了家庭、健康、旅行、教育、工作、烹饪、婚姻、电影、音乐、社交、名人、天气、体育等日常生活常见话题，适用于所有行业。发音者性别比例大致均衡，年龄主要在16-45岁之间，口音主要来自塞尔维亚中部。数据集包含60小时的录音，语言为塞尔维亚语，由50人参与录制。

This dataset is a Serbian language free dialogue corpus, suitable for 16K mobile devices. The corpus covers common topics in daily life such as family, health, travel, education, work, cuisine, marriage, movies, music, socializing, celebrities, weather, sports, and is applicable to all industries. The pronouncers have an approximately even gender distribution, mainly aged between 16-45, with accents primarily from central Serbia. The dataset contains 60 hours of recordings in Serbian, with 50 speakers.

提供机构：

DataoceanAI

原始信息汇总

数据集概述

产品类型

语言：塞尔维亚语
对话类型：自由对话
应用场景：移动设备，16K采样率

语料类型

主题：家庭、健康、旅行、教育、工作、烹饪、婚姻、电影、音乐、社交、名人、天气、体育及其他日常生活话题
上下文：自然语境，适用于各行业

发音人信息

性别：男女比例大致均衡
年龄：主要涵盖16-45岁年龄段
口音：主要来自塞尔维亚中部

数据集标识

ID：King-ASR-938

数据规模

时长：60小时

语言

语言：塞尔维亚语

发音人数

人数：50人

5,000+

优质数据集

54 个

任务类型

进入经典数据集