five

ToneBooksPlus

收藏
魔搭社区2025-11-12 更新2025-09-20 收录
下载链接:
https://modelscope.cn/datasets/Vikhrmodels/ToneBooksPlus
下载链接
链接失效反馈
官方服务:
资源简介:
# ToneBooksPlus **ToneBooksPlus** — расширенная версия датасета [Vikhrmodels/ToneBooks](https://huggingface.co/datasets/Vikhrmodels/ToneBooks), но без эмоциональной разметки. В датасете 179.16 часов аудио для `train` сплита и 9.42 часа для `validation`. Большое спасибо [its5Q](https://huggingface.co/datasets/its5Q/biggest-ru-book) за помощь в сборе этих данных. --- ## Описание Для каждого аудиофрагмента собраны: 1. **Ссылка на MP3-файл** (`audio`) 2. **Текстовая расшифровка** (`text`) 3. **Имя голоса** (`voice_name`) — одно из имён дикторов: - Aleksandr Kotov - Aleksandr Zbarovskii - Alina Archibasova - Daniel Che - Evgenii Babincev - Evgenii Lebedev - Irina Bulekova - Jam Nebesky - Maksim Suslov - Smelova S - И другие --- ## Формат записи (JSON) ```json { "audio": "https://.../train/000001.mp3", "text": "Сорокапятилетний Немцов был худощавым меланхоличным мужчиной, неинициативным, излишне осторожным., "voice_name": "dmitrii_shabrov" } ``` --- ## Пример использования ```python from datasets import load_dataset ds = load_dataset("Vikhrmodels/ToneBooksPlus") ```

# ToneBooksPlus **ToneBooksPlus** — 扩展版数据集[Vikhrmodels/ToneBooks](https://huggingface.co/datasets/Vikhrmodels/ToneBooks),但移除了情感标注。该数据集的训练集包含179.16小时音频,验证集包含9.42小时音频。 特别感谢[its5Q](https://huggingface.co/datasets/its5Q/biggest-ru-book)为本次数据采集提供的支持。 --- ## 数据集说明 针对每个音频片段,均包含以下字段信息: 1. **MP3文件链接**(字段名:`audio`) 2. **文本转录内容**(字段名:`text`) 3. **发声人姓名**(字段名:`voice_name`),为以下配音员之一: - 亚历山大·科托夫(Aleksandr Kotov) - 亚历山大·兹巴罗夫斯基(Aleksandr Zbarovskii) - 阿丽娜·阿尔基巴索娃(Alina Archibasova) - 丹尼尔·车(Daniel Che) - 叶夫根尼·巴宾采夫(Evgenii Babincev) - 叶夫根尼·列别杰夫(Evgenii Lebedev) - 伊琳娜·布列科娃(Irina Bulekova) - 贾姆·内贝斯基(Jam Nebesky) - 马克西姆·苏斯洛夫(Maksim Suslov) - 斯梅洛娃·S(Smelova S) - 及其他配音员 --- ## JSON数据格式 json { "audio": "https://.../train/000001.mp3", "text": "Сорокапятилетний Немцов был худощавым меланхоличным мужчиной, неинициативным, излишне осторожным.", "voice_name": "dmitrii_shabrov" } --- ## 使用示例 python from datasets import load_dataset ds = load_dataset("Vikhrmodels/ToneBooksPlus")
提供机构:
maas
创建时间:
2025-09-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作