ToneBooksPlus
收藏魔搭社区2025-11-12 更新2025-09-20 收录
下载链接:
https://modelscope.cn/datasets/Vikhrmodels/ToneBooksPlus
下载链接
链接失效反馈官方服务:
资源简介:
# ToneBooksPlus
**ToneBooksPlus** — расширенная версия датасета [Vikhrmodels/ToneBooks](https://huggingface.co/datasets/Vikhrmodels/ToneBooks), но без эмоциональной разметки. В датасете 179.16 часов аудио для `train` сплита и 9.42 часа для `validation`.
Большое спасибо [its5Q](https://huggingface.co/datasets/its5Q/biggest-ru-book) за помощь в сборе этих данных.
---
## Описание
Для каждого аудиофрагмента собраны:
1. **Ссылка на MP3-файл** (`audio`)
2. **Текстовая расшифровка** (`text`)
3. **Имя голоса** (`voice_name`) — одно из имён дикторов:
- Aleksandr Kotov
- Aleksandr Zbarovskii
- Alina Archibasova
- Daniel Che
- Evgenii Babincev
- Evgenii Lebedev
- Irina Bulekova
- Jam Nebesky
- Maksim Suslov
- Smelova S
- И другие
---
## Формат записи (JSON)
```json
{
"audio": "https://.../train/000001.mp3",
"text": "Сорокапятилетний Немцов был худощавым меланхоличным мужчиной, неинициативным, излишне осторожным.,
"voice_name": "dmitrii_shabrov"
}
```
---
## Пример использования
```python
from datasets import load_dataset
ds = load_dataset("Vikhrmodels/ToneBooksPlus")
```
# ToneBooksPlus
**ToneBooksPlus** — 扩展版数据集[Vikhrmodels/ToneBooks](https://huggingface.co/datasets/Vikhrmodels/ToneBooks),但移除了情感标注。该数据集的训练集包含179.16小时音频,验证集包含9.42小时音频。
特别感谢[its5Q](https://huggingface.co/datasets/its5Q/biggest-ru-book)为本次数据采集提供的支持。
---
## 数据集说明
针对每个音频片段,均包含以下字段信息:
1. **MP3文件链接**(字段名:`audio`)
2. **文本转录内容**(字段名:`text`)
3. **发声人姓名**(字段名:`voice_name`),为以下配音员之一:
- 亚历山大·科托夫(Aleksandr Kotov)
- 亚历山大·兹巴罗夫斯基(Aleksandr Zbarovskii)
- 阿丽娜·阿尔基巴索娃(Alina Archibasova)
- 丹尼尔·车(Daniel Che)
- 叶夫根尼·巴宾采夫(Evgenii Babincev)
- 叶夫根尼·列别杰夫(Evgenii Lebedev)
- 伊琳娜·布列科娃(Irina Bulekova)
- 贾姆·内贝斯基(Jam Nebesky)
- 马克西姆·苏斯洛夫(Maksim Suslov)
- 斯梅洛娃·S(Smelova S)
- 及其他配音员
---
## JSON数据格式
json
{
"audio": "https://.../train/000001.mp3",
"text": "Сорокапятилетний Немцов был худощавым меланхоличным мужчиной, неинициативным, излишне осторожным.",
"voice_name": "dmitrii_shabrov"
}
---
## 使用示例
python
from datasets import load_dataset
ds = load_dataset("Vikhrmodels/ToneBooksPlus")
提供机构:
maas
创建时间:
2025-09-19



