SiberiaSoft/SiberianPersonaChat-2
收藏Hugging Face2023-09-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SiberiaSoft/SiberianPersonaChat-2
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
task_categories:
- text-generation
- text2text-generation
- conversational
language:
- ru
size_categories:
- 100K<n<1M
---
### SiberiaSoft/SiberianPersonaChat
Датасет диалогов, QA
Данный датасет был создан для диалоговых агентов с имитацией личности.
Большая часть датасета была сгенерирована с помощью chatGPT и различных промптов к ней. Кроме этого, в состав датасета входит измененный [TolokaPersonaChatRus](https://toloka.ai/datasets/?category=nlp)
## Формат описаний личности
1. Я очень умная девушка, и хочу помочь своему другу полезными советами.
2. Я парень, консультант по разным вопросам. Я очень умный. Люблю помогать собеседнику.
Также в промпт можно подставлять факты о личности: ФИО, возраст и т.д
1. Я девушка 18 лет. Я учусь в институте. Живу с родителями. У меня есть кот. Я ищу парня для семьи.
Статья на habr: [ссылка](https://habr.com/ru/articles/751580/)
## Процентное данных:
| Задача | Процентное содержание |
|:-----------------------:|:---------------------:|
| qa | 32.088% |
| persons | 19.096% |
| man3 | 18.426% |
| woman | 17.433% |
| chitchat | 7.893% |
| man | 4.797% |
| reaction | 0.268% |
### Citation
```
@MISC{SiberiaSoft/SiberianPersonaChat2,
author = {Denis Petrov, Ivan Ramovich},
title = {Russian dataset for Chat models},
url = {https://huggingface.co/datasets/SiberiaSoft/SiberianPersonaChat-2},
year = 2023
}
```
提供机构:
SiberiaSoft
原始信息汇总
数据集概述
数据集名称
SiberiaSoft/SiberianPersonaChat
数据集用途
用于对话代理的个性模拟。
数据集来源
主要由chatGPT生成,并包含修改自TolokaPersonaChatRus的部分。
数据集语言
俄语
数据集大小
100K<n<1M
数据集任务类别
- 文本生成
- 文本到文本生成
- 对话
数据格式
描述个性的文本,包括性格特征、年龄、职业等信息。
数据集内容分布
| 任务 | 百分比 |
|---|---|
| qa | 32.088% |
| persons | 19.096% |
| man3 | 18.426% |
| woman | 17.433% |
| chitchat | 7.893% |
| man | 4.797% |
| reaction | 0.268% |
引用信息
@MISC{SiberiaSoft/SiberianPersonaChat2, author = {Denis Petrov, Ivan Ramovich}, title = {Russian dataset for Chat models}, url = {https://huggingface.co/datasets/SiberiaSoft/SiberianPersonaChat-2}, year = 2023 }



