CodeferSystem/ru-chain-of-thought-sharegpt-clean
收藏Hugging Face2026-04-16 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/CodeferSystem/ru-chain-of-thought-sharegpt-clean
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
language:
- ru
size_categories:
- 1K<n<10K
---
# Russian dataset focused on GPT models
## Copyright
Author of the original dataset: [evilfreelancer](https://huggingface.co/evilfreelancer)
Original dataset: [evilfreelancer/ru-chain-of-thought-sharegpt](https://huggingface.co/datasets/evilfreelancer/ru-chain-of-thought-sharegpt/viewer/default/train?row=0)
<b>I do not claim authorship for this dataset.</b>
## Dataset description
Dataset size 7 thousand data (as in the original). The data contains the QA category (Question-Answer).
## Changes
The original markup is as follows (Text shortened to save code size):
```json
[
{
"conversations": [
{
"from": "human",
"value": "Объясните разницу между правдой и оправданием в эпистемологии..."
},
{
"from": "gpt",
"value": "<thinking>Задача: Объяснить разницу между правдой и оправданием в эпистемологии...</reflection> </thinking> <output>Истина и оправдание являются двумя различными понятиями в эпистемологии, которые часто...</output>"
}
]
},
```
Changed markup (Text shortened to save code size):
```json
[
{
"prompt": "Объясните разницу между правдой и оправданием в эпистемологии...",
"response": "Истина и оправдание являются двумя различными понятиями в эпистемологии..."
},
```
The markup created for training models for "<b>deep thinking</b>" has been replaced with regular responses. The standard two data columns, "<b>prompt</b>" and "<b>response</b>" will reduce the markup required for model training if you don't need "<b>deep thinking</b>."
提供机构:
CodeferSystem



