d0rj/OpenHermes-2.5-ru
收藏Hugging Face2024-07-07 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/OpenHermes-2.5-ru
下载链接
链接失效反馈官方服务:
资源简介:
这是一个将[teknium/OpenHermes-2.5](https://huggingface.co/datasets/teknium/OpenHermes-2.5)翻译成俄语的版本,使用Google Translate进行翻译。数据集包含对话和来源信息,对话由发送者和内容组成,来源为字符串类型。数据集分为训练集,包含约100万条样本。适用于文本生成、文本到文本生成和问答任务。
This is a translated version of [teknium/OpenHermes-2.5](https://huggingface.co/datasets/teknium/OpenHermes-2.5) into Russian using Google Translate. The dataset contains conversations and source information, with conversations consisting of sender and content, and source being a string type. The dataset is divided into a training set, containing approximately 1 million samples. It is suitable for text generation, text-to-text generation, and question-answering tasks.
提供机构:
d0rj
原始信息汇总
OpenHermes-2.5 (Russian) 数据集概述
数据集描述
- 名称: OpenHermes-2.5 (Russian)
- 语言: 俄语
- 多语言性: 单语种
- 语言来源: 翻译自英语
- 标签: 合成数据, 指令, 指令微调
- 大小类别: 1M < n < 10M
- 许可证: Apache-2.0
数据集特征
- 特征:
- conversations:
- from: 字符串类型
- value: 字符串类型
- source: 字符串类型
- conversations:
数据集分割
- 训练集:
- 样本数: 1,001,551
- 字节数: 2,816,241,444
数据集大小
- 下载大小: 1,196,019,593 字节
- 数据集大小: 2,816,241,444 字节
任务类别
- 文本生成
- 文本到文本生成
- 问答
配置
- 默认配置:
- 数据文件:
- 训练集: data/train-*
- 数据文件:



