IlyaGusev/stihi_ru
收藏Hugging Face2023-03-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/IlyaGusev/stihi_ru
下载链接
链接失效反馈官方服务:
资源简介:
Stihi.ru数据集是一个俄语文本生成数据集,是从Taiga数据集中提取的一个子集,并进行了额外的清理。数据集包含id、text、title、genre、topic和author等字段,主要用于文本生成任务。数据集未进行匿名化处理,因此可能包含个人姓名和作者信息。
Stihi.ru数据集是一个俄语文本生成数据集,是从Taiga数据集中提取的一个子集,并进行了额外的清理。数据集包含id、text、title、genre、topic和author等字段,主要用于文本生成任务。数据集未进行匿名化处理,因此可能包含个人姓名和作者信息。
提供机构:
IlyaGusev
原始信息汇总
数据集概述
数据集名称
- Stihi.ru dataset
数据集特征
- id: 字符串类型
- text: 字符串类型
- title: 字符串类型
- genre: 字符串类型
- topic: 字符串类型
- author: 字符串类型
数据集分割
- train: 5151050个样本,总大小为6029108612字节
下载大小
- 1892727043字节
数据集大小
- 6029108612字节
任务类别
- text-generation
语言
- 俄语 (ru)
大小类别
- 1M<n<10M
个人信息和敏感信息
- 数据集未匿名化,可能包含个人姓名和原作者信息。



