pourmand1376/fa-wikipedia
收藏Hugging Face2023-08-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pourmand1376/fa-wikipedia
下载链接
链接失效反馈官方服务:
资源简介:
这是一个转换版本的波斯语维基百科数据集,以符合Open-assistant标准。数据集包含TEXT、SOURCE和METADATA三个特征,均为字符串类型。数据集的分割为train,包含2525369个示例,大小为5070809373字节。数据集的下载大小为1109211246字节,数据集大小为5070809373字节。数据集的许可证为apache-2.0,任务类别为文本生成,语言为波斯语(fa),数据集名称为Farsi Wikipedia,规模类别为1M<n<10M。
提供机构:
pourmand1376
原始信息汇总
数据集概述
数据集名称
- 名称: Farsi Wikipedia
数据集特征
- 特征1: TEXT
- 数据类型: string
- 特征2: SOURCE
- 数据类型: string
- 特征3: METADATA
- 数据类型: string
数据集划分
- 训练集:
- 样本数量: 2525369
- 数据大小: 5070809373 字节
数据集大小
- 下载大小: 1109211246 字节
- 总数据大小: 5070809373 字节
数据集配置
- 配置名称: default
- 数据文件路径: data/train-*
许可证
- 许可证类型: apache-2.0
任务类别
- 类别: text-generation
语言
- 语言: fa (波斯语)
数据集大小分类
- 分类: 1M<n<10M



