davanstrien/test3
收藏Hugging Face2023-07-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/test3
下载链接
链接失效反馈官方服务:
资源简介:
FarsiNews数据集是一个波斯语新闻数据集,主要用于文本生成和填充掩码任务。数据集包含标题、摘要、链接和标签等特征,分为hamshahri和radiofarda两个子集。数据集的大小类别为1K<n<10K,来源数据集为farsi_news,语言为波斯语,许可证未知,且为单语言数据集。
FarsiNews数据集是一个波斯语新闻数据集,主要用于文本生成和填充掩码任务。数据集包含标题、摘要、链接和标签等特征,分为hamshahri和radiofarda两个子集。数据集的大小类别为1K<n<10K,来源数据集为farsi_news,语言为波斯语,许可证未知,且为单语言数据集。
提供机构:
davanstrien
原始信息汇总
数据集概述
基本信息
- 名称: FarsiNews
- 语言: 波斯语 (fa)
- 多语言性: 单语种
- 许可证: 未知
- 大小: 1K<n<10K
数据来源
- 源数据集: farsi_news
任务类别
- 文本生成
- 填充掩码
数据集特征
- 标题 (title): 字符串类型
- 摘要 (summary): 字符串类型
- 链接 (link): 字符串类型
- 标签 (tags): 字符串序列类型
数据分割
- hamshahri: 2203个样本,总字节数1267659
- radiofarda: 284个样本,总字节数265272
下载与数据集大小
- 下载大小: 1648337字节
- 数据集大小: 1532931字节



