barunsaha/bangla_sahitya
收藏Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/barunsaha/bangla_sahitya
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含一些公开领域的孟加拉语诗歌的小型数据集,名为Bangla Sahitya。数据集包含387个训练样本,每个样本有作者和文本两个特征。
A small collection of some Bengali poems available in the public domain, named Bangla Sahitya. The dataset contains 387 training examples, each with features of author and text.
提供机构:
barunsaha
原始信息汇总
数据集概述
数据集名称
- 名称: bangla_sahitya
- 别名: barunsaha/bangla_sahitya, Bangla Sahitya (বাংলা সাহিত্য)
数据集描述
- 描述: 这是一个公开领域中可用的一些孟加拉语诗歌的小型集合。
数据集创建者
- 创建者: Barun Saha
- 链接: Barun Saha的个人页面
数据集关键词
- 关键词: Bengali, < 1K, parquet, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US
数据集分布
- 分布:
-
类型: cr:FileObject
-
名称: repo
-
描述: HF Mirror git 仓库。
-
内容链接: HF Mirror git 仓库
-
编码格式: git+https
-
类型: cr:FileSet
-
名称: parquet-files-for-config-default
-
描述: 由 HF Mirror 转换的底层 Parquet 文件(参见:HF Mirror Parquet 文档)。
-
包含于: repo
-
编码格式: application/x-parquet
-
包含文件: default//.parquet
-
数据集记录集
- 记录集:
- 类型: cr:RecordSet
- 名称: default
- 描述: barunsaha/bangla_sahitya - default 子集
- 字段:
-
类型: cr:Field
-
名称: default/author
-
描述: HF Mirror Parquet 文件中的 author 列。
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取: author 列
-
类型: cr:Field
-
名称: default/text
-
描述: HF Mirror Parquet 文件中的 text 列。
-
数据类型: sc:Text
-
来源:
- 文件集: parquet-files-for-config-default
- 提取: text 列
-
数据集符合的标准
- 符合标准: MLCommons Croissant 1.0



