five

barunsaha/bangla_sahitya

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/barunsaha/bangla_sahitya
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含一些公开领域的孟加拉语诗歌的小型数据集,名为Bangla Sahitya。数据集包含387个训练样本,每个样本有作者和文本两个特征。

A small collection of some Bengali poems available in the public domain, named Bangla Sahitya. The dataset contains 387 training examples, each with features of author and text.
提供机构:
barunsaha
原始信息汇总

数据集概述

数据集名称

  • 名称: bangla_sahitya
  • 别名: barunsaha/bangla_sahitya, Bangla Sahitya (বাংলা সাহিত্য)

数据集描述

  • 描述: 这是一个公开领域中可用的一些孟加拉语诗歌的小型集合。

数据集创建者

数据集关键词

  • 关键词: Bengali, < 1K, parquet, Text, Datasets, pandas, Croissant, 🇺🇸 Region: US

数据集分布

  • 分布:
    • 类型: cr:FileObject

    • 名称: repo

    • 描述: HF Mirror git 仓库。

    • 内容链接: HF Mirror git 仓库

    • 编码格式: git+https

    • 类型: cr:FileSet

    • 名称: parquet-files-for-config-default

    • 描述: 由 HF Mirror 转换的底层 Parquet 文件(参见:HF Mirror Parquet 文档)。

    • 包含于: repo

    • 编码格式: application/x-parquet

    • 包含文件: default//.parquet

数据集记录集

  • 记录集:
    • 类型: cr:RecordSet
    • 名称: default
    • 描述: barunsaha/bangla_sahitya - default 子集
    • 字段:
      • 类型: cr:Field

      • 名称: default/author

      • 描述: HF Mirror Parquet 文件中的 author 列。

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取: author 列
      • 类型: cr:Field

      • 名称: default/text

      • 描述: HF Mirror Parquet 文件中的 text 列。

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取: text 列

数据集符合的标准

数据集链接

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作