five

Zaid/ashaar_small_proc

收藏
Hugging Face2023-05-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Zaid/ashaar_small_proc
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含诗歌及其相关信息的结构化数据,涵盖了诗歌的标题、韵律、诗句、主题、URL,以及诗人的姓名、描述、URL、时代、位置等信息。诗歌描述字段是一个复杂的嵌套结构,包含多个子字段,如属性、子元素等。数据集分为训练集,包含10000个样本,总大小为31435320字节,下载大小为8441588字节。

该数据集包含诗歌及其相关信息的结构化数据,涵盖了诗歌的标题、韵律、诗句、主题、URL,以及诗人的姓名、描述、URL、时代、位置等信息。诗歌描述字段是一个复杂的嵌套结构,包含多个子字段,如属性、子元素等。数据集分为训练集,包含10000个样本,总大小为31435320字节,下载大小为8441588字节。
提供机构:
Zaid
原始信息汇总

数据集概述

数据集名称

  • 名称: ashaar_small_proc

数据集特征

  • 诗标题 (string)
  • 诗韵律 (string)
  • 诗节数 (string)
  • 诗主题 (string)
  • 诗URL (string)
  • 诗人姓名 (string)
  • 诗人描述 (string)
  • 诗人URL (string)
  • 诗人时代 (string)
  • 诗人地点 (string)
  • 诗描述 (结构化列表)
    • 属性 (结构体)
      • 类别 (string)
      • 颜色 (string)
      • 方向 (string)
      • (string)
      • ID (string)
      • 语言 (string)
      • 风格 (string)
    • 子项 (列表)
      • 属性 (结构体)
        • 颜色 (string)
        • 方向 (string)
        • (string)
        • 链接 (string)
        • ID (string)
        • 语言 (string)
        • 风格 (string)
        • 标题 (string)
        • (string)
      • 子项 (列表)
        • 属性 (结构体)
          • 类别 (string)
          • 颜色 (string)
          • 方向 (string)
          • (string)
          • 语言 (string)
          • 风格 (string)
        • 子项 (列表)
          • 属性 (结构体)
            • 对齐 (string)
            • (string)
            • 不换行 (string)
          • 名称 (string)
          • 父属性 (结构体)
            • 语言 (string)
            • 风格 (string)
          • 大小 (int64)
          • 文本 (string)
          • 截断 (bool)
          • 类型 (string)
    • 诗语言类型 (string)

数据集分割

  • 训练集
    • 示例数量: 10000
    • 字节数: 31435320

数据集大小

  • 下载大小: 8441588
  • 数据集大小: 31435320
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个阿拉伯语诗歌数据集,包含约10,000首诗歌,覆盖宗教、赞美、浪漫等多种主题,并附带诗人信息和时代背景。数据以parquet格式存储,适用于文本分析和自然语言处理任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作