five

Zaid/ashaar-small-proc

收藏
Hugging Face2023-05-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Zaid/ashaar-small-proc
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: poem title dtype: string - name: poem meter dtype: string - name: poem verses dtype: string - name: poem theme dtype: string - name: poem url dtype: string - name: poet name dtype: string - name: poet description dtype: string - name: poet url dtype: string - name: poet era dtype: string - name: poet location dtype: string - name: poem description list: - name: attributes struct: - name: class dtype: string - name: color dtype: string - name: dir dtype: string - name: face dtype: string - name: id dtype: string - name: lang dtype: string - name: style dtype: string - name: children list: - name: attributes struct: - name: color dtype: string - name: dir dtype: string - name: face dtype: string - name: href dtype: string - name: id dtype: string - name: lang dtype: string - name: style dtype: string - name: title dtype: string - name: value dtype: string - name: children list: - name: attributes struct: - name: class dtype: string - name: color dtype: string - name: dir dtype: string - name: face dtype: string - name: lang dtype: string - name: style dtype: string - name: children list: - name: attributes struct: - name: align dtype: string - name: face dtype: string - name: nowrap dtype: string - name: name dtype: string - name: parentAttributes struct: - name: lang dtype: string - name: style dtype: string - name: size dtype: int64 - name: text dtype: string - name: truncated dtype: bool - name: type dtype: string - name: name dtype: string - name: parentAttributes struct: - name: dir dtype: string - name: face dtype: string - name: id dtype: string - name: lang dtype: string - name: style dtype: string - name: partA dtype: string - name: size dtype: int64 - name: text dtype: string - name: truncated dtype: bool - name: type dtype: string - name: name dtype: string - name: parentAttributes struct: - name: class dtype: string - name: color dtype: string - name: dir dtype: string - name: id dtype: string - name: lang dtype: string - name: style dtype: string - name: partA dtype: string - name: partB dtype: string - name: size dtype: int64 - name: text dtype: string - name: truncated dtype: bool - name: type dtype: string - name: name dtype: string - name: parentAttributes struct: - name: dir dtype: string - name: style dtype: string - name: partA dtype: string - name: partB dtype: string - name: size dtype: int64 - name: text dtype: string - name: truncated dtype: bool - name: type dtype: string - name: poem language type dtype: string splits: - name: train num_bytes: 31435320 num_examples: 10000 download_size: 0 dataset_size: 31435320 --- # Dataset Card for "ashaar-small-proc" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Zaid
原始信息汇总

数据集概述

数据集名称

  • 名称:ashaar-small-proc

数据集特征

  • 诗标题 (poem title):字符串类型
  • 诗韵律 (poem meter):字符串类型
  • 诗节数 (poem verses):字符串类型
  • 诗主题 (poem theme):字符串类型
  • 诗URL (poem url):字符串类型
  • 诗人姓名 (poet name):字符串类型
  • 诗人描述 (poet description):字符串类型
  • 诗人URL (poet url):字符串类型
  • 诗人时代 (poet era):字符串类型
  • 诗人地点 (poet location):字符串类型
  • 诗描述 (poem description):包含多个子特征的列表
    • 属性 (attributes):结构化数据,包含以下字段:
      • 类别 (class):字符串类型
      • 颜色 (color):字符串类型
      • 方向 (dir):字符串类型
      • 面 (face):字符串类型
      • ID (id):字符串类型
      • 语言 (lang):字符串类型
      • 风格 (style):字符串类型
    • 子项 (children):列表,包含多个子特征
      • 属性 (attributes):结构化数据,包含以下字段:
        • 颜色 (color):字符串类型
        • 方向 (dir):字符串类型
        • 面 (face):字符串类型
        • 链接 (href):字符串类型
        • ID (id):字符串类型
        • 语言 (lang):字符串类型
        • 风格 (style):字符串类型
        • 标题 (title):字符串类型
        • 值 (value):字符串类型
      • 子项 (children):列表,包含多个子特征
        • 属性 (attributes):结构化数据,包含以下字段:
          • 类别 (class):字符串类型
          • 颜色 (color):字符串类型
          • 方向 (dir):字符串类型
          • 面 (face):字符串类型
          • 语言 (lang):字符串类型
          • 风格 (style):字符串类型
        • 子项 (children):列表,包含多个子特征
          • 属性 (attributes):结构化数据,包含以下字段:
            • 对齐 (align):字符串类型
            • 面 (face):字符串类型
            • 不换行 (nowrap):字符串类型
          • 名称 (name):字符串类型
          • 父属性 (parentAttributes):结构化数据,包含以下字段:
            • 语言 (lang):字符串类型
            • 风格 (style):字符串类型
          • 大小 (size):整数类型
          • 文本 (text):字符串类型
          • 截断 (truncated):布尔类型
          • 类型 (type):字符串类型
  • 诗语言类型 (poem language type):字符串类型

数据集分割

  • 训练集 (train):
    • 字节数:31435320
    • 示例数:10000

数据集大小

  • 下载大小:0
  • 数据集大小:31435320字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作