five

Sleoruiz/disc_cla_septima-2

收藏
Hugging Face2023-03-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sleoruiz/disc_cla_septima-2
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: text dtype: 'null' - name: inputs struct: - name: comision dtype: string - name: fecha_gaceta dtype: string - name: gaceta_numero dtype: string - name: name dtype: string - name: text dtype: string - name: prediction list: - name: label dtype: string - name: score dtype: float64 - name: prediction_agent dtype: string - name: annotation sequence: string - name: annotation_agent dtype: string - name: multi_label dtype: bool - name: explanation dtype: 'null' - name: id dtype: string - name: metadata dtype: 'null' - name: status dtype: string - name: event_timestamp dtype: timestamp[us] - name: metrics struct: - name: text_length dtype: int64 splits: - name: train num_bytes: 21725404 num_examples: 9432 download_size: 10861388 dataset_size: 21725404 --- # Dataset Card for "disc_cla_septima-2" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息: 特征字段: - 名称: text 数据类型: "null" - 名称: inputs 类型: 结构体 子字段: - 名称: comision(委员会) 数据类型: string - 名称: fecha_gaceta(公报日期) 数据类型: string - 名称: gaceta_numero(公报编号) 数据类型: string - 名称: name(名称) 数据类型: string - 名称: text(文本) 数据类型: string - 名称: prediction 类型: 列表 列表元素为结构体: - 名称: label(标签) 数据类型: string - 名称: score(置信度得分) 数据类型: float64 - 名称: prediction_agent(预测代理) 数据类型: string - 名称: annotation(标注序列) 数据类型: 字符串序列 - 名称: annotation_agent(标注代理) 数据类型: string - 名称: multi_label(多标签模式) 数据类型: bool - 名称: explanation(解释字段) 数据类型: "null" - 名称: id(样本ID) 数据类型: string - 名称: metadata(元数据) 数据类型: "null" - 名称: status(状态) 数据类型: string - 名称: event_timestamp(事件时间戳) 数据类型: timestamp[us] - 名称: metrics(统计指标) 类型: 结构体 子字段: - 名称: text_length(文本长度) 数据类型: int64 数据集划分: - 名称: train(训练集) 字节数: 21725404 样本量: 9432 下载大小: 10861388 数据集总大小: 21725404 --- # 「disc_cla_septima-2」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Sleoruiz
原始信息汇总

数据集概述

数据集名称

  • 名称: disc_cla_septima-2

数据集特征

  • text: 数据类型为null
  • inputs: 结构化数据,包含以下字段:
    • comision: 数据类型为string
    • fecha_gaceta: 数据类型为string
    • gaceta_numero: 数据类型为string
    • name: 数据类型为string
    • text: 数据类型为string
  • prediction: 列表类型,包含以下字段:
    • label: 数据类型为string
    • score: 数据类型为float64
  • prediction_agent: 数据类型为string
  • annotation: 序列类型,数据类型为string
  • annotation_agent: 数据类型为string
  • multi_label: 数据类型为bool
  • explanation: 数据类型为null
  • id: 数据类型为string
  • metadata: 数据类型为null
  • status: 数据类型为string
  • event_timestamp: 数据类型为timestamp[us]
  • metrics: 结构化数据,包含以下字段:
    • text_length: 数据类型为int64

数据集分割

  • train: 包含9432个样本,数据集大小为21725404字节,下载大小为10861388字节。

数据集大小

  • 下载大小: 10861388字节
  • 数据集大小: 21725404字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作