Sleoruiz/disc_cla_septima-2
收藏Hugging Face2023-03-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sleoruiz/disc_cla_septima-2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: 'null'
- name: inputs
struct:
- name: comision
dtype: string
- name: fecha_gaceta
dtype: string
- name: gaceta_numero
dtype: string
- name: name
dtype: string
- name: text
dtype: string
- name: prediction
list:
- name: label
dtype: string
- name: score
dtype: float64
- name: prediction_agent
dtype: string
- name: annotation
sequence: string
- name: annotation_agent
dtype: string
- name: multi_label
dtype: bool
- name: explanation
dtype: 'null'
- name: id
dtype: string
- name: metadata
dtype: 'null'
- name: status
dtype: string
- name: event_timestamp
dtype: timestamp[us]
- name: metrics
struct:
- name: text_length
dtype: int64
splits:
- name: train
num_bytes: 21725404
num_examples: 9432
download_size: 10861388
dataset_size: 21725404
---
# Dataset Card for "disc_cla_septima-2"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征字段:
- 名称: text
数据类型: "null"
- 名称: inputs
类型: 结构体
子字段:
- 名称: comision(委员会)
数据类型: string
- 名称: fecha_gaceta(公报日期)
数据类型: string
- 名称: gaceta_numero(公报编号)
数据类型: string
- 名称: name(名称)
数据类型: string
- 名称: text(文本)
数据类型: string
- 名称: prediction
类型: 列表
列表元素为结构体:
- 名称: label(标签)
数据类型: string
- 名称: score(置信度得分)
数据类型: float64
- 名称: prediction_agent(预测代理)
数据类型: string
- 名称: annotation(标注序列)
数据类型: 字符串序列
- 名称: annotation_agent(标注代理)
数据类型: string
- 名称: multi_label(多标签模式)
数据类型: bool
- 名称: explanation(解释字段)
数据类型: "null"
- 名称: id(样本ID)
数据类型: string
- 名称: metadata(元数据)
数据类型: "null"
- 名称: status(状态)
数据类型: string
- 名称: event_timestamp(事件时间戳)
数据类型: timestamp[us]
- 名称: metrics(统计指标)
类型: 结构体
子字段:
- 名称: text_length(文本长度)
数据类型: int64
数据集划分:
- 名称: train(训练集)
字节数: 21725404
样本量: 9432
下载大小: 10861388
数据集总大小: 21725404
---
# 「disc_cla_septima-2」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Sleoruiz
原始信息汇总
数据集概述
数据集名称
- 名称: disc_cla_septima-2
数据集特征
- text: 数据类型为
null。 - inputs: 结构化数据,包含以下字段:
- comision: 数据类型为
string。 - fecha_gaceta: 数据类型为
string。 - gaceta_numero: 数据类型为
string。 - name: 数据类型为
string。 - text: 数据类型为
string。
- comision: 数据类型为
- prediction: 列表类型,包含以下字段:
- label: 数据类型为
string。 - score: 数据类型为
float64。
- label: 数据类型为
- prediction_agent: 数据类型为
string。 - annotation: 序列类型,数据类型为
string。 - annotation_agent: 数据类型为
string。 - multi_label: 数据类型为
bool。 - explanation: 数据类型为
null。 - id: 数据类型为
string。 - metadata: 数据类型为
null。 - status: 数据类型为
string。 - event_timestamp: 数据类型为
timestamp[us]。 - metrics: 结构化数据,包含以下字段:
- text_length: 数据类型为
int64。
- text_length: 数据类型为
数据集分割
- train: 包含9432个样本,数据集大小为21725404字节,下载大小为10861388字节。
数据集大小
- 下载大小: 10861388字节
- 数据集大小: 21725404字节



