Sleoruiz/disc_cla_segunda
收藏Hugging Face2023-03-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sleoruiz/disc_cla_segunda
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: inputs
struct:
- name: text
dtype: string
- name: prediction
list:
- name: label
dtype: string
- name: score
dtype: float64
- name: prediction_agent
dtype: string
- name: annotation
sequence: string
- name: annotation_agent
dtype: string
- name: multi_label
dtype: bool
- name: explanation
dtype: 'null'
- name: id
dtype: string
- name: metadata
dtype: 'null'
- name: status
dtype: string
- name: event_timestamp
dtype: timestamp[us]
- name: metrics
struct:
- name: text_length
dtype: int64
splits:
- name: train
num_bytes: 30333232
num_examples: 7327
download_size: 15864012
dataset_size: 30333232
---
# Dataset Card for "disc_cla_segunda"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 字段名:文本(text),数据类型:字符串型
- 字段名:输入(inputs),为结构体类型,包含子字段:
- 子字段名:文本(text),数据类型:字符串型
- 字段名:预测结果(prediction),为列表类型,列表元素包含:
- 子字段名:标签(label),数据类型:字符串型
- 子字段名:置信度得分(score),数据类型:64位浮点型(float64)
- 字段名:预测AI智能体(prediction_agent),数据类型:字符串型
- 字段名:标注信息(annotation),为字符串序列类型
- 字段名:标注AI智能体(annotation_agent),数据类型:字符串型
- 字段名:多标签(multi_label),数据类型:布尔型
- 字段名:解释说明(explanation),数据类型:空值
- 字段名:标识符(id),数据类型:字符串型
- 字段名:元数据(metadata),数据类型:空值
- 字段名:状态(status),数据类型:字符串型
- 字段名:事件时间戳(event_timestamp),数据类型:微秒级时间戳(timestamp[us])
- 字段名:指标(metrics),为结构体类型,包含子字段:
- 子字段名:文本长度(text_length),数据类型:64位整型
数据划分:
- 划分名称:训练集(train),占用字节数:30333232,样本数量:7327
下载大小:15864012
数据集总大小:30333232
# 「disc_cla_segunda」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Sleoruiz
原始信息汇总
数据集概述
数据集特征
- text: 数据类型为字符串。
- inputs: 结构化数据,包含子特征:
- text: 数据类型为字符串。
- prediction: 列表类型,包含:
- label: 数据类型为字符串。
- score: 数据类型为浮点数。
- prediction_agent: 数据类型为字符串。
- annotation: 序列类型,数据类型为字符串。
- annotation_agent: 数据类型为字符串。
- multi_label: 数据类型为布尔值。
- explanation: 数据类型为空。
- id: 数据类型为字符串。
- metadata: 数据类型为空。
- status: 数据类型为字符串。
- event_timestamp: 数据类型为时间戳,单位为微秒。
- metrics: 结构化数据,包含子特征:
- text_length: 数据类型为整数。
数据集分割
- train:
- 数据量: 30333232 字节
- 示例数量: 7327
数据集大小
- 下载大小: 15864012 字节
- 数据集大小: 30333232 字节



