Sleoruiz/disc_cla_quinta
收藏Hugging Face2023-03-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sleoruiz/disc_cla_quinta
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: inputs
struct:
- name: text
dtype: string
- name: prediction
list:
- name: label
dtype: string
- name: score
dtype: float64
- name: prediction_agent
dtype: string
- name: annotation
sequence: string
- name: annotation_agent
dtype: string
- name: multi_label
dtype: bool
- name: explanation
dtype: 'null'
- name: id
dtype: string
- name: metadata
dtype: 'null'
- name: status
dtype: string
- name: event_timestamp
dtype: timestamp[us]
- name: metrics
struct:
- name: text_length
dtype: int64
splits:
- name: train
num_bytes: 38464874
num_examples: 7507
download_size: 20620936
dataset_size: 38464874
---
# Dataset Card for "disc_cla_quinta"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 字段名:text,数据类型:字符串(string)
- 字段名:inputs,为结构体类型,包含子字段:
- 子字段名:text,数据类型:字符串(string)
- 字段名:prediction,为列表类型,列表元素包含两个子字段:
- 子字段名:label,数据类型:字符串(string)
- 子字段名:score,数据类型:64位浮点数(float64)
- 字段名:prediction_agent,数据类型:字符串(string)
- 字段名:annotation,为字符串序列类型
- 字段名:annotation_agent,数据类型:字符串(string)
- 字段名:multi_label,数据类型:布尔值(bool)
- 字段名:explanation,数据类型:空值(null)
- 字段名:id,数据类型:字符串(string)
- 字段名:metadata,数据类型:空值(null)
- 字段名:status,数据类型:字符串(string)
- 字段名:event_timestamp,数据类型:微秒级时间戳(timestamp[us])
- 字段名:metrics,为结构体类型,包含子字段:
- 子字段名:text_length,数据类型:64位整数(int64)
数据集划分:
- 划分名称:train(训练集),占用字节数:38464874,样本数量:7507
下载大小:20620936
数据集总大小:38464874
---
# "disc_cla_quinta"数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Sleoruiz
原始信息汇总
数据集概述
数据集特征
- text:字符串类型
- inputs:结构类型,包含子特征
- text:字符串类型
- prediction:列表类型,包含子特征
- label:字符串类型
- score:浮点数类型(float64)
- prediction_agent:字符串类型
- annotation:序列类型,字符串
- annotation_agent:字符串类型
- multi_label:布尔类型
- explanation:空值类型
- id:字符串类型
- metadata:空值类型
- status:字符串类型
- event_timestamp:时间戳类型(微秒)
- metrics:结构类型,包含子特征
- text_length:整数类型(int64)
数据集划分
- train:
- num_bytes:38464874字节
- num_examples:7507个样本
数据集大小
- download_size:20620936字节
- dataset_size:38464874字节



