jorgeortizfuentes/spanish_nominal_groups
收藏Hugging Face2023-05-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jorgeortizfuentes/spanish_nominal_groups
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: tokens
sequence: string
- name: prediction
dtype: 'null'
- name: prediction_agent
dtype: 'null'
- name: annotation
list:
- name: end
dtype: int64
- name: label
dtype: string
- name: start
dtype: int64
- name: annotation_agent
dtype: string
- name: vectors
dtype: 'null'
- name: id
dtype: string
- name: metadata
dtype: 'null'
- name: status
dtype: string
- name: event_timestamp
dtype: timestamp[us]
- name: metrics
struct:
- name: annotated
struct:
- name: mentions
list:
- name: capitalness
dtype: string
- name: chars_length
dtype: int64
- name: density
dtype: float64
- name: label
dtype: string
- name: score
dtype: float64
- name: tokens_length
dtype: int64
- name: value
dtype: string
- name: tags
list:
- name: tag
dtype: string
- name: value
dtype: string
- name: predicted
struct:
- name: mentions
sequence: 'null'
- name: tags
sequence: 'null'
- name: text_length
dtype: int64
- name: tokens
list:
- name: capitalness
dtype: string
- name: char_end
dtype: int64
- name: char_start
dtype: int64
- name: custom
dtype: 'null'
- name: idx
dtype: int64
- name: length
dtype: int64
- name: score
dtype: 'null'
- name: tag
dtype: string
- name: value
dtype: string
- name: tokens_length
dtype: int64
splits:
- name: train
num_bytes: 12035700
num_examples: 2613
download_size: 3065295
dataset_size: 12035700
---
# Dataset Card for "spanish_nominal_groups"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
jorgeortizfuentes
原始信息汇总
数据集概述
数据集名称
- 名称: spanish_nominal_groups
数据集特征
- text: 文本内容,数据类型为字符串。
- tokens: 词元序列,数据类型为字符串序列。
- prediction 和 prediction_agent: 预测相关信息,数据类型为空。
- annotation: 注释信息,包含开始位置、结束位置和标签,数据类型分别为整数和字符串。
- annotation_agent: 注释代理,数据类型为字符串。
- vectors 和 metadata: 向量和元数据,数据类型为空。
- id: 唯一标识符,数据类型为字符串。
- status: 状态信息,数据类型为字符串。
- event_timestamp: 事件时间戳,数据类型为微秒级时间戳。
- metrics: 度量信息,包含注释和预测的详细结构,以及文本和词元的长度。
数据集分割
- train: 训练集,包含2613个样本,总大小为12035700字节。
数据集大小
- 下载大小: 3065295字节
- 数据集大小: 12035700字节



