coref-data/phrase_detectives_indiscrim_parsed
收藏Hugging Face2024-02-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/coref-data/phrase_detectives_indiscrim_parsed
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: sentences
list:
- name: id
dtype: int64
- name: misc
struct:
- name: parse_tree
dtype: string
- name: speaker
dtype: 'null'
- name: text
dtype: string
- name: tokens
list:
- name: deprel
dtype: string
- name: end_char
dtype: int64
- name: feats
dtype: string
- name: head
dtype: int64
- name: id
dtype: int64
- name: lemma
dtype: string
- name: misc
dtype: string
- name: start_char
dtype: int64
- name: text
dtype: string
- name: upos
dtype: string
- name: xpos
dtype: string
- name: coref_chains
sequence:
sequence:
sequence: int64
- name: id
dtype: string
- name: text
dtype: string
- name: genre
dtype: string
- name: meta_data
struct:
- name: comment
dtype: string
splits:
- name: validation
num_bytes: 9354637
num_examples: 45
- name: test
num_bytes: 3041706
num_examples: 45
download_size: 3017260
dataset_size: 12396343
configs:
- config_name: default
data_files:
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
提供机构:
coref-data
原始信息汇总
数据集概述
数据集特征
- sentences
- id: 数据类型为
int64 - misc
- parse_tree: 数据类型为
string
- parse_tree: 数据类型为
- speaker: 数据类型为
null - text: 数据类型为
string - tokens
- deprel: 数据类型为
string - end_char: 数据类型为
int64 - feats: 数据类型为
string - head: 数据类型为
int64 - id: 数据类型为
int64 - lemma: 数据类型为
string - misc: 数据类型为
string - start_char: 数据类型为
int64 - text: 数据类型为
string - upos: 数据类型为
string - xpos: 数据类型为
string
- deprel: 数据类型为
- id: 数据类型为
- coref_chains: 数据类型为
int64的序列 - id: 数据类型为
string - text: 数据类型为
string - genre: 数据类型为
string - meta_data
- comment: 数据类型为
string
- comment: 数据类型为
数据集分割
- validation
- 字节数: 9354637
- 样本数: 45
- test
- 字节数: 3041706
- 样本数: 45
数据集大小
- 下载大小: 3017260 字节
- 数据集大小: 12396343 字节
配置
- default
- validation: 文件路径为
data/validation-* - test: 文件路径为
data/test-*
- validation: 文件路径为



