coref-data/dpr_indiscrim
收藏Hugging Face2024-01-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/coref-data/dpr_indiscrim
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过将`coref-data/dpr_raw`数据集重新格式化为无差别共指格式生成的。数据集包含多个特征字段,如id、text、sentences、coref_chains、genre和meta_data等。数据被分为训练集和测试集,训练集包含1322个样本,测试集包含564个样本。
该数据集是通过将`coref-data/dpr_raw`数据集重新格式化为无差别共指格式生成的。数据集包含多个特征字段,如id、text、sentences、coref_chains、genre和meta_data等。数据被分为训练集和测试集,训练集包含1322个样本,测试集包含564个样本。
提供机构:
coref-data
原始信息汇总
数据集概述
数据集信息
特征
- id: 字符串类型
- text: 字符串类型
- sentences: 列表类型
- end_char: 64位整数类型
- id: 64位整数类型
- speaker: 空类型
- start_char: 64位整数类型
- text: 字符串类型
- tokens: 列表类型
- deprel: 字符串类型
- end_char: 64位整数类型
- feats: 字符串类型
- head: 64位整数类型
- id: 64位整数类型
- lemma: 字符串类型
- start_char: 64位整数类型
- text: 字符串类型
- upos: 字符串类型
- xpos: 字符串类型
- coref_chains: 序列类型,内部为64位整数类型序列
- genre: 字符串类型
- meta_data: 结构类型
- comment: 字符串类型
数据分割
- train:
- 字节数: 2526395
- 样本数: 1322
- test:
- 字节数: 1050530
- 样本数: 564
数据集大小
- 下载大小: 615184 字节
- 数据集大小: 3576925 字节
配置
- default:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为



