coref-data/phrase_detectives_indiscrim
收藏Hugging Face2024-01-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/coref-data/phrase_detectives_indiscrim
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过重新格式化`coref-data/phrase_detectives_raw`数据集生成的,采用了无差别共指格式。数据集中包含句子、共指链、ID、文本、类型和元数据等特征。数据集分为训练集、验证集和测试集,分别包含695、45和45个示例。
该数据集是通过重新格式化`coref-data/phrase_detectives_raw`数据集生成的,采用了无差别共指格式。数据集中包含句子、共指链、ID、文本、类型和元数据等特征。数据集分为训练集、验证集和测试集,分别包含695、45和45个示例。
提供机构:
coref-data
原始信息汇总
数据集详情
特征
- sentences
- id: 数据类型为
int64 - speaker: 数据类型为
null - text: 数据类型为
string - tokens
- id: 数据类型为
int64 - text: 数据类型为
string
- id: 数据类型为
- id: 数据类型为
- coref_chains: 数据类型为
int64的序列 - id: 数据类型为
string - text: 数据类型为
string - genre: 数据类型为
string - meta_data
- comment: 数据类型为
string
- comment: 数据类型为
数据分割
- train
- 字节数: 43394172.38513514
- 样本数: 695
- validation
- 字节数: 2809694.614864865
- 样本数: 45
- test
- 字节数: 847618
- 样本数: 45
数据大小
- 下载大小: 13119886 字节
- 数据集大小: 47051485.0 字节
配置
- default
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-*
- train: 路径为



