mbruton/spanish_srl
收藏Hugging Face2024-01-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mbruton/spanish_srl
下载链接
链接失效反馈官方服务:
资源简介:
西班牙语语义角色标注数据集,包含分词后的句子及其每个词在句子中的语义角色。数据集分为训练、测试和开发集,用于测试一种特定的动词索引方法。
西班牙语语义角色标注数据集,包含分词后的句子及其每个词在句子中的语义角色。数据集分为训练、测试和开发集,用于测试一种特定的动词索引方法。
提供机构:
mbruton
原始信息汇总
数据集概述
名称: SpanishSRL
语言: 西班牙语
任务类别: 词元分类
数据集大小: 10K<n<100K
数据集结构
数据字段
- tokens: 字符串序列,表示句子中的词元。
- tags: 整数序列,表示每个词元的语义角色标签。标签包括多种角色,如"arg0|[agt, cau, exp, src]", "arg1|[ext, loc, pat, tem]"等。
- ids: 整数,表示句子的唯一标识符。
数据分割
- train: 包含14328个样本,总字节数为7401018。
- test: 包含1724个样本,总字节数为876498。
- dev: 包含1654个样本,总字节数为870737。
数据集创建
来源数据
- 数据来源于2009 CoNLL Shared Task。
数据集创建者
- 数据集由Micaella Bruton创建,作为其硕士论文的一部分。



