five

mbruton/spanish_srl

收藏
Hugging Face2024-01-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mbruton/spanish_srl
下载链接
链接失效反馈
官方服务:
资源简介:
西班牙语语义角色标注数据集,包含分词后的句子及其每个词在句子中的语义角色。数据集分为训练、测试和开发集,用于测试一种特定的动词索引方法。

西班牙语语义角色标注数据集,包含分词后的句子及其每个词在句子中的语义角色。数据集分为训练、测试和开发集,用于测试一种特定的动词索引方法。
提供机构:
mbruton
原始信息汇总

数据集概述

名称: SpanishSRL

语言: 西班牙语

任务类别: 词元分类

数据集大小: 10K<n<100K

数据集结构

数据字段

  • tokens: 字符串序列,表示句子中的词元。
  • tags: 整数序列,表示每个词元的语义角色标签。标签包括多种角色,如"arg0|[agt, cau, exp, src]", "arg1|[ext, loc, pat, tem]"等。
  • ids: 整数,表示句子的唯一标识符。

数据分割

  • train: 包含14328个样本,总字节数为7401018。
  • test: 包含1724个样本,总字节数为876498。
  • dev: 包含1654个样本,总字节数为870737。

数据集创建

来源数据

数据集创建者

  • 数据集由Micaella Bruton创建,作为其硕士论文的一部分。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作