five

dstrohmaier/SeCoDa

收藏
Hugging Face2023-05-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dstrohmaier/SeCoDa
下载链接
链接失效反馈
官方服务:
资源简介:
SeCoDa(Sense Complexity Dataset)是一个用于词义消歧的英文数据集,基于CWIG3G2数据集构建。数据集的主要数据存储在SeCoDa.tsv文件中,包含需要消歧的词汇、其在上下文中的起始和结束位置、上下文句子、选择的词义以及注释。词义来源于《剑桥高级学习者词典》。数据集还包含了一些更新信息,如添加了缺失的条目和修正了注释中的拼写错误。使用该数据集的研究必须引用相关的学术论文。

SeCoDa(Sense Complexity Dataset)是一个用于词义消歧的英文数据集,基于CWIG3G2数据集构建。数据集的主要数据存储在SeCoDa.tsv文件中,包含需要消歧的词汇、其在上下文中的起始和结束位置、上下文句子、选择的词义以及注释。词义来源于《剑桥高级学习者词典》。数据集还包含了一些更新信息,如添加了缺失的条目和修正了注释中的拼写错误。使用该数据集的研究必须引用相关的学术论文。
提供机构:
dstrohmaier
原始信息汇总

数据集概述

数据集名称

  • SeCoDa

数据集描述

  • SeCoDa 是一个用于词义复杂性分析的数据集。

数据集内容

  • 主要数据文件:SeCoDa.tsv
  • 数据结构:
      1. 待消歧的词
      1. 词在上下文中的起始偏移
      1. 词在上下文中的结束偏移
      1. 上下文(词出现的句子)
      1. 选定的词义
      1. 注释(包含多词表达信息)

数据集语言

  • 英语

数据集任务类别

  • 词元分类

数据集来源

数据集更新

  • 已添加两个缺失的条目并修正了注释中的拼写错误。

数据集许可证

  • Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作