dstrohmaier/SeCoDa
收藏Hugging Face2023-05-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dstrohmaier/SeCoDa
下载链接
链接失效反馈官方服务:
资源简介:
SeCoDa(Sense Complexity Dataset)是一个用于词义消歧的英文数据集,基于CWIG3G2数据集构建。数据集的主要数据存储在SeCoDa.tsv文件中,包含需要消歧的词汇、其在上下文中的起始和结束位置、上下文句子、选择的词义以及注释。词义来源于《剑桥高级学习者词典》。数据集还包含了一些更新信息,如添加了缺失的条目和修正了注释中的拼写错误。使用该数据集的研究必须引用相关的学术论文。
SeCoDa(Sense Complexity Dataset)是一个用于词义消歧的英文数据集,基于CWIG3G2数据集构建。数据集的主要数据存储在SeCoDa.tsv文件中,包含需要消歧的词汇、其在上下文中的起始和结束位置、上下文句子、选择的词义以及注释。词义来源于《剑桥高级学习者词典》。数据集还包含了一些更新信息,如添加了缺失的条目和修正了注释中的拼写错误。使用该数据集的研究必须引用相关的学术论文。
提供机构:
dstrohmaier
原始信息汇总
数据集概述
数据集名称
- SeCoDa
数据集描述
- SeCoDa 是一个用于词义复杂性分析的数据集。
数据集内容
- 主要数据文件:
SeCoDa.tsv - 数据结构:
-
- 待消歧的词
-
- 词在上下文中的起始偏移
-
- 词在上下文中的结束偏移
-
- 上下文(词出现的句子)
-
- 选定的词义
-
- 注释(包含多词表达信息)
-
数据集语言
- 英语
数据集任务类别
- 词元分类
数据集来源
数据集更新
- 已添加两个缺失的条目并修正了注释中的拼写错误。
数据集许可证
- Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License



