five

MichiganNLP/levin_verbs

收藏
Hugging Face2023-06-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MichiganNLP/levin_verbs
下载链接
链接失效反馈
官方服务:
资源简介:
Levins Verb Classes数据集来源于Beth Levin的著作《English Verb Classes And Alternations: A Preliminary Investigation》,并由John M. Lawler从原始索引生成反向索引。该数据集旨在方便用户访问Levin的动词分类。

Levins Verb Classes数据集来源于Beth Levin的著作《English Verb Classes And Alternations: A Preliminary Investigation》,并由John M. Lawler从原始索引生成反向索引。该数据集旨在方便用户访问Levin的动词分类。
提供机构:
MichiganNLP
原始信息汇总

Levins Verb Classes 数据集概述

基本信息

  • 许可证: other
  • 语言: 英语 (en)
  • 名称: Levins Verb Classes

数据来源

  • 数据集源自书籍《English Verb Classes And Alternations: A Preliminary Investigation》,作者为 Beth Levin,由 The University of Chicago Press 于1993年出版。
  • 数据集内容基于 John M. Lawler 生成的反向索引,包括索引 12

使用许可

  • 数据集内容可根据美国版权法的合理使用条款进行使用和共享。
  • 电子形式的存档和再分发需通知 The University of Chicago Press,且不得收取访问费用。
  • 任何基于此索引的出版或未出版作品,需承认《English Verb Classes And Alternations: A Preliminary Investigation》,并建议通知 Beth Levin。
搜集汇总
数据集介绍
main_image_url
构建方式
在计算语言学领域,动词分类研究对于理解语言结构至关重要。Levin动词类别数据集源自Beth Levin的经典著作《英语动词类别与交替:初步调查》,该数据集通过逆向索引技术构建,从John M. Lawler提供的两个文本索引文件中提取并整理而成。这些索引文件基于原始出版物内容生成,旨在数字化呈现Levin对英语动词的系统分类,将动词按照句法行为和语义角色划分为不同类别,为语言资源提供了结构化基础。
特点
该数据集的核心特点在于其系统性和权威性,它涵盖了英语动词的详细分类体系,依据动词的句法交替模式进行组织。每个动词类别均标注了相关的语义角色和句法框架,体现了形式与功能的对应关系。数据集以文本格式呈现,结构清晰,便于计算处理,同时保留了学术著作的严谨性,为自然语言处理任务如动词消歧、句法分析和语义角色标注提供了可靠的理论依据。
使用方法
在自然语言处理应用中,该数据集可作为动词分类的基准资源。研究人员可直接加载文本文件,解析动词类别及其对应信息,用于训练或评估模型在动词相关任务上的性能。它适用于语义角色标注系统的开发、动词交替模式的统计分析,或作为语言学研究的参考语料。使用时应遵循版权声明,确保符合合理使用条款,并在相关工作中引用原始著作以尊重学术贡献。
背景与挑战
背景概述
在计算语言学与自然语言处理领域,动词的语义分类与句法行为研究一直是理解语言结构的关键。Levin动词类别数据集源于Beth Levin于1993年出版的《英语动词类别与交替:初步研究》,由芝加哥大学出版社发行。该数据集系统性地探索了英语动词的语义类别与其句法交替模式之间的关联,旨在揭示动词意义如何制约其句法表现。作为语言资源,它由密歇根大学的John M. Lawler基于原始索引生成反向索引,便于学术访问,对词汇语义学、句法理论及自然语言处理任务如动词消歧与句法解析产生了深远影响,为后续研究提供了基础框架。
当前挑战
该数据集核心挑战在于解决动词语义与句法映射的复杂性,即如何准确分类动词并预测其句法交替行为,这对自然语言理解中的动词角色标注与句法生成至关重要。构建过程中,挑战包括从纸质索引到数字化格式的转换,需确保数据完整性与一致性,同时遵循版权与公平使用条款,限制了大规模自动化处理。此外,原始分类基于1990年代的语言学理论,可能未完全覆盖现代英语的动词演变,这要求后续研究在应用时进行扩展与验证。
常用场景
经典使用场景
在计算语言学和自然语言处理领域,Levin's Verb Classes数据集为动词分类与句法行为研究提供了经典范例。该数据集依据Beth Levin的开创性工作,系统整理了英语动词的类别及其交替模式,广泛应用于动词语义角色标注、句法结构预测等任务。研究者常利用该数据集构建动词分类模型,探索动词与论元结构之间的映射关系,为句法-语义接口的理论建模奠定数据基础。
解决学术问题
该数据集有效解决了动词多义性分析和句法交替模式识别等核心学术问题。通过提供系统化的动词类别体系,它帮助研究者厘清动词在不同句法框架中的行为规律,促进了词汇语义学与计算语言学之间的交叉融合。其意义在于为动词的语义分类提供了可计算的理论框架,推动了基于规则的句法分析向数据驱动的语义理解范式转变,对自然语言处理中的词义消歧和句法解析产生了深远影响。
衍生相关工作
基于该数据集衍生的经典工作包括VerbNet语义资源库的构建,该资源将Levin的动词类别扩展为包含语义角色和句法框架的层次化体系。此外,PropBank语料库的动词框架设计也深受其启发,通过标注动词的论元结构推动了语义角色标注技术的发展。在计算模型方面,该数据集为基于动词类别的句法生成模型、动词隐喻识别研究以及跨语言动词映射分析提供了重要的理论参照和数据基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作