AStitchInLanguageModels
收藏arXiv2021-09-10 更新2024-06-21 收录
下载链接:
https://github.com/H-TayyarMadabushi/AStitchInLanguageModels
下载链接
链接失效反馈官方服务:
资源简介:
AStitchInLanguageModels数据集由谢菲尔德大学计算机科学系创建,包含4558个英语例子和1872个葡萄牙语例子,总计6430个条目。该数据集专注于多词表达(MWEs)的习语性,提供了自然发生的句子及其上下文,以及对MWEs的细粒度分类,包括组合意义、习语意义、专有名词和“元用法”。数据集旨在评估语言模型在检测和表示习语性方面的能力,特别关注零样本、单样本和小样本学习场景。该数据集的应用领域包括情感分析和机器翻译等分类和序列到序列任务,旨在解决语言模型在处理习语性MWEs时的局限性。
提供机构:
谢菲尔德大学计算机科学系
创建时间:
2021-09-10



