five

NYTWIT

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/NYTWIT
下载链接
链接失效反馈
官方服务:
资源简介:
我们展示了纽约时报单词创新类型数据集或 NYTWIT,它是 2017 年 11 月至 2019 年 3 月期间在纽约时报上发表的 2,500 多个新颖英语单词的集合,并针对其新颖性类别(例如词汇推导、方言变体)进行了手动注释、混合或复合)。我们展示了新颖性类别的非上下文和上下文预测的基线结果,表明即使是最先进的 NLP 系统也有改进的空间。我们希望这个资源能够通过提供一个新词外观的真实环境来证明对语言学家和 NLP 从业者有用。
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
NYTWIT是一个包含2017年11月至2019年3月期间纽约时报中2500多个新颖英语单词的数据集,每个单词都手动标注了新颖性类别。该数据集提供了非上下文和上下文预测的基线结果,旨在帮助语言学家和NLP从业者研究新词在真实环境中的使用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作