纽约时报每日填字游戏数据集
收藏arXiv2022-05-21 更新2024-06-21 收录
下载链接:
https://github.com/text-machine-lab/xword_benchmark
下载链接
链接失效反馈官方服务:
资源简介:
纽约时报每日填字游戏数据集是由马萨诸塞大学洛厄尔分校计算机科学系创建的一个包含25年(1993-2018)纽约时报每日填字游戏的集合,总计约九千个游戏。该数据集包含多种类型的线索,如历史、事实、词义、同义词/反义词、填空、缩写、前缀/后缀、文字游戏等,以及依赖其他答案的线索。数据集被用于开放域问答任务,旨在通过解决填字游戏中的线索来提高自然语言理解能力。
The New York Times Daily Crossword Puzzle Dataset was created by the Department of Computer Science at the University of Massachusetts Lowell. It encompasses approximately 9,000 daily crossword puzzles spanning 25 years (1993–2018) from The New York Times. The dataset includes a wide range of clue categories, such as historical, factual, lexical meaning, synonym/antonym, fill-in-the-blank, abbreviation, prefix/suffix, wordplay, and clues that rely on other answers in the puzzle. It has been utilized for open-domain question answering tasks, with the objective of enhancing natural language understanding capabilities through solving the clues presented in crossword puzzles.
提供机构:
马萨诸塞大学洛厄尔分校计算机科学系
创建时间:
2022-05-21
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集基于纽约时报每日填字游戏,旨在为NLP研究提供新的基准测试,包含线索-答案对和填字游戏谜题两部分。线索-答案数据集公开提供,分为训练、验证和测试集,并经过后处理优化;而填字游戏谜题因版权限制仅提供日期信息,需通过第三方工具获取。
以上内容由遇见数据集搜集并总结生成



