five

WebQueryTable

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/FeiWang96/GTR
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为WebQueryTable,包含了从一家商业搜索引擎的搜索日志中收集的21,113条查询,以及273,816张表格。经过人工评估后,每个查询都获得了一张相关的表格。此外,还提供了表格的标题作为上下文信息。该数据集采用了最初发布的训练集、验证集和测试集的划分方式。其规模涉及273,816张表格和21,113条查询,针对的任务是自然语言表格检索(Nltr)。

This dataset is named WebQueryTable. It contains 21,113 queries and 273,816 tables collected from the search logs of a commercial search engine. After manual evaluation, each query is paired with a relevant table. Additionally, the titles of the tables are provided as contextual information. The dataset adopts the original training, validation, and test set splits released in the initial publication. With a scale of 273,816 tables and 21,113 queries, this dataset is designed for the task of Natural Language Table Retrieval (NLTR).
提供机构:
Commercial search engine
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作