five

hltcoe/plaid-shirttt-doc-date

收藏
Hugging Face2024-05-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/hltcoe/plaid-shirttt-doc-date
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了Clueweb09和NeuCLIR1文档的日期信息,用于复现PLAID SHIRTTT论文中的实验。数据集将文档ID按分片划分,并记录了每个文档的创建日期(ISO格式)。

该数据集包含了Clueweb09和NeuCLIR1文档的日期信息,用于复现PLAID SHIRTTT论文中的实验。数据集将文档ID按分片划分,并记录了每个文档的创建日期(ISO格式)。
提供机构:
hltcoe
原始信息汇总

数据集概述

数据集名称

Clueweb09 and NeuCLIR1 document dates for reproducing PLAID SHIRTTT

许可证

MIT

任务类别

  • 文本检索

任务ID

  • 文档检索

多语言性

多语言

源数据集

  • Clueweb09
  • NeuCLIR1

数据集内容

该数据集包含了Clueweb09NeuCLIR1中每个文档的日期,用于重现PLAID SHIRTTT论文(SIGIR 2024接受)中的实验。每个文档的创建日期以ISO格式记录,并附带文档ID。

数据集结构

数据集中的文档ID被分成多个分片,每个分片对应一个文件。

引用信息

若使用本数据集中的日期,请考虑引用以下论文:

bibtex @inproceedings{plaid-shirttt, author = {Dawn Lawrie and Efsun Kayi and Eugene Yang and James Mayfield and and Douglas W. Oard}, title = {PLAID SHIRTTT for Large-Scale Streaming Dense Retrieval}, booktitle = {Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR) (Short Paper)}, year = {2024}, doi = {??} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作