hltcoe/plaid-shirttt-doc-date
收藏Hugging Face2024-05-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/hltcoe/plaid-shirttt-doc-date
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了Clueweb09和NeuCLIR1文档的日期信息,用于复现PLAID SHIRTTT论文中的实验。数据集将文档ID按分片划分,并记录了每个文档的创建日期(ISO格式)。
该数据集包含了Clueweb09和NeuCLIR1文档的日期信息,用于复现PLAID SHIRTTT论文中的实验。数据集将文档ID按分片划分,并记录了每个文档的创建日期(ISO格式)。
提供机构:
hltcoe
原始信息汇总
数据集概述
数据集名称
Clueweb09 and NeuCLIR1 document dates for reproducing PLAID SHIRTTT
许可证
MIT
任务类别
- 文本检索
任务ID
- 文档检索
多语言性
多语言
源数据集
- Clueweb09
- NeuCLIR1
数据集内容
该数据集包含了Clueweb09和NeuCLIR1中每个文档的日期,用于重现PLAID SHIRTTT论文(SIGIR 2024接受)中的实验。每个文档的创建日期以ISO格式记录,并附带文档ID。
数据集结构
数据集中的文档ID被分成多个分片,每个分片对应一个文件。
引用信息
若使用本数据集中的日期,请考虑引用以下论文:
bibtex @inproceedings{plaid-shirttt, author = {Dawn Lawrie and Efsun Kayi and Eugene Yang and James Mayfield and and Douglas W. Oard}, title = {PLAID SHIRTTT for Large-Scale Streaming Dense Retrieval}, booktitle = {Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR) (Short Paper)}, year = {2024}, doi = {??} }



