irds/tripclick
收藏Hugging Face2023-01-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/irds/tripclick
下载链接
链接失效反馈官方服务:
资源简介:
`tripclick`数据集是一个由[ir-datasets](https://ir-datasets.com/)提供的大型健康网络搜索引擎日志文件数据集,包含1,523,878个文档,主要用于文本检索任务。该数据集被用于多个相关的训练和验证数据集。
The `tripclick` dataset is a large-scale health web search engine log dataset provided by [ir-datasets](https://ir-datasets.com/). It consists of 1,523,878 documents and is primarily intended for text retrieval tasks. This dataset has been utilized across multiple related training and validation datasets.
提供机构:
irds
原始信息汇总
数据集概述
数据集名称
tripclick
数据提供方
由 ir-datasets 包提供。
数据内容
docs(文档,即语料库); 数量=1,523,878
数据用途
该数据集被用于以下项目:
tripclick_traintripclick_train_headtripclick_train_head_dctrtripclick_train_hofstaetter-triplestripclick_train_tailtripclick_train_torsotripclick_val_head_dctr
引用信息
@inproceedings{Rekabsaz2021TripClick, title={TripClick: The Log Files of a Large Health Web Search Engine}, author={Navid Rekabsaz and Oleg Lesota and Markus Schedl and Jon Brassey and Carsten Eickhoff}, year={2021}, booktitle={SIGIR} }
搜集汇总
数据集介绍

背景与挑战
背景概述
tripclick数据集是一个包含1,523,878个文档的大型健康网络搜索引擎日志文件集合,适用于文本检索任务,由ir-datasets包提供,并在SIGIR 2021会议上发表相关研究。
以上内容由遇见数据集搜集并总结生成



