five

irds/tripclick

收藏
Hugging Face2023-01-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/irds/tripclick
下载链接
链接失效反馈
官方服务:
资源简介:
`tripclick`数据集是一个由[ir-datasets](https://ir-datasets.com/)提供的大型健康网络搜索引擎日志文件数据集,包含1,523,878个文档,主要用于文本检索任务。该数据集被用于多个相关的训练和验证数据集。

The `tripclick` dataset is a large-scale health web search engine log dataset provided by [ir-datasets](https://ir-datasets.com/). It consists of 1,523,878 documents and is primarily intended for text retrieval tasks. This dataset has been utilized across multiple related training and validation datasets.
提供机构:
irds
原始信息汇总

数据集概述

数据集名称

tripclick

数据提供方

ir-datasets 包提供。

数据内容

  • docs (文档,即语料库); 数量=1,523,878

数据用途

该数据集被用于以下项目:

  • tripclick_train
  • tripclick_train_head
  • tripclick_train_head_dctr
  • tripclick_train_hofstaetter-triples
  • tripclick_train_tail
  • tripclick_train_torso
  • tripclick_val_head_dctr

引用信息

@inproceedings{Rekabsaz2021TripClick, title={TripClick: The Log Files of a Large Health Web Search Engine}, author={Navid Rekabsaz and Oleg Lesota and Markus Schedl and Jon Brassey and Carsten Eickhoff}, year={2021}, booktitle={SIGIR} }

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
tripclick数据集是一个包含1,523,878个文档的大型健康网络搜索引擎日志文件集合,适用于文本检索任务,由ir-datasets包提供,并在SIGIR 2021会议上发表相关研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作