irds/trec-cast_v1_2020|信息检索数据集|学术搜索数据集
收藏数据集概述
数据集名称
trec-cast/v1/2020
数据来源
- 源数据集:
irds/trec-cast_v1
数据内容
queries
(查询): 数量=216qrels
(相关性评估): 数量=40,451docs
数据来自irds/trec-cast_v1
数据用途
该数据集被用于 trec-cast_v1_2020_judged
数据加载示例
python from datasets import load_dataset
queries = load_dataset(irds/trec-cast_v1_2020, queries) for record in queries: record # {query_id: ..., raw_utterance: ..., automatic_rewritten_utterance: ..., manual_rewritten_utterance: ..., manual_canonical_result_id: ..., topic_number: ..., turn_number: ...}
qrels = load_dataset(irds/trec-cast_v1_2020, qrels) for record in qrels: record # {query_id: ..., doc_id: ..., relevance: ..., iteration: ...}
引用信息
@inproceedings{Dalton2020Cast, title={CAsT 2020: The Conversational Assistance Track Overview}, author={Jeffrey Dalton and Chenyan Xiong and Jamie Callan}, booktitle={TREC}, year={2020} }

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
VQA
我们提出了自由形式和开放式视觉问答 (VQA) 的任务。给定图像和关于图像的自然语言问题,任务是提供准确的自然语言答案。反映许多现实世界的场景,例如帮助视障人士,问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域,包括背景细节和底层上下文。因此,与生成通用图像说明的系统相比,在 VQA 上取得成功的系统通常需要对图像和复杂推理有更详细的理解。此外,VQA 适合自动评估,因为许多开放式答案仅包含几个单词或一组封闭的答案,可以以多项选择的形式提供。我们提供了一个数据集包含 100,000 的图像和问题并讨论它提供的信息。提供了许多 VQA 基线,并与人类表现进行了比较。
OpenDataLab 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录