TREC|信息检索数据集|研究数据集数据集
收藏
- TREC(文本检索会议)首次由美国国家标准与技术研究院(NIST)和美国国防部高级研究计划局(DARPA)联合举办,标志着文本检索领域的一个重要里程碑。
- TREC首次引入主题跟踪任务,旨在评估系统在处理动态信息流中的表现。
- TREC引入了网页检索任务,这是首次在文本检索会议中专门针对网页数据进行评估。
- TREC增加了问答系统任务,推动了自动问答技术的发展。
- TREC引入了博客检索任务,反映了互联网内容多样化的趋势。
- TREC增加了实时系统任务,强调了对实时信息处理的需求。
- TREC引入了微博检索任务,进一步扩展了其评估范围至社交媒体领域。
- TREC增加了大规模数据检索任务,反映了大数据时代对检索技术的新挑战。
- TREC继续扩展其任务范围,包括了跨语言检索和多模态检索,以适应信息检索技术的多元化发展。
- 1The Text REtrieval Conference (TREC) – A Brief HistoryNational Institute of Standards and Technology (NIST) · 2005年
- 2Overview of the TREC 2019 Deep Learning TrackNational Institute of Standards and Technology (NIST) · 2019年
- 3Overview of the TREC 2018 Common Core TrackNational Institute of Standards and Technology (NIST) · 2018年
- 4Overview of the TREC 2020 Deep Learning TrackNational Institute of Standards and Technology (NIST) · 2020年
- 5Overview of the TREC 2017 Common Core TrackNational Institute of Standards and Technology (NIST) · 2017年
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录