five

CLEFeHealth, TREC 2017 Precision Medicine Track, TREC 2016 Clinical Decision Support Track

收藏
github2024-04-08 更新2024-05-31 收录
下载链接:
https://github.com/Isminoula/IR-datasets
下载链接
链接失效反馈
官方服务:
资源简介:
CLEFeHealth:包含医疗健康相关的搜索任务数据集。TREC 2017 Precision Medicine Track:用于精确医疗的生物医学文章和临床试验数据集。TREC 2016 Clinical Decision Support Track:用于临床决策支持的全文生物医学文章数据集。

CLEFeHealth: A dataset encompassing search tasks related to healthcare and medicine. TREC 2017 Precision Medicine Track: A collection of biomedical articles and clinical trials datasets aimed at precision medicine. TREC 2016 Clinical Decision Support Track: A dataset of full-text biomedical articles designed to support clinical decision-making.
创建时间:
2018-10-22
原始信息汇总

数据集概述

CLEFeHealth

  • 年份: 2018, 2016, 2013-2015
  • 数据集内容:
    • 2018: Common crawl 数据集,用于消费者健康搜索。
    • 2016: ClueWeb 12 B13 数据集,需获取免费许可证。
    • 2013-2015: 包含来自多个在线来源的医疗相关文档,如Health On the Net组织认证网站和知名医疗站点。

TREC 2017 Precision Medicine Track

  • 数据集内容:
    • 生物医学文章: 主要来自MEDLINE/PubMed的摘要,以及AACR和ASCO会议的摘要。
    • 临床试验: 来自ClinicalTrials.gov。

TREC 2016 Clinical Decision Support Track

  • 数据集内容:
    • 文档: 使用PubMed Central的开放获取子集,包含1.25百万篇文章。

TREC Novelty Tracks

  • 数据集要求: 需要购买AQUAINT文档集合。

TREC-9 Filtering Track

  • 数据集内容: OHSUMED测试集合,包含MEDLINE的标题和/或摘要,涉及270种医学期刊。

LETOR from Microsoft

  • 数据集内容: 包含OHSUMED数据集合和**.gov**数据集合的标准特征和相关性判断。

TREC Total Recall track 2015,2016

  • 数据集内容: 用于研究如何在最小人力投入下尽可能找到所有相关文档。

Reuters Corpus Volume I (RCV1)

  • 数据集内容: 用于研究高召回检索的非平稳Thompson采样扩展。

TREC 2010 Legal Track

  • 数据集内容: 用于法律领域的相关性判断。

以上数据集主要用于信息检索和相关性判断的研究,涵盖了医疗、生物医学、法律等多个领域。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建方式主要基于多个权威医学和健康相关资源的整合。CLEFeHealth数据集通过汇集来自Health On the Net组织认证网站、Genetics Home Reference、ClinicalTrial.gov等多个在线医疗数据库的文档,形成了一个涵盖广泛医疗主题的文档集合。TREC 2017 Precision Medicine Track则利用了MEDLINE/PubMed的2017年快照,并加入了AACR和ASCO会议的摘要,以提供精准医学相关的科学文献。TREC 2016 Clinical Decision Support Track则使用了PubMed Central的开放获取子集,确保了数据集的时效性和一致性。
特点
该数据集的主要特点在于其广泛性和专业性。CLEFeHealth数据集不仅涵盖了多种医疗主题,还确保了文档的多样性和权威性。TREC 2017 Precision Medicine Track的数据集特别关注精准医学领域,提供了与患者治疗和临床试验相关的详细信息。TREC 2016 Clinical Decision Support Track的数据集则专注于临床决策支持,提供了与电子健康记录相关的全文医学文献,适合用于解决具体的临床问题。
使用方法
该数据集适用于多种信息检索和数据分析任务。对于CLEFeHealth数据集,用户可以利用其丰富的医疗文档进行消费者健康搜索和相关性评估。TREC 2017 Precision Medicine Track的数据集适合用于开发和测试精准医学相关的信息检索系统,特别是那些需要从科学文献和临床试验中提取相关信息以支持患者治疗的系统。TREC 2016 Clinical Decision Support Track的数据集则适合用于构建和评估临床决策支持系统,帮助医疗专业人员从大量文献中快速找到与患者情况相关的信息。
背景与挑战
背景概述
CLEFeHealth、TREC 2017 Precision Medicine Track 和 TREC 2016 Clinical Decision Support Track 数据集是由多个国际研究机构和组织共同开发的重要资源,旨在推动健康信息检索和临床决策支持领域的研究。CLEFeHealth 数据集自2013年起由 Khresmoi 项目提供,涵盖了广泛的医疗主题,主要来源于健康相关网站和数据库。TREC 2017 Precision Medicine Track 数据集则聚焦于精准医学,提供了从 PubMed 和 ClinicalTrials.gov 获取的生物医学文章和临床试验数据,旨在帮助研究人员检索与患者治疗相关的文献和试验。TREC 2016 Clinical Decision Support Track 数据集则基于 PubMed Central 的开放获取子集,专注于通过检索全文本生物医学文献来支持临床决策。这些数据集的创建和维护,极大地促进了健康信息检索和临床决策支持领域的研究进展。
当前挑战
这些数据集在构建和应用过程中面临多项挑战。首先,CLEFeHealth 数据集的构建涉及从多个在线来源收集医疗相关文档,确保数据的质量和多样性是一个重要挑战。其次,TREC 2017 Precision Medicine Track 数据集需要从庞大的生物医学文献中精确检索与患者治疗相关的文章和临床试验,这对检索算法的准确性和效率提出了高要求。TREC 2016 Clinical Decision Support Track 数据集则需要在海量的生物医学文献中快速定位与临床问题相关的信息,这对信息检索系统的性能和响应速度构成了挑战。此外,所有这些数据集都需要确保数据的安全性和隐私保护,特别是在处理患者信息时,必须严格遵守相关法律法规。
常用场景
经典使用场景
CLEFeHealth、TREC 2017 Precision Medicine Track 和 TREC 2016 Clinical Decision Support Track 数据集在信息检索领域中具有广泛的应用。这些数据集主要用于评估和优化检索系统的性能,特别是在医疗健康领域。例如,CLEFeHealth 数据集通过提供医疗相关的文档集合,支持消费者健康搜索任务,帮助用户从海量信息中快速找到所需的医疗资源。TREC 2017 Precision Medicine Track 数据集则聚焦于精准医疗,通过检索生物医学文章和临床试验,帮助医生为患者找到最适合的治疗方案。TREC 2016 Clinical Decision Support Track 数据集则用于临床决策支持,通过检索与电子健康记录相关的全文文献,辅助医生进行诊断和治疗决策。
衍生相关工作
基于这些数据集,研究者们开发了多种创新性的检索算法和模型,推动了信息检索领域的技术进步。例如,CLEFeHealth 数据集的广泛应用催生了多种消费者健康搜索算法,提升了用户在健康信息检索中的体验。TREC 2017 Precision Medicine Track 数据集的研究则促进了精准医疗检索技术的发展,特别是在生物医学文献和临床试验的检索方面,涌现了多种高效的检索模型。TREC 2016 Clinical Decision Support Track 数据集的研究则推动了临床决策支持系统的智能化,开发了多种基于自然语言处理的文本分析技术,提升了临床信息的检索效率和准确性。这些衍生工作不仅丰富了信息检索领域的研究成果,也为医疗健康领域的智能化应用提供了技术支持。
数据集最近研究
最新研究方向
在医疗信息检索领域,CLEFeHealth、TREC 2017 Precision Medicine Track和TREC 2016 Clinical Decision Support Track数据集的研究方向主要集中在精准医疗和临床决策支持系统的开发与优化。这些数据集通过提供丰富的医学文献和临床试验数据,推动了基于患者特异性信息的个性化治疗方案的研究。特别是在TREC 2017 Precision Medicine Track中,研究者们致力于从PubMed和ClinicalTrials.gov等数据库中检索出与特定患者病情相关的生物医学文章和临床试验,以实现更精准的医疗决策。此外,TREC 2016 Clinical Decision Support Track则聚焦于从PubMed Central的开放获取子集中提取与电子健康记录(EHR)相关的全文文献,以支持临床医生在诊断和治疗过程中的信息需求。这些研究不仅提升了医疗信息检索的效率和准确性,还为推动精准医疗和临床决策支持系统的发展提供了重要的数据基础和方法论支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作