five

DDI corpus

收藏
github2020-01-09 更新2024-05-31 收录
下载链接:
https://github.com/rezacsedu/DDICorpus
下载链接
链接失效反馈
官方服务:
资源简介:
DDI语料库:一个包含药理学物质和药物相互作用的注释语料库。

DDI Corpus: An annotated corpus containing pharmacological substances and drug-drug interactions.
创建时间:
2019-05-09
原始信息汇总

数据集引用信息

引用文献1

  • 作者:María Herrero-Zazo, Isabel Segura-Bedmar, Paloma Martínez, Thierry Declerck
  • 标题:The DDI corpus: An annotated corpus with pharmacological substances and drug–drug interactions
  • 期刊:Journal of Biomedical Informatics
  • 卷期:Volume 46, Issue 5
  • 发表时间:October 2013
  • 页码:Pages 914-920
  • DOI:http://dx.doi.org/10.1016/j.jbi.2013.07.011

引用文献2

  • 作者:Isabel Segura-Bedmar, Paloma Martínez, María Herrero Zazo
  • 标题:Lessons learnt from the DDIExtraction-2013 shared task
  • 期刊:Journal of Biomedical Informatics
  • 卷期:Vol.51
  • 发表时间:2014
  • 页码:pp:152-164
搜集汇总
数据集介绍
main_image_url
构建方式
DDI corpus的构建是基于药物-药物相互作用(DDI)的文本挖掘需求,该数据集通过系统的文献调研和专家标注,收集整理了包含药理学物质和药物-药物相互作用的注释文本。构建过程中,研究团队对大量生物医学文献进行了筛选,并利用专业知识和自然语言处理技术,对文献中的药物及其相互作用进行标注,确保了数据集的质量和可靠性。
特点
该数据集显著的特点在于其专业性和详尽的标注信息。DDI corpus包含了丰富的药物实体及其相互作用关系的实例,为药物相互作用研究提供了宝贵的语料资源。此外,数据集的构建遵循严格的标注标准,使得数据集在研究领域内具有较高的参考价值。每一条记录都详细标注了药物名称、相互作用类型和上下文信息,极大地促进了相关任务的自动化处理。
使用方法
使用DDI corpus时,用户应首先确保遵守数据使用规范,并在研究成果中引用相关论文。数据集可通过GitHub获取,用户可以将其应用于药物-药物相互作用关系的抽取、文本挖掘和自然语言处理等研究领域。此外,数据集的使用还涉及到数据预处理、特征工程和模型训练等步骤,用户需要具备相应的数据处理能力,以保证研究结果的准确性和有效性。
背景与挑战
背景概述
DDI corpus数据集,由María Herrero-Zazo、Isabel Segura-Bedmar、Paloma Martínez和Thierry Declerck等研究人员于2013年创建,是生物医药信息学领域的重要资源。该数据集专注于药物-药物相互作用(DDI)的标注,提供了丰富的药物实体及其相互作用关系的实例,旨在推动药物相互作用关系自动提取的研究。DDI corpus的构建,不仅为自然语言处理和文本挖掘领域提供了研究基础,也为药物安全监测和临床决策支持系统的研究与开发提供了有力支撑,对相关领域产生了深远的影响。
当前挑战
DDI corpus在构建和应用过程中面临的挑战主要包括:1) 领域问题挑战,如药物实体识别和DDI关系提取的复杂性,需要高度专业的领域知识和先进的文本挖掘技术;2) 构建挑战,包括数据标注的一致性和准确性,以及如何处理大量非结构化文本数据以构建高质量的数据集。这些挑战促使研究人员不断探索更为高效、准确的药物相互作用信息提取方法,以促进生物医药信息学的进步。
常用场景
经典使用场景
在药物信息学研究领域,DDI corpus作为一项基础资源,其经典使用场景主要在于为自然语言处理任务提供训练与测试的基准。该数据集含有药物及其相互作用的标注信息,可供研究者进行药物-药物相互作用关系的识别与提取,从而促进药物安全性的研究。
衍生相关工作
DDI corpus的构建不仅推动了药物相互作用信息提取的研究,还衍生了诸多相关工作,如药物知识图谱的构建、药物安全信号的监测以及基于文本挖掘的药物再利用研究等,为药物信息学及相关领域的学术探索提供了丰富的资源和启示。
数据集最近研究
最新研究方向
在药物信息学领域,DDI corpus作为药物-药物相互作用的数据集,近期研究方向主要聚焦于深度学习技术在药物相互作用预测中的应用。该数据集的构建为研究药物间相互作用提供了宝贵的资源,近期研究不仅涉及药物相互作用的自动提取和分类,亦关注于提升模型的泛化能力和准确度。此外,随着药物安全性的重视程度日益增加,该数据集在药物警戒和个性化医疗领域的影响愈发显著,为相关研究的深入提供了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作