DDI corpus
收藏github2024-04-17 更新2024-05-31 收录
下载链接:
https://github.com/isegura/DDICorpus
下载链接
链接失效反馈官方服务:
资源简介:
DDI corpus是一个包含药理物质和药物-药物相互作用的注释数据集,由María Herrero-Zazo, Isabel Segura-Bedmar, Paloma Martínez, Thierry Declerck等人创建,用于医学和生物信息学研究。
DDI语料库系由María Herrero-Zazo、Isabel Segura-Bedmar、Paloma Martínez、Thierry Declerck等学者共同编纂而成,汇聚了药理物质及其药物间相互作用的详尽注释,旨在服务于医学与生物信息学领域的研究探索。
创建时间:
2019-05-09
原始信息汇总
DDI corpus 数据集概述
数据集基本信息
- 名称: DDI corpus
- 引用要求: 使用本数据集时,需引用以下两篇论文:
- María Herrero-Zazo, Isabel Segura-Bedmar, Paloma Martínez, Thierry Declerck, The DDI corpus: An annotated corpus with pharmacological substances and drug–drug interactions, Journal of Biomedical Informatics, Volume 46, Issue 5, October 2013, Pages 914-920, http://dx.doi.org/10.1016/j.jbi.2013.07.011.
- Isabel Segura-Bedmar, Paloma Martínez, María Herrero Zazo, (2014). Lessons learnt from the DDIExtraction-2013 shared task, Journal of Biomedical Informatics, Vol.51, pp:152-164.
数据集许可
- 许可类型: Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC)
- 使用条件: 用户可以分享和改编本数据集,但需给予原作者信用,且不得用于任何商业目的。
数据集创建者
- 创建机构: Hulat Group at University Carlos III of Madrid
- 联系信息:
- 邮箱: isegura@inf.uc3m.es
- 邮箱: isegurabe@gmail.com
搜集汇总
数据集介绍

构建方式
DDI语料库由Hulat Group在马德里卡洛斯三世大学创建,其构建过程严格遵循生物医学领域的标准,旨在捕捉药物之间的相互作用信息。该语料库通过对大量医学文献进行系统性标注,涵盖了多种药物及其相互作用类型,确保数据的准确性和全面性。
特点
DDI语料库的显著特点在于其专注于药物相互作用(DDI)的标注,涵盖了广泛的药物种类和相互作用类型。此外,该语料库经过严格的同行评审,确保了数据的高质量和可靠性,适用于多种自然语言处理和生物医学信息学任务。
使用方法
DDI语料库可用于药物相互作用检测、药物关系抽取等任务。用户可以通过下载该语料库并遵循CC BY-NC许可协议进行非商业用途的研究。在使用过程中,需引用相关文献以确保学术诚信,并避免任何商业用途。
背景与挑战
背景概述
DDI corpus是由西班牙马德里卡洛斯三世大学的Hulat研究团队创建的一个专门用于药物相互作用(Drug-Drug Interactions, DDI)研究的语料库。该数据集的核心研究问题在于通过自然语言处理技术,识别和分析药物之间的相互作用,从而为药物安全性和有效性提供支持。该语料库的创建始于2013年,主要研究人员包括María Herrero-Zazo、Isabel Segura-Bedmar、Paloma Martínez和Thierry Declerck。其研究成果发表于《Journal of Biomedical Informatics》,并在药物相互作用领域产生了广泛的影响。DDI corpus的发布为药物相互作用的研究提供了宝贵的资源,推动了相关领域的技术进步。
当前挑战
DDI corpus在构建过程中面临了多个挑战。首先,药物相互作用的复杂性和多样性使得数据标注和分类变得极为困难。其次,药物名称和相互作用描述的多样性要求高度专业化的知识,这增加了数据处理的复杂性。此外,确保数据集的高质量和一致性也是一个重要的挑战,因为任何错误都可能对药物安全性和有效性评估产生重大影响。最后,数据集的使用限制(如非商业用途)也限制了其在更广泛领域的应用,这可能阻碍了其潜在的进一步发展和影响力。
常用场景
经典使用场景
DDI corpus数据集在药物相互作用(Drug-Drug Interaction, DDI)领域中具有经典应用,主要用于药物相互作用关系的自动识别与分类。通过该数据集,研究者能够训练和评估自然语言处理(NLP)模型,以从医学文献中提取药物及其相互作用信息,从而辅助药物安全性和有效性的评估。
解决学术问题
DDI corpus数据集解决了药物相互作用自动识别中的关键学术问题,包括如何从非结构化文本中准确提取药物实体及其相互作用关系。该数据集的引入显著推动了生物医学信息学领域的发展,为药物安全性和药物开发提供了重要的技术支持,具有深远的学术意义。
衍生相关工作
基于DDI corpus数据集,衍生了许多相关的经典工作,包括药物相互作用自动提取算法的研究、药物实体识别模型的优化以及药物相互作用分类系统的开发。这些工作不仅推动了NLP技术在生物医学领域的应用,还为药物安全性和药物开发提供了新的研究方向和方法论支持。
以上内容由遇见数据集搜集并总结生成



