bigbio/mediqa_rqe

Name: bigbio/mediqa_rqe
Creator: bigbio
Published: 2022-12-22 15:45:33
License: 暂无描述

Hugging Face2022-12-22 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/bigbio/mediqa_rqe

下载链接

链接失效反馈

官方服务：

资源简介：

--- language: - en bigbio_language: - English license: unknown multilinguality: monolingual bigbio_license_shortname: UNKNOWN pretty_name: MEDIQA RQE homepage: https://sites.google.com/view/mediqa2019 bigbio_pubmed: False bigbio_public: True bigbio_tasks: - TEXT_PAIRS_CLASSIFICATION --- # Dataset Card for MEDIQA RQE ## Dataset Description - **Homepage:** https://sites.google.com/view/mediqa2019 - **Pubmed:** False - **Public:** True - **Tasks:** TXT2CLASS The MEDIQA challenge is an ACL-BioNLP 2019 shared task aiming to attract further research efforts in Natural Language Inference (NLI), Recognizing Question Entailment (RQE), and their applications in medical Question Answering (QA). Mailing List: https://groups.google.com/forum/#!forum/bionlp-mediqa The objective of the RQE task is to identify entailment between two questions in the context of QA. We use the following definition of question entailment: “a question A entails a question B if every answer to B is also a complete or partial answer to A” [1] [1] A. Ben Abacha & D. Demner-Fushman. “Recognizing Question Entailment for Medical Question Answering”. AMIA 2016. ## Citation Information ``` @inproceedings{MEDIQA2019, author = {Asma {Ben Abacha} and Chaitanya Shivade and Dina Demner{-}Fushman}, title = {Overview of the MEDIQA 2019 Shared Task on Textual Inference, Question Entailment and Question Answering}, booktitle = {ACL-BioNLP 2019}, year = {2019} } ```

--- 语言： - 英语 BigBio数据集语言： - 英语许可证：未知多语言属性：单语言 BigBio数据集短许可证名：UNKNOWN 友好名称：MEDIQA RQE 主页：https://sites.google.com/view/mediqa2019 BigBio数据集PubMed关联：否 BigBio数据集公开状态：是 BigBio数据集任务： - 文本对分类（TEXT_PAIRS_CLASSIFICATION） --- # MEDIQA RQE 数据集卡片 ## 数据集描述 - **主页**：https://sites.google.com/view/mediqa2019 - **PubMed关联**：否 - **公开状态**：是 - **任务**：文本到分类（TXT2CLASS） MEDIQA挑战赛是ACL-BioNLP 2019共享任务，旨在推动自然语言推理（Natural Language Inference, NLI）、问题蕴涵识别（Recognizing Question Entailment, RQE）及其在医疗问答（Medical Question Answering, QA）领域的应用研究。邮件列表：https://groups.google.com/forum/#!forum/bionlp-mediqa RQE任务的目标是识别问答场景下两个问题之间的蕴涵关系。我们采用如下问题蕴涵定义：“若问题B的所有答案同时也是问题A的完整或部分答案，则问题A蕴涵问题B”[1] [1] A. Ben Abacha 与 D. Demner-Fushman. 《用于医疗问答的问题蕴涵识别》. AMIA 2016. ## 引用信息 @inproceedings{MEDIQA2019, author = {Asma Ben Abacha、Chaitanya Shivade、Dina Demner-Fushman}, title = {MEDIQA 2019共享任务：文本推理、问题蕴涵与问答综述}, booktitle = {ACL-BioNLP 2019}, year = {2019} }

提供机构：

bigbio

原始信息汇总

数据集卡片 for MEDIQA RQE

数据集描述

主页: https://sites.google.com/view/mediqa2019
是否公开: 是
任务类型: 文本对分类

MEDIQA 挑战是 ACL-BioNLP 2019 共享任务，旨在吸引更多研究努力于自然语言推理（NLI）、识别问题蕴含（RQE）及其在医学问答（QA）中的应用。

RQE 任务的目标是识别问答情境中两个问题之间的蕴含关系。我们使用以下定义：“如果对问题 B 的每个答案也是对问题 A 的完整或部分答案，则问题 A 蕴含问题 B” [1] [1] A. Ben Abacha & D. Demner-Fushman. “Recognizing Question Entailment for Medical Question Answering”. AMIA 2016.

引用信息

@inproceedings{MEDIQA2019, author = {Asma {Ben Abacha} and Chaitanya Shivade and Dina Demner-Fushman}, title = {Overview of the MEDIQA 2019 Shared Task on Textual Inference, Question Entailment and Question Answering}, booktitle = {ACL-BioNLP 2019}, year = {2019} }

搜集汇总

数据集介绍

构建方式

MEDIQA RQE数据集是在ACL-BioNLP 2019共享任务框架下构建的，旨在推动自然语言推理（NLI）、问题蕴含识别（RQE）及其在医学问答中的应用研究。该数据集通过精心的文本对分类任务设计，搜集并标注了大量的医学问题对，以训练和评估模型在问题蕴含关系识别方面的性能。

特点

本数据集具有领域专业性，专注于医学问答领域的问题蕴含识别任务，其独特之处在于采用了严格的定义标准来确定问题间的蕴含关系。此外，数据集为单语种英语，提供了充足的数据资源以供研究之用，且作为公开数据集，为学术界的广泛研究提供了便利。

使用方法

用户可通过访问MEDIQA RQE的官方网站获取数据集详情和资源。使用该数据集时，研究者应当遵循数据标注的规范和任务要求，针对文本对分类任务进行模型训练和评估。同时，建议用户在研究和引用时遵循数据集的引用规范，以尊重数据集创建者的知识产权和贡献。

背景与挑战

背景概述

MEDIQA RQE数据集，全称为Medical Question Answering Recognizing Question Entailment，是在ACL-BioNLP 2019年会上提出的一项共享任务，旨在推动自然语言推理（NLI）和识别问题蕴含（RQE）在医学问答（QA）领域的研究。该数据集由Asma Ben Abacha、Chaitanya Shivade和Dina Demner-Fushman等研究人员创建，核心研究问题是在医学问答场景中，判断两个问题之间的蕴含关系。自提出以来，该数据集对医学自然语言处理领域产生了显著影响，推动了相关技术和应用的发展。

当前挑战

MEDIQA RQE数据集在构建过程中遇到的挑战主要包括：1）医学问答领域的问题蕴含判断标准较为主观，需要精确界定问题之间的逻辑关系；2）数据集的构建需要大量专业知识，确保问题及其蕴含关系的准确性和可靠性；3）在任务执行过程中，如何有效处理医学语言中的专业术语和同义词问题，是提高模型性能的关键挑战。此外，所解决的领域问题，即在医学问答中准确识别问题之间的蕴含关系，对于提升医学问答系统的准确性和实用性具有重要意义。

常用场景

经典使用场景

在医学问答系统的研究领域，MEDIQA RQE数据集被广泛用于训练模型以识别问题之间的蕴含关系。该数据集通过提供一对问题，并要求模型判断其中一个问题是否能够蕴含另一个问题，即一个问题的所有答案是否也能回答另一个问题，从而成为评估和提升自然语言处理能力的重要资源。

实际应用

在实际应用中，MEDIQA RQE数据集的应用不仅限于学术研究，还拓展到了医疗健康领域的咨询服务、自动问答系统以及智能医疗辅助系统中，为医生和患者提供了更加精准和高效的交流方式。

衍生相关工作

基于MEDIQA RQE数据集的研究成果，衍生出了一系列相关工作，包括但不限于改进自然语言处理模型以适应医学领域的特定需求，以及开发新的评估指标来更全面地衡量模型在医学问答任务中的性能。这些工作进一步推动了医学信息学的跨学科研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集