five

bigbio/ntcir_13_medweb

收藏
Hugging Face2022-12-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bigbio/ntcir_13_medweb
下载链接
链接失效反馈
官方服务:
资源简介:
NTCIR-13 MedWeb(医学自然语言处理用于网页文档)任务要求进行多标签分类,为每条推文分配八种疾病/症状的标签。给定伪推文,输出为八种疾病/症状的正面(Positive:p)或负面(Negative:n)标签。该任务的成果几乎可以直接应用于实际应用的基础引擎。该任务提供了一个跨语言和多标签的语料库,涵盖日语、英语和中文三种语言,并标注了八种标签,如流感、腹泻/胃痛、花粉症、咳嗽/喉咙痛、头痛、发烧、流鼻涕和感冒。此外,该数据集还提供了英语、日语和中文的平行语料库,可用于训练这三种语言之间的翻译模型。
提供机构:
bigbio
原始信息汇总

数据集概述

基本信息

  • 名称: NTCIR-13 MedWeb
  • 语言: 英语、中文、日语
  • 许可证: CC-BY-4.0
  • 多语言支持: 是

数据集描述

  • 主页: NTCIR-13 MedWeb主页
  • 是否公开: 否
  • 是否包含PubMed数据: 否
  • 任务类型: 翻译、文本分类

任务详情

  • 任务描述: 该任务要求对伪推文进行多标签分类,为每条推文分配八种疾病/症状的标签。输出为八种疾病/症状的正负标签(Positive:p 或 Negative:n)。
  • 数据内容: 提供跨语言和多标签的伪推文语料库,涵盖日语、英语和中文,并标注有八种标签,如流感、腹泻/胃痛、花粉症、咳嗽/喉咙痛、头痛、发烧、流鼻涕和感冒。
  • 额外用途: 该数据集还可用于训练英、日、中三种语言之间的翻译模型。

引用信息

@article{wakamiya2017overview, author = {Shoko Wakamiya, Mizuki Morita, Yoshinobu Kano, Tomoko Ohkuma and Eiji Aramaki}, title = {Overview of the NTCIR-13 MedWeb Task}, journal = {Proceedings of the 13th NTCIR Conference on Evaluation of Information Access Technologies (NTCIR-13)}, year = {2017}, url = {http://research.nii.ac.jp/ntcir/workshop/OnlineProceedings13/pdf/ntcir/01-NTCIR13-OV-MEDWEB-WakamiyaS.pdf} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作