five

HiTZ/AbstRCT-ES

收藏
Hugging Face2024-04-09 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/AbstRCT-ES
下载链接
链接失效反馈
官方服务:
资源简介:
AbstRCT-ES是一个西班牙语的医学领域数据集,主要用于论元挖掘任务。该数据集是通过将AbstRCT英文论元挖掘数据集翻译成西班牙语生成的,并使用Easy Label Projection进行标签投影和手动校正。数据集包含多个分割文件,如neoplasm_train、neoplasm_dev、neoplasm_test、glaucoma_test和mixed_test。数据集的标签包括Claim和Premise,分别表示研究中的结论性陈述和支持或攻击其他论元组件的观察或测量。

AbstRCT-ES是一个西班牙语的医学领域数据集,主要用于论元挖掘任务。该数据集是通过将AbstRCT英文论元挖掘数据集翻译成西班牙语生成的,并使用Easy Label Projection进行标签投影和手动校正。数据集包含多个分割文件,如neoplasm_train、neoplasm_dev、neoplasm_test、glaucoma_test和mixed_test。数据集的标签包括Claim和Premise,分别表示研究中的结论性陈述和支持或攻击其他论元组件的观察或测量。
提供机构:
HiTZ
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 语言: 西班牙语 (es)
  • 名称: AbstRCT-ES

数据集内容

  • 数据文件:
    • neoplasm_train: 路径为 es/neoplasm_train-*
    • neoplasm_dev: 路径为 es/neoplasm_dev-*
    • neoplasm_test: 路径为 es/neoplasm_test-*
    • glaucoma_test: 路径为 es/glaucoma_test-*
    • mixed_test: 路径为 es/mixed_test-*

任务类别

  • 任务: 词元分类

标签定义

  • 标签:
    • "O": 0
    • "B-Claim": 1
    • "I-Claim": 2
    • "B-Premise": 3
    • "I-Premise": 4

标签说明

  • Claim: 作者关于研究结果的结论性陈述,在医学领域可能是一个诊断或治疗的主张。
  • Premise: 研究中的观察或测量(事实基础),支持或攻击另一个论证组件,通常是Claim。这些是可信的事实,无需进一步证据。

引用信息

bibtex @misc{yeginbergen2024crosslingual, title={Cross-lingual Argument Mining in the Medical Domain}, author={Anar Yeginbergen and Rodrigo Agerri}, year={2024}, eprint={2301.10527}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作