HiTZ/AbstRCT-ES
收藏Hugging Face2024-04-09 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/AbstRCT-ES
下载链接
链接失效反馈官方服务:
资源简介:
AbstRCT-ES是一个西班牙语的医学领域数据集,主要用于论元挖掘任务。该数据集是通过将AbstRCT英文论元挖掘数据集翻译成西班牙语生成的,并使用Easy Label Projection进行标签投影和手动校正。数据集包含多个分割文件,如neoplasm_train、neoplasm_dev、neoplasm_test、glaucoma_test和mixed_test。数据集的标签包括Claim和Premise,分别表示研究中的结论性陈述和支持或攻击其他论元组件的观察或测量。
AbstRCT-ES是一个西班牙语的医学领域数据集,主要用于论元挖掘任务。该数据集是通过将AbstRCT英文论元挖掘数据集翻译成西班牙语生成的,并使用Easy Label Projection进行标签投影和手动校正。数据集包含多个分割文件,如neoplasm_train、neoplasm_dev、neoplasm_test、glaucoma_test和mixed_test。数据集的标签包括Claim和Premise,分别表示研究中的结论性陈述和支持或攻击其他论元组件的观察或测量。
提供机构:
HiTZ
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 语言: 西班牙语 (es)
- 名称: AbstRCT-ES
数据集内容
- 数据文件:
neoplasm_train: 路径为es/neoplasm_train-*neoplasm_dev: 路径为es/neoplasm_dev-*neoplasm_test: 路径为es/neoplasm_test-*glaucoma_test: 路径为es/glaucoma_test-*mixed_test: 路径为es/mixed_test-*
任务类别
- 任务: 词元分类
标签定义
- 标签:
- "O": 0
- "B-Claim": 1
- "I-Claim": 2
- "B-Premise": 3
- "I-Premise": 4
标签说明
- Claim: 作者关于研究结果的结论性陈述,在医学领域可能是一个诊断或治疗的主张。
- Premise: 研究中的观察或测量(事实基础),支持或攻击另一个论证组件,通常是Claim。这些是可信的事实,无需进一步证据。
引用信息
bibtex @misc{yeginbergen2024crosslingual, title={Cross-lingual Argument Mining in the Medical Domain}, author={Anar Yeginbergen and Rodrigo Agerri}, year={2024}, eprint={2301.10527}, archivePrefix={arXiv}, primaryClass={cs.CL} }



