CasiMedicos-Arg|医学问答数据集|论证分析数据集
收藏Antidote CasiMedicos Datasets
数据集概述
该数据集基于CasiMedicos项目,该项目由医学专业人员组成的社区,自愿且免费地发布关于Resident Medical Intern考试(MIR)中可能答案的书面解释。这些考试通过多选题问卷评估医学生,有时通过简短的临床案例进行情境化。
数据集内容
- casimedicos-raw: 包含原始MIR考试和西班牙医学医生编写的解释的纯文本文档。
- casimedicos-exp: 对解释部分的标注,将解释中的部分与可能的答案相关联。
- casimedicos-arg: 对论证结构的标注,包括论证组件、关系、话语标记、医疗治疗和诊断。
casimedicos-raw
- 包含2011-2014年、2016年以及2018-2022年的1,561个带注释的问题。
- 选择包含临床案例的问题后,文档数量从1,561减少到622。
- 下载链接: casimedicos-raw
casimedicos-exp
- 基于casimedicos-raw中包含临床案例的文档。
- 手动标注了正确和错误答案解释的开始和结束位置。
- 提供了格式化的数据集: casimedicos-exp-squad-format
引用
-
casimedicos-raw: bibtex @inproceedings{Agerri2023HiTZAntidoteAE, title={HiTZ@Antidote: Argumentation-driven Explainable Artificial Intelligence for Digital Medicine}, author={Rodrigo Agerri and I{~n}igo Alonso and Aitziber Atutxa and Ander Berrondo and Ainara Estarrona and Iker Garc{i}a-Ferrero and Iakes Goenaga and Koldo Gojenola and Maite Oronoz and Igor Perez-Tejedor and German Rigau and Anar Yeginbergenova}, booktitle={SEPLN 2023: 39th International Conference of the Spanish Society for Natural Language Processing.}, year={2023} }
-
casimedicos-exp: bibtex @misc{goenaga2023explanatory, title={Explanatory Argument Extraction of Correct Answers in Resident Medical Exams}, author={Iakes Goenaga and Aitziber Atutxa and Koldo Gojenola and Maite Oronoz and Rodrigo Agerri}, year={2023}, eprint={2312.00567}, archivePrefix={arXiv} }
联系信息
- Rodrigo Agerri (rodrigo.agerri@ehu.eus)

- 1CasiMedicos-Arg: A Medical Question Answering Dataset Annotated with Explanatory Argumentative Structures法国蔚蓝海岸大学,CNRS,Inria,I3S · 2024年
中国区域地面气象要素驱动数据集 v2.0(1951-2024)
中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。
国家青藏高原科学数据中心 收录
中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。
国家海洋科学数据中心 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
Photovoltaic power plant data
包括经纬度、电源板模型、NWP等信息。
github 收录
The Rice Annotation Project Database (RAP-DB)
RAP-DB是一个专注于水稻基因组注释的数据库,提供了水稻基因组的详细注释信息,包括基因结构、功能注释、表达数据等。该数据库旨在为水稻研究者提供一个全面的资源,以促进水稻基因组学和遗传学的研究。
rapdb.dna.affrc.go.jp 收录
