five

Chinese Medical Corpus

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/scienceasdf/medical-books
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个大规模语料库,它来源于医学教材和在线医疗问答论坛,旨在提取疾病提及信息。该数据集包含了从用户查询日志中提取的10万条疾病提及记录。它汇集了来自14本医学教材以及多个在线论坛的数据。该数据集的主要任务是提取疾病提及。

This dataset is a large-scale corpus sourced from medical textbooks and online medical Q&A forums, targeting disease mention extraction. It contains 100,000 disease mention records extracted from user query logs, and aggregates data from 14 medical textbooks and multiple online forums. The primary task of this dataset is disease mention extraction.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作