five

GAIC

收藏
arXiv2025-09-30 收录
下载链接:
https://tianchi.aliyun.com/competition/entrance/531852
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个经过脱敏处理的医疗文本竞赛数据集,其中所有的文字均被数字替代。它包含了17个标签的30,000个样本的多标签分类数据集。此外,该数据集融合了初赛和半决赛的匹配数据集,并移除了一些标签。规模上,数据集包含了30,000个样本,任务类型为多标签文本分类。

This dataset is a de-identified medical text competition dataset, where all original textual content has been replaced with digits. It is a multi-label text classification dataset that includes 30,000 samples annotated with 17 labels. Additionally, this dataset integrates the matched datasets from both the preliminary and semi-final rounds, with some labels removed. In terms of scale, the dataset contains 30,000 samples, and the task falls under multi-label text classification.
提供机构:
Aliyun Tianchi
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作