邵武综合农场通讯表
收藏MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
OMIM (Online Mendelian Inheritance in Man)
OMIM是一个包含人类基因和遗传疾病信息的在线数据库。它提供了详细的遗传疾病描述、基因定位、相关文献和临床信息。数据集内容包括疾病名称、基因名称、基因定位、遗传模式、临床特征、相关文献引用等。
www.omim.org 收录
TCM-SD
TCM-SD数据集是首个公开的大规模证型辨识基准,由北京理工大学计算机科学与技术学院创建。该数据集包含54,152条真实世界的临床记录,涵盖148种证型,旨在通过自然语言处理技术推动中医理论的实证研究。数据集的创建过程涉及从网站爬取大量未标记文本,构建中医领域特定的预训练语言模型ZY-BERT。TCM-SD数据集的应用领域主要集中在中医诊断与治疗系统中,特别是证型辨识任务,以解决中医领域数据驱动AI技术的进一步发展需求。
arXiv 收录
Anti-UAV
Anti-UAV数据集由中国科学院大学创建,专注于无人机跟踪研究。该数据集包含318对RGB-T视频,总计超过580,000个手动标注的边界框,适用于长距离无人机跟踪。数据集内容丰富,包括多种场景和光照条件下的视频序列,支持单模态和多模态无人机跟踪。创建过程中,数据集通过精细的标注策略确保高质量。该数据集的应用领域主要集中在无人机监控和跟踪技术的发展,旨在解决无人机在复杂环境中的状态感知问题。
arXiv 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录