fine-tuned/cmedqav2-c-256-24|医疗健康数据集|机器学习数据集
收藏cmedqav2-c-256-24 Dataset
概述
- 名称: medical information and advice search
- 用途: 支持特定领域嵌入模型开发,用于检索任务
- 语言: 中文
- 许可: Apache-2.0
数据集详情
- 任务类别:
- 特征提取
- 句子相似度
- 标签:
- sentence-transformers
- feature-extraction
- sentence-similarity
- mteb
- Healthcare
- Medicine
- Treatment
- Diagnosis
- Advice
- 大小类别: n<1K
关联模型
- 模型名称: cmedqav2-c-256-24
- 模型链接: cmedqav2-c-256-24
使用方法
-
加载数据集: python from datasets import load_dataset
dataset = load_dataset("fine-tuned/cmedqav2-c-256-24") print(dataset[test][0])
The MaizeGDB
The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。
www.maizegdb.org 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
CWD30
CWD30包含超过219,770张20种杂草和10种作物的高分辨率图像,涵盖了不同的生长阶段、多个观察角度和环境条件。这些图像是从不同地理位置和季节的多样化农业领域收集的,确保了数据集的代表性。
github 收录