List (persons with numbers), KTU 4.350|考古学数据集|古代文献数据集
收藏Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
SAVEE
SAVEE(Surrey Audio-Visual Expressed Emotion)数据集包含480个音频和视频文件,由4名男性英语母语者在7种不同的情绪状态下录制。这些情绪包括愤怒、高兴、悲伤、惊讶、恐惧、厌恶和中性。每个文件的时长约为3秒,总时长约为24分钟。该数据集主要用于情感识别研究。
kahlan.eps.surrey.ac.uk 收录
Salinas
Salinas数据集是一个高光谱遥感图像数据集,包含16个波段,覆盖了加利福尼亚州Salinas山谷的农业区域。该数据集主要用于高光谱图像分类和土地覆盖分析。
www.ehu.eus 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
