中国2010年林业发展报告2009年各地区森林火灾情况|林业数据集|森林火灾数据集
收藏MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Chinese Multimodal Depression Corpus (CMDC)
CMDC包含半结构化访谈,旨在支持中国主要抑郁症障碍的筛查和评估。这些访谈作为创建自动AI工具的一部分收集,用于采访人员并识别MDD的视觉、声学和文本指示器。
github 收录
IST-3 CT Head Scans
IST-3 CT头部扫描数据集由爱丁堡大学临床脑科学中心创建,包含10,659个CT系列,用于研究颅内动脉钙化的分割。数据集来源于第三届国际中风试验(IST-3),涉及3035名急性缺血性中风患者的非增强CT扫描。数据集创建过程中,通过与模板配准和质量控制,确保了数据的有效性和准确性。该数据集主要用于支持深度学习方法在中风风险评估中的应用,特别是在颅内动脉钙化的自动量化方面。
arXiv 收录
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录