PubMedDiabetes|糖尿病研究数据集|文本分类数据集
收藏
- PubMedDiabetes数据集首次发表,由美国国家医学图书馆(NLM)发布,旨在支持糖尿病相关研究的数据分析和机器学习应用。
- PubMedDiabetes数据集首次应用于机器学习竞赛,促进了糖尿病研究领域的算法优化和模型改进。
- PubMedDiabetes数据集被广泛应用于多个学术研究项目,推动了糖尿病相关文献的自动化分析和知识发现。
- PubMedDiabetes数据集的更新版本发布,增加了更多的文献记录和特征,提升了数据集的完整性和应用价值。
- PubMedDiabetes数据集在多个国际会议上被引用,展示了其在糖尿病研究中的重要性和影响力。
- 1PubMed Diabetes DatasetUniversity of California, Irvine · 2014年
- 2A Comparative Study of Machine Learning Algorithms for Predicting Diabetes Using the PubMed Diabetes DatasetIEEE · 2020年
- 3Exploring the PubMed Diabetes Dataset for Predictive ModelingElsevier · 2018年
- 4Feature Selection and Classification of PubMed Diabetes Dataset Using Ensemble MethodsSpringer · 2019年
- 5Deep Learning Approaches for Diabetes Prediction Using PubMed Diabetes DatasetarXiv · 2021年
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
FMA (Free Music Archive)
免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集
OpenDataLab 收录
糖尿病预测数据集
糖尿病相关的医学研究或者健康数据
AI_Studio 收录