Cora|文本分类数据集|自然语言处理数据集
收藏
- Cora数据集首次发表,作为机器学习和数据挖掘领域的基准数据集,用于评估分类算法在图结构数据上的性能。
- Cora数据集首次应用于图神经网络(GNN)的研究中,标志着其在深度学习领域的应用开始。
- Cora数据集在图卷积网络(GCN)的研究中得到广泛应用,成为图神经网络模型性能评估的重要基准。
- Cora数据集被用于验证多种新型图神经网络架构的有效性,进一步巩固了其在图神经网络研究中的地位。
- 1Mining of Massive DatasetsStanford University · 2014年
- 2Semi-Supervised Classification with Graph Convolutional NetworksUniversity of California, Los Angeles · 2017年
- 3DeepWalk: Online Learning of Social RepresentationsUniversity of Pennsylvania · 2014年
- 4Inductive Representation Learning on Large GraphsStanford University · 2017年
- 5Node2Vec: Scalable Feature Learning for NetworksStanford University · 2016年
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录