Microsoft Academic Graph|学术研究数据集|知识图谱数据集
收藏
- Microsoft Academic Graph首次发布,作为微软研究院的一项重要成果,旨在提供一个全面、开放的学术研究数据集。
- Microsoft Academic Graph开始与学术界和工业界广泛合作,支持多种学术研究和应用场景,如文献推荐、学术影响力分析等。
- 数据集的规模和覆盖范围进一步扩大,增加了对更多语言和学科的支持,提升了数据集的多样性和全面性。
- Microsoft Academic Graph开始支持机器学习和人工智能领域的研究,成为许多学术论文和研究项目的重要数据源。
- 数据集的更新频率和数据质量得到进一步提升,支持实时数据分析和动态学术网络构建。
- Microsoft Academic Graph与多个国际学术数据库和平台进行整合,进一步扩大了其在全球学术界的影响力。
- 1Microsoft Academic Graph: When experts are not enoughMicrosoft Research · 2015年
- 2A Review of Microsoft Academic Graph and Its Applications in Academic SearchUniversity of Science and Technology of China · 2020年
- 3Exploring the Impact of Microsoft Academic Graph on Research EvaluationUniversity of Cambridge · 2021年
- 4Enhancing Academic Search with Microsoft Academic Graph: A Comparative StudyStanford University · 2022年
- 5Microsoft Academic Graph: A Comprehensive Dataset for Scholarly Big Data AnalysisMassachusetts Institute of Technology · 2023年
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Houston2013, Berlin, Augsburg
本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。
arXiv 收录
ChinaTravel
ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。
arXiv 收录