2019年8-9月青海大柴旦试验10-100km全球预报数据集|临近空间预报数据集|高空气球数据集
收藏MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
laion/open-access-papers
该数据集包含从CORE(core.ac.uk)收集的开放获取学术论文,涵盖不同学科的出版物。每个数据实例代表一篇学术论文,包含唯一标识符、URL、详细的元数据(如DOI、标题、作者、出版日期等)以及全文的路径(如果可用)。数据集的主要语言是英语,但也可能包含其他语言的论文。数据集以WebDataset格式提供,便于流式处理。
hugging_face 收录
ReClor
逻辑推理是检查、分析和批判性评估论点的重要能力,因为它们以普通语言出现,如法学院招生委员会的定义。 ReClor 是从标准化研究生入学考试的逻辑推理问题中提取的数据集。
OpenDataLab 收录
PIPES
PIPES是一个元数据集,旨在支持元学习研究,通过提供一系列涉及多个数据预处理和分类算法的机器学习实验。该数据集包含了在300个数据集上执行的9,408个管道的结果,并提供了关于管道块、训练和测试时间、预测结果、性能以及可能出现的错误信息。PIPES旨在克服OpenML中管道缺乏多样性和完整性的问题,为元学习社区提供了一个更全面和代表性的数据集。
arXiv 收录
ECNU-SEA/SEA_data
该数据集包含四种类型的文件:原始PDF格式的论文、通过Nougat解析后的mmd文件、爬取的原始评审文本以及处理后的评审JSON文件。数据集来源于OpenReview,包括NeurIPS-2023和ICLR-2024的最新论文及其评审。
hugging_face 收录