建设项目用地预审与选址意见书|土地管理数据集|建设项目数据集
收藏MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
海天瑞声-超大规模中文多领域高质量多轮对话语料库
这是一个符合中国人表达习惯的自然对话数据集,共计约1,0000,000轮,上亿级token,包含正式&非正式风格对话,使用偏口语化自然表达。覆盖工作、生活、校园等场景,及金融、教育、娱乐、体育、汽车、科技等领域。在数据集构成上,DOTS-NLP-216包含了对真实场景的对话采集,及高度还原真实场景的模拟对话这两种方式,兼顾分布的代表性、多样性和样本规模。
魔搭社区 收录
CALCE
马里兰大学锂电池数据集 CALCE,用于基于 Python 的锂电池寿命预测(Remaining Useful Life,RUL)和(End Of Life,EOL)。
github 收录
Pavia University
帕维亚大学数据集是一个高光谱图像数据集,由意大利帕维亚市上空的反射光学系统成像光谱仪 (ROSIS-3) 传感器收集。该图像由 610×340 像素组成,具有 115 个光谱带。图像分为 9 类,共 42,776 个标记样本,包括沥青、草地、砾石、树木、金属板、裸土、沥青、砖块和阴影。
OpenDataLab 收录