PlantFlowerDatasets|植物学数据集|植物养护数据集
收藏数据集概述
植物花卉数据集
- 数据格式:jsonl
- 数据量:5100条
- 内容:涵盖养护、种植、生长、形态、花语、养护知识、养护问答等语料数据
- 更新计划:后续时间会陆续增加数据集
中国植物志数据集
- 数据量:30993条
- 文件大小:62MB
- 数据格式:binidx
- 用途:方便RWKV的炼丹师使用
植物花卉+中国植物志合订本数据集
- 数据量:36033条
- 文件大小:70MB
- 数据格式:bin, idx
数据集特点
- 数据集更新:数据集将持续更新,增加新的数据条目。
- 数据格式优化:所有数据均清洗为支持RWKV Word模型的jsonl格式,并转换为binidx文件,便于直接训练。
- 数据集整合:新增合订本数据集,整合了植物花卉与中国植物志的数据。

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊
reereererreereererreereererreereererreereererreereererreereererreereererreereererreereererreereererreereerer
阿里云天池 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
World Bank - World Governance Indicators
世界银行的世界治理指标(World Governance Indicators, WGI)数据集提供了全球各国在六个治理维度上的评估数据,包括言论和问责、政治稳定和无暴力、政府效率、监管质量、法治以及腐败控制。这些指标基于多个来源的数据,旨在帮助政策制定者和研究人员了解和改善治理质量。
databank.worldbank.org 收录