USDA Food Composition Databases|食物营养数据集|数据库数据集
收藏
- USDA首次发布了《美国农业部食品成分数据库》,为食品营养成分的科学研究提供了基础数据支持。
- USDA更新了数据库,引入了更多食品种类和详细的营养成分信息,提升了数据集的全面性和准确性。
- 数据库进一步扩展,增加了对有机食品和特殊饮食需求食品的营养成分分析,满足了不同用户群体的需求。
- USDA推出了在线版本的《USDA食品成分数据库》,用户可以通过网络直接访问和查询数据,极大地方便了数据的使用和共享。
- 数据库进行了重大更新,引入了新的数据分析工具和可视化功能,增强了用户对食品营养成分的理解和应用。
- USDA继续更新和维护数据库,确保数据的时效性和准确性,同时增加了对新兴食品和营养成分的研究数据。
- 1USDA Food Composition Databases: An Overview and AnalysisUnited States Department of Agriculture · 2015年
- 2Nutrient Intake and Dietary Patterns of US Adults: Analysis Using USDA Food Composition DatabasesAmerican Society for Nutrition · 2018年
- 3Application of USDA Food Composition Databases in Nutritional Epidemiology ResearchNational Institutes of Health · 2020年
- 4Validation of Nutrient Intake Estimates Using USDA Food Composition DatabasesUniversity of North Carolina at Chapel Hill · 2019年
- 5Impact of Food Processing on Nutrient Composition: Insights from USDA Food Composition DatabasesFrontiers in Nutrition · 2021年
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
RFUAV
RFUAV数据集是由浙江科技大学信息科学与工程学院开发的高质量原始射频数据集,包含37种不同无人机的约1.3 TB原始频率数据。该数据集旨在解决现有无人机检测数据集类型单一、数据量不足、信号-to-噪声比(SNR)范围有限等问题,提供了丰富的SNR级别和用于特征提取的基准预处理方法及模型评估工具。数据集适用于射频无人机检测和识别,有助于推动相关技术的研究与应用。
arXiv 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
中国行政区划shp数据
中国行政区划数据是重要的基础地理信息数据,目前不同来源的全国行政区划数据非常多,但能够开放获取的高质量行政区域数据少之又少。基于此,锐多宝的地理空间制作一套2013-2023年可开放获取的高质量行政区划数据。该套数据以2022年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区划数据、天地图行政区划数据,参考历年来民政部公布的行政区划为属性基础,具有时间跨度长、属性丰富、国界准确、更新持续等特性。 中国行政区划数据统计截止时间是2023年2月12日,包含省、市、县、国界、九段线等矢量shp数据。该数据基于2020年行政区划底图,按时间顺序依次制作了2013-2023年初的行政区划数据。截止2023年1月1日,我国共有34个省级单位,分别是4个直辖市、23个省、5个自治区和2个特别行政区。截止2023年1月1日,我国共有333个地级单位,分别是293个地级市、7个地区、30个自治州和3个盟,其中38个矢量要素未纳入统计(比如直辖市北京等、特别行政区澳门等、省直辖县定安县等)。截止2023年1月1日,我国共有2843个县级单位,分别是1301个县、394个县级市、977个市辖区、117个自治县、49个旗、3个自治旗、1个特区和1个林区,其中9个矢量要素未纳入县级类别统计范畴(比如特别行政区香港、无县级单位的地级市中山市东莞市等)。
CnOpenData 收录
BBT-FinCorpus
BBT-FinCorpus是由上海数据科学重点实验室创建的大型中文金融领域数据集,包含约300GB的原始文本,来源于金融新闻、公司公告、研究报告和社交媒体等四个不同渠道。该数据集的创建旨在丰富金融领域的文本多样性,支持金融预训练语言模型的开发。通过精细的收集和处理,BBT-FinCorpus覆盖了金融NLP任务中的主要文本类型,为金融领域的语言理解和生成任务提供了丰富的数据资源。该数据集的应用领域广泛,特别适用于金融信息提取、情感分析等任务,旨在提升中文金融NLP的整体水平。
arXiv 收录