UCI Machine Learning Repository: Energy Efficiency|建筑能源效率数据集|机器学习数据集
收藏
- UCI Machine Learning Repository首次建立,成为机器学习领域的重要数据资源库。
- Energy Efficiency数据集首次被引入UCI Machine Learning Repository,旨在通过机器学习技术评估建筑物的能源效率。
- Energy Efficiency数据集在多个国际会议和期刊上被引用,标志着其在能源效率研究中的重要性逐渐被认可。
- Energy Efficiency数据集被广泛应用于机器学习算法的研究和开发,特别是在回归分析和预测模型中。
- Energy Efficiency数据集的更新版本发布,增加了新的特征和数据点,以反映最新的建筑能源效率研究成果。
- Energy Efficiency数据集被用于多个跨学科研究项目,包括建筑科学、环境工程和计算机科学,进一步推动了其在学术界和工业界的应用。
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
红外谱图数据库
收集整理红外谱图实验手册等数据,建成了红外谱图数据库。本数据库收录了常见化合物的红外谱图。主要包括化合物数据和对应的红外谱图数据。其中,原始红外谱图都进行了数字化处理,从而使谱峰检索成为可能。用户可以在数据库中检索指定化合物的谱图,也可以提交谱图/谱峰数据,以检索与之相似的谱图数据,以协助进行谱图鉴定。
国家基础学科公共科学数据中心 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
lmarena-ai/PPE-Debug
--- dataset_info: features: - name: question_id dtype: string - name: prompt dtype: string - name: response_1 dtype: string - name: response_2 dtype: string - name: winner dtype: string splits: - name: test num_bytes: 1903286 num_examples: 1000 download_size: 1085469 dataset_size: 1903286 configs: - config_name: default data_files: - split: test path: data/test-* --- # Overview This is just a debug set for Preference Proxy Evaluations. The prompts are sampled from [lmsys/chatbot_arena_conversations](https://huggingface.co/datasets/lmsys/chatbot_arena_conversations). This dataset is meant for benchmarking and evaluation, not for training. [Paper](https://arxiv.org/abs/2410.14872) [Code](https://github.com/lmarena/PPE) # License User prompts are licensed under CC BY 4.0, and model outputs are governed by the terms of use set by the respective model providers.
hugging_face 收录