mmlu_eval|模型评估数据集|推理能力数据集
收藏数据集概述
数据集信息
- 特征:
- question: 问题描述,数据类型为字符串。
- subject: 问题所属主题,数据类型为字符串。
- choices: 选项列表,数据类型为字符串序列。
- answer: 正确答案,数据类型为分类标签,包含以下类别:
- 0: A
- 1: B
- 2: C
- 3: D
- input: 输入数据,数据类型为字符串。
- baseline_llama_1b: 基线模型输出,数据类型为字符串。
- reasoning_64_a128_mix_mmlu_csqa_gsm8k_even: 混合推理模型输出,数据类型为字符串。
- output_w_reasoning_llama_1b: 带推理的模型输出,数据类型为字符串。
- eval_baseline_vs_mixed_reasoning: 基线模型与混合推理模型对比评估结果,数据类型为字符串。
数据集划分
- validation:
- 样本数量: 1531
- 数据大小: 10295402 字节
数据集配置
- config_name: default
- 数据文件路径: data/validation-*
数据集大小
- 下载大小: 4908248 字节
- 数据集总大小: 10295402 字节

典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
Global Solar Dataset
在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录