haonan-li/cmmlu|中文语言理解数据集|多任务评估数据集
收藏数据集概述
数据集名称
- CMMLU
数据集描述
- CMMLU 是一个专为评估大型语言模型(LLMs)在中文语言和文化背景下的高级知识和推理能力而设计的综合评估套件。该数据集覆盖了从基础到高级专业水平的67个主题,包括需要计算专业知识的物理和数学,以及人文和社会科学领域。
数据集特点
- 包含多个选择题和问答任务。
- 每个问题都是带有4个选项的多项选择题,仅有一个正确答案。
- 许多任务因其特定的上下文细微差别和措辞,不易从其他语言翻译。
- 许多任务的答案特定于中国,可能不适用于其他地区或语言。
数据集结构
- 提供每个主题的开发和测试数据集。
- 开发集包含5个问题,测试集包含100多个问题。
数据集使用
- 数据集可以通过Python代码加载,支持按主题加载或一次性加载所有数据。
数据集许可证
引用信息
@misc{li2023cmmlu, title={CMMLU: Measuring massive multitask language understanding in Chinese}, author={Haonan Li and Yixuan Zhang and Fajri Koto and Yifei Yang and Hai Zhao and Yeyun Gong and Nan Duan and Timothy Baldwin}, year={2023}, eprint={2306.09212}, archivePrefix={arXiv}, primaryClass={cs.CL} }

Open Power System Data
Open Power System Data is a free-of-charge data platform dedicated to electricity system researchers. We collect, check, process, document, and publish data that are publicly available but currently inconvenient to use. The project is a service provider to the modeling community: a supplier of a public good. Learn more about its background or just go ahead and explore the data platform.
re3data.org 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
新能源光伏功率预测数据
采集数值天气预报数据、实时环境气象数据、光伏电站实时输出功率数据等信息,通过气象预测模型与功率预测算法,实现对光伏电站未来一段时间内气象数据及功率数据的预测。
安徽省数据知识产权登记平台 收录
BDD100K
数据集推动了视觉的进步,但现有的驾驶数据集在视觉内容和支持任务方面缺乏研究,以研究自动驾驶的多任务学习。研究人员通常只能在一个数据集上研究一小组问题,而现实世界的计算机视觉应用程序需要执行各种复杂的任务。我们构建了最大的驾驶视频数据集 BDD100K,包含 10 万个视频和 10 个任务,以评估图像识别算法在自动驾驶方面的令人兴奋的进展。该数据集具有地理、环境和天气的多样性,这对于训练不太可能对新条件感到惊讶的模型很有用。基于这个多样化的数据集,我们为异构多任务学习建立了一个基准,并研究了如何一起解决这些任务。我们的实验表明,现有模型需要特殊的训练策略来执行此类异构任务。 BDD100K 为未来在这个重要场所的学习打开了大门。更多详细信息请参见数据集主页。
OpenDataLab 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录