five

zhongshupeng/dataset_4090_3

收藏
Hugging Face2023-10-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zhongshupeng/dataset_4090_3
下载链接
链接失效反馈
官方服务:
资源简介:
# Disclaimer: this dataset is curated for NeurIPS 2023 LLM efficiency challange, and currently work in progress. Please use at your own risk. # Data composition: All data were derived from the training set portion of the open source dataset. **gsm2k_dolly12k_cnnadd4k_mmlulog1.7w_bbqabc8k.json**: -gsm8k_2000: https://huggingface.co/datasets/gsm8k -dolly_12000: https://huggingface.co/datasets/databricks/databricks-dolly-15k -cnn_dailymail_4000: https://huggingface.co/datasets/cnn_dailymail -mmlu_17000: https://huggingface.co/datasets/cais/mmlu -bbq_8000: https://huggingface.co/datasets/tasksource/bigbench
提供机构:
zhongshupeng
原始信息汇总

数据集概述

数据来源

所有数据均源自开源数据集的训练集部分。

数据文件

gsm2k_dolly12k_cnnadd4k_mmlulog1.7w_bbqabc8k.json

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作