five

LongAlpaca12k

收藏
arXiv2025-09-30 收录
下载链接:
https://huggingface.co/datasets/Open-Orca/OpenOrca
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集被用于训练模型处理不超过32k个令牌的序列,它是现有的一种长上下文数据集。此外,该数据集还作为第一阶段和第二阶段指令调整的初始数据集的一部分。所涉及的任务是指令调整。

This dataset is utilized for training models to handle sequences with up to 32k tokens, and it is a currently available long-context dataset. Furthermore, this dataset also serves as a component of the initial datasets for first-stage and second-stage instruction tuning. The task involved herein is instruction tuning.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作