five

allenai/tulu-v2-sft-mixture-olmo-4096

收藏
Hugging Face2024-07-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/allenai/tulu-v2-sft-mixture-olmo-4096
下载链接
链接失效反馈
官方服务:
资源简介:
Tulu V2 Mix (4096 OLMo版本)是Tulu V2 Mix数据集的修改版本,专门用于训练2024年4月之后的OLMo-SFT/Instruct模型变体。该版本的主要变化是将硬编码子集替换为与OLMo相关的示例。数据集适用于问答、对话和文本生成任务,语言为英语,数据规模在10万到100万之间。数据集采用ODC-BY许可证,部分数据可能受非商业用途限制。

This is a modified version of the Tulu V2 Mix dataset, specifically designed for training newer OLMo-SFT/Instruct models after April 2024. The main change in this version is the replacement of the hardcoded subset with examples related to OLMo, rather than the original Tulu examples. The dataset is released under the ODC-BY license, indicating that different subsets may have different licenses, including non-commercial ones.
提供机构:
allenai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作