osieosie/mixed_sft_math500_original_64_s1_tulu2_sft_s1_10.0pct
收藏Hugging Face2025-11-13 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/osieosie/mixed_sft_math500_original_64_s1_tulu2_sft_s1_10.0pct
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含文本和消息内容的集合,每个消息包括内容和角色信息。数据集中的记录还包含来源、是否为污染数据、原始索引、种子信息以及与污染数据相关的元数据。数据集分为训练集,提供了字节数和示例数,可用于训练自然语言处理模型。
This dataset is a collection of text and message contents, with each message including content and role information. The records in the dataset also contain source, contamination status, original index, seeding information, and metadata related to contaminated data. The dataset is split into a training set, providing the number of bytes and examples, which can be used to train natural language processing models.
提供机构:
osieosie



