five

srs6901/FSS1STR

收藏
Hugging Face2026-04-25 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/srs6901/FSS1STR
下载链接
链接失效反馈
官方服务:
资源简介:
FSS1STR是一个基于FSS1数据集导出的助手专用PT字符串数据集,包含17,770,136行数据,模式为单列字符串(text列),内容仅提取自原始messages中的助手消息内容。该数据集旨在用于PT模式下的纯文本流预训练,示例使用方式包括在训练脚本中指定相关参数。注意:空助手输出已被过滤,且未包含源数据中的辅助元数据字段(如source、replied_to、reversed)。

Assistant-only PT string export of FSS1. Source: datasets/FSS1, with 17,770,136 rows and a schema of one column (text: string). Content includes only assistant message content extracted from messages. Intended for pretraining in pt mode as plain text stream. Notes: Empty assistant outputs were dropped, and auxiliary metadata fields (source, replied_to, reversed) are not included.
提供机构:
srs6901
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作