five

THU-KEG/LongWriter-Zero-RLData

收藏
Hugging Face2025-07-10 更新2025-07-05 收录
下载链接:
https://hf-mirror.com/datasets/THU-KEG/LongWriter-Zero-RLData
下载链接
链接失效反馈
官方服务:
资源简介:
LongWriter-Zero RL Data数据集是为了通过强化学习实现超长文本生成而设计的。该数据集由会话查询和长度范围标签组成,这些标签定义了期望的输出跨度(以单词或中文字符为单位)。这些注释用于训练LongWriter-Zero模型,使其能够持续生成超过10,000个单词的文章。

The LongWriter-Zero RL Data dataset is designed for ultra-long text generation via reinforcement learning. The dataset consists of conversational queries paired with *length-range tags*, which specify the desired output span (measured in words or Chinese characters). These annotations are used to train the **LongWriter-Zero** model, enabling it to consistently generate passages exceeding **10,000 words**.
提供机构:
THU-KEG
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作