five

seangogo/processed_tldr_sft_dataset_20251029_045736_with_rewards|自然语言处理数据集|机器学习数据集

收藏
hugging_face2025-11-08 更新2025-11-15 收录
自然语言处理
机器学习
下载链接:
https://hf-mirror.com/datasets/seangogo/processed_tldr_sft_dataset_20251029_045736_with_rewards
下载链接
链接失效反馈
资源简介:
该数据集包含了论坛帖子的相关特征,如帖子ID、所属版块、标题、帖子内容、摘要、查询语句、查询语句的token表示、查询和回复的合并字符串及其token表示和标签、奖励值等。数据集被划分为训练集,可用于训练论坛对话系统或相关自然语言处理任务。

The dataset contains features related to forum posts, such as post ID, subreddit, title, post content, summary, query statement, token representation of the query, combined string of query and response with its token representation and labels, reward value, etc. The dataset is split into a training set, which can be used to train forum dialogue systems or related natural language processing tasks.
提供机构:
seangogo
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作