UCL-DARK/openai-tldr-filtered-queries
收藏Hugging Face2023-10-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/UCL-DARK/openai-tldr-filtered-queries
下载链接
链接失效反馈官方服务:
资源简介:
这是用于https://arxiv.org/abs/2310.06452研究论文的数据集版本。如果开始一个新项目,建议使用https://huggingface.co/datasets/openai/summarize_from_feedback。该数据集仅对查询进行了过滤,因此比https://huggingface.co/datasets/UCL-DARK/openai-tldr-filtered包含更多数据,后者对查询和摘要都进行了过滤。
提供机构:
UCL-DARK
原始信息汇总
Filtered TL;DR Dataset 概述
基本信息
- 许可证: CC-BY-4.0
- 语言: 英语 (en)
- 多语言性: 单语种
- 数据集大小: 10万<n<100万
创建者信息
- 标注创建者: 众包
- 语言创建者: 众包
数据集特性
- 标签:
- 对齐
- 文本分类
- 摘要生成
- 人类反馈
- 任务类别: 文本生成
数据集版本与来源
- 版本: 此版本的数据集用于论文 https://arxiv.org/abs/2310.06452。
- 来源: 扩展自原始数据集
- 过滤方式: 仅对查询进行过滤,数据量多于 https://huggingface.co/datasets/UCL-DARK/openai-tldr-filtered,后者同时对查询和摘要进行过滤。



