ogrnz/chat-titles
收藏Hugging Face2024-05-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/ogrnz/chat-titles
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Chat-titles,包含10,000个样本,每个样本由标题和对话对组成。对话内容来自Puffin和chatalpaca-20k数据集,标题则由gpt-3.5-turbo生成。该数据集是一个更大项目的一部分,旨在微调一个大型语言模型(LLM)以生成聊天对话的简短标题。数据集格式为JSONL,每个条目包含两个键:message和title。
该数据集名为Chat-titles,包含10,000个样本,每个样本由标题和对话对组成。对话内容来自Puffin和chatalpaca-20k数据集,标题则由gpt-3.5-turbo生成。该数据集是一个更大项目的一部分,旨在微调一个大型语言模型(LLM)以生成聊天对话的简短标题。数据集格式为JSONL,每个条目包含两个键:message和title。
提供机构:
ogrnz
原始信息汇总
数据集概述
数据集名称
Chat-titles
数据集内容
- 包含10,000个样本的标题与对话对,全部为英文。
- 数据集文件名为
dataset.jsonl。
数据来源
- 对话内容来源于Puffin和chatalpaca-20k。
- 标题由
gpt-3.5-turbo生成。
数据格式
- 采用JSONL格式,每行一个JSON条目,包含两个键:
message和title。
许可证
MIT



