mrsteyk/opechatgpt-safe-r1
收藏Hugging Face2023-05-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mrsteyk/opechatgpt-safe-r1
下载链接
链接失效反馈官方服务:
资源简介:
这是一个旧的ChatGPT抓取版本,数据由模型自身生成,可能来自所谓的alpha版本。数据集的整理理由不多,建议用户自行检查和修正数据。数据来源部分提到用户查询和助手的回答是数据的主要组成部分。数据集没有社会影响,但存在一些偏见和已知的限制。数据集的策展人是MrSteyk和旧的ChatGPT。
这是一个旧的ChatGPT抓取版本,数据由模型自身生成,可能来自所谓的alpha版本。数据集的整理理由不多,建议用户自行检查和修正数据。数据来源部分提到用户查询和助手的回答是数据的主要组成部分。数据集没有社会影响,但存在一些偏见和已知的限制。数据集的策展人是MrSteyk和旧的ChatGPT。
提供机构:
mrsteyk
原始信息汇总
数据集概述
数据集描述
数据集总结
- 数据集为旧版ChatGPT的抓取数据,属于RAW版本。
- 数据生成于早期,甚至早于“Plus”版本,完全由模型自身生成。
- 可能源自当前所称的“alpha”版本,甚至更早。
支持的任务和排行榜
- 详细信息请参考数据集。
语言
- 主要为英语,可能包含一些翻译内容。
数据集结构
数据实例
- [更多信息待补充]
数据字段
- [更多信息待补充]
数据分割
- [更多信息待补充]
数据集创建
精选理由
- 数据精选程度不高,建议自行检查并修正部分答案。
源数据
初始数据收集和标准化
- 首先生成用户查询,随后生成助手答案。
源语言生产者
- 可能为OpenAI。
注释
注释过程
- [更多信息待补充]
注释者
- [更多信息待补充]
个人和敏感信息
- [更多信息待补充]
使用数据集的考虑
数据集的社会影响
- 无。
偏见讨论
- 数据集存在偏向讨论OpenAI相关内容和一些特殊话题的偏见,缺少“NDA”相关内容。
其他已知限制
- 部分查询包含答案,直接使用此数据训练的模型可能会出现问题。原始数据中包含“今天的日期”等信息,未包含在后续的Neo(X)微调中。
附加信息
数据集管理员
- MrSteyk和旧版ChatGPT。
许可信息
- [更多信息待补充]
引用信息
- 无需引用。
贡献
- 除OpenAI外,贡献者自知。



