mrsteyk/opechatgpt-safe-r1

Name: mrsteyk/opechatgpt-safe-r1
Creator: mrsteyk
Published: 2023-05-17 21:33:44
License: 暂无描述

Hugging Face2023-05-17 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/mrsteyk/opechatgpt-safe-r1

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个旧的ChatGPT抓取版本，数据由模型自身生成，可能来自所谓的alpha版本。数据集的整理理由不多，建议用户自行检查和修正数据。数据来源部分提到用户查询和助手的回答是数据的主要组成部分。数据集没有社会影响，但存在一些偏见和已知的限制。数据集的策展人是MrSteyk和旧的ChatGPT。

提供机构：

mrsteyk

原始信息汇总

数据集概述

数据集描述

数据集总结

数据集为旧版ChatGPT的抓取数据，属于RAW版本。
数据生成于早期，甚至早于“Plus”版本，完全由模型自身生成。
可能源自当前所称的“alpha”版本，甚至更早。

支持的任务和排行榜

详细信息请参考数据集。

语言

主要为英语，可能包含一些翻译内容。

数据集结构

数据实例

[更多信息待补充]

数据字段

[更多信息待补充]

数据分割

[更多信息待补充]

数据集创建

精选理由

数据精选程度不高，建议自行检查并修正部分答案。

源数据

初始数据收集和标准化

首先生成用户查询，随后生成助手答案。

源语言生产者

可能为OpenAI。

注释

注释过程

[更多信息待补充]

注释者

[更多信息待补充]

个人和敏感信息

[更多信息待补充]

使用数据集的考虑

数据集的社会影响

无。

偏见讨论

数据集存在偏向讨论OpenAI相关内容和一些特殊话题的偏见，缺少“NDA”相关内容。

其他已知限制

部分查询包含答案，直接使用此数据训练的模型可能会出现问题。原始数据中包含“今天的日期”等信息，未包含在后续的Neo(X)微调中。

附加信息

数据集管理员

MrSteyk和旧版ChatGPT。

许可信息

[更多信息待补充]

引用信息

无需引用。

贡献

除OpenAI外，贡献者自知。

5,000+

优质数据集

54 个

任务类型

进入经典数据集