cognitivecomputations/ultrachat-uncensored
收藏Hugging Face2023-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cognitivecomputations/ultrachat-uncensored
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
---
This is based on ultrachat dataset https://huggingface.co/datasets/stingning/ultrachat
I filtered it using the classic "unfiltered" keywords list https://huggingface.co/datasets/anon8231489123/ShareGPT_Vicuna_unfiltered to remove instances of refusals and bias
About 90% of the dataset was removed.
What remains (400k conversations) is unlikely to inclinate the model to refuse.
I am investigating a less heavy handed approach using dolphin-2.1 to reword any detected refusals.
提供机构:
cognitivecomputations
原始信息汇总
数据集概述
数据来源
- 基于 ultrachat 数据集,原数据集链接:ultrachat。
数据处理
- 使用 "unfiltered" 关键词列表进行过滤,该列表链接:unfiltered keywords。
- 过滤目的是移除拒绝和偏见的实例。
- 约90%的数据被移除。
数据规模
- 剩余数据量为400,000次对话。
后续研究
- 正在研究使用 dolphin-2.1 重新表述检测到的拒绝,以采取更温和的处理方法。



