cognitivecomputations/ultrachat-uncensored

Name: cognitivecomputations/ultrachat-uncensored
Creator: cognitivecomputations
Published: 2023-10-23 05:29:16
License: 暂无描述

Hugging Face2023-10-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/cognitivecomputations/ultrachat-uncensored

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: mit --- This is based on ultrachat dataset https://huggingface.co/datasets/stingning/ultrachat I filtered it using the classic "unfiltered" keywords list https://huggingface.co/datasets/anon8231489123/ShareGPT_Vicuna_unfiltered to remove instances of refusals and bias About 90% of the dataset was removed. What remains (400k conversations) is unlikely to inclinate the model to refuse. I am investigating a less heavy handed approach using dolphin-2.1 to reword any detected refusals.

提供机构：

cognitivecomputations

原始信息汇总

数据集概述

数据来源

基于 ultrachat 数据集，原数据集链接：ultrachat。

数据处理

使用 "unfiltered" 关键词列表进行过滤，该列表链接：unfiltered keywords。
过滤目的是移除拒绝和偏见的实例。
约90%的数据被移除。

数据规模

剩余数据量为400,000次对话。

后续研究

正在研究使用 dolphin-2.1 重新表述检测到的拒绝，以采取更温和的处理方法。

5,000+

优质数据集

54 个

任务类型

进入经典数据集