five

CoolOppo/WizardLM_evol_instruct_V2_196k_uncensored

收藏
Hugging Face2023-06-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CoolOppo/WizardLM_evol_instruct_V2_196k_uncensored
下载链接
链接失效反馈
官方服务:
资源简介:
这是WizardLM_evol_instruct_V2_196k数据集的未过滤版本,通过过滤该数据集并与未经过滤的ShareGPT数据集合并而成。未过滤处理使用了Rust重写的清理脚本,该脚本使用了与Eric Hartford等人相同的词汇,但通过编译成大型正则表达式以提高运行速度。

这是WizardLM_evol_instruct_V2_196k数据集的未过滤版本,通过过滤该数据集并与未经过滤的ShareGPT数据集合并而成。未过滤处理使用了Rust重写的清理脚本,该脚本使用了与Eric Hartford等人相同的词汇,但通过编译成大型正则表达式以提高运行速度。
提供机构:
CoolOppo
原始信息汇总

数据集概述

标签

  • uncensored
  • wizard

描述

  • 该数据集是 WizardLM_evol_instruct_V2_196k 的未审查版本。
  • 通过过滤 Wizard 数据集并与已未审查的 ShareGPT 数据集合并得到。

处理方法

  • 使用 my rust rewrite 对清理脚本进行重写,该脚本是基于 Eric Hartford 等人使用的脚本。
  • 该重写版本使用完全相同的词汇,只是编译成一个大型正则表达式以提高运行速度。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作