V3N0M/TinyJenna-Uncensored-v01

Name: V3N0M/TinyJenna-Uncensored-v01
Creator: V3N0M
Published: 2024-06-15 13:07:35
License: 暂无描述

Hugging Face2024-06-15 更新2024-06-22 收录

下载链接：

https://hf-mirror.com/datasets/V3N0M/TinyJenna-Uncensored-v01

下载链接

链接失效反馈

官方服务：

资源简介：

Uncensored Alpaca数据集是一个包含未经审查的提示和响应的集合，遵循Alpaca格式。该数据集旨在为训练语言模型提供多样化和未经过滤的数据源，涵盖广泛的主题和风格，强调其多样性和未审查的特性。数据集适用于研究和训练目的，但使用时需考虑伦理问题。

提供机构：

V3N0M

原始信息汇总

Uncensored Alpaca Dataset: A New Frontier in Language Models

概述

Uncensored Alpaca Dataset 是一个包含未审查提示和响应的集合，采用 Alpaca 格式。该数据集旨在为训练语言模型提供一个多样化和未经筛选的数据源，推动这些模型理解和生成语言的边界。

特点

未审查内容： 该数据集包含涉及常被审查或避免的主题的提示和响应，包括可能具有争议性、攻击性或敏感性的内容。
Alpaca 格式： 遵循与原始 Alpaca 数据集相同的格式，确保与现有训练工具和框架的兼容性。
多样性： 数据集涵盖广泛的主题、风格和视角，提供更丰富和细致的人类语言表示。

使用

训练： 可用于训练语言模型，使其能够理解和生成更细致和多样化的语言。
研究： 研究人员可以探索未审查数据对语言模型行为和性能的影响。
伦理考虑： 使用此数据集训练模型时，必须考虑伦理影响。

数据结构

数据集结构如下： json [ { "instruction": "Write a short story about [topic]", "input": "[optional input]", "output": "[model response]" }, { "instruction": "Translate the following text into [language]: [text]", "input": "[text]", "output": "[translation]" }, // ... 更多示例 ]

许可证

该数据集采用 MIT 许可证。

贡献

欢迎贡献！如果您想向此数据集添加更多提示和响应，请遵循以下指南：

伦理考虑： 确保您的贡献是负责任的，避免推广有害内容。
格式： 使用上述 Alpaca 格式。
质量： 提交高质量的提示和响应。

注意事项

该数据集仍在进行中，可能包含错误或不一致之处。
鼓励负责任和伦理的使用。

5,000+

优质数据集

54 个

任务类型

进入经典数据集