V3N0M/TinyJenna-Uncensored-v01
收藏Hugging Face2024-06-15 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/V3N0M/TinyJenna-Uncensored-v01
下载链接
链接失效反馈官方服务:
资源简介:
Uncensored Alpaca数据集是一个包含未经审查的提示和响应的集合,遵循Alpaca格式。该数据集旨在为训练语言模型提供多样化和未经过滤的数据源,涵盖广泛的主题和风格,强调其多样性和未审查的特性。数据集适用于研究和训练目的,但使用时需考虑伦理问题。
Uncensored Alpaca数据集是一个包含未经审查的提示和响应的集合,遵循Alpaca格式。该数据集旨在为训练语言模型提供多样化和未经过滤的数据源,涵盖广泛的主题和风格,强调其多样性和未审查的特性。数据集适用于研究和训练目的,但使用时需考虑伦理问题。
提供机构:
V3N0M
原始信息汇总
Uncensored Alpaca Dataset: A New Frontier in Language Models
概述
Uncensored Alpaca Dataset 是一个包含未审查提示和响应的集合,采用 Alpaca 格式。该数据集旨在为训练语言模型提供一个多样化和未经筛选的数据源,推动这些模型理解和生成语言的边界。
特点
- 未审查内容: 该数据集包含涉及常被审查或避免的主题的提示和响应,包括可能具有争议性、攻击性或敏感性的内容。
- Alpaca 格式: 遵循与原始 Alpaca 数据集相同的格式,确保与现有训练工具和框架的兼容性。
- 多样性: 数据集涵盖广泛的主题、风格和视角,提供更丰富和细致的人类语言表示。
使用
- 训练: 可用于训练语言模型,使其能够理解和生成更细致和多样化的语言。
- 研究: 研究人员可以探索未审查数据对语言模型行为和性能的影响。
- 伦理考虑: 使用此数据集训练模型时,必须考虑伦理影响。
数据结构
数据集结构如下: json [ { "instruction": "Write a short story about [topic]", "input": "[optional input]", "output": "[model response]" }, { "instruction": "Translate the following text into [language]: [text]", "input": "[text]", "output": "[translation]" }, // ... 更多示例 ]
许可证
该数据集采用 MIT 许可证。
贡献
欢迎贡献!如果您想向此数据集添加更多提示和响应,请遵循以下指南:
- 伦理考虑: 确保您的贡献是负责任的,避免推广有害内容。
- 格式: 使用上述 Alpaca 格式。
- 质量: 提交高质量的提示和响应。
注意事项
- 该数据集仍在进行中,可能包含错误或不一致之处。
- 鼓励负责任和伦理的使用。



