five

V3N0M/TinyJenna-Uncensored-v01

收藏
Hugging Face2024-06-15 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/V3N0M/TinyJenna-Uncensored-v01
下载链接
链接失效反馈
官方服务:
资源简介:
Uncensored Alpaca数据集是一个包含未经审查的提示和响应的集合,遵循Alpaca格式。该数据集旨在为训练语言模型提供多样化和未经过滤的数据源,涵盖广泛的主题和风格,强调其多样性和未审查的特性。数据集适用于研究和训练目的,但使用时需考虑伦理问题。

Uncensored Alpaca数据集是一个包含未经审查的提示和响应的集合,遵循Alpaca格式。该数据集旨在为训练语言模型提供多样化和未经过滤的数据源,涵盖广泛的主题和风格,强调其多样性和未审查的特性。数据集适用于研究和训练目的,但使用时需考虑伦理问题。
提供机构:
V3N0M
原始信息汇总

Uncensored Alpaca Dataset: A New Frontier in Language Models

概述

Uncensored Alpaca Dataset 是一个包含未审查提示和响应的集合,采用 Alpaca 格式。该数据集旨在为训练语言模型提供一个多样化和未经筛选的数据源,推动这些模型理解和生成语言的边界。

特点

  • 未审查内容: 该数据集包含涉及常被审查或避免的主题的提示和响应,包括可能具有争议性、攻击性或敏感性的内容。
  • Alpaca 格式: 遵循与原始 Alpaca 数据集相同的格式,确保与现有训练工具和框架的兼容性。
  • 多样性: 数据集涵盖广泛的主题、风格和视角,提供更丰富和细致的人类语言表示。

使用

  • 训练: 可用于训练语言模型,使其能够理解和生成更细致和多样化的语言。
  • 研究: 研究人员可以探索未审查数据对语言模型行为和性能的影响。
  • 伦理考虑: 使用此数据集训练模型时,必须考虑伦理影响。

数据结构

数据集结构如下: json [ { "instruction": "Write a short story about [topic]", "input": "[optional input]", "output": "[model response]" }, { "instruction": "Translate the following text into [language]: [text]", "input": "[text]", "output": "[translation]" }, // ... 更多示例 ]

许可证

该数据集采用 MIT 许可证。

贡献

欢迎贡献!如果您想向此数据集添加更多提示和响应,请遵循以下指南:

  • 伦理考虑: 确保您的贡献是负责任的,避免推广有害内容。
  • 格式: 使用上述 Alpaca 格式。
  • 质量: 提交高质量的提示和响应。

注意事项

  • 该数据集仍在进行中,可能包含错误或不一致之处。
  • 鼓励负责任和伦理的使用。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作