five

V3N0M/Uncensored-Alpaca

收藏
Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/V3N0M/Uncensored-Alpaca
下载链接
链接失效反馈
官方服务:
资源简介:
Uncensored Alpaca数据集是一个包含未经过滤提示和响应的集合,采用Alpaca格式。该数据集旨在为语言模型训练提供多样化和未经过滤的数据源,推动这些模型理解和生成语言的边界。数据集涵盖了广泛的主题、风格和观点,提供了更丰富和细致的人类语言表示。数据集主要用于研究和训练语言模型,但也强调了使用时的伦理考虑。

Uncensored Alpaca数据集是一个包含未经过滤提示和响应的集合,采用Alpaca格式。该数据集旨在为语言模型训练提供多样化和未经过滤的数据源,推动这些模型理解和生成语言的边界。数据集涵盖了广泛的主题、风格和观点,提供了更丰富和细致的人类语言表示。数据集主要用于研究和训练语言模型,但也强调了使用时的伦理考虑。
提供机构:
V3N0M
原始信息汇总

Uncensored Alpaca Dataset

概述

Uncensored Alpaca Dataset 是一个包含未经过滤的提示和响应的集合,采用 Alpaca 格式。该数据集旨在为训练语言模型提供多样化和未经过滤的数据源,推动这些模型在理解和生成语言方面的边界。

特点

  • 未经过滤:数据集包含涉及常被审查或避免的传统数据集中的主题的提示和响应,包括潜在的争议性、冒犯性或敏感性主题。
  • Alpaca 格式:遵循与原始 Alpaca 数据集相同的格式,确保与现有训练工具和框架的兼容性。
  • 多样性:涵盖广泛的主题、风格和视角,提供更丰富和更细致的人类语言表示。

使用场景

  • 训练:用于训练语言模型,使其能够理解和生成更细致和多样化的语言。
  • 研究:研究人员可以探索未经过滤数据对语言模型行为和性能的影响。
  • 伦理考虑:在使用此数据集训练模型时,必须考虑伦理影响。

数据结构

数据集结构如下: json [ { "instruction": "Write a short story about [topic]", "input": "[optional input]", "output": "[model response]" }, { "instruction": "Translate the following text into [language]: [text]", "input": "[text]", "output": "[translation]" }, // ... 更多示例 ]

许可证

该数据集采用 MIT 许可证。

贡献

欢迎贡献!如果您想为此数据集添加更多提示和响应,请遵循以下指南:

  • 伦理考虑:确保您的贡献是负责任的,避免推广有害内容。
  • 格式:使用上述 Alpaca 格式。
  • 质量:提交高质量的提示和响应。

注意事项

  • 该数据集是一个持续进行的工作,可能包含错误或不一致性。
  • 鼓励负责任和伦理地使用此数据集。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作