five

MinervaAI/Aesir-Preview

收藏
Hugging Face2024-02-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MinervaAI/Aesir-Preview
下载链接
链接失效反馈
官方服务:
资源简介:
MinervaAI发布了其首个公共数据集Aesir-Preview,这是一个基于ShareGPT的预览数据集,包含1000个完全合成的角色扮演对话,这些对话是在匿名用户和Chub.ai的角色卡片之间生成的。每个对话都经过了数十次自动验证、修正和手动策划,以确保在GPT 3.5 Instruct模型的限制内达到最高质量。数据集包含大量NSFW内容,包括各种色情主题、可能令人不安的场景和非常强烈的语言,因此基于此数据训练的模型将强烈倾向于重现此类行为。

MinervaAI released its first public dataset, Aesir-Preview, which is a preview dataset based on ShareGPT. It contains 1,000 fully synthetic role-playing conversations generated between anonymous users and character cards from Chub.ai. Each conversation has undergone dozens of rounds of automatic verification, correction and manual curation to ensure the highest quality within the constraints of the GPT-3.5 Instruct model. The dataset includes extensive NSFW content, including various erotic themes, potentially disturbing scenarios and highly offensive language, so models trained on this data will strongly tend to reproduce such behaviors.
提供机构:
MinervaAI
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 标签:
    • not-for-all-audiences
    • roleplay
    • conversational
  • 数据规模: 1K<n<10K

内容描述

  • 数据来源: ShareGPT-based
  • 数据类型: 完全合成角色扮演对话
  • 对话对象: 匿名用户与Chub.ai的角色卡片
  • 数据处理: 经过多轮自动化验证、修正和人工校对
  • 模型使用: GPT 3.5 Instruct

注意事项

  • 预览性质: 该数据集为预览版,可能不反映最终内容或质量
  • 内容警告: 包含大量NSFW内容,涉及多种色情主题、可能令人不安的场景和强烈语言
  • 使用建议: 使用时需谨慎,模型训练结果可能偏向于重现此类行为

贡献者

  • Gryphe, Doctor Shotgun, IkariDev, Undi, Mixel, [Chat Error], kubernetes_bad, StefanGliga
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作