five

anton96vice/samantha-1.1-uncensored-split-and-prepared

收藏
Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/anton96vice/samantha-1.1-uncensored-split-and-prepared
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与虚拟助手Samantha的未审查、基于指令的交互记录,每条记录包括提供给Samantha的指令、她接收的输入以及她产生的输出,并附有额外的文本上下文。该数据集旨在用于训练和评估高级自然语言处理和理解系统,重点是准确解释和执行各种指令。

该数据集包含与虚拟助手Samantha的未审查、基于指令的交互记录,每条记录包括提供给Samantha的指令、她接收的输入以及她产生的输出,并附有额外的文本上下文。该数据集旨在用于训练和评估高级自然语言处理和理解系统,重点是准确解释和执行各种指令。
提供机构:
anton96vice
原始信息汇总

数据集卡片

数据集详情

数据集描述

该数据集包含与Samantha(一个虚拟助手)的未经审查的、基于指令的交互的丰富集合。每个条目详细记录了提供给Samantha的指令、她接收的输入以及她产生的输出,并附有额外的文本上下文。该数据集旨在用于训练和评估先进的自然语言处理和理解系统,专注于准确解释和执行广泛的指令。

  • 语言(NLP): 英语
  • 许可证: Apache

数据集结构

特征

  • instruction: 字符串
  • input: 字符串
  • output: 字符串
  • text: 字符串

分割

  • train:
    • 字节数: 9760644.749754662
    • 样本数: 1630
  • test:
    • 字节数: 2443155.250245339
    • 样本数: 408

数据大小

  • 下载大小: 6418929 字节
  • 数据集大小: 12203800.0 字节

数据集配置

  • config_name: default
    • 数据文件:
      • train: data/train-*
      • test: data/test-*

数据集创建

策划理由

重新准备数据集,以便无需麻烦地准备个人助手训练数据集。

源数据

SOURCE

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作