anton96vice/samantha-1.1-uncensored-split-and-prepared
收藏Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/anton96vice/samantha-1.1-uncensored-split-and-prepared
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含与虚拟助手Samantha的未审查、基于指令的交互记录,每条记录包括提供给Samantha的指令、她接收的输入以及她产生的输出,并附有额外的文本上下文。该数据集旨在用于训练和评估高级自然语言处理和理解系统,重点是准确解释和执行各种指令。
该数据集包含与虚拟助手Samantha的未审查、基于指令的交互记录,每条记录包括提供给Samantha的指令、她接收的输入以及她产生的输出,并附有额外的文本上下文。该数据集旨在用于训练和评估高级自然语言处理和理解系统,重点是准确解释和执行各种指令。
提供机构:
anton96vice
原始信息汇总
数据集卡片
数据集详情
数据集描述
该数据集包含与Samantha(一个虚拟助手)的未经审查的、基于指令的交互的丰富集合。每个条目详细记录了提供给Samantha的指令、她接收的输入以及她产生的输出,并附有额外的文本上下文。该数据集旨在用于训练和评估先进的自然语言处理和理解系统,专注于准确解释和执行广泛的指令。
- 语言(NLP): 英语
- 许可证: Apache
数据集结构
特征
- instruction: 字符串
- input: 字符串
- output: 字符串
- text: 字符串
分割
- train:
- 字节数: 9760644.749754662
- 样本数: 1630
- test:
- 字节数: 2443155.250245339
- 样本数: 408
数据大小
- 下载大小: 6418929 字节
- 数据集大小: 12203800.0 字节
数据集配置
- config_name: default
- 数据文件:
- train: data/train-*
- test: data/test-*
- 数据文件:
数据集创建
策划理由
重新准备数据集,以便无需麻烦地准备个人助手训练数据集。



