nomic-ai/gpt4all_prompt_generations
收藏Hugging Face2023-04-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nomic-ai/gpt4all_prompt_generations
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: response
dtype: string
- name: source
dtype: string
splits:
- name: train
num_bytes: 782175193
num_examples: 437604
download_size: 397878357
dataset_size: 782175193
license: apache-2.0
task_categories:
- text-generation
language:
- en
size_categories:
- 100K<n<1M
---
# Dataset Card for [GPT4All Prompt Generations]
## Dataset Description
Dataset used to train [GPT4All](https://huggingface.co/nomic-ai/gpt4all-lora)
- **Homepage:**
- **Repository:** [gpt4all](https://github.com/nomic-ai/gpt4all)
- **Paper:** [Technical Report](https://s3.amazonaws.com/static.nomic.ai/gpt4all/2023_GPT4All_Technical_Report.pdf)
- **Atlas Map:** [Map of Cleaned Data](https://atlas.nomic.ai/map/gpt4all_data_clean)
提供机构:
nomic-ai
原始信息汇总
数据集概述
数据集名称
GPT4All Prompt Generations
数据集描述
用于训练GPT4All的数据集。
数据集特征
- prompt: 数据类型为字符串。
- response: 数据类型为字符串。
- source: 数据类型为字符串。
数据集分割
- train: 包含437604个示例,总字节数为782175193。
数据集大小
- 下载大小: 397878357字节
- 数据集大小: 782175193字节
许可
Apache-2.0
任务类别
- 文本生成
语言
- 英语
大小类别
- 100K<n<1M



