GPT4all
收藏魔搭社区2026-01-09 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/wyj123456/GPT4all
下载链接
链接失效反馈资源简介:
## 数据集描述
It contains 806199 en instructions in code, storys and dialogs tasks.
## 数据示例
```
{"instruction": "Forensic experts track printer fingerprints Counterfeiters who make \\$10 bills on printers could find the cops on their trail if tracking techniques pan out. \nIs this a piece of news regarding world politics, sports, business, or science and technology? ", "input": "", "output": "science and technology"}
```
### 数据集加载方式
```Python
from modelscope.msdatasets import MsDataset
from modelscope.utils.constant import DownloadMode
# Load the dataset
ds_train = MsDataset.load('wyj123456/GPT4all', split='train', download_mode=DownloadMode.FORCE_REDOWNLOAD)
print(next(iter(ds_train)))
```
### Clone with HTTP
```bash
git clone https://www.modelscope.cn/datasets/wyj123456/GPT4all.git
```
### 数据集描述
本数据集包含806199条适用于代码、故事与对话任务的英文指令。
### 数据示例
{"instruction": "法医专家追踪打印机指纹 若该追踪技术取得实效,利用打印机印制10美元假钞的造假者或将被警方追查。 该新闻属于世界政治、体育、商业还是科技领域?", "input": "", "output": "科技领域"}
### 数据集加载方式
Python
from modelscope.msdatasets import MsDataset
from modelscope.utils.constant import DownloadMode
# 加载数据集
ds_train = MsDataset.load('wyj123456/GPT4all', split='train', download_mode=DownloadMode.FORCE_REDOWNLOAD)
print(next(iter(ds_train)))
### HTTP 克隆方式
bash
git clone https://www.modelscope.cn/datasets/wyj123456/GPT4all.git
提供机构:
maas
创建时间:
2023-07-29
搜集汇总
数据集介绍

背景与挑战
背景概述
GPT4all是一个大规模英文指令数据集,包含806,199条指令,覆盖代码、故事和对话等多种任务,数据格式为指令-输出对,便于训练对话模型。该数据集采用Apache 2.0许可证,允许商用和修改,大小为1.01GB,更新于2024年9月,提供了从ModelScope平台加载的便捷方式,适合用于智能对话、问答和文本生成等AI应用开发。
以上内容由遇见数据集搜集并总结生成



