five

GPT4all

收藏
魔搭社区2026-01-09 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/wyj123456/GPT4all
下载链接
链接失效反馈
资源简介:
## 数据集描述 It contains 806199 en instructions in code, storys and dialogs tasks. ## 数据示例 ``` {"instruction": "Forensic experts track printer fingerprints Counterfeiters who make \\$10 bills on printers could find the cops on their trail if tracking techniques pan out. \nIs this a piece of news regarding world politics, sports, business, or science and technology? ", "input": "", "output": "science and technology"} ``` ### 数据集加载方式 ```Python from modelscope.msdatasets import MsDataset from modelscope.utils.constant import DownloadMode # Load the dataset ds_train = MsDataset.load('wyj123456/GPT4all', split='train', download_mode=DownloadMode.FORCE_REDOWNLOAD) print(next(iter(ds_train))) ``` ### Clone with HTTP ```bash git clone https://www.modelscope.cn/datasets/wyj123456/GPT4all.git ```

### 数据集描述 本数据集包含806199条适用于代码、故事与对话任务的英文指令。 ### 数据示例 {"instruction": "法医专家追踪打印机指纹 若该追踪技术取得实效,利用打印机印制10美元假钞的造假者或将被警方追查。 该新闻属于世界政治、体育、商业还是科技领域?", "input": "", "output": "科技领域"} ### 数据集加载方式 Python from modelscope.msdatasets import MsDataset from modelscope.utils.constant import DownloadMode # 加载数据集 ds_train = MsDataset.load('wyj123456/GPT4all', split='train', download_mode=DownloadMode.FORCE_REDOWNLOAD) print(next(iter(ds_train))) ### HTTP 克隆方式 bash git clone https://www.modelscope.cn/datasets/wyj123456/GPT4all.git
提供机构:
maas
创建时间:
2023-07-29
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
GPT4all是一个大规模英文指令数据集,包含806,199条指令,覆盖代码、故事和对话等多种任务,数据格式为指令-输出对,便于训练对话模型。该数据集采用Apache 2.0许可证,允许商用和修改,大小为1.01GB,更新于2024年9月,提供了从ModelScope平台加载的便捷方式,适合用于智能对话、问答和文本生成等AI应用开发。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作