四次尝试
收藏魔搭社区2025-10-13 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/liuxing1234/four-test
下载链接
链接失效反馈官方服务:
资源简介:
## 数据集描述
该数据集为GPT-4生成的中文数据集,用于LLM的指令精调和强化学习等。
### 数据集加载方式
```python
from modelscope.msdatasets import MsDataset
ds = MsDataset.load('liuxing1234/four-test', subset_name='default', split='train')
print(next(iter(ds)))
```
### 数据分片
数据已经预设了train分片。
## 数据集版权信息
数据集已经开源,license为CC BY NC 4.0(仅用于非商业化用途),如有违反相关条款,随时联系modelscope删除。
## 引用方式
```
@article{peng2023gpt4llm,
title={Instruction Tuning with GPT-4},
author={Baolin Peng, Chunyuan Li, Pengcheng He, Michel Galley, Jianfeng Gao},
journal={arXiv preprint arXiv:2304.03277},
year={2023}
}
```
## 参考链接
```
https://huggingface.co/datasets/c-s-ale/alpaca-gpt4-data-zh
https://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLM
```
### Clone with HTTP
```bash
git clone https://www.modelscope.cn/datasets/liuxing1234/four-test.git
```
## 数据集描述
本数据集为由GPT-4生成的中文数据集,适用于大语言模型(LLM)的指令微调与强化学习等任务。
### 数据集加载方式
python
from modelscope.msdatasets import MsDataset
ds = MsDataset.load('liuxing1234/four-test', subset_name='default', split='train')
print(next(iter(ds)))
### 数据分片
本数据集已预设train分片。
## 数据集版权信息
本数据集已开源,许可证为CC BY NC 4.0(仅可用于非商业用途),若违反相关条款,可随时联系modelscope申请删除该数据集。
## 引用方式
@article{peng2023gpt4llm,
title={Instruction Tuning with GPT-4},
author={Baolin Peng, Chunyuan Li, Pengcheng He, Michel Galley, Jianfeng Gao},
journal={arXiv preprint arXiv:2304.03277},
year={2023}
}
## 参考链接
https://huggingface.co/datasets/c-s-ale/alpaca-gpt4-data-zh
https://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLM
### Clone with HTTP
bash
git clone https://www.modelscope.cn/datasets/liuxing1234/four-test.git
提供机构:
maas
创建时间:
2023-09-09
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个由GPT-4生成的中文数据集,专门用于大型语言模型的微调和强化学习。它采用CC BY NC 4.0许可证,仅限非商业使用,并已预设训练分割。
以上内容由遇见数据集搜集并总结生成



