five

train_0.5M_CN

收藏
魔搭社区2026-05-23 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/AI-ModelScope/train_0.5M_CN
下载链接
链接失效反馈
官方服务:
资源简介:
## 内容 包含约50万条由[BELLE](https://github.com/LianjiaTech/BELLE)项目生成的中文指令数据。 ## 示例代码 ```python from modelscope import MsDataset from modelscope.utils.constant import DownloadMode ds = MsDataset.load('AI-ModelScope/train_0.5M_CN', split='train', download_mode=DownloadMode.FORCE_REDOWNLOAD) print(next(iter(ds))) ``` ## 样例 ``` { "instruction": "给定一个文字输入,将其中的所有数字加1。\n“明天的会议在9点开始,记得准时到达。”\n", "input": "", "output": "“明天的会议在10点开始,记得准时到达。”" } ``` ### 字段: ``` instruction: 指令 input: 输入(本数据集均为空) output: 输出 ``` ## 使用限制 仅允许将此数据集及使用此数据集生成的衍生物用于研究目的,不得用于商业,以及其他会对社会带来危害的用途。 本数据集不代表任何一方的立场、利益或想法,无关任何团体的任何类型的主张。因使用本数据集带来的任何损害、纠纷,本项目不承担任何责任。

Contains approximately 500,000 Chinese instruction samples generated by the [BELLE](https://github.com/LianjiaTech/BELLE) project. ## Example Code python from modelscope import MsDataset from modelscope.utils.constant import DownloadMode ds = MsDataset.load('AI-ModelScope/train_0.5M_CN', split='train', download_mode=DownloadMode.FORCE_REDOWNLOAD) print(next(iter(ds))) ## Sample json { "instruction": "Given a text input, add 1 to all numbers within it. "Tomorrow's meeting starts at 9 o'clock, please arrive on time." ", "input": "", "output": ""Tomorrow's meeting starts at 10 o'clock, please arrive on time."" } ### Fields: instruction: Instruction input: Input (all entries in this dataset are empty) output: Output ### Usage Restrictions This dataset and derivatives generated using it are only permitted for research purposes, and shall not be used for commercial purposes or other uses that may cause harm to society. This dataset does not represent the position, interests or opinions of any party, and is unrelated to any type of claims of any organization. The project shall not be liable for any damages or disputes arising from the use of this dataset.
提供机构:
maas
创建时间:
2023-12-04
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作