erhwenkuo/train_2m-chinese-zhtw
收藏Hugging Face2023-09-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/erhwenkuo/train_2m-chinese-zhtw
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: instruction
dtype: string
- name: input
dtype: string
- name: output
dtype: string
splits:
- name: train
num_bytes: 1857012653
num_examples: 2000000
download_size: 1134473798
dataset_size: 1857012653
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
task_categories:
- text-generation
language:
- zh
tags:
- alpaca
- fine-tune
size_categories:
- 1M<n<10M
---
# Dataset Card for "train_2m-chinese-zhtw"
## 內容
包含約 200 萬條由 [BELLE](https://github.com/LianjiaTech/BELLE) 專案目產生的中文指令(instruction)資料。
## 範例
```
{
"instruction": "將以下三個句子組合成一個有意義的段落。\n狗是人類最好的朋友。它們非常聰明,可以進行各種活動。如果你喜歡散步,狗可以成為你一起散步的夥伴。",
"input": "",
"output": "狗是人類最好的朋友,它們非常聰明,可以進行各種活動。如果你喜歡散步,狗可以成為你一起散步的伙伴。出門散步是一種良好的鍛煉方式,而有狗的陪伴會讓散步變得更有趣,並且有狗在身邊也能給你帶來安全感。所以,擁有一隻狗作為你的伙伴,可以幫助你變得更加積極主動和健康。"
}
```
### 欄位:
```
instruction: 指令
input: 輸入(此資料集均為空)
output: 輸出
```
## 使用限制
僅允許將此資料集及使用此資料集產生的衍生物用於研究目的,不得用於商業,以及其他會對社會帶來危害的用途。
本資料集不代表任何一方的立場、利益或想法,無關任何團體的任何類型的主張。因使用本資料集所帶來的任何損害、糾紛,本專案不承擔任何責任。
提供机构:
erhwenkuo
原始信息汇总
数据集卡片 "train_2m-chinese-zhtw"
内容
包含约 200 万条由 BELLE 项目产生的中文指令(instruction)数据。
示例
json { "instruction": "将以下三个句子组合成一个有意义的段落。 狗是人类最好的朋友。它们非常聪明,可以进行各种活动。如果你喜欢散步,狗可以成为你一起散步的伙伴。", "input": "", "output": "狗是人类最好的朋友,它们非常聪明,可以进行各种活动。如果你喜欢散步,狗可以成为你一起散步的伙伴。出门散步是一种良好的锻炼方式,而有狗的陪伴会让散步变得更有趣,并且有狗在身边也能给你带来安全感。所以,拥有一只狗作为你的伙伴,可以帮助你变得更加积极主动和健康。" }
字段:
instruction: 指令input: 输入(此数据集均为空)output: 输出
使用限制
仅允许将此数据集及使用此数据集产生的衍生物用于研究目的,不得用于商业,以及其他会对社会带来危害的用途。 本数据集不代表任何一方的立场、利益或想法,无关任何团体的任何类型的主张。因使用本数据集所带来任何损害、纠纷,本项目不承担任何责任。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



