five

erhwenkuo/train_2m-chinese-zhtw

收藏
Hugging Face2023-09-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/erhwenkuo/train_2m-chinese-zhtw
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: instruction dtype: string - name: input dtype: string - name: output dtype: string splits: - name: train num_bytes: 1857012653 num_examples: 2000000 download_size: 1134473798 dataset_size: 1857012653 configs: - config_name: default data_files: - split: train path: data/train-* task_categories: - text-generation language: - zh tags: - alpaca - fine-tune size_categories: - 1M<n<10M --- # Dataset Card for "train_2m-chinese-zhtw" ## 內容 包含約 200 萬條由 [BELLE](https://github.com/LianjiaTech/BELLE) 專案目產生的中文指令(instruction)資料。 ## 範例 ``` { "instruction": "將以下三個句子組合成一個有意義的段落。\n狗是人類最好的朋友。它們非常聰明,可以進行各種活動。如果你喜歡散步,狗可以成為你一起散步的夥伴。", "input": "", "output": "狗是人類最好的朋友,它們非常聰明,可以進行各種活動。如果你喜歡散步,狗可以成為你一起散步的伙伴。出門散步是一種良好的鍛煉方式,而有狗的陪伴會讓散步變得更有趣,並且有狗在身邊也能給你帶來安全感。所以,擁有一隻狗作為你的伙伴,可以幫助你變得更加積極主動和健康。" } ``` ### 欄位: ``` instruction: 指令 input: 輸入(此資料集均為空) output: 輸出 ``` ## 使用限制 僅允許將此資料集及使用此資料集產生的衍生物用於研究目的,不得用於商業,以及其他會對社會帶來危害的用途。 本資料集不代表任何一方的立場、利益或想法,無關任何團體的任何類型的主張。因使用本資料集所帶來的任何損害、糾紛,本專案不承擔任何責任。
提供机构:
erhwenkuo
原始信息汇总

数据集卡片 "train_2m-chinese-zhtw"

内容

包含约 200 万条由 BELLE 项目产生的中文指令(instruction)数据。

示例

json { "instruction": "将以下三个句子组合成一个有意义的段落。 狗是人类最好的朋友。它们非常聪明,可以进行各种活动。如果你喜欢散步,狗可以成为你一起散步的伙伴。", "input": "", "output": "狗是人类最好的朋友,它们非常聪明,可以进行各种活动。如果你喜欢散步,狗可以成为你一起散步的伙伴。出门散步是一种良好的锻炼方式,而有狗的陪伴会让散步变得更有趣,并且有狗在身边也能给你带来安全感。所以,拥有一只狗作为你的伙伴,可以帮助你变得更加积极主动和健康。" }

字段:

  • instruction: 指令
  • input: 输入(此数据集均为空)
  • output: 输出

使用限制

仅允许将此数据集及使用此数据集产生的衍生物用于研究目的,不得用于商业,以及其他会对社会带来危害的用途。 本数据集不代表任何一方的立场、利益或想法,无关任何团体的任何类型的主张。因使用本数据集所带来任何损害、纠纷,本项目不承担任何责任。

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作