five

Kendamarron/jimba-instruction-simplify-200

收藏
Hugging Face2024-04-01 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Kendamarron/jimba-instruction-simplify-200
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 dataset_info: features: - name: original dtype: string - name: simplify dtype: string splits: - name: train num_bytes: 89231 num_examples: 200 download_size: 51470 dataset_size: 89231 configs: - config_name: default data_files: - split: train path: data/train-* language: - ja --- ## データセットについて [Kendamarron/jimba-instuction-1k-beta](https://huggingface.co/datasets/Kendamarron/jimba-instuction-1k-beta)のinstructionのうち200個をより単純なタスクに書き換えたデータセットです。 『[Wizard LM](https://arxiv.org/abs/2304.12244)』のIn-depth evolvingを再現するために作成しました。 将来的にはもう少しレコード数を増やしたいと考えています。 詳細については[こちら](https://zenn.dev/kendama/articles/85ed50d31207bf)をご覧ください。 ## 備考 Discordサーバー「ローカルLLMに向き合う会」とメタデータラボ株式会社が共同開催された「[LOCAL AI HACKATHON #000](https://prtimes.jp/main/html/rd/p/000000007.000056944.html)」にて作成した成果物になります。
提供机构:
Kendamarron
原始信息汇总

数据集概述

数据集信息

  • 许可证: Apache-2.0
  • 特征:
    • original: 数据类型为 string
    • simplify: 数据类型为 string
  • 分割:
    • train: 包含200个示例,总字节数为89231
  • 下载大小: 51470字节
  • 数据集大小: 89231字节
  • 配置:
    • default: 包含训练数据文件,路径为 data/train-*
  • 语言: 日语 (ja)

数据集描述

本数据集是对Kendamarron/jimba-instuction-1k-beta中的200个指令进行简化处理后的版本,旨在再现『Wizard LM』的In-depth evolving。未来计划增加更多记录。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作